03第三章 统计分布的数值特征
- 格式:ppt
- 大小:7.96 MB
- 文档页数:99
《统计学概论》习题解答第三章 统计分布的数值特征【7】某大型集团公司下属35个企业工人工资变量数列如下表所示:试计算该企业平均工资。
(注:比重——各组工人人数在工人总数中所占的比重) 【解】 该集团公司职工的平均工资为755元/人。
【8】某地甲、乙两个农贸市场三种主要水果价格及销售额资料见下表试计算比较该地区哪个农贸市场水果平均价格高?并说明原因。
解:()千克元甲市场水果平均价格44.20009000002002==()元乙市场水果平均价格44.200000010005502== 甲市场以较低价格销售的水果所占的比重比乙市场以相同价格销售的水果的比重大,反之,正好情况相反,故甲市场水果的平均价格较低。
【10】根据某城市500户居民家计调查结果,将居民户按其食品开支占全部消费开支的比重(即恩格尔系数)分组后,得到如下的频数分布资料:恩格尔系数 ( % ) 户 数 向上累计户数 x f (户%)分 组组中值( % )(户) (户)xf ∑f20以下 15 6 6 0.90 20—30 25 38 44 9.50 30—40 35 107 151 37.45 40—50 45 (中)137288(中) 61.65 50—60 55 114 402 62.70 60—70 65 74 476 48.10 70以上 75 24 500 18.00 合 计—500—283.30(1)据资料估计该城市恩格尔系数的中位数和众数,并说明这两个平均的具体分析意义。
(2)利用上表资料,按居民户数加权计算该城市恩格尔系数的算术平均数。
(3)上面计算的算术平均数能否说明该城市恩格尔系数的一般水平?为什么?解:()()()()%%%% M %%%% M o e 66.4540501141371071371071374022.47405013715125040=-⨯-+--+==-⨯-+=数:众中位数:以户数为权数计算的恩格尔系数的平均数:%fxf 66.4750030.283==∑∑不能作为该500户家庭恩格尔系数的平均水平。
第3章统计学数据分布特征的描述统计学是一门研究收集、分析和解释数据的学科。
在统计学中,数据分布特征的描述是指通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。
数据的集中趋势描述了数据的平均水平或中心。
常用的统计量有平均值、中位数和众数。
平均值是将所有观测值相加然后除以观测值的总数,它能够反映数据的总体平均水平。
然而,当数据包含异常值时,平均值的计算结果可能会受到影响。
因此,中位数和众数在这种情况下被认为是更稳健的集中趋势度量。
中位数是将数据按大小排序,然后找出中间位置的观测值。
众数是数据中出现次数最多的观测值。
数据的离散程度描述了数据的变异程度或分散程度。
常用的统计量有方差、标准差和四分位差。
方差是观测值与均值之间差异的平方的平均值,它反映了数据的总体离散程度。
标准差是方差的平方根,用于衡量数据的波动性。
四分位差是数据的上四分位数和下四分位数之差,它描述了数据的中间50%的变异程度。
数据的分布形态描述了数据的形状和对称性。
常用的分布形态有正态分布、偏态分布和峰态分布。
正态分布是最常见的分布形态,其特点是对称、钟形曲线。
偏态分布是指数据分布不对称的情况,主要分为正偏态和负偏态。
正偏态分布意味着数据的尾部偏向右侧,负偏态分布则意味着数据的尾部偏向左侧。
峰态分布用于描述数据的峰值的尖锐程度,主要分为正态分布、高峰态和低峰态。
除了统计量,还可以使用图表来对数据分布特征进行描述。
常用的图表包括直方图、箱线图和散点图。
直方图是通过将数据分组并在坐标轴上绘制各组的频率或相对频率来展示数据的分布形态。
箱线图通过绘制数据的分位数和异常值来展示数据的中位数、四分位数和离群观测值。
散点图用于展示两个变量之间的关系,特别适用于发现变量之间的相关性和异常值。
综上所述,统计学中的数据分布特征描述是通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。
这些描述能够帮助我们更好地理解数据,并对数据进行分析和解释。