第四章、统计数据分布特征的描述
- 格式:doc
- 大小:109.38 KB
- 文档页数:4
1分布特征描述类分布特征是指在一定范围内,不同数值或对象的分布情况。
通过对分布特征的描述和分析,可以更好地理解数据的规律和特点,有助于数据的统计分析和决策支持。
在统计学和数据分析领域,分布特征描述是非常重要的一部分,可以帮助我们揭示数据的本质,并为后续的研究和应用提供依据。
分布特征描述主要包括对数据的中心趋势、离散程度、形状和对称性等方面的描述。
其中,数据的中心趋势反映了数据的集中程度,通常用均值、中位数和众数等来描述;数据的离散程度则反映了数据的分散程度,通常用方差、标准差和极差等来描述;数据的形状和对称性反映了数据的分布形态,通常用偏度和峰度来描述。
这些描述指标可以帮助我们全面地认识数据的特点,为数据分析和决策提供依据。
在描述分布特征时,我们通常会用图表和统计指标相结合的方法,来展示数据的分布情况。
常见的图表包括直方图、箱线图、饼图和散点图等,这些图表可以直观地展示数据的分布情况,帮助我们找出数据的规律和特点。
而统计指标则可以量化地描述数据的分布特征,提供客观的数据支持。
在实际应用中,分布特征描述可以帮助我们进行数据探索和分析,找出数据中的异常情况和规律性,为后续的数据处理和分析提供基础。
比如,在市场调研中,我们可以通过对销售数据的分布特征描述,找出最畅销的产品和销售状况,为产品的推广和销售提供决策支持;在金融风险管理中,我们可以通过对资产收益率的分布特征描述,找出潜在的风险源和赚钱机会,为投资决策提供指导。
总的来说,分布特征描述是数据分析的重要一环,可以帮助我们更好地理解数据的特点和规律,为数据处理和决策提供依据。
通过对数据的中心趋势、离散程度、形状和对称性等方面的描述,我们可以全面地认识数据,并更好地利用数据为我们的工作和生活带来更多的价值。
因此,分布特征描述不仅在统计学和数据分析领域具有重要意义,而且在各个行业和领域都有着广泛的应用前景。
第四章 静态指标分析法(一)一、填空题1、数据分布集中趋势的测度值(指标)主要有、和。
其中和用于测度品质数据集中趋势的分布特征,用于测度数值型数据集中趋势的分布特征。
2、标准差是反映的最主要指标(测度值)。
3、几何平均数是计算和的比较适用的一种方法。
4、当两组数据的平均数不等时,要比较其数据的差异程度大小,需要计算。
5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。
6、当一组工人的月平均工资悬殊较大时,用他们工资的比其算术平均数更能代表全部工人工资的总体水平。
二.选择题单选题:1.反映的时间状况不同,总量指标可分为( )A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某厂1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同一变量数列中,当标志值(变量值)比较大的次数较多时,计算出来的平均数( )A 接近标志值小的一方B 接近标志值大的一方C 接近次数少的一方D 接近哪一方无法判断4、在计算平均数时,权数的意义和作用是不变的,而权数的具体表现( )A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某厂甲车间工人的月平均工资为520元,乙车间工人的月平均工资为540元,1999年各车间的工资水平不变,但甲车间的工人占全部工人的比重由原来的40%提高到了60%,则1999年两车间工人的总平均工资比1998年( )A 提高B 不变C 降低D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越小,则( )A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越高C 说明变量值越分散,平均数代表性越高D 说明变量值越集中,平均数代表性越低7、有甲、乙两数列,已知甲数列:07.7,70==甲甲σX ;乙数列:41.3,7==乙乙σX 根据以上资料可直接判断( )A 甲数列的平均数代表性大B 乙数列的平均数代表性大C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百人手机拥有量为90部,这个指标是 ( )A 、比例相对指标B 、比较相对指标C 、结构相对指标D 、强度相对指标 9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为 ( ) A 、左偏分布 B 、右偏分布 C 、对称分布 D 、无法判断10、加权算术平均数的大小 ( )A 主要受各组标志值大小的影响,与各组次数多少无关;B 主要受各组次数多少的影响,与各组标志值大小无关;C 既与各组标志值大小无关,也与各组次数多少无关;D 既与各组标志值大小有关,也受各组次数多少的影响11、已知一分配数列,最小组限为30元,最大组限为200元,不可能是平均数的为 ( ) A 、50元 B 、80元 C 、120元 D 、210元12、比较两个单位的资料,甲的标准差小于乙的标准差,则 ( ) A 两个单位的平均数代表性相同 B 甲单位平均数代表性大于乙单位C 乙单位平均数代表性大于甲单位D 不能确定哪个单位的平均数代表性大 13、若单项数列的所有标志值都增加常数9,而次数都减少三分之一,则其算术平均数 ( ) A 、增加9 B 、增加6C 、减少三分之一 D 、增加三分之二 14、如果数据分布很不均匀,则应编制( )A 开口组B 闭口组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( ) A 总体性B 全面性C 同质性D 可比性16、某企业的职工工资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为()A1500元 B 1600元 C 1750元D 2000元 17、统计分组的首要问题是( )A 选择分组变量和确定组限B 按品质标志分组C 运用多个标志进行分组,形成一个分组体系D 善于运用复合分组18、某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开支情况,最合适的调查方式是:() A 普查B 抽样调查C 典型调查D 重点调查21、已知两个同类企业的职工平均工资的标准差分别为5元和6元,而平均工资分别为3000元,3500元则两企业的工资离散程度为 ( )A 甲大于乙B 乙大于甲C 一样的D 无法判断 22、加权算术平均数的大小取决于( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,而标志值仍然不变.那么算术平均数( ) A 不变 B 扩大到5倍 C 减少为原来的1/5 D 不能预测其变化 24、 计算平均比率最好用 ( )A 算术平均数B 调和平均数C 几何平均数D 中位数25、若两数列的标准差相等而平均数不同,在比较两数列的离散程度大小时,应采用() A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布B正态分布 C 右偏分布DU型分布28、一次小型出口商品洽谈会,所有厂商的平均成交额的方差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁生产的基本情况,调查了上钢、鞍钢等十几个大型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。
第四章数据分布特征的测度学习目的和要求:通过本章的学习,掌握数据分布特征的各种描述方法;掌握不同测度方法的特点、应用条件及应用场合;能利用所学的方法对统计数据作各种统计描述。
难点释疑:(一)算术平均数通常用来反映总体分布的集中趋势,调和平均数往往只作为算术平均数的变形来使用,即在已知标志总量而未知总体单位总量的情况下计算调和平均数;而几何平均数较适用于计算平均比率和平均速度。
(二)调和平均数虽然是根据标志值的倒数计算的,但其结果不等于算术平均数的倒数。
在计算和应用平均指标时,除了考虑数理方面的要求外,更重要的是要考虑其现实的经济意义。
(三)平均数的性质是简捷计算法的基础,也是计算标志变异指标的基础。
掌握中位数和众数与算术平均数的关系的目的是能够根据其中的两个平均数大体计算出第三个平均数,并判断总体的分布状态。
(四)全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。
全距是描述数据离散程度的最简单测度值,它计算简单,易于理解,但不能全面反映总体各单位标志值的差异程度。
标准差与平均差的意义基本相同,但在数学性质上比平均差要优越,所以,在反映标志变动度大小时,一般都采用标准差。
标准差是实际中应用最广泛的离散程度测度值。
(五)标准差系数的应用。
为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。
它是标志变异的相对指标。
它既消除了变量数列变量值差异程度的影响,也消除了变量数列水平高低的影响。
练习题:(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)1.平均指标反映了()。
①总体变量值分布的集中趋势②总体分布的离散特征③总体单位的集中趋势④总体变动趋势2.加权算术平均数的大小( )。
①受各组标志值的影响最大 ②受各组次数的影响最大③受各组权数系数的影响最大 ④受各组标志值和各组次数的共同影响3.在变量数列中,如果变量值较小的一组权数较大,则计算出来的算术平均数( )。
《管理统计学》作业集习题集及答案第一章导论*1-1 对50名职工的工资收入情况进行调查,则总体单位是(单选)( 3 )(1)50名职工(2)50名职工的工资总额(3)每一名职工(4)每一名职工的工资*1-2 一个统计总体(单选)( 4 )(1)只能有一个标志(2)只能有一个指标(3)可以有多个标志(4)可以有多个指标*1-3 某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是(单选)( 4 )(1)指标(2)标志(3)变量(4)标志值第二章统计数据的调查与收集*2-1 非全面调查包括(多项选择题)( 12 4 )(1)重点调查(2)抽样调查(3)快速普查(4)典型调查(5)统计年报*2-2 统计调查按搜集资料的方法不同,可以分为(多项选择题)( 12 3 ) (1)采访法(2)抽样调查法(3)直接观察法(4)典型调查法(5)报告法*2-3 某市进行工业企业生产设备状况普查,要求在7月1日至7月5日全部调查完毕。
则规定的这一时间是(单项选择题)(2)(1) 调查时间 (2) 调查期限 (3) 标准时间 (4) 登记期限*2-4 某城市拟对占全市储蓄额五分之四的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是(单项选择题)(4)(1) 普查 (2) 典型调查 (3) 抽样调查 (4) 重点调查*2-5 下列判断中,不正确的有(多项选择题)(23 4 )(1)重点调查是一种非全面调查,既可用于经常性调查,也可用于一次性调查;(2)抽样调查是非全面调查中最科学的方法,因此它适用于完成任何调查任务;(3)在非全面调查中,抽样调查最重要,重点调查次之,典型调查最不重要;(4)如果典型调查的目的是为了近似地估计总体的数值,则可以选择若干中等的典型单位进行调查;(5)普查是取得全面统计资料的主要调查方法。
*2-6 下列属于品质标志的是(单项选择题)( 2 )(1)工人年龄(2)工人性别(3)工人体重(4)工人工资*2-7 下列标志中,属于数量标志的有(多项选择题)(3)(1)性别(2)工种(3)工资(4)民族(5)年龄*2-8 下列指标中属于质量指标的有(多项选择题)(13 4 )(1)劳动生产率(2)废品量(3)单位产品成本(1)资金利润率(5)上缴税利额第三章统计数据的整理*3-1 区分下列几组基本概念:(1)频数和频率;答:A、频数:在一组依大小顺序排列的测量值中,当按一定的组距将其分组时出现在各组内的测量值的数目。
第四章、统计数据分布特征的描述
一、单项选择题(在每小题的四个备选答案中,选出一个正确答案)
1. 调和平均数是()。
A. 总体标志总量指标与总体单位总量指标的比值
B. 总体各单位变量值倒数的算术平均数
C. 总体各单位变量值倒数算术平均数的倒数
D. 总体各单位变量值连乘积的平方根
2. 在分组的情况下,总体平均指标数值的大小()。
A. 只受各组变量值水平的影响,与各组单位数无关
B. 只受各组单位数的影响,与各组变量值水平无关
C. 既受各组变量值水平的影响,又与各组次数有关
D. 既不受各组变量值水平的影响,也部受各组次数的影响
3. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是()。
A. 各组次数必须相等
B. 各组必须是闭口组
C. 总体各单位变量值水平相等
D. 总体各单位变量值水平在各组内呈均匀分布
4. 标志变异指标反映了总体各单位变量值分布的().
A. 集中趋势
B. 离散趋势
C. 变动趋势
D. 长期趋势
5. 下列变异指标中,受极端数值影响最大的是()。
A. 全距
B. 平均差
C. 标准差
D. 变异系数
6. 算术平均数与总体单位数的乘积等于()。
A. 总体各单位变量值的总和
B. 总体各单位变量值的连乘积
C. 总体各单位变量值与平均数的离差
D. 总体各单位变量值与平均数离差的平方
7. 权数对算术平均数的影响作用,实质上取决于()。
A. 作为权数的各组单位数占总体单位数比重的大小
B. 各组变量值占总体标志总量比重的大小
C. 变量值本身的大小
D. 变量值数量的多少
8.平均指标反映了总体分布的()。
A. 集中趋势
B. 离散趋势
C. 变动趋势
D. 长期趋势
9.数据观察值与均值之差的和()。
A.等于零
B.大于1
C.为最大
D.为最小
10.如果一组数据是右偏分布,则 X、Me、Mo三者之间的关系表现为()
A.X=Me=Mo
B. X>Me>Mo c. X<Me<Mo D. X>Mo>Me
11.若男青年组体重均值为55公斤,标准差为4.2公斤,离散系数为7.6%;女青年组体重均值为48公斤,标准差为3.9公斤,离散系数为8.1%,则()。
A.男青年组体重差异大于女青年组
B.男青年组体重差异小于女青年组
C.男青年组体重差异与女青年组相同
D.男女青年组体重差异无法确定
12.算术平均数(均值)的数学性质()
A. B.
C. D.
13.如果一组数据是左偏分布,则、、三者之间的关系表现为()
A.==
B.>>
C.<<
D.<<
14.有下列资料:75、78、80、82、87、90、91、92,中位数是()
A.82
B.84.5
C.87
D.90
二、多项选择题(在每小题的五个备选答案中,选出二至五个正确答案)
1. 数值平均数的计算方法有()。
A. 算术平均法
B. 众数法
C. 中位数法
D. 调和平均法
E. 几何平均数
2.位置平均数的计算方法有()。
A. 算术平均法
B. 众数法
C. 中位数法
D. 调和平均法
E. 几何平均数
3. 在下列条件下,加权算术平均数和简单算术平均数相等()。
A. 各组次数相等
B. 各组变量值不等
C. 变量数列为组距数列
D. 各组次数都为1
E. 各组次数占总次数的比重相等
4. 数据集中趋势的测度值主要有()
A.众数
B.中位数
C.均值
D. 调和平均数
E.几何平均数
5.众数()
A.是一组数据中出现次数最多的变量值
B.从分布的角度看,是一组数据分布的最高峰点所对应的数值
C.是位置平均数
D.不受数据中极端值的影响
E.不一定存在,若存在也不一定是唯一的
6.在一个正态分布下,中位数()
A. 等于算术平均数
B. 小于算术平均数
C. 等于众数
D. 大于众数
E. 无法判断
7. 加权算术平均数的大小()
A. 受各组次数多少的影响
B. 受各组标志值大小的影响
C. 受各组标志值和次数的影响
D. 不受标志值的影响
E. 与各组次数分布无关
三、判断题(正确的打“√”,错误的打“×”)
1. 根据组距数列计算的平均指标是一个近似值。
2. 众数是变量数列中最大的次数。
3. 平均指标反映了现象的一般水平,但掩盖了总体各单位的差异,因此仅通过这个指标不能全面反映总体的特征。
4. 所有冠以“平均”一词的统计指标都是平均指标。
5. 变量的变异程度越高,其平均指标的代表性就越高;反之就越低。
6. 比较不同总体变异程度的高低,既可以用变异系数,也可以用标准差或其他变异指标。
7. 用加权平均数法计算标准差,既适用于分组资料,也适用于未分组资料。
8. 平均指标必须而且只能在同质总体中计算。
9. 根据组距数列计算中位数,其假定条件是变量值在中位数组分布均匀。
10. 根据组距数列计算众数时,如果众数组前一组次数等于其后一组次数,则众数等于众数组的组中值。
11.根据组距数列计算的平均指标是不精确的。
12. 众数在统计分布中不一定存在,若存在也不一定是唯一的。
13. 标准差和标准差变异(离散)系数都是反映变量离散的绝对水平的。
14. 中位数是指总体中出现次数最多的变量值。
15. 变量值与中位数之差的绝对值之和小于变量值与均值之差的绝对值之和。
四、问答题
1.算术平均数如何计算?有什么数学性质?
2. 什么是标准差?如何计算?
3. 数据集中趋势的测度值有哪些?其中最主要的测度值是哪个?它有哪些
重要的数学性质?。