统计学教(学)案(第5章数据分布特征的测度)
- 格式:docx
- 大小:289.55 KB
- 文档页数:13
统计学习题_第四章_数据分布特征的描述习题答案第四章静态指标分析法(⼀)⼀、填空题1、数据分布集中趋势的测度值(指标)主要有、和。
其中和⽤于测度品质数据集中趋势的分布特征,⽤于测度数值型数据集中趋势的分布特征。
2、标准差是反映的最主要指标(测度值)。
3、⼏何平均数是计算和的⽐较适⽤的⼀种⽅法。
4、当两组数据的平均数不等时,要⽐较其数据的差异程度⼤⼩,需要计算。
5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。
6、当⼀组⼯⼈的⽉平均⼯资悬殊较⼤时,⽤他们⼯资的⽐其算术平均数更能代表全部⼯⼈⼯资的总体⽔平。
⼆.选择题单选题:1.反映的时间状况不同,总量指标可分为()A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某⼚1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同⼀变量数列中,当标志值(变量值)⽐较⼤的次数较多时,计算出来的平均数()A 接近标志值⼩的⼀⽅B 接近标志值⼤的⼀⽅C 接近次数少的⼀⽅D 接近哪⼀⽅⽆法判断4、在计算平均数时,权数的意义和作⽤是不变的,⽽权数的具体表现()A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某⼚甲车间⼯⼈的⽉平均⼯资为520元,⼄车间⼯⼈的⽉平均⼯资为540元,1999年各车间的⼯资⽔平不变,但甲车间的⼯⼈占全部⼯⼈的⽐重由原来的40%提⾼到了60%,则1999年两车间⼯⼈的总平均⼯资⽐1998年()A 提⾼D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越⼩,则()A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越⾼C 说明变量值越分散,平均数代表性越⾼D 说明变量值越集中,平均数代表性越低7、有甲、⼄两数列,已知甲数列:07.7,70==甲甲σX ;⼄数列:41.3,7==⼄⼄σX 根据以上资料可直接判断( )A 甲数列的平均数代表性⼤B ⼄数列的平均数代表性⼤C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百⼈⼿机拥有量为90部,这个指标是()A 、⽐例相对指标B 、⽐较相对指标C 、结构相对指标D 、强度相对指标9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为() A 、左偏分布 B 、右偏分布 C 、对称分布 D 、⽆法判断10、加权算术平均数的⼤⼩() A 主要受各组标志值⼤⼩的影响,与各组次数多少⽆关; B 主要受各组次数多少的影响,与各组标志值⼤⼩⽆关; C 既与各组标志值⼤⼩⽆关,也与各组次数多少⽆关; D 既与各组标志值⼤⼩有关,也受各组次数多少的影响11、已知⼀分配数列,最⼩组限为30元,最⼤组限为200元,不可能是平均数的为() A 、50元 B 、80元 C 、120元 D 、210元12、⽐较两个单位的资料,甲的标准差⼩于⼄的标准差,则()A 两个单位的平均数代表性相同B 甲单位平均数代表性⼤于⼄单位C ⼄单位平均数代表性⼤于甲单位D 不能确定哪个单位的平均数代表性⼤ 13、若单项数列的所有标志值都增加常数9,⽽次数都减少三分之⼀,则其算术平均数() A 、增加9 B 、增加6 C 、减少三分之⼀ D 、增加三分之⼆ 14、如果数据分布很不均匀,则应编制 ( )A 开⼝组B 闭⼝组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( )A 总体性B 全⾯性16、某企业的职⼯⼯资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为 ( )A1500元 B 1600元 C 1750元 D 2000元 17、统计分组的⾸要问题是 ( )A 选择分组变量和确定组限B 按品质标志分组C 运⽤多个标志进⾏分组,形成⼀个分组体系D 善于运⽤复合分组18、某连续变量数列,其末组为开⼝组,下限为200,⼜知其邻组的组中值为170,则末组组中值为 ( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是 ( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开⽀情况,最合适的调查⽅式是:() A 普查 B 抽样调查 C 典型调查 D 重点调查21、已知两个同类企业的职⼯平均⼯资的标准差分别为5元和6元,⽽平均⼯资分别为3000元,3500元则两企业的⼯资离散程度为 ( )A 甲⼤于⼄B ⼄⼤于甲C ⼀样的D ⽆法判断 22、加权算术平均数的⼤⼩取决于 ( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,⽽标志值仍然不变.那么算术平均数 ( ) A 不变 B 扩⼤到5倍 C 减少为原来的1/5D 不能预测其变化 24、计算平均⽐率最好⽤ ( )A 算术平均数B 调和平均数C ⼏何平均数D 中位数25、若两数列的标准差相等⽽平均数不同,在⽐较两数列的离散程度⼤⼩时,应采⽤ ( ) A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为 ( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布 B 正态分布 C 右偏分布 D U型分布28、⼀次⼩型出⼝商品洽谈会,所有⼚商的平均成交额的⽅差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁⽣产的基本情况,调查了上钢、鞍钢等⼗⼏个⼤型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。
第一套一、填空1. 统计数据的直接来源主要有两个渠道:一是;二是。
2.统计的含义包括三个方面,它们是。
3.按照计量层次分类,统计数据可以分为:。
4.按照时间状况分类,统计数据可以分为:。
5.按照收集方法分类,统计数据可以分为:。
6.8、9、12、7、11、13、9、11、8、10以上10个数据的平均数是,中位数是,方差是。
7.在大样本的检验方法中,当总体方差2σ未知时,可以用样本方差2s 来近似代替总体方差,此时总体均值检验的统计量为:。
8.判定系数2R =(请用SSR SSE SST 、、表示)。
9.一般将时间序列的构成要素分成四种,即。
10.已知11p q 为报告期的销售额,10/p p 是对个体的价格指数,则价格指数的加权平均调和形式的计算公式为:。
二、单项选择1.下列数据属于品质数据的是()A.顺序数据B.截面数据C.观测数据D.实验数据 2.对一批小麦种子进行发芽率试验,这时总体是() A 该批小麦种子 B 该批小麦的发芽率 C 该批小麦中发芽的种子 D 该批小麦的发芽率3.已知均值为μ,方差为2σ的总体中,抽取容量为n 的随机样本,当n 充分大时,样本的均值和方差近似等于() A.2n nμσ B.2nμσ C. 2μσ D. 2nσμ4.下列散点图中表示非线性相关的图为( )A BC D5.在右侧检验中,利用P 值进行检验时,拒绝原假设的条件是( ) A. P α>值 B. P β>值 C. P α<值 D. P β<值三、判断题1.分层抽样除了可以对总体进行估计外,还可以对各层的子总体进行估计。
2.平均指标反映了现象总体的规模和一般水平,但掩盖了总体各单位的差异情况,因此通过平均指标不能全面认识总体的特征。
()3.总体分布为非正态分布而样本均值可能为正态分布。
( )4.抽样误差由于事先可以进行控制或计算的,所以这类误差通常是可以消除的。
( )5.在单独求一组数据计算标准差时,公式下方虚线处应为1n -四、简答题1. 河南大学数学院为了增加学生们的学习积极性,推行了一套新的制度,通过一学期的试行,由最终的成绩决定是否继续执行。
第三章统计整理1、某生产车间20名工人日加工零件数(件)如下:30 26 42 41 36 44 40 37 43 35 31 36 49 42 32 25 30 46 29 34要求:根据以上资料分成如下几组:25-30,30-35,35-40,40-45,45-50,计算出各组的频数和频率,整理编制次数分布表。
解:40名工人加工零件数次数分配表为:第四章总量指标与相对指标4.1某空调厂2003年产量资料如表4—1所示。
的单位成本计划降低5.2%,实际降低6.4%。
试运用各类相对指标对该厂2003年的空调生产情况进行分析。
解:该厂空调总产量计划完成百分比为110%,其中窗式空调计划完成百分比为102.22%;柜式空调计划完成百分比为133.33%;空调生产单位成本计划完成百分比为98.73%。
2003年空调总产量66万台,其中窗式占69.70%,柜式占30.30%,窗式产量与柜式产量比为2.3:1;空调总产量与2002年相比增长了26.92%,其中窗式空调产量增长9.52%,柜式空调产量增长100%。
空调总产量已经达到国家重点企业产量的68.75%,其中窗式、柜式空调产量分别达到国家重点企业产量的69.7%与66.7%;资金利润率为18.02%.第5章 数据的分布特征的测度5.1 某百货公司6月份前6天的销售额数据(万元)如下: 276 297 257 252 238 310计算该百货公司这6天的日销售额的均值、中位数、众数、四分位数。
解:67.2716310238252257297276=+++++==∑nx x i(万元)排序:238 252 257 276 297 310不存在O U L M 25.300 Q 5.248Q 5.266===e M解:2000年甲种自行车的平均单位成本=210*0.4+230*0.45+250*0.15=225 (元/辆)5.3已知某集团下属各企业的生产资料如下:试计算该集团生产平均计划完成百分比 解:列表计算如下该集团生产平均计划完成百分比%57.103420435==∑∑=xm m X5.4 某电子产品某电子产品企业工人日产量资料如下表:试根据表中资料计算工人日产量的平均数、中位数和众数,并判断该分布数列的分布状64.84848660428001121332211===++++++=∑∑==ni ini iinnn f f xf f f f x f x f x f x x60=L 70=U 260=f1401=-f 1501=+f 10=i代入公式65.2173910)150260()140260(15026070)()(111=⨯-+---=⨯-+---=+-+i f f f f f f U M o651026020026607021=⨯--=⨯--=+∑i f S fU M mm e651026020026606021=⨯-+=⨯-+=-∑i f S fL M m m e5.5 一位投资者持有一种股票,2001-2004年的收益率分别为4.5%,2.1%,25.5%和1.9%。
第四章数据分布特征的测度教学目的与要求:统计平均指标是表明总体数量特征的一个重要指标,它是将总体各单位标志值的差异抽象化,反映总体各单位标志值的一般水平,揭示总体分布的集中趋势。
变异指标是反映总体各单位标志值的差异程度,揭示总体分布离中趋势的又一重要数量特征指标。
通过本章的学习,要求理解统计平均指标的意义和作用;掌握各种统计平均指标的特点、应用条件、应用范围和计算方法;理解变异指标的意义和作用;掌握各种变异指标的性质和计算方法;能运用变异指标衡量平均数代表性的大小。
教学重点与难点:重点为各种平均指标和变异指标的概念、特点、应用条件、应用范围和计算方法。
难点是不同条件下平均指标和变异指标的计算。
统计数据经过整理和显示后,对数据分布的形状和特征就可以有一个大致的了解。
为进一步掌握数据分布的特征和规律,进行更深入的分析,还需要找到反映数据分布特征的各个代表值。
对一组数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢和聚集的程度;二是分布的离散程度,反映各数据远离中心值的趋势;三是分布偏态和峰态,反映数据分布的形状。
这三个方面分别反映了数据分布特征的不同侧面。
第一节集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,它反映了一组数据中心点的位置所在。
测度集中趋势也就是寻找数据一般水平的代表值或中心值。
低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据。
因此,选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型和特点来确定。
一、分类数据:众数(M o)众数是指一组数据中出现次数最多的变量值。
•出现次数最多的变量值•不受极端值的影响•一组数据可能没有众数或有几个众数•主要用于分类数据,也可用于顺序数据和数值型数据从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。
综合1、统计的含义包括( )。
ACDA.统计资料B.统计指标C.统计工作D.统计学E.统计调查2、统计研究运用各种专门的方法,包括( )。
ABCDEA.大量观察法B.统计分组法C.综合指标法D.统计模型法E.统计推断法3、全国第5次人口普查中( )。
BCEA.全国人口数是统计总体?B.总体单位是每一个人C.全部男性人口数是统计指标D.人口性别比是总体的品质标志E.人的年龄是变量4、下列各项中,属于连续变量的有( )。
ACDA.基本建设投资额B.岛屿个数C.国民生产总值中3次产业比例D.居民生活费用价格指数E.就业人口数5、下列指标中,属于数量指标的有( )。
ACA.国民生产总值B.人口密度C.全国人口数D.投资效果系数E.工程成本降低率6、下列标志中,属于品质标志的有( )。
BEA.工资B. 所有制C.旷课次数D.耕地面积E.产品质量7、下列各项中,哪些属于统计指标?( )ACDEA.我国2005年国民生产总值B.某同学该学期平均成绩C.某地区出生人口总数D.某企业全部工人生产某种产品的人均产量E.某市工业劳动生产率8、统计指标的表现形式有( )。
BCEA.比重指标B.总量指标C.相对指标D.人均指标E.平均指标9、总体、总体单位、标志、指标间的相互关系表现为( )。
ABCDA.没有总体单位也就没有总体,总体单位也不能离开总体而存在B.总体单位是标志的承担者C.统计指标的数值来源于标志D.指标是说明总体特征的,标志是说明总体单位特征的E.指标和标志都能用数值表示10、国家统计系统的功能或统计的职能有( )。
ABCDA.收集信息职能B.提供咨询职能C.实施监督职能D.支持决策职能E.组织协调职能统计数据的收集1、普查是一种( )。
BCDA.非全面调查B.专门调查C.全面调查D.一次性调查E.经常性调查2、某地对集市贸易个体户的偷漏税情况进行调查,1月5日抽选5%样本检查,5月1日抽选10%样本检查,这种调查是( )。
《生物统计学》教学大纲课程名称:生物统计学课程编号:H09026英文名称:Biostatistics 课程属性:必修课学时:48 学分:3.0先修课程:高等数学、线性代数、概率论与数理统计、普通生物学等课程适用专业:生物技术、生物科学等本科专业一、课程简介统计学是论述收集、分析并解释数字信息的科学,生物统计学则是一门运用统计学的原理和方法,研究生物学数据资料的交叉学科。
统计方法是现代生物学研究不可缺少的工具,而且在新兴的分子生物学研究中也发挥着重要作用。
正确的统计分析能够帮助我们正确认识事物客观存在的规律性。
本课程教学的全过程可以看成是一个生物信息搜集、处理、分析,从而提炼新的生物信息的过程。
教学重点是通过生物现象的数量观察、对比、归纳和分析,揭示那些困惑费解的生物学问题,从偶然性的剖析中,发现事物的必然性,指导生物科学的理论和实践。
二、课程内容及学时分配第一单元:绪论(建议学时数:2学时)【学习目的和要求】1.知识掌握:理解什么是统计,什么是统计学,什么生物统计学。
2.能力培养:学会用统计的方法来看待生物学问题。
3.教学方法:举例讲授。
………………………【重点】统计工作、统计数据及统计学以及它们间的关系。
【难点】描述统计与推断统计的区别,应用的场合。
第二单元:统计数据的收集与整理(建议学时数:4学时)【学习目的和要求】1.知识掌握:1.1 数据收集和预处理:几个常用的统计术语、数据收集和预处理1.2 数据整理和显示:数据的整理、数据的显示1.3 数据分布特征的测度:集中趋势的测度、离散程度的测度、偏态和峭度的测度2.能力培养:了解数据收集及预处理的内容和方法。
掌握不同类型分布图的制作及应用;掌握集中趋势、离散趋势及分布形状的统计特征数计算及应用。
3.教学方法:举例讲授。
………………………【重点】集中趋势、离散趋势及分布形状的统计数计算。
【难点】数据的计量尺度,集中趋势、离散趋势及分布形状的统计特征数应用。
第四章思考与习题一、思考题1.什么是集中趋势?测度集中趋势常用指标有哪些?2.算术均值.众数和中位数有何关系?3.什么是几何平均数?其适用场合是什么?4.什么叫离散趋势?测度离散趋势常用指标有哪些?5.为什么要计算离散系数?二、练习题(一)填空题1.统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的__________,反映所有数据向其中心值靠拢或聚集的程度;二是分布的__________,反映各数据远离其中心值的趋势;三是分布的__________,反映数据分布的形状。
2.在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080.750.1080.850.960.2000.1050.1080.760.1080.950.1080.660,则其众数为,中位数为。
3.算术均值有两个重要数学性质:各变量值与其算术均值的__________等于零;各变量值与其算术均值的__________等于最小值。
4.简单算术均值是__________的特例。
4.几何均值主要用于计算__________的平均。
5.在一组数据分布中,当算术均值大于中位数大于众数时属于________分布;当算术均值小于中位数小于众数时属于________分布。
6.__________是各变量值与其均值离差平方的平均数,是测度数值型数据__________最主要的方法。
7.为了比较人数不等的两个班级学生的学习成绩的优劣,需要计算__________;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算________。
8.偏态是对数据分布__________或__________的测度;而峰度是对数据分布_________的测度。
(二)判断题1.众数的大小只取决于众数组与相邻组次数的多少。
()2.当总体单位数n为奇数时,中位数=(n+1)/2。
()3.根据组距分组数据计算的均值是一个近似值。
()4.若已知甲企业工资的标准差小于乙企业,则可断言:甲企业平均工资的代表性好于乙企业。
第四章数据分布特征的测度一、选择题1.一组数据中出现频数最多的变量值称为()。
A.众数B.中位数C.四分位数D.均值2.下列关于众数的叙述,不正确的是()。
A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不受极端值的影响3.一组数据排序后处于中间位置上的变量值称为()。
A.众数B.中位数C.四分位数D.均值4.一组数据排序后处于25%和75%位置上的值称为()。
A.众数 B.中位数C.四分位数D.均值5.非众数组的频数占总额数的比率称为()。
A.异众比率B.离散系数C.平均差D.标准差6.如果一个数据的标准分数是-2,表明该数据()。
A.比平均数高出2个标准差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差7.比较两组数据的离散程度最适合的统计量是()。
A.极差B.平均差C.标准差D.离散系数8.偏度系数测度了数据分布的非对称性程度。
如果一组数据的分布是对称的,则偏度系数()。
A.等于0 B.等于1 C.大于0 D.大于1 9.某专家小组成员的年龄分别为29,45,35,43,45,58,他们的年龄中位数为()。
A.45 B.40 C.44 D.3910.某居民小区准备建一个娱乐活动场所,为此,随机抽取了80户居民进行调查,其中表示赞成的有59户,表示中立的有12户,表示反对的有9户。
该组数据的中位数是()。
A.赞成B.59 C.中立D.1211.对于右偏分布,均值、中位数和众数之间的关系是()。
A .均值>中位数>众数B .中位数>均值>众数C .众数>中位数>均值D .众数>均值>中位数12.某班学生的大学英语平均成绩是70分,标准差是10分。
如果已知该班学生的考试分数为对称分布,可以判断成绩在60分~80分之间的学生大约占( )。
A .95%B .89%C .68%D .99%13.当一组数据中有一项为零时,不能计算( )。
广西工学院成人高等教育《统计学》课程学习指南主编:万欢甘平2010年1月《统计学》模拟试题 《统计学》模拟试题(一)(考试时间:120分钟;考试方式:开卷 )一、填空题(每空1分,共15分)1、 离散系数的作用主要用于比较_不同_总体或样本的离散程度,离散系数越大,说明均值的代表性_越差_;离散系数越小,说明均值的代表性_越好_。
2、 标志是用来说明__总体单位__的特征的,指标是用来说明__总体数量__特征的。
3、 统计总体具有的三个基本特征_同质性__、__大量性_和_差异性_。
4、 X~N(12、100),则EX=___12__,DX=_100_。
5、 抽样调查的优点包括科学性、经济性、__及时性_、__准确性_。
6、 代表性误差通常是__无法消除_,但可以计算和控制。
7、 均值的两个重要的数学性质是:各变量值与其均值的离差之和等于 0 ;各变量值与其均值的_离差平方之和_等于最小值。
二、选择题(每小题2分,共20分)1、在回归直线01Y X ββ∧=+中,回归系数1β表示( D )A 、当0x =时,y 的期望值B 、x 变动一个单位时y 的变动总额C 、y 变动一个单位时x 的平均变动量D 、x 变动一个单位时y 的平均变动量2、帕氏质量指数公式的同度量因素采用( D )A 、基期的质量指标B 、报告期的质量指标C 、基期的数量指标D 、报告期的数量指标3、若销售量增加,而销售额不变,则商品的销售价格指数( B )A 、增加B 、减少C 、不变D 、无法判断4、对某城市占成交额比重大的8个大型集市贸易市场的成交额进行调查,这种调查的组织方式是:( C )A、普查B、抽样调查C、重点调查D、典型调查5、离散程度的测度值愈大,则( A )A、反映变量值愈分散,均值代表性愈差B、反映变量值愈集中,均值代表性愈差C、反映变量值愈分散,均值代表性愈好D、反映变量值愈集中,均值代表性愈好6、权数对算术平均数的影响作用,实质上取决于:( A )A、各组单位数占总体单位数比重的大小B、各组标志值占总体标志值总量比重的大小C、标志值本身的大小D、标志值数量的多少7、用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(C )A、2倍B、3倍C、4倍D、5倍8、下列哪一个是品质标志( A )A、所有制B、收入水平C、考试分数D、年龄9、相关系数的取值范围是:( D )A、0≤r<1B、-1≤r<0C、-1<r<1D、-1≤r≤110、人均粮食消费量是一个( A )A、强度相对指标B、结构相对指标D、离散程度指标三、简答题(第1小题8分,第2小题7分,共15分)1、什么是标志和指标二者之间有何区别与联系(P12—P13)2、抽样组织形式有哪些试比较它们之间的关系。
《统计学》各章参考答案第一章导论一、选择题1.C2.A3.C4.C5.C6.B7.A8.D9.C 10.D 11.A 12.C 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 21.D 22. D23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 31.C 32.A 33.B第二章数据的收集一、选择题1.A2.B3.A4.D5.B6.C7.D8.D9.D 10.C 11.C 12.A 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 21.A 22.B 23.C 24.A 25.B 26.B 27.A 28.B 29.C 30.C (A)二、判断题1.∨2.∨3.×4. ∨5. ×6. ×7. ∨8. ×9. ×10. ×第三章数据整理与显示一、选择题CABCD CBBAB BACBD DDBC第四章数据分布特征的测度一、选择题1.A2.C3.B4.C5.D6.D7.A8.B9.A 10.B 11.A 12.D 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 27.D 28.A 29.D 30.C 31.C 32.D二、判断题1. ×2. ∨3. ×4. ×5. ×6. ×7. ∨8. ×9. × 10. ∨ 11. ∨ 12. ×四、计算题1. 11399073.8954ki ii kii x fx f=====∑∑甲11.96σ===甲73.89100%100% 6.18%11.96x σν=⨯=⨯=甲73.8100%100%7.43%9.93x σν=⨯=⨯=乙甲的代表性强2. 10.2510.966ki ii kii x fx f====∑∑0.250.056σ==0.250.056100%100% 5.834%0.966xσν=⨯=⨯= 1114.534ki ii kii x fx f====∑∑10.1295σ==10.1295100%100% 2.857%4.534xσν=⨯=⨯=该教练的说法不成立。
第三章+数据分布特征的描述(教案)第三章数据分布特征的描述(一)教学目的通过本章的自学,并使同学们正确理解各种指标的概念及计算方法,学会运用适当的统计数据指标对数据的原产特征展开分析表明。
(二)基本要求并使学生熟练掌握数据分布特征的叙述方法。
(三)教学要点1、集中趋势的测度指标及其计算方法;2、离散趋势的测度指标及其计算方法;3、总体分布的偏度与峰度的测度。
(四)教学时数9――10课时(五)学习内容本章共分三节:第一节数据分布分散趋势的测量一、定类数据集中趋势的测度――众数(mode)(一)概念要点众数就是指一组数据中发生次数最少的变量值,用mo表示。
从变量分布的角度看,众数就是具备显著分散趋势点的数值,一组数据分布的最高峰点所对应的数值即为为众数。
当然,如果数据的原产没显著的分散趋势或最高峰点,众数也可以不存有;如果存有多个高峰点,也就存有多个众数。
1.集中趋势的测度值之一2.出现次数最多的变量值3.不受极端值的影响4.可能将没众数或存有几个众数5.主要用于定类数据,也可用于定序数据和数值型数据众数的不唯一性:并无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242(二)众数的排序根据未分组数据或单变量值分组数据计算众数时,我们只需找出出现次数最多的变量值即为众数。
对于组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这种关系可作如下的理解:设众数组的频数为fm,众数前一组的频数为f?1,众数后一组的频数为f?1。
当众数相连两组的频数成正比时,即f?1=f?1,众数组的组中值即为众数;当众数组的前一组的频数多于众数组后一组的频数时,即f?1>f?1,则众数可以向其前一组依靠,众数大于其组中值;当众数组后一组的频数多于众数组前一组的频数时,即f?1<f?1,则众数可以向其后一组依靠,1众数大于其组中值。
基于这种思路,借助几何图形而求出的分组数据众数的计算公式如下:下限公式:mo?l?下限公式:fm?f?1??d?l?1?d(fm?f?1)?(fm?f?1)?1??2(3.1)fm?f?1??d?u?2?d(fm?f?1)?(fm?f?1)?1??2(3.2)mo?u?式中:l表示众数所在组的下限;u表示众数所在组的上限;d表示众数所在组的组距。
统计学概论一、课程说明课程编号:046102课程性质:专业必修课适用专业:财经类统计学专业、管理类专业开设。
开课学期:一般可在第二学期开设。
学时与学分:课堂学时:32学时;上机实验:16学时;3学分。
先修课程:高等数学、西方经济学等相关课程。
二、开课目的统计学概论课程是国家教育部确定的高等院校财经类专业11门核心课程之一,是一门认识客观现象总体数量关系和方法论科学。
统计学是基于数据,利用统计理论与方法从数据中得到有关信息的分析工具,可用于经济、管理等各个研究领域。
统计学概论是财经类统计学专业的专业必修课,管理类专业的专业选修课。
通过本课程的学习,学生可以学到运用统计数据研究经济管理问题的实证分析技能,建立定性分析和定量分析相结合的研究思想;使学生能够比较系统地掌握统计学的基本理论、基本知识和基本方法,为进一步学习专业课及各分支学科打下基础。
通过本课程的学习,使学生明确统计的特点和作用,理解并记忆统计学的有关基本概念和范畴,掌握并能运用统计基本方法和技术,能进行统计设计,统计调查、统计整理和统计分析、以提高科学研究和实际工作能力。
设置本课程的总体目标是:1.使学生系统地掌握各种统计方法,并理解各种统计方法中所包含的统计思想。
2.使学生掌握各种统计方法的不同特点、应用条件及适用场合。
3.为进一步学习专业课程打好基础。
4.培养学生具有搜集数据、整理数据,运用统计分析方法,解决实际问题的能力。
使学生能够利用统计理论与方法解决经济管理及日常生活学习中的实际问题。
第三节指数体系一、总量指数与指数体系总量指数与各因素指数的关系。
指数体系的构成。
二、指数体系的分析与应用加权综合指数体系及其应用。
简单介绍加权平均指数体系及应用、平均指标指数体系及应用。
第四节几种常用的价格指数实际中常见的几种指数,如零售价格指数、消费价格指数、生产价格指数、股票价格指数等。
六、教学学时分配统计学概论教学环节与学时分配表七、推荐教材与参考书目(一)建议教材1.向蓉美、王青花主编的《统计学导论》(第二版)西南财经大学出版社出版,2008 年11月第1次印刷2.贾俊平编著的《统计学》(第二版),中国人民大学出版社出版,2006年9月第一次印(二)总参考书目1.曾五一、肖红叶主编,《统计学导论》,科学出版社2006年版。
统计学
第一节总体分布集中趋势的测度
总体分布集中趋势是指总体中各单位的次数分布从两边向中间集中(靠拢)的趋势。
在分布数列中,越靠近中心值,标志值出现的次数越多,而远离中心值的次数较少。
由于对大多数统计总体来说,其总体单位的数值分布是以平均数为中心的,因此平均数反映了总体分布的集中趋势。
所以,对集中趋势进行测度,就是寻找总体一般水平的中心值或代表值,就是计算总体的平均数(平均指标)。
一、平均指标的概念和作用
㈠概念:平均指标是指在同质总体将各单位的数量差异抽象化,反映总体一般水平的代表值。
㈡特点
⒈将数量差异抽象化;
⒉必须具有同质性;
⒊反映总体变量值的集中趋势。
㈢作用:
⒈可用于同类现象在不同空间的比;
⒉可用于同类现象在不同时间的比。
式中,m 代表各组标志总量,其余符号与前相同。
例: 某食堂购进某种蔬菜,相关资料如下,求这种蔬菜的平均价格。
4-13 某种蔬菜价格资料及其计算表
早午晚
价格(元/千克)
购买金额(元)
购买量(千克)
x
m
m x
1.00 1.20 1.10
10.0 15.0 20.0 10.0 12.5 18.2 合计
-
45.0
40.7
根据上表计算食堂购进这种蔬菜的平均价格为:
10.015.020.045.0 1.106
/40.740.7m H m x
++=
===∑∑(元千克)
通过上例计算,可以看出,加权平均数实质上是加权算术平均数的一种变形式。
其变换形式如下:
m xf xf H m xf
f
x x =
==∑∑∑∑∑∑
3.几何平均数 (1)概念
几何平均数是n 个比率乘积的n 次方根。
(2)几何平均数的计算
社会经济统计中,几何平均法适用于计算平均比率和平均速度。
简单几何平均数的计算公式为:
n
21x x x G ⋅⋅⋅=Λ
G表示几何平均数;x 表示变量值;n 表示变量值个数。
加权几何平均数的计算公式为
n 21n
21f f f f n
f
2f 1x x x G +++⋅⋅⋅=ΛΛ
关于几何平均数的具体计算及应用将在第七章发展速度部分讲述。
(二)位置平均数的计算 1.众数 (1)概念
众数是总体中出现次数最多的标志值。
用字母M 表示。
(2)计算
根据变量数列的不同种类, 确定众数可采用不同的方法。
单项式数列确定众数 组距数列确定众数 下限公式
d
L M 211
o ⋅∆+∆∆+
=
上限公式
d U M 2
12
o ⋅∆+∆∆-
=
Mo: 表示次数;L:表示众数所在组的下限;U:表示众数所在组的上限;△1: 表示众数所在组次数与前一组次数之差;△2: 表示众数所在组次数与后一组次数之差;d: 表示众数所在组的组距。
2.中位数 (1)概念
中位数是将总体各单位的标志值按大小顺序排列,处于数列中点位置的标志值为中位数。
中位数将数列分为相等的两部分,一部分的标志值小于中位数,另一部分的标志值大于中位数。
在许多情况下,不易计算平均值时,可用中位数代表总体的一般水平。
例如,人口年龄中位数,可表示人口总体年龄的一般水平。
(2)计算
由未分组资料确定中位数
根据未分组资料确定中位数时,首先将标志值按大小顺序排列,然后根据公式(n +1)/2确定中位数的位置,再根据中位数的位置找出对应的标志值。
单项式分组资料确定中位数
直接可用公式2f
∑确定中位数的位次,再根据位次用较小累计次数或较大累计次数的方法将次累计次数刚超过中位数位次的组确定为中位数组,该组的标志值即为中位数。
组距分组资料确定中位数。
组距资料确定中位数与单项式资料不同的是需要采用公式计算。
下限公式:
d
f S 2
f
L M m
1m e --+=∑
上限公式:
d
f S 2
f
U M m
1m e +--=∑
式中:L: 表示中位数组的下限,U 表示中位数组的上限,fm: 表示中位数组的次
数,Sm-1 表示中位数所在组以前各组的累计次数,Sm+1 表示中位数所在组以后各组的累计次数,∑f: 表示总次数,d: 表示中位数所在组的组距。
第二节 总体分布离散程度的测度 一、标志变动指标概念
标志变动度就是说明总体单位标志值的差异大小和程度的指标。
在统计研究中,一方面要计算平均数,用以反映总体各单位标志值的一般水平,另一方面也要测定标志变动度,用以反映总体各单位标志值的差异程度。
同时,平均数的代表性还必须用标志变动度指标来测量,标志变动度大,平均数的代表性就小,相反,标志变动度小,平均数的代表性就大,如果标志变动度等于零,则说明平均数具有完全的代表性。
所以,为了全面准确地反映出总体特征,在计算了平均数之后,还要进一步计算标志变动指标,以便对平均数作出补充说明。
∑
=
N
i
i
i
f
f
1把原点移到算术平均数处,以
)
(X
-
i
X的各次方为力臂的距离,以为各作用力的大小,则构成统计的k阶中心矩,即:
∑
∑
=
=
-
=
N
i
i
N
i
i
k
i
f
f
X
X
u
1
1
1
)
(
集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,还需要掌握数据分布的形状是否对称、偏斜的程度以及扁平程度等。
反映这些分布特征的测度值有两个:(1)偏态;(2)峰度。
二、分布的偏态
(一)偏态的含义
偏态(Skewness)是对分布偏斜方向和程度的测度。
在客观实际生活中,一些现象变量的次数分配往往是非对称型的,如收入分配、市场占有份额、资源配置等等,这些变量经分组后,总体各单位在不同的分组变量值下分布并不
均匀对称,而呈现出偏斜的分布状况,统计上将其称为偏态分布。
(二)偏态的测度
利用众数、中位数和平均数之间的关系就可以判断分布是对称、左偏还是右偏。
显然,判断偏态的方向并不困难,但要测度偏斜的程度则需要计算偏态系数。
统计分析中测定偏态系数的方法很多,一般采用动差概念计算。
由公式可知:当算术平均数大于众数时,偏态系数为正值,属于正偏(右偏);当算术平均数小于众数时,偏态系数为负值,属于负偏(左偏)
经验:在分布适度偏斜的情况下,算术平均数与众数的距离约等于算术平均数和中位数之间距离的三倍,即有如下近似的等式关系:()
e M X M X -=-30 因此,偏态也可用算术平均数与中位数之间的关系来测定,即: ()
σ
e M X SK -=3 可知,偏态系数的变动围为33+≤≤-SK ,当SK=0时,表示对称分布;当SK=3时,表示极右偏态;当SK=-3时,表示极左偏态。
例题5.19 P124
(三)采用矩的概念测定分布偏态
偏态系数的计算公式为三阶中心矩与标准差的三次方之比:
()313133
σσα⋅-==∑∑==n i i i n i i f f X X v
当高于平均数的离差之和与低于平均数的离差之和相等时,全部离差之和等于0,分布为对称分布;当这两种离差之和不相等,经正、负相互抵消之后,结果便可显示出分布的偏斜程度。
一阶中心矩恒为0,而偶数阶离差不能正、负消减,惟独奇次阶的中心矩能满足正负离差和的比较,其中又以三阶中心矩为最简单。
从公式可以看到,当a=0 分布是对称的,
当a> 0 (为正值)时,为正偏或右偏;反之,a< 0 (为负值)时,为负偏或左偏。
偏态系数a 的数值一般在0与±3之间, a 越接近0,分布的偏斜度越小; 越接近±3,分布的偏斜度越大。
三、分布的峰度
在变量数列的分布特征中,常常以正态分布为标准,观察变量数列分布曲线顶峰的尖平程度,统计上称之为峰度测度。
如果分布的形状比正态分布更高更瘦,则称为尖峰分布,如果分布的形状比正态分布更矮更胖,则称为平峰分布。
峰度的测度。