统计学习题答案 4~9章
- 格式:ppt
- 大小:1.36 MB
- 文档页数:85
统计学习题_第四章_数据分布特征的描述习题答案第四章静态指标分析法(⼀)⼀、填空题1、数据分布集中趋势的测度值(指标)主要有、和。
其中和⽤于测度品质数据集中趋势的分布特征,⽤于测度数值型数据集中趋势的分布特征。
2、标准差是反映的最主要指标(测度值)。
3、⼏何平均数是计算和的⽐较适⽤的⼀种⽅法。
4、当两组数据的平均数不等时,要⽐较其数据的差异程度⼤⼩,需要计算。
5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。
6、当⼀组⼯⼈的⽉平均⼯资悬殊较⼤时,⽤他们⼯资的⽐其算术平均数更能代表全部⼯⼈⼯资的总体⽔平。
⼆.选择题单选题:1.反映的时间状况不同,总量指标可分为()A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某⼚1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同⼀变量数列中,当标志值(变量值)⽐较⼤的次数较多时,计算出来的平均数()A 接近标志值⼩的⼀⽅B 接近标志值⼤的⼀⽅C 接近次数少的⼀⽅D 接近哪⼀⽅⽆法判断4、在计算平均数时,权数的意义和作⽤是不变的,⽽权数的具体表现()A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某⼚甲车间⼯⼈的⽉平均⼯资为520元,⼄车间⼯⼈的⽉平均⼯资为540元,1999年各车间的⼯资⽔平不变,但甲车间的⼯⼈占全部⼯⼈的⽐重由原来的40%提⾼到了60%,则1999年两车间⼯⼈的总平均⼯资⽐1998年()A 提⾼D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越⼩,则()A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越⾼C 说明变量值越分散,平均数代表性越⾼D 说明变量值越集中,平均数代表性越低7、有甲、⼄两数列,已知甲数列:07.7,70==甲甲σX ;⼄数列:41.3,7==⼄⼄σX 根据以上资料可直接判断( )A 甲数列的平均数代表性⼤B ⼄数列的平均数代表性⼤C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百⼈⼿机拥有量为90部,这个指标是()A 、⽐例相对指标B 、⽐较相对指标C 、结构相对指标D 、强度相对指标9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为() A 、左偏分布 B 、右偏分布 C 、对称分布 D 、⽆法判断10、加权算术平均数的⼤⼩() A 主要受各组标志值⼤⼩的影响,与各组次数多少⽆关; B 主要受各组次数多少的影响,与各组标志值⼤⼩⽆关; C 既与各组标志值⼤⼩⽆关,也与各组次数多少⽆关; D 既与各组标志值⼤⼩有关,也受各组次数多少的影响11、已知⼀分配数列,最⼩组限为30元,最⼤组限为200元,不可能是平均数的为() A 、50元 B 、80元 C 、120元 D 、210元12、⽐较两个单位的资料,甲的标准差⼩于⼄的标准差,则()A 两个单位的平均数代表性相同B 甲单位平均数代表性⼤于⼄单位C ⼄单位平均数代表性⼤于甲单位D 不能确定哪个单位的平均数代表性⼤ 13、若单项数列的所有标志值都增加常数9,⽽次数都减少三分之⼀,则其算术平均数() A 、增加9 B 、增加6 C 、减少三分之⼀ D 、增加三分之⼆ 14、如果数据分布很不均匀,则应编制 ( )A 开⼝组B 闭⼝组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( )A 总体性B 全⾯性16、某企业的职⼯⼯资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为 ( )A1500元 B 1600元 C 1750元 D 2000元 17、统计分组的⾸要问题是 ( )A 选择分组变量和确定组限B 按品质标志分组C 运⽤多个标志进⾏分组,形成⼀个分组体系D 善于运⽤复合分组18、某连续变量数列,其末组为开⼝组,下限为200,⼜知其邻组的组中值为170,则末组组中值为 ( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是 ( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开⽀情况,最合适的调查⽅式是:() A 普查 B 抽样调查 C 典型调查 D 重点调查21、已知两个同类企业的职⼯平均⼯资的标准差分别为5元和6元,⽽平均⼯资分别为3000元,3500元则两企业的⼯资离散程度为 ( )A 甲⼤于⼄B ⼄⼤于甲C ⼀样的D ⽆法判断 22、加权算术平均数的⼤⼩取决于 ( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,⽽标志值仍然不变.那么算术平均数 ( ) A 不变 B 扩⼤到5倍 C 减少为原来的1/5D 不能预测其变化 24、计算平均⽐率最好⽤ ( )A 算术平均数B 调和平均数C ⼏何平均数D 中位数25、若两数列的标准差相等⽽平均数不同,在⽐较两数列的离散程度⼤⼩时,应采⽤ ( ) A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为 ( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布 B 正态分布 C 右偏分布 D U型分布28、⼀次⼩型出⼝商品洽谈会,所有⼚商的平均成交额的⽅差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁⽣产的基本情况,调查了上钢、鞍钢等⼗⼏个⼤型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。
第4章练习题1、一组数据中岀现频数最多的变量值称为()A. 众数B.中位数C.四分位数D.平均数2、下列关于众数的叙述,不正确的是()A. —组数据可能存在多个众数B.众数主要适用于分类数据C. 一组数据的众数是唯一的D. 众数不受极端值的影响3、一组数据排序后处于中间位置上的变量值称为()A.众数B.,中位数C.四分位数D.平均数4、一组数据排序后处于25%和75%位置上的值称为()A.众数B.中位数C.四分位数D.平均数5、非众数组的频数占总频数的比例称为()A.异众比率B.离散系数C.平均差D.标准差6、四分位差是()A. 上四分位数减下四分位数的结果|B. 下四分位数减上四分位数的结果C.下四分位数加上四分位数D. 下四分位数与上四分位数的中间值7、一组数据的最大值与最小值之差称为()A.平均差B.标准差C.极差D.四分位差8、各变量值与其平均数离差平方的平均数称为()A.极差B. 平均差C.,方差D.标准差9、变量值与其平均数的离差除以标准差后的值称为()A.标准分数B.离散系数C.方差D.标准差10、如果一个数据的标准分数-2,表明该数据()A.比平均数高出2个标准差B. ■比平均数低2个标准差C.等于2倍的平均数D. 等于2倍的标准差11、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有()A.68%的数据B.95% 的数据C.99% 的数据D.100%勺数据12、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是()A. 至少有75%勺数据落在平均数加减4个标准差的范围之内B. 至少有89%的数据落在平均数加减4个标准差的范围之内C. 至少有94%的数据落在平均数加减4个标准差的范围之内D. 至少有99%的数据落在平均数加减4个标准差的范围之内13、离散系数的主要用途是()A.反映一组数据的离散程度B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平14、比较两组数据离散程度最适合的统计量是()A.极差B.平均差C.标准差D.离散系数15、偏态系数测度了数据分布的非对称性程度。
第四章一.思考题1、一组数据的分布特征可以从哪几个方面进行测度?答:可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、怎样理解平均数在统计学中的地位?答:平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。
从统计学思想上看,平均数是一组数据的重心所在,是数据误差相互抵消后的必然结果。
3、简述四分位数的计算方法。
答:四分位数是一组数据排序后处于25%和75%位子上的值。
四分位数是通过3个点将全部数据等分成4分,其中每部分包含25%的数据。
中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值和处在75%位置上的数值。
它是根据为分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数据就是四分位数。
4、对于比率数据的平均数为什么采用几何平均?答:几何平均数是适用于特殊数据的一种平均数,主要适用于计算平均比率。
当所掌握的变量值本身是比率的形式时,采用几何平均法计算平均比率更为合理。
5、简述众数、中位数、平均数的特点和应用场合。
答:众数是数据中出现次数次数最多的变量值。
主要应用于分类数据。
中位数是一组数据排序后处于中间位置的变量值,其适用于顺序数据。
平均数也称均值,它是一组数据相加后除以数据个数的结果,是集中去世的主要测量值,它适用于数值型数据。
6、简述异众比率、四分位差、方差、标准差的使用场合。
答:异众比率主要适合测度分类数据的离散程度,对于顺序数据以及数值型数据也可以计算异众比率。
四分位差主要用于测度顺序数据的离散程度。
方差和标准差适用于测度数值型数据的离散程度。
7、标准分数有哪些用途?答:首先是比较不同单位和不同质数据的位置。
其次是和正态分布结合起来,求得概率和标准分值之间的对应关系。
还有就是在假设检验和估计中应用。
第一章序论一、单项选择题1、社会经济统计是分析研究社会经济现象的_____。
A、质量方面B、数量方面C、质与量两个方面D、各个方面2、以下哪点不是统计总体的特征____。
A、社会性B、同质性C、大量性D、差异性答案:1是B;2是A3、社会经济统计的基本特点是_____。
A、数量性B、社会性C、抽象性D、总体的同质性4、以下哪个是组成总体的前提条件_____。
A、大量性B、同质性C、综合性D、广泛性答案:3是A;4是B5、抽查5个学生的考试成绩,考试成绩分别是75分、80分、85分、89分、93分。
这5个数字是____。
A、标志值B、标志C、变量D、指标答案:A6、在工业生产设备普查中,总体单位是_。
A、每个工业企业B、每台设备C、每台工业生产设备D、每台已安装设备7、在工业生产设备普查中,总体是___。
A、所有工业企业B、每个工业企业C、所有工业生产设备D、工业企业的每台设备答案:6是C;7是C8、下列哪个是连续变量___。
A、工厂数B、人数C、净产值D、设备数9、研究某市职工家庭收支情况时,统计总体应确定为____。
A、该市全体职工B、该市全部职工家庭C、该市每个职工家庭D、该市全部居民家庭答案:8是C;9是B10、下列标志属于品质标志的是____。
A、教师的教龄B、学生的成绩C、商品价格D、民族11、一个统计总体____。
A、只能有一个标志B、只能有一个指标C、可以有多个指标D、可以有多个标志答案:10是D;11是C12、以全国的石油工业企业为总体,则大庆石油工业总产值是:____。
A、品质标志B、数量标志C、数最指标D、质量指标13、要了解某市职工情况,统计指标是:____。
A、该市每个职工B、该市每个职工的工资C、该市全部职工D、该市职工的工资总额答案:12是B;13是D二、多项选择题1、统计的特点包括____。
A、数量性B、社会性C、可变性D、不变性E、综合性2、下列哪些是数量标志____。
《统计学概论》第四章课后练习题答案一、思考题1.相对指标有什么作用?P90-912.平均指标有什么作用?P963.为什么说算术平均是最基本平均指标计算方法?P974.强度相对数和平均指标有什么区别?强度相对指标与平均指标的区别主要表现在以下两点:(1)指标的含义不同。
强度相对指标说明的是某一现象在另一现象中发展的强度、密度或普遍程度;而平均指标说明的是现象发展的一般水平,计算方法不同。
(2)强度相对指标与平均指标,虽然都是两个有联系的总量指标之比,但是,强度相对指标分子与分母的联系,只表现为一种经济关系,而平均指标分子与分母的联系是一种内在的联系,即分子是分母(总体单位)所具有的标志,对比结果是对总体各单位某一标志值的平均。
5.时期指标和时点指标有什么区别?P876.为什么说总量指标是基础指标?P877.简述平均指标及其作用。
(2009.10)P96二、单项选择题1.某企业2006年产值比上年增加了150万元,这个指标是()。
A.时期指标B.时点指标C.相对指标D.平均指标2.2006年中国新增就业人数575万人,这个指标是()。
A.时期指标B.时点指标C.相对指标D.平均指标3.某地区2006年底常住人口为100万人,医疗机构500个,平均每个医疗结构可以服务2000人,这个指标是()。
A.平均指标B.强度相对指标C.比较相对指标D.比例相对指标4.研究2006年中国31省区直辖市经济发展情况,江苏省GDP为21645.8亿元,浙江省GDP为15742.51亿元,江苏省GDP与浙江省GDP相比为1:0.73,这个指标是()。
A.比较相对数B.强度相对数C.比例相对数D.结构相对数5.2006年浙江省人均GDP 为31874元/人,全国总的人均GDP 为16084元/人,浙江省是全国的1.98倍,这个指标是( )。
P 94A .比较相对数B .强度相对数C .比例相对数D .结构相对数【解析】全国人均GDP 和浙江省人均GDP 是不同空间下的同类指标数值,不是总体全部数值和总体部分数值的关系,因而“浙江省GDP/全国GDP”是一个比较相对数。
第四章统计数据的概括性度量4. 1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15要求:(1) 计算汽车销售量的众数、中位数和平均数。
(2) 根据定义公式计算四分位数。
(3) 计算销售量的标准差。
(4) 说明汽车销售量分布的特征。
解:汽车销售数量StatisticsNValid 10Missing0 Mean9.60Median10.00Mode10Std. Deviation4.169 Percentiles25 6.255010.007512.504. 2随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23要求;(1) 计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:LI2.557.5 10汽车销售数量12.5 15Mean =9.6Std. Dev. =4.169N =10Histogram32网络用尸的年龄FrequencyPercent Cumulative FrequencyCumulative PercentValid15 14.0 14.016 1 4.0 2 8.0 17 1 4.0 3 12.0 18 1 4.0 4 16.0 19 3 12.0 7 28.0 20 2 8.0 9 36.0 21 1 4.0 10 40.0 22 2 8.0 12 48.0 233 12.0 15 60.0 24 2 8.0 17 68.0 25 1 4.0 18 72.0 27 1 4.0 19 76.0 29 1 4.0 20 80.0 30 1 4.0 21 84.0 31 1 4.0 22 88.0 34 1 4.0 23 92.0 38 1 4.0 24 96.0 41 1 4.0 25100.0Total25100.0从频数看出,众数 Mo 有两个:19、23;从累计频数看,中位数 Me=23。
第九章相关与回归一.判断题部分题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。
()答案:×题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。
()答案:√题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。
()答案:×题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。
()答案:×题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。
()答案:×题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。
()答案:√题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。
()答案:×题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。
()答案:×题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。
()答案:√题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。
()答案:×题目11:完全相关即是函数关系,其相关系数为±1。
()答案:√题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。
()答案×二.单项选择题部分题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A.相关关系B.函数关系C.回归关系D.随机关系答案:B题目2:现象之间的相互关系可以归纳为两种类型,即()。
A.相关关系和函数关系B.相关关系和因果关系第 3 页共27页C.相关关系和随机关系D.函数关系和因果关系答案:A题目3:在相关分析中,要求相关的两变量()。
A.都是随机的B.都不是随机变量C.因变量是随机变量D.自变量是随机变量答案:A题目4:测定变量之间相关密切程度的指标是()。
统计学知识点与复习题(特别说明:考试不出名词解释等类型题目,但需要学生掌握,总结辅导不可或缺,另有章节练习题单独给出,这里列示的是为了巩固各章知识点内容,为了加深学生的复习和掌握,除计算题外,有的题目未附答案,各位老师辅导时注意)考试题型:填空、单选、多选、判断、计算第一章绪论练习题一、填空题1.统计一词从不同角度理解有三种涵义,即统计工作、统计资料和统计学。
2.社会经济统计的研究对象是社会经济现象的数量方面。
3.统计总体具有的特点是大量性、同质性和差异性。
4.标志是说明总体单位特征的,可以分为品质标志和数量标志。
5.统计指标是说明总体特征的,其构成要素有6个,分别为指标名称、数值、计量单位、计算方法、时间范围、空间范围。
6.职工的文化程度是品质标志,工龄是数量标志。
7.企业的机器台数和职工人数是属于离散变量,而固定资产原值和销售收入是连续变量。
8.要了解我国乳品企业的生产情况,总体是所有乳品企业,总体单位是每一个乳品企业。
9.要了解我国乳品企业的设备状况,总体是所有乳品企业,总体单位是每一个乳品企业。
10.学生的性别、民族属于品质标志,而学生的身高、体重是数量标志。
11.统计指标的概念完整表述为:“说明社会经济现象总体的数量特征的概念和具体数值”。
12.按统计指标的性质不同,统计指标可分为数量指标和质量指标。
二、判断题1.随着研究目的的不同,总体与总体单位之间是可以变换的,指标与标志也是可以变换的。
(T )2.张明同学期末数学成绩85分,这是统计指标。
(F )3.总体单位的特征用指标来说明,总体的特征用标志来说明。
(F )4.标志可以用文字表现,也可以用数字表现。
(T )5.指标可以用文字表现,也可以用数字表现。
(F )6.指标值是由标志值汇总计算而得到。
(T )7.在全国人口普查中,“年龄”是变量。
(T )8.某班学生学习情况调查中,班级名称和学生姓名都是可变标志。
(F )9.张明同学期末数学成绩85分,“成绩”是连续变量,“85分”是变量值。
第9章 时间序列分析——练习题●1. 某汽车制造厂2003年产量为30万辆。
(1)若规定2004—2006年年递增率不低于6%,其后年递增率不低于5%,2008年该厂汽车产量将达到多少?(2)若规定2013年汽车产量在2003年的基础上翻一番,而2004年的增长速度可望达到7.8%,问以后9年应以怎样的速度增长才能达到预定目标?(3)若规定2013年汽车产量在2003年的基础上翻一番,并要求每年保持7.4%的增长速度,问能提前多少时间达到预定目标?解:设i 年的环比发展水平为x i ,则由已知得:x 2003=30, (1)又知:320042005200620032004200516%x x x x x x ≥+(),2200720082006200715%x x x x ≥+(),求x 2008由上得32200820072008200320032007(16%)(15%)x x x x x x =≥++ 即为3220081.061.0530x ≥,从而2008年该厂汽车产量将达到 得 x 2008≥30× 31.06×21.05= 30×1.3131 = 39.393(万辆) 从而按假定计算,2008年该厂汽车产量将达到39.393万辆以上。
(2)规定201320032x x =,20042003x x =1+7.8%由上得=107.11%==可知,2004年以后9年应以7.11%的速度增长,才能达到2013年汽车产量在2003年的基础上翻一番的目标。
(3)设:按每年7.4%的增长速度n 年可翻一番, 则有 201320031.0742na a == 所以 1.074log 20.30103log 29.70939log1.0740.031004n ====(年)可知,按每年保持7.4%的增长速度,约9.71年汽车产量可达到在2003年基础上翻一番的预定目标。
原规定翻一番的时间从2003年到2013年为10年,故按每年保持7.4%的增长速度,能提前0.29年即3个月另14天达到翻一番的预定目标。