数据统计学第四章测试答案
- 格式:pdf
- 大小:81.66 KB
- 文档页数:4
第四章一、单项选择题1。
由反映总体单位某一数量特征的标志值汇总得到的指标是()A。
总体单位总量 B.质量指标C。
总体标志总量 D。
相对指标2。
各部分所占比重之和等于1或100%的相对数( )A.比例相对数 B.比较相对数C.结构相对数D.动态相对数3。
某企业工人劳动生产率计划提高5%,实际提高了10%,则提高劳动生产率的计划完成程度为( )A.104。
76%B.95.45%C.200%D.4。
76%4.某企业计划规定产品成本比上年度降低10%实际产品成本比上年降低了14.5%,则产品成本计划完成程度( )A。
14。
5%B。
95% C.5%D.114.5%5.在一个特定总体内,下列说法正确的是( )A。
只存在一个单位总量,但可以同时存在多个标志总量B.可以存在多个单位总量,但必须只有一个标志总量C.只能存在一个单位总量和一个标志总量D。
可以存在多个单位总量和多个标志总量6。
计算平均指标的基本要求是所要计算的平均指标的总体单位应是()A。
大量的B.同质的 C。
有差异的 D。
不同总体的7。
几何平均数的计算适用于求()A。
平均速度和平均比率 B.平均增长水平C。
平均发展水平D。
序时平均数8.一组样本数据为3、3、1、5、13、12、11、9、7这组数据的中位数是( )A.3 B.13 C。
7。
1 D。
79。
某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是( )A。
方差 B。
极差 C.标准差 D。
变异系数10.用标准差比较分析两个同类总体平均指标的代表性大小时,其基本的前提条件是( )A.两个总体的标准差应相等 B。
两个总体的平均数应相等C。
两个总体的单位数应相等 D。
两个总体的离差之和应相等11.已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应采用( )A.简单算术平均数B.加权算术平均数C.加权调和平均数D.几何平均数12。
第四章一.思考题1、一组数据的分布特征可以从哪几个方面进行测度?答:可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、怎样理解平均数在统计学中的地位?答:平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。
从统计学思想上看,平均数是一组数据的重心所在,是数据误差相互抵消后的必然结果。
3、简述四分位数的计算方法。
答:四分位数是一组数据排序后处于25%和75%位子上的值。
四分位数是通过3个点将全部数据等分成4分,其中每部分包含25%的数据。
中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值和处在75%位置上的数值。
它是根据为分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数据就是四分位数。
4、对于比率数据的平均数为什么采用几何平均?答:几何平均数是适用于特殊数据的一种平均数,主要适用于计算平均比率。
当所掌握的变量值本身是比率的形式时,采用几何平均法计算平均比率更为合理。
5、简述众数、中位数、平均数的特点和应用场合。
答:众数是数据中出现次数次数最多的变量值。
主要应用于分类数据。
中位数是一组数据排序后处于中间位置的变量值,其适用于顺序数据。
平均数也称均值,它是一组数据相加后除以数据个数的结果,是集中去世的主要测量值,它适用于数值型数据。
6、简述异众比率、四分位差、方差、标准差的使用场合。
答:异众比率主要适合测度分类数据的离散程度,对于顺序数据以及数值型数据也可以计算异众比率。
四分位差主要用于测度顺序数据的离散程度。
方差和标准差适用于测度数值型数据的离散程度。
7、标准分数有哪些用途?答:首先是比较不同单位和不同质数据的位置。
其次是和正态分布结合起来,求得概率和标准分值之间的对应关系。
还有就是在假设检验和估计中应用。
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数.(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing0Mean9.60Median10.00Mode10Std. Deviation4。
169Percentiles256。
255010.0075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18。
75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0。
75×2=26.5。
(3)计算平均数和标准差;Mean=24。
00;Std。
Deviation=6。
652(4)计算偏态系数和峰态系数:Skewness=1。
080;Kurtosis=0。
773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 — 最小值)÷ 组数=(41-15)÷6=4。
3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客.得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。
《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。
将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数.(3)计算销售量的标准差.(4)说明汽车销售量分布的特征。
解:Statistics10Missing0Mean9.60Median10.00Mode10Std。
Deviation4。
169Percentiles25 6.255010.0075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数.Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18。
75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0。
75×2=26。
5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1。
080;Kurtosis=0。
773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 — 最小值)÷ 组数=(41—15)÷6=4。
3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待.为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客.得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟.第二种排队方式的等待时间(单位:分钟)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8要求:(1)画出第二种排队方式等待时间的茎叶图。
第4章练习题1、一组数据中出现频数最多的变量值称为(A)A.众数B.中位数C.四分位数D.平均数2、下列关于众数的叙述,不正确的是(C)A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不受极端值的影响3、一组数据排序后处于中间位置上的变量值称为(B)A.众数B.中位数C.四分位数D.平均数4、一组数据排序后处于25%和75%位置上的值称为(C)A.众数B.中位数C.四分位数D.平均数5、非众数组的频数占总频数的比例称为(A)A.异众比率B.离散系数C.平均差D.标准差6、四分位差是(A)A.上四分位数减下四分位数的结果B.下四分位数减上四分位数的结果C.下四分位数加上四分位数D.下四分位数与上四分位数的中间值7、一组数据的最大值与最小值之差称为(C)A.平均差B.标准差C.极差D.四分位差8、各变量值与其平均数离差平方的平均数称为(C)A.极差B.平均差C.方差D.标准差9、变量值与其平均数的离差除以标准差后的值称为(A)A.标准分数B.离散系数C.方差D.标准差10、如果一个数据的标准分数-2,表明该数据(B)A.比平均数高出2个标准差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差11、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有(B)A.68%的数据B.95%的数据C.99%的数据D.100%的数据12、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是(C)A.至少有75%的数据落在平均数加减4个标准差的范围之内B. 至少有89%的数据落在平均数加减4个标准差的范围之内C. 至少有94%的数据落在平均数加减4个标准差的范围之内D. 至少有99%的数据落在平均数加减4个标准差的范围之内13、离散系数的主要用途是(C)A.反映一组数据的离散程度B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平14、比较两组数据离散程度最适合的统计量是(D)A.极差B.平均差C.标准差D.离散系数15、偏态系数测度了数据分布的非对称性程度。
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing0Mean9.60Median10.00Mode10Std. Deviation 4.169Percentiles25 6.255010.0075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。
应用统计学(答案)第四章P834.19解:依题意提出假设:01:82;:82.μμ≥<H H 由Excel 中的ZTEST 函数得到的检验P 值为:()011:32,820.00850.01,拒绝α=-=<=P ZTESE A A H , 该城市空气中悬浮颗粒的平均值显著低于过去的平均值。
4.20解:依题意提出假设:01:=25;:25.H H μμ≠ 由于是小样本,采取t 检验。
计算得到的统计量为: 1.036905t =.由Excel 中的TDIST 函数得到的检验p 值为:()1.039905,19,20.3114370.05,α==>=P TDIST 0H 不拒绝, 没有证据表明该企业生产的金属板不符合要求。
4.21解:依题意提出假设:01:17;:17.%%ππ≤>H H 检验统计量为:()0,1 2.440.0070.05,拒绝H α=-=<=P NORMSDIST该生产商的说法是属实的。
4.23解:依题意提出假设:012112:-=0;:0.H H μμμμ-≠(1)用Excel 【数据分析】工具中的【t-检验:双样本等方差假设】进行检验,结果为:t-检验:双样本等方差假设2.44z ===(2)用Excel 【数据分析】工具中的【t-检验:双样本异方差假设】进行检验,结果为:t-检验:双样本异方差假设由于“()=t 双尾<P T ”小于0=0.05H α,拒绝,表明两种方法的培训效果有显著差异。
4.24解:依题意提出假设:2222012112:=1: 1.H H σσσσ≠,利用Excel 【数据分析】工具中的【F-检验:双样本方差分析】进行检验得到的结果为:F-检验:双样本方差分析由于“()=f 单尾<P F ”小于0=0.025H α,拒绝,表明两部机器生产的袋装茶重量的方差存在显著差异。
4.25解:(1)依题意提出假设:012112:-0;:0.μμμμ≤->H H用Excel 【数据分析】工具中的【t-检验:双样本等方差假设】进行检验,结果为: t-检验:双样本异方差假设由于“()=t 单尾<P T ”小于0=0.025H α,拒绝,表明新肥料获得的平均产量显著地高于旧废料。
第4章练习题1、一组数据中出现频数最多的变量值称为()A.众数B.中位数C.四分位数D.平均数2、下列关于众数的叙述,不正确的是()A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不受极端值的影响3、一组数据排序后处于中间位置上的变量值称为()A.众数B.中位数C.四分位数D.平均数4、一组数据排序后处于25%和75%位置上的值称为()A.众数B.中位数C.四分位数D.平均数5、非众数组的频数占总频数的比例称为()A.异众比率B.离散系数C.平均差D.标准差6、四分位差是()A.上四分位数减下四分位数的结果B.下四分位数减上四分位数的结果C.下四分位数加上四分位数D.下四分位数与上四分位数的中间值7、一组数据的最大值与最小值之差称为()A.平均差B.标准差C.极差D.四分位差8、各变量值与其平均数离差平方的平均数称为()A.极差B.平均差C.方差D.标准差9、变量值与其平均数的离差除以标准差后的值称为()A.标准分数B.离散系数C.方差D.标准差10、如果一个数据的标准分数-2,表明该数据()A.比平均数高出2个标准差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差11、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有()A.68%的数据B.95%的数据C.99%的数据D.100%的数据12、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是()A.至少有75%的数据落在平均数加减4个标准差的范围之内B. 至少有89%的数据落在平均数加减4个标准差的范围之内C. 至少有94%的数据落在平均数加减4个标准差的范围之内D. 至少有99%的数据落在平均数加减4个标准差的范围之内13、离散系数的主要用途是()A.反映一组数据的离散程度B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平14、比较两组数据离散程度最适合的统计量是()A.极差B.平均差C.标准差D.离散系数15、偏态系数测度了数据分布的非对称性程度。