统计学答案第九章
- 格式:doc
- 大小:31.50 KB
- 文档页数:3
第9章习题参考答案
9.1
解:(1)长度Y(厘米)与重量X(克)之间的散点图如下所示:
由Y与X的散点图可以大致推测长度Y关于重量X是线性相关,且二者呈正相关关系。
(2)首先,先分别求出平均重量和平均长度:
;;
其次,计算回归参数,其计算表如下:
表1:回归方程参数的计算表
(X-(Y-
最后,根据公式(9.6)计算相应的回归参数:
;
所以,Y关于X的一元线性回归方程为:
9.5
解:总变差,回归平方和,残差平方和的计算如下:
表2:总变差,回归平方和,残差平方和的计算表
∴残差平方和:;
回归平方和:
9.6
解:由表2得:
判定系数
又∵习题9.1的散点图显示Y与X是呈正相关关系
∴相关系数
显著性检验:
(1)回归方程的显著性检验:
原假设H0:该回归方程不显著;备择假设H1:该回归方程显著
计算F统计量:
∵在α=0.05的显著性水平下,有4454.79>F0.05(1,4)=7.71
∴拒绝原假设,认为该回归方程式显著的。
(2)回归参数的假设检验:
原假设H0:备择假设H1:
计算t统计量:;
[其中] ∵在α=0.05的显著性水平下,有15.98>t0.05(4)=2.776
∴拒绝原假设,即认为自变量X对因变量Y有显著性影响。
(3)相关关系的显著性检验:
原假设H0:ρ=0;备择假设H1:ρ
计算t统计量:;
∵在α=0.05的显著性水平下,有66.64> t0.05(4)=2.776
∴拒绝原假设,认为总体相关系数不为0。
第九章统计综合评价习题答案一、名词解释用规范性的语言解释统计学中的名词。
1.统计综合评价:是根据分析研究的目的,依据已有的资料,运用统计方法,综合事物所处的具体环境,对现象总体的规模大小、水平高低、速度快慢、质量优劣等方面做出量的判断。
2. 功效系数法:是对多目标规划原理中的功效系数加以改进,经计算得到综合判断的分数。
3.德尔菲法:是借助专家的经验与主观判断的结果来确定各指标的权数,并在不断的反馈和修改中逐步得到比较满意的结果。
4. 指标比较法:是将相邻两个指标进行比较,以其中一个指标作为对比的基础,确定另一个指标的重要程度,并将重要程度数量化,依次顺序比较,确定各指标权数的方法。
5.变异系数法:是直接利用各指标所包含的信息计算出相应指标的权重,是一种客观赋权的方法。
二、填空题根据下面提示的内容,将准确的名词、词组或短语填入相应的空格之中。
11.统计指标、统计指标体系2.性质相同3.同度量4. 权数5. 定量方法、分析法6.标准值、标准值7.消除量纲、阈值、不容许值、满意值8.正态分布、0、19.直接、所包含的信息10.分值、分值三、选择题从各题给出的四个备选答案中,选择一个或多个正确答案,填入相应的括号中。
1.BCD 2. A 3. CD 4. AB 5. AD6. A7. AD8. AB9. BD 10. ABCD2四、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。
1. 变异系数法赋权是一种人工赋权法。
(×)客观2. 资产负债率、万元产值消耗能源比率和物耗率皆为逆指标。
(√)3. 进行归一化处理后,权数之和一定为1。
(√)4. 综合评价指标体系中的各指标要从同一方向说明总体。
(×)不一定5. 在对指标的无量纲处理时,如果指标是相对数,就不要进行无量纲处理。
(×)也要6. 在对学生的各科考试成绩进行综合评价时,各科考试成绩的单位都是分,因此就不需要进行无量纲化操作。
9.1(1)设原假设为H:不同收入群体对某种特定商品的购买习惯相同:即不同收入群体对某种特定商品的购买习惯不完全相同H1(2)由SPSS计算可得χ2值为17.626(3)自由度=(3-1)×(4-1)=6,当α=0.1时,χ0.12(6)=10.64∵χ2=17.626>10.64=χ0.12(6)故拒绝原假设,即不同收入群体对某种特定商品的购买习惯不完全相同。
(4)由SPSS计算可得φ系数为0.183、c系数为0.180、V系数为0.1299.2解:设原假设为H0:现在情况与经验数据相比没有发生变化;H1:现在情况与经验数据相比发生了变化。
由已知条件可得χ2值为:χ2=(28−0.1×200)20.1×200+(56−0.2×200)20.2×200+(48−0.3×200)20.3×200+(36−0.2×200)20.2×200+(32−0.2×200)20.2×200=14P[χ2(5−1)>14]=0.007295<0.1=α,故拒绝原假设。
9.3设原假设为H0:π1=π2=π3=π4(即阅读习惯与文化程度无关)H1:π1,π2,π3,π4不完全相等(即阅读习惯与文化程度有关)表中各项的期望值:E11=n1×n1n=77×50254=15.16E12=n2×n1n=91×50254=17.91E13=n3×n1n=42×50254=8.27E14=n4×n1n=44×50254=8.66E21=n1×n2n=77×44254=13.34E22=n2×n2n=91×44254=15.76E23=n3×n2n=42×44254=7.28E24=n4×n2n=44×44254=7.62E31=n1×n3n=77×95254=28.80E32=n2×n3n=91×95254=34.04E33=n3×n3n=42×95254=15.71E34=n4×n3n=44×95254=16.46E41=n1×n4n=77×65254=19.70E42=n2×n4n=91×65254=23.29E43=n3×n4n=42×65254=10.75E44=n4×n4n=44×65254=11.26所以χ2=(6-15.16)2/15.16+(12-13.34)2/13.34+……+(13-11.26)2/11.26=31.86。
统计学习题答案(九、⼗、⼗⼀)第九章习题⼀、名词解释时间序列:是指反映客观现象的同⼀指标在不同时间上的数值,按时间先后顺序排列⽽形成的序列。
发展⽔平:是指时间序列中的每⼀项具体指标数值,反映的是现象在不同时间发展所达到的规模和⽔平。
增长⽔平:简称增长量,是时间序列中两个不同时期发展⽔平之差,其计算公式为:增长量=报告期发展⽔平-基期发展⽔平。
由于所采⽤的基期不同,增长量可以分为逐期增长量和累积增长量。
发展速度:是两个时期发展⽔平对⽐⽽得到的结果,表明现象发展的程度,说明报告期⽔平是基期⽔平的百分之⼏(或若⼲倍)。
增长速度:是根据增减量与基期⽔平对⽐⽽求得的⼀种相对数,反映现象在⼀段时期内数量增减的⽅向和程度的动态分析指标。
加法模型:假设各构成部分对时间序列的影响是可加的,并且是相互独⽴的,这样就可以把时间序列Y表⽰为:Y=T+S+C+I。
按照这种模型,时间序列的发展变化是4种因素叠加⽽成的。
乘法模型:假设四个因素变动之间存在某些相互影响的关系,则时间序列各期⽔平的数值就是四种因素相乘的乘积,其分解模型为:Y=T×S×C×I。
按照这种模型,时间序列的发展变化是4种因素乘积⽽成的倍⽐关系。
⼀次指数平滑法:⼀次指数平滑法是指以最后的⼀个第⼀次指数平滑。
如果为了使指数平滑值敏感地反映最新观察值的变化,应取较⼤α值,如果所求指数平滑值是⽤来代表该时间序列的长期趋势值,则应取较⼩α值。
季节变动:由于季节⽓候(春、夏、秋、冬、晴、阴、⾬等)和社会习惯(春节、端午、重阳等)等原因,客观现象普遍存在季节变动影响(服装的销售量,农作物的⽣长,旅游⼈次;等等)。
测定季节变动的规律,主要在于测定季节指数,常⽤的测定季节指数的⽅法有简单平均法和移动平均趋势剔除法。
循环波动:循环波动的周期在⼀年以上且长短不⼀,可采⽤剩余法对循环波动进⾏分析。
⼆、单项选择1~5:D A B C D 6~10:B A D C D三、简答题1、根据时点序列计算序时平均数分别有哪⼏种类型?请分别予以说明。
第9章 时间序列分析——练习题●1. 某汽车制造厂2003年产量为30万辆。
(1)若规定2004—2006年年递增率不低于6%,其后年递增率不低于5%,2008年该厂汽车产量将达到多少?(2)若规定2013年汽车产量在2003年的基础上翻一番,而2004年的增长速度可望达到7.8%,问以后9年应以怎样的速度增长才能达到预定目标?(3)若规定2013年汽车产量在2003年的基础上翻一番,并要求每年保持7.4%的增长速度,问能提前多少时间达到预定目标?解:设i 年的环比发展水平为x i ,则由已知得:x 2003=30, (1)又知:320042005200620032004200516%x x x x x x ≥+(),2200720082006200715%x x x x ≥+(),求x 2008由上得32200820072008200320032007(16%)(15%)x x x x x x =≥++ 即为3220081.061.0530x ≥,从而2008年该厂汽车产量将达到 得 x 2008≥30× 31.06×21.05= 30×1.3131 = 39.393(万辆) 从而按假定计算,2008年该厂汽车产量将达到39.393万辆以上。
(2)规定201320032x x =,20042003x x =1+7.8%由上得=107.11%==可知,2004年以后9年应以7.11%的速度增长,才能达到2013年汽车产量在2003年的基础上翻一番的目标。
(3)设:按每年7.4%的增长速度n 年可翻一番, 则有 201320031.0742na a == 所以 1.074log 20.30103log 29.70939log1.0740.031004n ====(年)可知,按每年保持7.4%的增长速度,约9.71年汽车产量可达到在2003年基础上翻一番的预定目标。
原规定翻一番的时间从2003年到2013年为10年,故按每年保持7.4%的增长速度,能提前0.29年即3个月另14天达到翻一番的预定目标。
第九章相关与回归一.判断题部分题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。
()答案:×题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。
()答案:√题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。
()答案:×题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。
()答案:×题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。
()答案:×题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。
()答案:√题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。
()答案:×题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。
()答案:×题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。
()答案:√题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。
()答案:×题目11:完全相关即是函数关系,其相关系数为±1。
()答案:√题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。
()答案×二.单项选择题部分题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A.相关关系B.函数关系C.回归关系D.随机关系答案:B题目2:现象之间的相互关系可以归纳为两种类型,即()。
A.相关关系和函数关系B.相关关系和因果关系C.相关关系和随机关系D.函数关系和因果关系答案:A题目3:在相关分析中,要求相关的两变量()。
A.都是随机的B.都不是随机变量C.因变量是随机变量D.自变量是随机变量答案:A题目4:测定变量之间相关密切程度的指标是()。
高中数学必修二第九章统计基础知识点归纳总结单选题1、下列调查所抽取的样本具有代表性的是()A.利用某地七月份的日平均最高气温值估计该地全年的日平均最高气温B.在农村调查市民的平均寿命C.利用一块实验水稻田的产量估计水稻的实际产量D.为了了解一批洗衣粉的质量情况,从仓库中任意抽取100袋进行检验答案:D分析:根据抽取样本要具的广泛性和代表性,抽取的样本必须是随机的,逐个分析判断即可A项中某地七月份的日平均最高气温值不能代表全年的日平均最高气温;B项中在农村调查得到的平均寿命,不具代表性;C项中利用一块实验水稻田的产量估计水稻的实际产量,不具代表性;D项抽取的样本是随机的,具有代表性.故选:D2、为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案:C分析:根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%> 50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+ 9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C.故选:C.小提示:本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的×组距.估计值.注意各组的频率等于频率组距3、下列调查方式合适的是().A.为了了解一批头盔的抗压能力,采用普查的方式B.为了了解一批玉米种子的发芽率,采用普查的方式C.为了了解一条河流的水质,采用抽查的方式D.为了了解一个寝室的学生(共5个人)每周体育锻炼的时间,采用抽查的方式答案:C分析:根据抽查和普查的特点,对每个选项进行逐一分析,即可判断和选择.对于选项A,采用普查的方式测试头盔的抗压能力,成本较高,不适合,故A错误;对于选项B,采用普查的方式测试玉米种子的发芽率,较为繁琐且工作量较大,不适合,故B错误;对于选项C,采用抽查的方式了解河流的水质,适合,故C正确;对于选项D,为了了解5个人每周体育锻炼的时间,适合采用普查的方式,故D错误.故选:C.4、2021年3月12日是全国第43个植树节,为提高大家爱劳动的意识,某中学组织开展植树活动,并收集了高三年级1~11班植树量的数据(单位:棵),绘制了下面的折线图.根据折线图,下列结论不正确的是()A.各班植树的棵数不是逐班增加的B.4班植树的棵数低于11个班的平均值C.各班植树棵数的中位数为6班对应的植树棵数D.1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳答案:C分析:从图中直接观察可以判定AD正确,结合平均数的定义,将比4班多的里面取出部分补到比4班少的班中,可以使得4班的植树量最少,从而判定B正确;结合中位数的定义可以判定C错误.从图可知,2班的植树量少于1班,8班的植树量少于7班,故A正确;4班的指数棵数为10,11个班中只有2、3、8班三个的植树棵数少于10,且大于5棵,其余7个班的植树棵数都超过10棵,且有6、7、9、10、11班五个班的植树棵数都不少于15棵,将这五个班中的植树棵数各取出5棵,加到2、3、8班中取,除4班外,其余各班的植树棵数都超过了4班,所以4班植树的棵数低于11个班的平均值,故B正确;比6班植树多的只有9、10、11三个班,其余七个班都比6班少,故6班所对应的植树棵数不是中位数,故C是错误的;1到5班的植树棵数的极差在10以内,6到11班的植树棵数的极差超过了15,另外从图明显看出,1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳,故D正确;综上,不正确的只有C,故选:C.小提示:本题考查频数折线图的意义,涉及平均数,中位数,波动大小的判定,难点是平均数的估算,这里采用取长补短法进行估算,可以避免数字的计算.5、2020年广东12月份天气预报历史记录中1号至8号的数据如表所示,则()C.这8天的最低气温的极差为5°C D.这8天的最低气温的中位数为11.5°C答案:D分析:由极差等于一组数据中的最大值与最小值的差,并根据中位数的定义,求最高、最低气温数据的中位数即可判断各项的正误.=22°C,这8天的最低气温的这8天的最高气温的极差为23−19=4°C,这8天的最高气温的中位数为21+232=11.5°C,故选:D.极差为15−9=6°C,这8天的最低气温的中位数为11+1226、某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66674037146405711105650995866876832037905716031163149084452175738805905223594310若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是()A.10B.09C.71D.20答案:B分析:按照题意依次读出前4个数即可.从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09,故选:B7、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的4,5×100=480,③正确.故中位数为400+0.5−0.30.25故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题8、2021年是中国共产党成立100周年,某学校团委在7月1日前,开展了“奋斗百年路,启航新征程”党史知识竞赛.团委工作人员将进入决赛的100名学生的分数(满分100分且每人的分值为整数)分成6组:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100]得到如图所示的频率分布直方图,则下列关于这100名学生的分数说法错误的是()A.分数的中位数一定落在区间[85,90)B.分数的众数可能为97C.分数落在区间[80,85)内的人数为25D.分数的平均数约为85答案:B分析:根据小矩形的面积之和等于1,求出b=0.05,根据中位数的求法可判断A;根据众数的求法可判断B;由在区间[80,85)上的概率可判断C;由平均数的的计算公式:小矩形的底边中点横坐标与小矩形面积的乘积之和可判断D.A,由频率分布直方图可得(0.01+0.02×2+0.03+b+0.07)×5=1,解得b=0.05,前三组的概率为(0.02×2+0.05)×5=0.45<0.5,前四组的概率为(0.02×2+0.05+0.07)×5=0.7>0.5,所以分数的中位数一定落在第四组[85,90)内,故A正确;B,分数的众数可能为87.5,故B错误;C,分数落在区间[80,85)内的人数约为0.05×5×100=25,故C正确.D,分数的平均数为:72.5×0.02×5+77.5×0.02×5+82.5×0.05×5+87.5×0.07×5+92.5×0.03×5+97.5×0.01×5=85,故D正确.故选:B多选题9、2020年突如其来的新冠肺炎疫情对房地产市场造成明显的冲击,如图为某市2020年国庆节7天假期的楼房认购量与成交量的折线图,某同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则判断正确的是()A.日成交量的中位数是16B.日成交量超过平均成交量的只有1天C.10月7日认购量量的增长率大于10月7日成交量的增长率D.日认购量的方差大于日成交量的方差答案:BD解析:根据拆线图判断各数据特征后判断各选项.由拆线图日成交量的中位数是26,A错;日成交量均值为13+8+32+16+26+38+1667≈42.7,大于均值的只有一天,B正确;10月7日认购量量的增长率为y1=276−112112≈1.464,成交量的增长率为y2=166−3838≈3.368,显然C错;日认购量的均值为223+105+91+107+100+112+276≈144.857,7由各数据与均值的差可以看出日认购量的方差大于日成交量的方差,D正确.故选:BD.小提示:关键点点睛:本题考查统计图表,考查拆线图的识别.解题关键是由拆线图得出各数据,然后求得各数据特征.如中位数,均值,增长率,方差,解题中还要善于估值,如本题中的方差,从而大致比较出大小.10、成立时间少于10年.估值超过10亿美元且未上市的企业,称为独角兽企业.2021年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2021年中国新经济独角兽企业TOP200的行业分布图,中国新经济独角兽企业TOP200榜单中,京、沪、粤三地的企业数量共同占比达到69%.下列说法正确的是()A.随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注B.这12个行业TOP200榜单中独角兽企业数量的中位数是17C.中国新经济独角兽企业TOP200榜单中,京、沪、粤三地的企业超过130家D.2021年中国新经济独角兽企业TOP200榜单中汽车交通、企业服务、文化娱乐的企业数量共同占比超过40% 答案:ABC分析:结合图表对选项进行分析,由此确定正确选项.A选项,由图可知,汽车交通行业独角兽企业TOP200榜单中数量最多,是由A选项正确.=17,B选项正确.B选项,数据为8,8,12,13,16,17,17,18,18,19,25,29,中位数为17+172C选项,200×69%=138>130,所以C选项正确.×100%=36.5%<40%,D选项错误.D选项,汽车交通、企业服务、文化娱乐占比29+25+19200故选:ABC11、立德中学举行党史知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按照[50,60)、[60,70)、[70,80)、[80,90)、[90,100]分成5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是()A.图中的x值为0.020B.这组数据的极差为50C.得分在80分及以上的人数为400D.这组数据的平均数的估计值为77答案:ACD分析:根据频率分布直方图中所有长方形的面积和为1,以及极值、频数以及平均数的计算,对每个选项进行逐一分析,即可判断和选择.由(0.005+x+0.035+0.030+0.010)×10=1,可解得x=0.020,故选项A正确;频率分布直方图无法看出这组数据的最大值和最小值,故选项B不正确;得分在80分及以上的人数的频率为(0.030+0.010)×10=0.4,故人数为1000×0.4=400,故选项C正确;这组数据的平均数的估计值为:55×0.05+65×0.2+75×0.35+85×0.3+95×0.1=77故选项D正确.故选:ACD.填空题12、某学校有高中学生1000人,其中高一年级、高二年级、高三年级的人数分别为320,300,380,为了调查学生参加“社区志愿服务”的意向,现采用分层抽样的方法从该校学生中抽取一个样本量为200的样本,那么应抽取高二年级学生的人数为________答案:60分析:根据分层抽样,每层的抽样比相同计算即可.因为学校有高中学生1000人,抽取一个样本量为200的样本,故应抽取高二年级学生的人数为2001000×300=60.所以答案是:6013、有一组样本数据x1,x2,x3,x4,该样本的平均数和方差均为m.在该组数据中加入一个数m,得到新的样本数据,则新样本数据的方差为__________.答案:45m##0.8m分析:由平均数和方差的计算公式直接计算即可.样本数据x1,x2,x3,x4,该样本的平均数和方差均为m,在该组数据中加入1个数m,则新样本数据的平均数x̅=15×(4×m+m)=m,方差为s2=15×[4×m+(m−m)2]=45m.所以答案是:45m.14、由6个实数组成的一组数据的方差为S12,将其中一个数5改为2,另一个数4改为7 ,其余的数不变,得到新的一组数据的方差为S22,则S22−S12=________.答案:2分析:根据平均数和方差的定义进行求解即可.因为将其中一个数5改为2,另一个数4改为7,其余的数不变,所以这6个实数组成的一组数据的平均数不变,设为x,设没有变化的4个数与平均数差的平方和为S,所以S22−S12=[S+(2−x)2+(7−x)2]−[S+(5−x)2+(4−x)2]6=2,所以答案是:2解答题15、从甲、乙两人中选选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:甲78686591074乙9578768677(1)分别计算甲、乙两人射击命中环数的平均数:(2)选派谁去参赛更好?请说明理由.答案:(1)甲乙的平均数均为7;(2)选派乙,理由见解析.分析:(1)应用平均数的求法求甲乙平均数;(2)由(1)知甲乙平均数相同,求出甲乙的方差并比较大小,即可确定选派方法.(1)由题设,甲的平均数为x̅1=7+8+6+8+6+5+9+10+7+410=7,乙的平均数为x̅2=9+5+7+8+7+6+8+6+7+710=7.(2)甲的方差为s12=110∑(x i−x̅1)210i=1=0+1+1+1+1+4+4+9+0+910=3,乙的方差为s22=110∑(x i−x̅2)210i=1=4+4+0+1+0+1+1+1+0+010=1.2.由(1)知:x̅1=x̅2,而s12>s22,所以选派乙去参赛更好.。
第九章 统计指数(一)单选题1、如果销售额增加10%,零售物价指数下降5%,则销售量( )A 、增加5%B 、增加10%C 、增加15.79%D 、无法判断2、综合指数是依据以下方式来编制的A 、先对比,后平均B 、先综合,后对比C 、先除后乘D 、先加后除3、平均指数是依据以下方式来编制的A 、先对比,后平均B 、先综合,后对比C 、先除后乘D 、先加后除4、通常在指数体系的完整框架中,质量指标指数是以( )计算的。
A 、拉氏公式B 、帕氏公式C 、马-埃公式D 、费雪公式5、通常在指数体系的完整框架中,数量指标指数是以( )计算的。
A 、拉氏公式B 、帕氏公式C 、马-埃公式D 、费雪公式6、某商店销售多种商品,报告期与基期相比销售额未变,但销售量增长了15%,则销售价格指数为( )A 、115%B 、100%C 、85%D 、86.96%7、编制平均指数的基本问题之一是( )A 、指数化指标的选择问题B 、合理加权问题C 、同度量因素的固定问题 D 、以上答案均错8、用于比较不同地区或国家各种商品价格综合差异程度的指数是( )A 、个体价格指数B 、时间价格指数C 、空间价格指数D 、平均价格指数9、我国的消费者价格指数(CPI )是采用( )来编制的。
A 、固定加权算术平均的形式B 、固定加权调和平均的形式C 、固定加权几何平均的形式 D 、简单算术平均的形式10、采用标准比值法编制综合评价指数时,个体指数的计算方法为( )A 、参评指标标准值比相应指标报告期值B 、参评指标报告期值比相应指标基期值C 、参评指标计划值比相应指标标准值D 、参评指标实际值比相应指标标准值11、P 表示商品价格,q 表示商品销售量,则∑-∑1011q p q p 的意义是综合反映多种商品的( )A 、销售量变动的绝对额B 、价格变动的绝对额C 、因价格变动额增减的销售额D 、因销售量变动额增减的销售额12、以个体指数为基础计算总指数的指数形式是( )A 、综合指数B 、平均指数C 、可变构成指数D 、固定构成指数13、某商品价格发生变化,现在的100元只值原来的90元,则价格指数为( )A 、10.00%B 、90.00%C 、110.00%D 、111.11%14、某企业职工工资总额,今年比去年减少2%,而平均工资上升5%,则职工人数减少( )A 、3.0%B 、10.0%C 、75.0%D 、6.7%二、多项选择题1、以下属于时间指数的是( )A 、股票价格指数B 、计划完成情况指数C 、零售物价指数D 、地区间的价格比较指数 E 、工业生产指数2、以下属于质量指标指数的是( )A 、股价指数B 、物价指数C 、成本指数D 、产量指数E 、销售量指数3、以下属于数量指标指数的是( )A 、工业生产指数B 、商品销售额指数C 、总产值指数D 、产量指数 E 、销售量指数4、个体指数( )A 、是反映个别现象或个别项目数量变动的指数B 、采用先综合、后对比的方式编制 C 、采用先对比、后综合的方式编制 D 、也有质量指标指数和数量指标指数之分 E 、是总指数的重要形式之一5、同度量因素的作用有( )A 、“同度量”的作用B 、“平衡”的作用C 、对指数化指标“加权”的作用 D 、“平均”的作用 E 、以上均对6、某商店报告期全部商品的销售量指数为120%,这个指数是( )A 、个体指数B 、总指数C 、数量指标指数D 、质量指标指数 E 、平均数指数7、可变构成指数的意义及公式( )A 、可变构成指数反映了各组的变量水平及总体结构两个因素的影响B 、可变构成指数仅反映总体结构的影响C 、可变构成指数的计算公式为:D 、可变构成指数的计算公式为:E 、可变构成指数的计算公式为: 8、固定构成指数的意义及公式( )A 、固定构成指数反映了各组的变量水平的影响B 、固定构成指数反映了总体结构的影响C 、固定构成指数的计算公式为:∑∑÷∑∑=0001100f f x f f x x x 假定∑∑÷∑∑=00011101f f x f f x x x ∑∑÷∑∑=1101111f f x f f x x x 假定∑∑÷∑∑=0001100f f x f f x x x 假定∑∑÷∑∑=00011101f f x f f x x xD 、固定构成指数的计算公式为:e 、固定构成指数的计算公式为: 9、结构影响指数的意义及公式( )A 、结构影响指数反映了各组的变量水平的影响B 、结构影响指数反映了总体结构的影响C 、结构影响指数的计算公式为:D 、结构影响指数的计算公式为:E 、结构影响指数的计算公式为: 10、加权总指数的编制方式有( )A 、先综合、后对比B 、先加后减C 、先减后加 D 、先对比、后平均 E 、先除后乘11、总指数的计算形式有( )A 、综合指数B 、销售量指数C 、销售价格指数D 、平均指数E 、产量指数三、填空题1、在我国,工业生产指数是通过计算各种工业产品的 产值来加以编制的。
(名师选题)部编版高中数学必修二第九章统计带答案知识点总结归纳完整版单选题1、某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,90后从事互联网行业岗位分布条形图,则下列结论错误的是()注:90后指1990年及以后出生,80后指1980−1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后一定比80前多D.互联网行业中从事技术岗位的人数90后一定比80后多2、下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30百分位数是()3、为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间4、有甲、乙两种水稻,测得每种水稻各10株的分蘖数据,计算出样本均值E(X甲)=E(X乙),方差分别为D(X甲)=11,D(X乙)=3.4.由此可以估计()A.甲种水稻比乙种水稻分蘖整齐B.乙种水稻比甲种水稻分蘖整齐C.甲、乙两种水稻分蘖整齐程度相同D.甲、乙两种水稻分蘖整齐程度不能比较5、2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获药监局批准附条件上市,其保护效力达到世界卫生组织及药监局相关标准要求,现已对18至59岁的人提供.根据某地接种年龄样本的频率分布直方图(如图)估计该地接种年龄的中位数为()A.40B.39C.38D.376、2020年广东12月份天气预报历史记录中1号至8号的数据如表所示,则()C.这8天的最低气温的极差为5°C D.这8天的最低气温的中位数为11.5°C7、从某班50名学生中抽取6名学生进行视力状况的统计分析,下列说法正确的是()A.50名学生是总体B.每个被调查的学生是个体C.抽取的6名学生的视力是一个样本D.抽取的6名学生的视力是样本容量8、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3多选题9、中国的华为公司是全球领先的ICT(信息与通信)基础设施和智能终端提供商,其致力于把数字世界带给每个人、每个家庭、每个组织,构建万物互联的智能世界.其中华为的5G智能手机是全世界很多年轻人非常喜欢的品牌.为了研究某城市甲、乙两个华为5G智能手机专卖店的销售状况,统计了2020年4月到9月甲、乙两店每月的营业额(单位:万元),得到如下的折线图,则下列说法正确的是()A.根据甲店的营业额折线图可知,该店月营业额的平均值在[31,32]内B.根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势C.根据甲、乙两店的营业额折线图可知乙店的月营业额极差比甲店小D.根据甲、乙两店的营业额折线图可知7、8、9月份的总营业额甲店比乙店少10、如图所示的曲线图是2020年1月25日至2020年2月12日陕西省及西安市新冠肺炎累计确诊病例的曲线图,则下列判断正确的是()A.1月31日陕西省新冠肺炎累计确诊病例中西安市占比超过了13B.1月25日至2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势C.2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了97例D.2月8日到2月10日西安市新冠肺炎累计确诊病例的增长率大于2月6日到2月8日的增长率11、甲、乙、丙、丁四人各掷骰子5次(骰子每次出现的点数可能为1,2,3,4,5,6),并分别记录每次出现的点数,四人根据统计结果对各自的试验数据分别做了如下描述,可以判断一定没有出现6点的描述是()A.中位数为3,众数为5B.中位数为3,极差为3C.中位数为1,平均数为2D.平均数为3,方差为2填空题12、已知一组数据4,2a,3−a,5,6的平均数为4,则a的值是_____.13、某汽车研究院现有300名研究员,他们的学历情况如图所示该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科学历的研究员比例下降到15%,硕士学历的研究员比例不变,则该研究院今年计划招聘的硕士学历的研究员人数为______.部编版高中数学必修二第九章统计带答案(十七)参考答案1、答案:D解析:根据整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,对四个选项逐一分析,即可得出正确选项.对于选项A,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占的比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A正确;对于选项B,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B正确;对于选项C,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C正确;选项D,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数所占比为41%,条件中未给出从事技术岗位的占比,故不能判断,所以选项D错误.故选:D.小提示:关键点点睛:本题考查利用扇形统计图和条形统计图解决实际问题,解本题的关键就是利用条形统计图中“90后”事互联网行业岗位的占比乘以“90后”所占总人数的占比,再对各选项逐一分析即可.2、答案:D分析:根据百分位数的定义求解即可.12×30%=3.6,把12个班级的得分按照从小到大排序为7,7,8,9,9,10,10,10,11,13,13,14,可得30百分位数是第4个得分数,即9.故选:D3、答案:C分析:根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%> 50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+ 9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C.故选:C.小提示:本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于频率组距×组距.4、答案:B分析:可以用样本的方差估计总体的方差,方差越小,分蘖越整齐.解:已知样本方差:D(X乙)=3.4,D(X甲)=11由此估计,乙种水稻的方差约为3.4,甲种水稻的方差约为11. 因为3.4<11所以乙种水稻比甲种水稻分蘖整齐故选:B.5、答案:C分析:利用中位数左右两边的小矩形的面积都等于0.5即可求解.年龄位于[18,24)的频率为0.013×6=0.078,年龄位于[24,30)的频率为0.023×6=0.138,年龄位于[30,36)的频率为0.034×6=0.204,年龄位于[36,42)的频率为0.040×6=0.240,因为0.078+0.138+0.204=0.42<0.5,而0.078+0.138+0.204+0.240=0.42=0.66>0.5,所以中位数位于[36,42),设中位数为x,则0.078+0.138+0.204+(x−36)×0.04=0.5,解得:x=38,故选:C.6、答案:D分析:由极差等于一组数据中的最大值与最小值的差,并根据中位数的定义,求最高、最低气温数据的中位数即可判断各项的正误.=22°C,这8天的最低气温的这8天的最高气温的极差为23−19=4°C,这8天的最高气温的中位数为21+232=11.5°C,故选:D.极差为15−9=6°C,这8天的最低气温的中位数为11+1227、答案:C分析:根据总体、样本、个体、样本容量的概念判断.从某班50名学生中抽取6名学生进行视力状况的统计分析,则50个学生的视力状况是总体,抽取的6名学生的视力是一个样本,每个被调查的学生的视力状况是个体,样本容量是6,结合所给的选项,只有C正确.故选:C.8、答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的45,故中位数为400+0.5−0.30.25×100=480,③正确.故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题9、答案:ABD解析:计算出甲店的月营业额的平均值即可判断A;由图可直接判断B;分别计算出甲、乙两店的月营业额极差和7、8、9月份的总营业额即可判断CD.对于A,根据甲店的营业额折线图可知,该店月营业额的平均值为14+21+26+30+52+476=1906≈31.7,故A正确;对于B,根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势,故B正确;对于C,可得甲店的月营业额极差为52−14=38,乙店的月营业额极差为53−7=46,故C错误;对于D,甲店7、8、9月份的总营业额为30+52+47=129,乙店7、8、9月份的总营业额为33+44+ 53=130,故D正确.故选:ABD.10、答案:ABC分析:根据曲线图可得ABC正确,2月8日到2月10日西安新冠肺炎累计确诊病例增加了544,2月6日到2月8日西安新冠肺炎累计确诊病例增加了737,D说法不正确.1月31日陕西省新冠肺炎累计确诊病例共有87例,其中西安32例,所以西安所占比例为3287>13,故A正确;由曲线图可知,1月25日至2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势,故B正确;2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了213−116=97例,故C正确;2月8日到2月10日西安新冠肺炎累计确诊病例增加了98−8888=544,2月6日到2月8日西安新冠肺炎累计确诊病例增加了88−7474=737,显然737>544,故D错误.故选:ABC.11、答案:AD分析:根据数字特征的定义,依次对选项分析判断即可对于A,由于中位数为3,众数为5,所以这5个数从小到大排列后,第3个数是3,则第4和5个为5,所以这5个数中一定没有出现6,所以A正确,对于B,由于中位数为3,极差为3,所以这5个数可以是3,3,3,4,6,所以B错误,对于C,由于中位数为1,平均数为2,所以这5个数可以是1,1,1,1,6,所以C错误,对于D,由平均数为3,方差为2,可得x1+x2+x3+x4+x5=15,15[(x1−3)2+(x2−3)2+(x3−3)2+ (x4−3)2+(x5−3)2]=2,若有一个数为6,取x1=6,则x2+x3+x4+x5=9,(x2−3)2+(x3−3)2+ (x4−3)2+(x5−3)2=1,所以(x2−3)2≤1,(x3−3)2≤1,(x4−3)2≤1,(x5−3)2≤1,所以x2,x3,x4,x5这4个数可以是4,3,3,3或2,3,3,3,与x2+x3+x4+x5=9矛盾,所以x1≠6,所以这5个数一定没有出现6点,所以D正确,故选:AD12、答案:2分析:根据平均数的公式进行求解即可.∵数据4,2a,3−a,5,6的平均数为4∴4+2a+3−a+5+6=20,即a=2.所以答案是:2.小提示:本题主要考查平均数的计算和应用,比较基础.13、答案:40分析:根据题意,设今年招聘的硕士生x人,博士生y人,由扇形图分析可得现有本科生和硕士生的人数,进而可得方程组,变形解可得x的值,即可得答案.解:根据题意,设今年招聘的硕士生x人,博士生y人,又由现有研究员300人,其中本科生300×20%=60人,硕士生300×40%=120人,则有{60300+x+y=0.15120+x 300+x+y =0.4,解得{x=40y=60;所以答案是:40.。
第九章 统计指数 思考与练习1. 何谓统计指数?它有哪些特性和作用?统计指数的概念有广义和狭义之分。
从广义上说,凡用来反映现象在时间上数量变动程度和方向的相对数,都称为统计指数;从狭义上讲,统计指数是一种特殊的相对数,是用来表明复杂总体数量特征综合变动的一种特殊相对数。
统计指数具有相对性、综合性和平均性的特点,能够综合反映现象的变动方向和变动程度,能够分析受多种因素影响的现象的总变动中各个因素的影响方向和影响程度。
2. 简单指数分哪两类?它们是如何编制的?各有什么优缺点?简单指数分为简单综合指数和简单平均指数,以价格指数为例,i P 0和i P 1(i =1,2,3,……n )分别表示第i 种商品在基期和报告期的单位价格,则简单综合价格指数为: ∑∑=++++++++=0103020101312111)(1)(1PP P P P P nP P P P n I n np ΛΛΛΛ,简单平均指数为:x n P P P P P P n P P p n n -=+++=∑11110112021010()()ΛΛ。
简单综合指数方法存在两个缺点:(1)易受价格较高的商品价格变动的影响;(2)没有考虑各种商品的经济重要性。
简单平均指数先求比率再平均,克服了简单综合式价格指数的第一个缺点。
但它仍存在着与简单综合式价格指数相同的第二个缺点,难以准确地反映物价变动的一般水平。
3. 加权指数分哪两类?它们之间有何区别和联系?加权指数区分为加权综合指数和加权平均指数两种,其联系在于:在一定的权数下,两种指数之间有变形关系,此时两者在经济意义和数学性质上完全一致。
如果计算两种指数时所依据的资料也完全相同,则它们的计算结果也相等。
其区别在于:编制加权综合指数的基本问题是同度量因素问题,而加权平均指数不存在这个问题;编制加权综合指数需要全面资料和计算假定值,而加权平均指数不要求使用全面资料,也不计算假定值,具有独立的使用价值。
第九章 习题参考答案一、填空题9.1.1 时间 观察值 9.1.2 相对数时间数列、平均数时间数列 9.1.3 定基发展速度 9.1.4 时期9.1.5 4.17% 5.74% 9.1.6 32.25%9.1.7 几何平均法、高次方程法9.1.8 长期趋势、季节变动、循环变动、不规则变动 9.1.9 画散点图的方法、指标判别法 9.1.10 逐期增减量 9.1.11 二次曲线 、指数曲线 9.1.12 季节变动 同期平均法 9.1.13 长期趋势9.1.14 ˆ()i iy y 最小值2=-å 9.1.15 1200% 调整系数 9.1.16 移动平均法9.1.17 增降1%的绝对值 9.1.18 均方误差9.1.19 移动平均法 9.1.20 趋势外推法9.1.21 趋势季节模型 9.1.22 观察值与预测值二、单项选择题三、多项选择题四、判断题9.4.1 (×,各期环比增降速度不一定相等) 9.4.2 (×,计算年距发展速度) 9.4.3 (√)9.4.4 (×,考察期末所达到的发展水平) 9.4.5 (√)9.4.6 (×,其结果是不相同的)9.4.7 (×,指增降速度中每一个百分点所代表的绝对额) 9.4.8 (√)9.4.9 (×,逐期增长量不一定相等) 9.4.10 (×,a 不相同,b 相等) 9.4.11 (×,ˆ()i i y y最小值2=-å)9.4.12 (√)9.4.13 (×,拟合抛物线曲线趋势方程) 9.4.14 (×,进行一次平均即能得到预测值) 9.4.15 (√)9.4.16 (×,S j <100%时,表明现象此时处于淡季) 9.4.17 (√)9.4.18 (×,构建趋势季节模型) 9.4.19 (×,ˆˆy ys s=) 9.4.20 (√)五、简答题9.5.1 答:依据相对数时间数列计算平均发展水平的基本思想:①首先对相对数时间数列进行分解,找出各期的分子指标和分母指标;②其次分别计算出分子时间数列的平均发展水平a、分母时间数列的平均发展水平b;③最后将两个平均发展水平对比,以求得相对数时间数列的平均发展水平y。
统计学教程 第九章秩和检验五、习题答题要点(一)名词解释1.非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。
由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。
2.参数统计:通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计(parametric statistics) 3.秩次:变量值按照从小到大顺序所编的秩序号称为秩次(rank)。
4.秩和:各组秩次的合计称为秩和(rank sum),是非参数检验的基本统计量。
(二)单项选择题1.A 2.D 3.B 4.B 5.C 6.D 7.D 8.C 9.D 10.D 11.D 12.C 13.C 14.D 15.A 16.A 17.C 18.D 19.A 20.A 21.B 22.B 23.C 24.C 25.D 26.C 27.A 28.A 29.C (三)是非题1. 正确。
2.错误。
应视资料的特性而定,若资料符合参数检验方法的条件,就运用参数检验方法;若符合非参数检验方法的条件,就运用非参数检验方法。
3.错误。
应根据研究目的和资料性质而定,例如当资料的实验分组变量有序,而指标85分组变量无序时,可以采用列联表?2检验。
4.错误。
非参数检验是检验总体分布,而非总体参数。
(四)计算题1.答案:由于本资料数据离散程度相当大,分布不明,故宜用配对设计差值的符号秩检验(Wilcoxon配对法)。
负秩和T-=4.5,正秩和T+=61.5,P<0.05。
第九章 相关与回归分析习题答案一、单选1.C ;2.B ;3.C ;4.D ;5.A ;6.C ;7.B ;8.C ;9.A ;10.C 二、多选1.ACD ;2.AE ;3.AD ;4.ABCD ;5.ACD ;6.AB ;7.ABDE ;8.ACE ;9.AD ;10.ABE 三、计算分析题 1、解:(1)(2)建立线性回归方程xy ∧∧∧+=10ββ,根据最小二乘法得:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑∑∑∑∑∑∧∧∧n x n y x x n y x y x n i i i i i i i i 10221βββ)(由此可得∧1β=0.732,∧0β=-2.01,则回归方程是∧y =-2.01+0.732x(3)当受教育年数为15年时,其年薪的点估计值为:∧y =-2.01+0.732×15=8.97(万元)估计标准误差: 733.0538.0222===-=--=∑∧M S E n S S En y y S i iy )(置信区间为:∑=∧--+±n i i yx x x x nS t y 1202/)()(12α=8.97±2.228×0.733×9167.120917.6151212)(-+=8.97±1.290预测区间为:∑=∧--++±ni i yx x x x nS t y 1202/)()(112α=8.97±2.228×0.733×9167.120917.61512112)(-++ =8.97±2.081 2、解:(1)建立线性回归方程xy ∧∧∧+=10ββ,根据最小二乘法得:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑∑∑∑∑∑∧∧∧n x n y x x n y x y x n i i i i i i i i 10221βββ)(由此可得0093.00=∧β,316.01=∧β,则回归方程是x y 316.00093.0+=∧(3)当GDP 达到16时,其货币供应量的点估计值为:∧y =0.0093+0.316×16=5.065亿元估计标准误差:Sy=22--∑∧n y y i i)(=2-n SSE=MSE =09294.0=0.305置信区间为:∑=∧--+±n i i yx x x x nS t y 1202/)()(12α=5.065±2.228×0.305×21863.135711.11161212)(-+ 3、(1)利用EXCEL 的CORREL 函数计算相关系数r=0.9937.相关系数接近于1,表明农业总产值与农村购买力之间有较强的正线性相关关系。
第九章相关与回归一.判断题部分题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。
()答案:×题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。
()答案:√题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。
()答案:×题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。
()答案:×题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。
()答案:×题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。
()答案:√题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。
()答案:×题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。
()答案:×题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。
()答案:√题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。
()答案:×题目11:完全相关即是函数关系,其相关系数为±1。
()答案:√题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。
()答案×二.单项选择题部分题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A.相关关系B.函数关系C.回归关系D.随机关系答案:B题目2:现象之间的相互关系可以归纳为两种类型,即()。
A.相关关系和函数关系B.相关关系和因果关系第 3 页共27页C.相关关系和随机关系D.函数关系和因果关系答案:A题目3:在相关分析中,要求相关的两变量()。
A.都是随机的B.都不是随机变量C.因变量是随机变量D.自变量是随机变量答案:A题目4:测定变量之间相关密切程度的指标是()。
第九章 统计指数(一)单选题1、如果销售额增加10%,零售物价指数下降5%,则销售量( )A 、增加5%B 、增加10%C 、增加15.79%D 、无法判断2、综合指数是依据以下方式来编制的A 、先对比,后平均B 、先综合,后对比C 、先除后乘D 、先加后除3、平均指数是依据以下方式来编制的A 、先对比,后平均B 、先综合,后对比C 、先除后乘D 、先加后除4、通常在指数体系的完整框架中,质量指标指数是以( )计算的。
A 、拉氏公式B 、帕氏公式C 、马-埃公式D 、费雪公式5、通常在指数体系的完整框架中,数量指标指数是以( )计算的。
A 、拉氏公式B 、帕氏公式C 、马-埃公式D 、费雪公式6、某商店销售多种商品,报告期与基期相比销售额未变,但销售量增长了15%,则销售价格指数为( )A 、115%B 、100%C 、85%D 、86.96%7、编制平均指数的基本问题之一是( )A 、指数化指标的选择问题B 、合理加权问题C 、同度量因素的固定问题 D 、以上答案均错8、用于比较不同地区或国家各种商品价格综合差异程度的指数是( )A 、个体价格指数B 、时间价格指数C 、空间价格指数D 、平均价格指数9、我国的消费者价格指数(CPI )是采用( )来编制的。
A 、固定加权算术平均的形式B 、固定加权调和平均的形式C 、固定加权几何平均的形式 D 、简单算术平均的形式10、采用标准比值法编制综合评价指数时,个体指数的计算方法为( )A 、参评指标标准值比相应指标报告期值B 、参评指标报告期值比相应指标基期值C 、参评指标计划值比相应指标标准值D 、参评指标实际值比相应指标标准值11、P 表示商品价格,q 表示商品销售量,则∑-∑1011q p q p 的意义是综合反映多种商品的( )A 、销售量变动的绝对额B 、价格变动的绝对额C 、因价格变动额增减的销售额D 、因销售量变动额增减的销售额12、以个体指数为基础计算总指数的指数形式是( )A 、综合指数B 、平均指数C 、可变构成指数D 、固定构成指数13、某商品价格发生变化,现在的100元只值原来的90元,则价格指数为( )A 、10.00%B 、90.00%C 、110.00%D 、111.11%14、某企业职工工资总额,今年比去年减少2%,而平均工资上升5%,则职工人数减少( )A 、3.0%B 、10.0%C 、75.0%D 、6.7%二、多项选择题1、以下属于时间指数的是( )A 、股票价格指数B 、计划完成情况指数C 、零售物价指数D 、地区间的价格比较指数 E 、工业生产指数2、以下属于质量指标指数的是( )A 、股价指数B 、物价指数C 、成本指数D 、产量指数E 、销售量指数3、以下属于数量指标指数的是( )A 、工业生产指数B 、商品销售额指数C 、总产值指数D 、产量指数 E 、销售量指数4、个体指数( )A 、是反映个别现象或个别项目数量变动的指数B 、采用先综合、后对比的方式编制 C 、采用先对比、后综合的方式编制 D 、也有质量指标指数和数量指标指数之分 E 、是总指数的重要形式之一5、同度量因素的作用有( )A 、“同度量”的作用B 、“平衡”的作用C 、对指数化指标“加权”的作用 D 、“平均”的作用 E 、以上均对6、某商店报告期全部商品的销售量指数为120%,这个指数是( )A 、个体指数B 、总指数C 、数量指标指数D 、质量指标指数 E 、平均数指数7、可变构成指数的意义及公式( )A 、可变构成指数反映了各组的变量水平及总体结构两个因素的影响B 、可变构成指数仅反映总体结构的影响C 、可变构成指数的计算公式为:D 、可变构成指数的计算公式为:E 、可变构成指数的计算公式为: 8、固定构成指数的意义及公式( )A 、固定构成指数反映了各组的变量水平的影响B 、固定构成指数反映了总体结构的影响C 、固定构成指数的计算公式为:∑∑÷∑∑=0001100f f x f f x x x 假定∑∑÷∑∑=00011101f f x f f x x x ∑∑÷∑∑=1101111f f x f f x x x 假定∑∑÷∑∑=0001100f f x f f x x x 假定∑÷∑=00111f x f x xD 、固定构成指数的计算公式为:e 、固定构成指数的计算公式为: 9、结构影响指数的意义及公式( )A 、结构影响指数反映了各组的变量水平的影响B 、结构影响指数反映了总体结构的影响C 、结构影响指数的计算公式为:D 、结构影响指数的计算公式为:E 、结构影响指数的计算公式为: 10、加权总指数的编制方式有( )A 、先综合、后对比B 、先加后减C 、先减后加 D 、先对比、后平均 E 、先除后乘11、总指数的计算形式有( )A 、综合指数B 、销售量指数C 、销售价格指数D 、平均指数E 、产量指数三、填空题1、在我国,工业生产指数是通过计算各种工业产品的 产值来加以编制的。
《统计学概论》第九章课后练习答案一、思考题1.什么是国民经济核算?P281国民经济核算的作用有哪些?P2822.我国国民经济核算体系的发展大致经历了哪些阶段?P283-P2873.简述我国国民经济核算体系的基本框架。
P2884.什么是常住单位和非常住单位?试举例说明。
P287 –P2895.什么是机构单位?机构单位有哪些特点?6.国民经济核算的生产范围包括哪些?7.简述我国现行的国民经济行业分类及三次产业分类。
8.如何界定国民经济核算中的资产范围?9.什么是总产出、中间消耗和增加值?10.简述国内生产总值的三种不同计算方法。
11.什么是直接消耗系数?直接消耗系数的大小主要受哪些因素的影响?12.简述财产收入的内容和类别。
13.简述国内生产总值、国民总收入和国民可支配收入之间的关系。
14.什么是经常转移和资本转移?两者有何区别?15.国民资产负债核算中对资产是怎样进行分类的?16.简述收入使用核算的主要核算内容。
17.简述SNA对金融资产的分类。
18.简述国际收支平衡表的项目内容及其与国际收支头寸表的区别。
二、单项选择题1.划分国内经济活动和国外经济活动的基本依据是()。
A.基层单位和机构单位B.常住单位和非常住单位C.机构单位和机构部门D.基层单位和产业部门2.有权拥有资产和承担负债,能够独立从事经济活动和其他实体进行交易的经济实体称为()。
A.常住单位B.非常住单位C.基层单位D.机构单位3.常住单位定义中的经济领土不包括()。
A.领土、领海、领空B.具有海底开采管辖权的大陆架C.驻外使馆和领馆用地D.国外驻该国的使馆和领馆用地4.产品生产过程中的投入()。
A.就是中间消耗B.就是最初投入C.包括中间投入和最初投入两部分D.以上都不对5.投入产出表的第Ⅰ象限主要反映各产业部门之间的()。
A.技术联系B.经济联系C.技术经济联系D.中间消耗关系解析:第I象限是由名称相同、数目一致的若干个产业部门纵横交叉形成的棋盘式表格。
1 列联分析是利用列联表来研究()。
A.两个分类变量的关系
B.两个数值型变量的关系
C.一个分类变量和一个数值型变量的关系
D.两个数值型变量的分布
分布的自由度为()。
2 设R为列联表的行数,C为列联表的列数,则2
A.R
B. C
C.R×C
D.(R-1)×(C-1)
3 列联表中的每个变量()。
A.只能有一个类别
B.只能有两个类别
C.可以有两个或两个以上的类别
D.只能有三个类别
4 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如下:
这个表格是()。
A.4×4列联表
B.2×2列联表
C.2×3列联表
D.2×4列联表
5 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如上。
这个列联表的最右边一列称为()。
A.列边缘频数
B.行边缘频数
C.条件频数
D.总频数
6 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如上。
这个列联表的最下边一行称为()。
A.列边缘频数
B.行边缘频数
C.条件频数
D.总频数
7 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如上。
根据这个列联表计算的赞成上网收费的行百分比分别为()。
A.51.7%和48.3%
B.57.4%和42.6%
C.30%和70%
D.35%和65%
8 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如上。
根据这个列联表计算的男学生的列百分比分别为()。
A.51.7%和48.3%
B.57.4%和42.6%
C.30%和70%
D.35%和65%
9 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如上。
根据这个列联表计算的男女学生赞成上网收费的期望频数分别为()。
A.48和39
B.102和81
C.15和14
D.25和19
10 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如上。
根据这个列联表计算的男女学生反对上网收费的期望频数分别为()。
A.48和39
B.102和81
C.15和14
D.25和19
11 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如上。
根据这个列联表计算
χ统计量为()。
的2
A.0.617 6
B.1.617 6
C.0.308 8
D.1.308 8
12 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如上。
如果要检验男女学生对上网收费的看法是否相同,提出的原假设为()。
A.H0:π1=π2=270
B. H0:π1=π2=87
C. H0:π1=π2=150
D. H0:π1=π2=0.3222
13 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如上。
如果要检验男女学生
χ检验统计量的自由度是对上网收费的看法是否相同,即检验假设H0:π1=π2=0.3222, 2
()。
A.1
B.2
C.3
D.4
14 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如上。
如果根据显著性水平α=005,检验男女学生对上网收费的看法是否相同,即检验假设H0:π1=π2=0.3222,得出的结论是()。
A.拒绝原假设
B.不拒绝原假设
C.可以拒绝也可以不拒绝原假设
D.可能拒绝也可能不拒绝原假设
χ分布进行独立性检验,要求样本容量必须足够大,特别是每个单元中的期望频数
24 利用2
f e不能过小。
如果只有两个单元,每个单元的期望频数必须()。
A.等于或大于1
B.等于或大于2
C.等于或大于5
D.等于或大于10
25 如果列联表有两个以上的单元,不能应用χ2检验的条件是()。
A.20%的单元期望频数f e大于5
B.20%的单元期望频数f e小于5
C.10%的单元期望频数f e大于5
D.10%的单元期望频数f e小于5
1 A
2 D
3 C
4 B
5 B
6 A
7 A
8 C
9 A10 B11 A12 D13 A14 B15 A16 A17 D18 A19 A20 D21 D22 C23 C24 C25 B。