当前位置:文档之家› 统计学基础答案

统计学基础答案

第1章 总论
参考答案
一、单项选择题
1.D 2.A 3.D 4.B 5.D 6. D 7. A 8.D 9. B 10. D 11. A 12. A
二、多项选择题
1. ADE 2. BCE 3. BCDE 4. CDE 5. ACDE
三、判断题
1.√ 2. × 3. √ 4. × 5. √ 6. × 7. × 8. √ 9. × 10. √

第2章 数据收集与整理
一、单选题
1 B 2B 3C 4 C 5 C 6D 7 C 8 D 9 D 10 A 11 B 12D 13 B 14 B 15B 16B
二、多选题
1 ABCD 2 ABC 3 ABCD 4 AC 5 ACD 6 ABD 7 ABD 8 ACD 9 AC 10 BCD
三、判断题
1 √ 2 √ 3 √ 4 × 5 × 6 √ 7 √ 8 × 9 × 10 √
四、名词解释
1、普查:普查是为特定目的而专门组织的一次性或周期性的全面调查主要用来调查属于一定时点或一定时期内的社会现象总量。普查的目的在于收集那些不能够或不适宜用其他统计调查方式收集的统计数据
2、抽样调查:抽样调查是一种非全面调查,它是根据随机原则的要求,从总体中抽取部分个体构成样本,并依据样本信息推断总体数量特征的一种调查方法。
3、品质分布数列:按品质标志分组所形成的分布数列,称为品质分布数列,简称品质数列。品质数列由各组名称和次数构成。
4、变量分布数列:按数量标志分组所形成的次数分布数列叫变量分布数列,简称变量数列。变量数列由各组变量值和各组次数构成。
5、累计次数分布:累计次数分布是将变量数列各组的次数和频率逐组累计相加而形成的次数分布,它有向上累计和向下累计两种计算方法。
五、简答题
1、答:统计数据收集的原则有完整性原则、及时性原则、系统性原则和准确性原则。统计数据收集的方法有直接观察法、报告法、询问法和问卷调查法等几种。
2、答:一个完整的调查方案应该包括以下几个方面的内容。确定调查目的和任务、确定调查对象和调查单位、拟定调查提纲和调查表、确定调查时间和方法。
3、答:(1)问卷上所列问题应该都是必要的,可要可不要的问题不要列入;
(2)所问问题应是被调查者熟悉且易于回答的,避免出现被调查者不了解或难以回答的问题。回答全部问题所用的时间最多不超过半小时为适宜;
(3)问题要提得清楚、明确、具体、简短;明确问题的界限和范围,问句的词义要清楚;避免引导性问题或带有暗示性问题的出现。
(4)属于年龄、收入等私人生活问题,最好采用间接提问的方法。
(5)问卷上所拟答案要有穷尽性,避免重复或相互交叉。
(6)问卷纸张质地要良好,不宜破损,字迹印刷清晰,留作填写说明的空白处要大,页数较多时要装订成册。
4、答:(1)制定统计整理方案。(2)审核、纠正统计数据资料。(3)进行科学的统计数据分组与

汇总。(4)编制统计表和绘制统计图。
5、答:(1)统计分组可以划分社会经济现象的类型。(2)统计分组可以研究现象的内部结构。(3)统计分组可以分析现象之间的相互依存关系。
6、答:(1)根据统计研究的目的选择分组标志。(2)根据事物内部矛盾选择反映事物本质的分组标志。(3)根据被研究事物所处的具体条件选择分组标志。
7、答:(1)将原始资料按大小顺序排列。(2)确定组距和组数。(3)确定组限。(4)编制变量数列。
六、计算题
1
某工业公司某年利润计划完成情况
分组 组中值 次数(个) 频率(%) 累计次(个) 累计频率(%)
100%以下 95% 2 7 2 7
100%-110% 105% 16 59 18 66
110%-120% 115% 7 27 25 93
120%以上 125% 2 7 27 100
合计 — 27 100 — —
2、
第一步:排序
49 54 57 57 60 61 64 65 67 68 70 71 72 72 72 73 75 75 76 76 78 79 81 81 81 82 83 84 85 86 86 87 87 87 89 89 89 90 95 97
第二步:确定组距和组数
全距 = 97-49 = 48
根据考试成绩性质,60分为一个数量界限。在此基础上分为不及格、及格、中等、良好、优秀5个类型,则有
组数 = 5
组距 = 48/5 = 9.6
确定组距为10,组数为5.
第三步;确定组限。
组限为:60、70、80、90
第四步:编制变量数列。
某班学生大学英语考试成绩分布表
学生成绩(分) 学生人数(人) 比例(%)
60以下 4 10
60-70 6 15
70-80 12 30
80-90 15 37.5
90-100 3 7.5
合计 40 100

第3章 统计数据描述
一、单项选择题
1.C 2.B 3.C 4.A 5.B 6.C 7.C 8.D 9.D 10. 11.A 12.
二、多项选择题
1.AB 2.BD 3.ABC 4.BC 5.ABCDE 6.AE 7.ABCD 8.ABCE 9.BC
三、判断题
1. × 2.× 3.× 4.√ 5.× 6. × 7. × 8. √
四、计算题
1. 解:计算组中值,结果见计算表第二栏。
某集团公司产值计划完成程度及计算表
产值的计划完成程度(%) 组中值x(%) 各组企业所占比重(%) 计划产值
(万元) 实际产值
(万元)
80以下 75 15 300 225
80~90 85 30 400 340
90~100 95 30 600 570
100~110 105 10 800 840
110以上 115 15 900 1035
合计 - 100 3000 3010

2.解:计算调和平均数







3.解:(1)由组距数列确定中位数

根据公式得


上限公式:

(2)由组距数列确定众数
下限公式:
=
或者
上限公式:
=

4.解:(1)R1= max(xi)—min(xi)=120-20=100(件)
R2= max(xi)—min(xi)=73-67=6(件)
(2)



(3)

两组平均数相等,第二组标准差较小,所以第二组平均数代表性大。

5.解:
(1)分别计算两组的算术平均数


(2)
甲品种 乙品种
田块面积(亩) 产量(公斤) 亩产量(公斤)

田块面积(亩) 产量(公斤) 亩产量(公斤)
1.2 600 500 1.5 840 560
1.1 495 450 1.4 770 550
1.0 445 445 1.2 540 450
0.9 540 600 1.0 520 520
0.8 420 525 0.9 450 500
合计 5.0 2500 —— 6.0 3120 ——




(3) 乙组的标准差系数小,故乙品种较稳定。
第4章 时间序列
一、 单项选择
1.D 2.D 3.B 4.B 5.D 6.A 7.A 8.D 9.A 10. C
二、 多项选择
1.AB 2.CD 3.BC 4.AC 5.ACD 6.CE 7.ABD 8.AC
三、判断题
1.× 2. × 3.× 4. × 5. × 6.√

三、 计算题
1.(1) 某企业2009年职工劳动生产率
1月 2月 3月
劳动生产率(万元/人) 0.67 0.66 0.66

(2)
(3)

2.解:

3.解:


4、结果如下:
年份 产 量
(万辆) 增长量(万辆) 发展速度(%) 增长速度(%) 增长1%
绝对值
逐期 累积 环比 定基 环比 定基
2004
2005
2006
2007
2008
2009
2010 (50)
(51)
(48.45)
(60)
66
72
84 (-)
(1)
(-2.55)
(11.55)
(6)
(6)
(12) (-)
(1)
(-1.55)
(10)
(16)
(22)
(34) (-)
(102)
95
(123.84)
(110)
(109.09)
(116.67) (-)
(102)
(96.9)
120
(132)
(144)
(168) (-)
2
(-5)
(23.84)
10
(9.09)
(16.67) (-)
(2)
(-3.1)
(20)
(32)
(44)
(68) (-)
(0.5)
(0.51)
(0.4845)
(0.6)
(0.66)
(0.72)

5、解:(1)
(2)
(3)


6、某油田2000年至2010年的产量如表4.20所示,求出直线趋势方程,并预测2012年的产量。
解: =49.45

将a、b代入趋势方程,得 :yc=a+bt=49.4583.74+4.17t





7、解:计算过程见下表
表4.21 某地区某产品近四年各季度的出口额资料
一季度 二季度 三季度 四季度 年平均数
第一年 16 2 4 51 18.25
第二年 28 4.3 6.7 77.5 29.125
第三年 45 7.1 14.2 105 42.825
第四年 50 5.1 16.8 114 46.475
合计 139 18.5 41.7 347.5 -
季平均数 34.75 4.625 10.425 86.875 34.17
季节指数(%) 101.7 13.54 30.51 254.24 -

第5章 指数
练习题
一、单项选择题
1. D 2. C 3. A 4. B 5. B 6. A 7、D 8、B 9、D 10、A
二、多项选择题
1、ABCD 2、AE 3、AC 4、AD 5、CD
6、AD 7、CE 8、AB 9、ACDE 10、ABCDE
三、判断题
1. × 2. ∨ 3. ∨ 4. ∨ 5. × 6. × 7. × 8. × 9. × 10.∨
四、计算题
1.
商品名称 单位 价格(元) 销售量(千克)

基期 报告期 基期 报告期
皮鞋 双 40 45 3 4 180 160 120
布上衣 件 30 32 4 5 160 150 120
呢帽 顶 8 10 2 2.4 24 19.2 16
合计 - - - - - 364 329.2 256
①三种商品的个体价格指数

②拉氏、派氏价格指数
拉氏价格指数


派氏价格指数


③拉氏、派氏销售量指数
拉氏

销售量指数

派氏销售指数

2.
产品名称 总生产成本(万元) 2001年比2000年单位成本增减%
2000年 2001年
甲 1500 1600 20
乙 250 400 15
丙 400 700 -5
合并 2150 2700 -


成本指数为115.1%,单位成本上涨15.1%;成本的上涨使总生产成本增加354.2万元


总成本指数为125.6%,总成本上涨25.6%,上涨的绝对值为550万元。


产量指数为109.1%,产量增长9.1%,产量增长使总成本增长195.8万元。
3. 销售额指数为:

销售额增加数:

价格指数



销量指数


答:商品零售额指数为108.9%,销售额增加500万元。该变动由价格和销量两个因素引起的:价格指数为103.6%,价格变动使销售额增加212万元;销售量指数105.1%,销量的增加使销售额增加288万元。
4.

品 产量(台) 单位消耗量
(公斤) 材料价格
(元)


2010 2011 2010 2011 2010 2011
甲 24 26 12 12 54 59 15552 16848 16848 18404
乙 16 19 16 14 94 104 24064 28576 25004 27664
合计 — — — — — — 39616 45424 41852 46068

(1)计算材料支出的总变动情况,


这说明该企业的两种商品原材料支出比基期增长了16.3%,增加的绝对量为6452元
(2)产量的变动对材料支出总额变动的影响,具体情况如下:
产量指数:


计算结果表明,两种商品的产量总指数是114.7%,产量综合上涨了14.7%,由于产量的增长使材料支出总额增加了5808元。
(3)单位消耗量变动的影响,具体情况如下:


计算结果表明,三两种商品的单位耗材量总指数是92.1%,单位耗材量比基期下降了7.9%,从绝对数上看,单位耗材量的变化使材料支出总额减少了3752元。
(4)材料价格变动的影响,具体情况如下:


计算结果表明,商品的材料价格总指数是110.1%,比基期上长了10.1%,从绝对数上看,材料价格的变化使材料支出总额增加了4216元。
(5)综合分析
从相对数上看: 114.7%×92.1%×110.1%=116.3%
从绝对数上看:5808+(-3572)+4216=6452(元)
通过上述分析可以看出,该商店两种商品的材料支出额报告期比基期增长16.3%,支出额增加了6452元,其中产量增长了14.7%,使支出增加了5808元;商品单位耗材量降低了7.9%,使支出减少了3572元;材料价格上涨了110.1%,使支出增加了4216元。
5.
类别 平均价格(元/公) 消费量(万公斤)
2009年X 2010年 2009年 2010年
A市场 1.20 2.10 20 42
B市场 0.24 0.40 104 92


消费额指数为236.3%,上涨了136.3%;消费额比2009年多了0.54万元。
=

平均价格指数为172.5%,上涨了72.5%,价格的变动使人均消费额增加了0.39万元
=

消费量指数

为138.5%,使消费额增加了0.15万元。
6. 股票价格指数= 128.3%
答:股票的价格指数为128.3%。
7. (1)
答:销售量应该增加115.8%。
(2)工资总额指数=(1+3.2%) (1+2%)=105.3%
答:工厂工资总额增加5.3%。
(3) 物价指数=
物价指数=
答:物价指数是105.3%;物价指数为92.6%。

第6章 抽样与参数估计
一、单项选择题
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
B C D A A A C C C B C B A C D C
二、多项选择题
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
ACDE ABD ACE ABCE ACDE AB ABDE ABD BC ACD BC ABCDE AC ACD BDE
三、判断题
1.× 2.√ 3.× 4.× 5.√ 6.√ 7.× 8.√ 9.× 10.√ 11.√ 12.×
四、计算分析题
1.解:

2.解:①已假定总体标准差为 =15元,则样本均值的
抽样标准误差为

②已知置信水平1- =95%,得 Z=1.96,
允许误差
③已知样本均值为 ,置信水平
1- =95%,得 Z=1.96,
总体均值的置信区间为
如果样本均值为120元,总体均值95%的置信区间为
(115.8,124.2)元。
3.解:①该校学生考试的平均成绩的范围:



由 =95.45% 查表 Z=2



该校学生考试的平均成绩区间范围是:

②该校学生成绩在80分以上的学生所占比重范围:



全校80分以上的学生所占的比重范围为:
下限= =0.48-0.09992=0.3801
上限= =0.48+0.09992=0.5799
所以在95.45%概率保证程度下,该校学生成绩在80分以上的比重范围在38.01%—57.99%之间。
4.解:
每包重量 包数 组中值 总重量 离差 离差平方乘权数
148-149 10 148.5 1485 -1.8 32.4
149-150 20 149.5 2990 -0.8 12.8
150-151 50 150.5 7525 0.2 2
151-152 20 151.5 3030 1.2 28.8
100 15030 76

①平均每包重量
样本方差
抽样平均误差
概率为99.73%,所以概率度为Z=3,
允许误差 =3×0.08708=0.26154。
抽样置信区间: ,即
=
这批食品平均重量每包不低于150克,达到规格要求。
②P=70÷100=0.7则方差 =0.3×0.7=0.21
,因为概率为99.73%,
所以概率度Z=3。允许误差 =3×0.0458=0.1374。
则抽样置信区间:
=
能以99.73%的概率保证这批食品的合格率范围在
56.3%—83.7%之间。
5.解:①μ的置信度为0.95的置信区间为( ),
计算得

②μ的置信度为0.95的置信区间为( ),
计算得 ,
查表T=2.3060。


6.解:已知

这家广告公司应设计抽选24个批发类商店作样本,进行调查。
7.解:根据抽样结果及要求整理成如下分布数列:
按成绩分组(分) 人数(人)f 比重(%) 组中值 x xf

60分以下
60~70
70~80
80~90
90~100 3
6
15
12
4 7.5
15
37.5
30
1

0 55
65
75
85
95 165
390
1125
1020
380 -22
-12
-2
8
18 484
144
4
64
324 1452
864
60
768
1296
合计 40 100 3080 4440





全体职工考试成绩区间范围是:



即全体职工考试成绩在73.66---80.3分之间。若其它条件不变,极限误差范围缩小一半,应抽取的人数为:


8.解:因机构改革关系到所有人的利益,故采用分层抽样方法较宜.
∵ = ,∴10× =2,70× =14,20× =4
故从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.副处级以上干部被抽到的概率为 = ,一般干部被抽到的概率为 = ,工人被抽到的概率为 = ,即每个个体被抽到的概率都是 =
9.解:





以94.45%的概率推断该校学生平均体重的范围:
五、简答题
1.答:⑴按照随机原则抽取样本:总体中的各个单位是否入选样本,不受主观因素影响,保证总体中的每一单位都有相同的中选机会,剔除了人为主观因素,提高样本代表性。⑵由样本数据推断总体特征:通过逻辑上的归纳推算实现了从特殊到一般,从部分到总体的认识,由获得的样本的实际数据,计算样本指标,推算总体指标。⑶抽样调查中的抽样误差是不可避免的,但在事先可以估计:样本指标推断总体指标存在误差,这种误差可以事先估计,并能够控制这个误差范围。抽样推断根据事先给定的误差允许范围设计,具有一定概率保证的估计和判断。
2.答:①样本容量n的多少。在其它条件不变的情况下,样本容量愈大,抽样误差就愈小;反之,抽样误差就愈大。总体被研究标志的变异程度。②在其它条件不变的情况下,标志变异程度愈大,抽样误差也愈大;反之,则抽样误差就愈小。③ 抽样方法的选择。在相同的情况下,不重复抽样比重复抽样的误差小,这是因为重复抽样有可能使同一单位被多次抽中,因而产生的样本对总体的代表性就较差。
3.答: 抽样平均误差 是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度。抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。抽样平均误差大,说明样本指标对总体指标的代表性低;反之则说明样本指标对总体指标的代表性高。
抽样极限误差 是指用绝对值形式表示的样本指标与总体指标偏差的可允许的最大范围。它表明被估计的总体指标有希望落在一个以样本指标为基础的可能范围。它是由抽样指标变动可允许的上限或下限与总体指标之差的绝对值求得的。
两者的关系:抽样平均误差是反映

抽样误差一本水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标。
联系: 即极限误差是在抽样平均误差的基础上计算得到的。
其他条件不变时,概率保证程度越大,则临界值 越大,从而极限误差 越大;反之亦然。
4.答:精确性和可靠性(即效度和信度)在抽样估计中是相互矛盾的两个方面。两者的对立统一,停留在经验描述水平上是无法真正讲清楚的。这就要从参数估计的角度(而不仅仅是从假设检验的角度)来运用概率论。粗略地讲,效度和信度是成反比的。当精确程度达到最大而可信程度达到最小时,就过渡到了点估计。但若仔细分析不难发现,在参数估计中对效度和信度的要求并不是并重的。由于复杂系统内部事物矛盾运动的客观统计规律性,我们可以做点估计,即使这时估计区间为零,但估计对总体仍有一定的代表性。我们却不可以将估计区间任意放大,这样获得的可靠性对统计推论将没有任何意义。所以就此而言,在精确性和可靠性两因素之中,精确性是矛盾的主要方面。
5.答:估计量如果具有无偏性、一致性和有效性这三个要求或标准,就可以认为这种统计量是总体参数的合理估计或最佳估计。
(1)无偏性。如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是无偏估计。
(2)一致性。虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个一致的估计量。
(3)有效性。估计量的有效性指统计量的抽样分布集中在真实参数周围的程度。如果估计是无偏的,就可以用估计量的标准差来量度这种集中程度。标准差越小,估计量的有效性越高。
总之,如果一个估计量满足无偏性、一致性和有效性这三条准则,就可称其为最佳估计量。数理统计知识证明,只要样本容量大一些,用样本均值作为总体均值的估计量,总能满足上述三个标准,所以可以认为这是质量很高的点估计。
6.答:⑴ 总体各单位标志变异程度,即总体方差的大小。总体标志变异程度越大,要求样本容量要大些;反之则相反。
⑵ 抽样极限误差的大小。抽样极限误差越大,要求样本容量越小;反之则相反。
⑶ 抽样方法。在其他条件相同时,重复抽样比不重复抽样要求样本容量大些。
⑷ 抽样组织形式。例如,采用类型抽样的样本容量要小于简单随机抽样的样本容量。
⑸ 抽样推断的概率保证程度的大小。概率越大,要求样本容量越大;反之则相反。
7.答:分层抽样也称类型抽样,将总体按照某一标志进行分

组,在各组中按照随机原则抽取样本单位的组织方式。分层抽样将总体按照某一标志进行分组,各组的单位数一般是不相同的,样本单位数在各组之间的分配一般有两种方法:
⑴ 按照比例抽取样本数目,不考虑各组标志变异程度的大小,按各组的单位数占总体的比重抽取样本数目。
⑵ 各组抽取的样本数目,按照各组标志变异程度来确定,变异程度大多抽一点,变异程度小少抽一点。

第7章 假设检验
一、单项选择题
1.B 2.B 3.C 4.B 5.D 6.C
二、多项选择题
1.BD 2.AB 3.AB 4.CD 5.ABCD 6.ABCD
三、判断题
1.× 2. √ 3.× 4. √ 5.× 6.√
四、计算题
1、假设:

由显著性水平 =0.05,通过查正态分布表得
Z=8>1.96
因此拒绝原假设,接受备择假设,应该做出对生产线停产的决策。

=2>1.96
因此拒绝原假设,接受备择假设,应该做出对生产线停产的决策。
2、假设:
由于总体方差 未知,用样本方差 替代,此时可用 统计量作为检验统计量
由显著性水平 =0.05,通过查t分布表得
t=5>2.06=
因此拒绝原假设,接受备择假设,说明该电台该栏目的节目内容对目标观众没有针对性,需要进行调整与改进。
3、假设 ,
这是一个右侧检验问题。因为总体分布未知,大样本且方差未知,所以检验的统计量为
规定的显著性水平为 ,查表得临界值 2.33
Z=2.985>2.33
所以拒绝原假设 ,说明在显著性水平 下,该市人均居住面积有所增大。
4设 , 分别表示东部、西部两个地区农村平均家庭人口数,则根据题意有


提出的假设是: ,
这是一个双侧检验问题。虽然 , 分布未知,但 ,为大样本,所以检验的统计量为

对于显著性水平 ,查表得临界值 ,计算检验统计量 的值

因为 ,所以接受原假设 ,表明在 下,这两个地区的平均家庭人口数无差别。
5、设 表示某大学英语六级考试的及格率,样本容量n=300,样本比例 ,提出的假设是
,
这是一个左侧检验问题。检验的统计量为

规定的显著性水平为 ,查表得临界值 , 计算检验统计量Z的值

因为 ,所以接受原假设 ,说明在 下,该大学英语六级考试的及格率仍然保持在原有水平。
6、设 表示该杂志读者群中男性读者的比例,样本容量n=100,样本比例 ,提出的假设是
,
这是一个左侧检验问题。检验的统计量为

规定的显著性水平为 ,查表得临界值 , 计算检验统计量Z的值

因为 ,所以拒绝原假设 ,说明在 下,不能认为该杂志读者群中男性读者的比例不少于80%。
7、

设 表示20岁以下赞成的比例; 表示20岁以上赞成的比例。
提出的假设是: : ; : ;
这是一个双侧检验问题。

检验的统计量为

对于显著性水平 ,查表得临界值 ,计算检验统计量 Z的值

因为 ,所以接受原假设,表明在 下,20岁以下的和20岁以上的网民对所述问题的赞成比例没有显著差别。
8、本例中关注的是两个总体方差是否存在显著差异,因而属于双侧检验问题。设 分别表示夏季和冬季新生儿的体重,则根据题意可以计算得到:
, ,

提出的假设是
: ; :
检验的统计量为

规定的显著性水平为 ,查表得临界值
计算检验统计量 的值

由于 ,所以只需将检验统计量与 进行比较。因为 ,没有落在否定域 里,所以不否定 ,表明夏季和冬季新生儿体重的方差没有显著差异。
第8章 相关与回归分析
一、单项选择题
1.B 2.A 3.C 4.D 5.C
6.D 7.D 8.C 9.A 10.A
二、多项选择题
1.BCD 2.BCD 3.AC 4.AB 5.ABCD
6.BCD 7.AD 8.ABCD 9.AC 10.AD
三、判断题
1.× 2. × 3.× 4. × 5.×
6.√ 7. √ 8. √ 9. √ 10. ×
四、计算题
1、(1) 某企业总产值Y与生产性固定资产价值x相关表(单位:万元)
生产性固定资产价值 总产值
255
314
356
412
456
505
934
1022
1210
1225 656
605
535
835
916
946
1110
1240
1516
1624
(2) 正相关
(3)
(4) 参数 表示生产性固定资产价值每增加1万元,平均来说,总产值增加9300元。
(5)
(6) ,当生产性固定资产(自变量)为1500万元时总产值为1771.18万元。
2、(1)
(2)
(3) ,则总变差平方和中有91.61%可由回归方程解释。
(4)
3、(1)
(2) ,

(3)

4、(1)
(2) ,

(3)

5、
变差来源 平方和 自由度 方差
源于回归
源于残差 2500
120 1
27 2500
4.444
总变差 2620 28


第9章 方差分析
1.选择题
(1)B.(2)A.(3)B.(4)B.(5) C.(6) C.(7) D.(8) B.(9) D.(10)C.
(11) A.(12) C.(13) A.
2.多项选择题
(1)ACE (2)ABE (3)BE (4)C (5)ACD
3.判断题
(1)F(2)T(3)T(4)T(5)F(6)T(7)F(8)T(9)F
(10)T(11)T(12)F(13)T

4.计算
(1)
方差分析:单因素方差分析

SUMMARY
组 观测数 求和 平均 方差
企业A 5 1119 223.8 1609.7
企业B 6 889 148.1667 3001.767
企业C 6 1051 175.1667 762.9667


方差分析
差异源 SS df MS F P-value F crit
组间 15812.47 2 7906.237 4.381493 0.033288 3.738892
组内 252

62.47 14 1804.462
总计 41074.94 16

(2)方差分析:单因素方差分析

SUMMARY
组 观测数 求和 平均 方差
单独驾驶 10 637 63.7 87.56667
至少有一名乘客 12 683 56.91667 63.53788

方差分析
差异源 SS df MS F P-value F crit
组间 250.9833 1 250.9833 3.375663 0.081071 5.871494
组内 1487.017 20 74.35083
总计 1738 21



(3) 根据单因素方差分析表,将有下划线的空格填空,识别原假设和备择假设,在0.05的显著水平下,原假设是否成立?
差异源 平方和 自由度 均方差 F值
组间SSA 6752.0 2 3376.0 _ 3.02____
组内SSE 30178.0 _30-3=27_ 30178/27=1117.7
总计SST 36930.0 29 FC=1.88

因F>Fc, 原假设不成立

离差来源
平方和
自由度
均方差
F值

组间

t-1

组内

N-t


合计

N-1


(4)
方差分析:可重复双因素分析

SUMMARY 因素B1 因素B2 因素B3 总计
因素A1
观测数 2 2 2 6
求和 23 34 36 93
平均 11.5 17 18 15.5
方差 4.5 8 2 12.7

因素A2
观测数 2 2 2 6
求和 30 41 33 104
平均 15 20.5 16.5 17.33333
方差 0 4.5 0.5 7.466667

总计
观测数 4 4 4
求和 53 75 69
平均 13.25 18.75 17.25
方差 5.583333 8.25 1.583333


方差分析
差异源 SS df MS F P-value F crit
样本 10.08333 1 10.08333 3.102564 0.128644 5.987378
列 64.66667 2 32.33333 9.948718 0.012436 5.143253
交互 16.66667 2 8.333333 2.564103 0.156739 5.143253
内部 19.5 6 3.25
总计 110.9167 11


(5)根据两因素方差分析汇总表所给出的数据,将遗漏数据填入。并在0.05的显著水平下,检验原假设是否成立。

差异源 平方和 自由度 均方 F
因素A 1514.2 3 504.7333333 13.0044015
因素B 88.8 3 29.6 0.762640902
交互AB 1252.9 9 139.2111111 3.586759707
误差 1863 48 38.8125
总计 4718.9 63



离差来源 平方和 自由度 均方 F值
因素A

a-1
因素B

b-1
AB交互 SSAB=SST-SSA-SSB-SSE
(a-1)(b-1)
随机误差

ab(r-1)

总离差

abr-1




(6)根据两因素方差分析汇总表所给出的数据,将遗漏数据填入。并在0.05的显著水平下,检验原假设是否成立。

差异源 平方和 自由度 均方 F
因素A 126.75 1 126.75 14.22
因素B 310.08 1 310.08 34.78
交互AB 36.75 1 36.75 4.12
误差 71.33 8 8.91625
总计 544.91 11


相关主题
文本预览
相关文档 最新文档