第9章方差分析与回归分析习题答案
- 格式:doc
- 大小:280.50 KB
- 文档页数:4
应⽤回归分析-第9章课后习题答案第9章含定性变量的回归模型思考与练习参考答案9.1 ⼀个学⽣使⽤含有季节定性⾃变量的回归模型,对春夏秋冬四个季节引⼊4个0-1型⾃变量,⽤SPSS 软件计算的结果中总是⾃动删除了其中的⼀个⾃变量,他为此感到困惑不解。
出现这种情况的原因是什么?答:假如这个含有季节定性⾃变量的回归模型为:tt t t kt k t t D D D X X Y µαααβββ++++++=332211110其中含有k 个定量变量,记为x i 。
对春夏秋冬四个季节引⼊4个0-1型⾃变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到⼀次观测值,则样本设计矩阵为:=000110010110001010010010100011)(616515414313212111k k k k k k X X X X X X X X X X X XD X,显然,(X,D)中的第1列可表⽰成后4列的线性组合,从⽽(X,D)不满秩,参数⽆法唯⼀求出。
这就是所谓的“虚拟变量陷井”,应避免。
当某⾃变量x j 对其余p-1个⾃变量的复判定系数2j R 超过⼀定界限时,SPSS 软件将拒绝这个⾃变量x j 进⼊回归模型。
称Tol j =1-2j R 为⾃变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0.0001。
也就是说,当2j R >0.9999时,⾃变量x j 将被⾃动拒绝在回归⽅程之外,除⾮我们修改容忍度的默认值。
=k βββ 10β=4321ααααα⽽在这个模型中出现了完全共线性,所以SPSS软件计算的结果中总是⾃动删除了其中的⼀个定性⾃变量。
9.2对⾃变量中含有定性变量的问题,为什么不对同⼀属性分别建⽴回归模型,⽽采取设虚拟变量的⽅法建⽴回归模型?答:原因有两个,以例9.1说明。
⼀是因为模型假设对每类家庭具有相同的斜率和误差⽅差,把两类家庭放在⼀起可以对公共斜率做出最佳估计;⼆是对于其他统计推断,⽤⼀个带有虚拟变量的回归模型来进⾏也会更加准确,这是均⽅误差的⾃由度更9.3 研究者想研究采取某项保险⾰新措施的速度y对保险公司的规模x1和保险公司类型的关系(参见参考⽂献【3】)。
管理统计学刘金兰答案【篇一:管理统计学-刘金兰-第九章及复习题答案】t>*9-1 在相关分析中,对两个变量的要求是(A)。
(单选题) a.都是随机变量 b. 都不是随机变量 c. 其中一个是随机变量,一个是常数。
d. 都是常数。
*9-2 在建立与评价了一个回归模型以后,我们可以( d )。
(单选题) a. 估计未来所需要样本的容量。
b. 计算相关系数与判定系数。
c. 以给定因变量的值估计自变量的值。
d. 以给定自变量的值估计因变量的值。
9-3 对两变量的散点图拟合最好的回归线必须满足一个基本条件是( d )。
(单选题) a. c. ??y??yi?i?最大 b. ?y?i?最大d. ?y2??yi?i?最小?yii??y?i?最小?y2*9-4 如果某地区工人的日工资收入(元)随劳动生产率(千元/人时)的变动符合简单线性方程y=60+90x,请说明下列的判断中正确的有(AC)(多选) a.当劳动生产率为1千元/人时,估计日工资为150元;b.劳动生产率每提高1千元/人时,则日工资一定提高90元;c.劳动生产率每降低0.5千元/人时,则日工资平均减少45元;d.当日工资为240元时,劳动生产率可能达到2千元/人。
*9-5 变量之间的关系按相关程度可分为(b Cd )(多选) a.正相关 b.不相关 c.完全相关 d.不完全相关*9-6 简单线性回归分析的特点是:(Ab )。
(多选题) a. 两个变量之间不是对等关系 b. 回归系数有正负号 c. 两个变量都是随机的d. 利用一个方程两个变量可以互相推算 e.有可能求出两个回归方程 *9-7 一元线性回归方程中的回归系数b可以表示为(BC)。
(多选题) a. 两个变量之间相关关系的密切程度 b. 两个变量之间相关关系的方向 c. 当自变量增减一个单位时,因变量平均增减的量d. 当因变量增减一个单位时,自变量平均增减的量 e.回归方程的拟合优度*9-8 回归分析和相关分析的关系是( aBe )。
方差分析与回归分析习题答案SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#第九章 方差分析与回归分析习题参考答案1. 为研究不同品种对某种果树产量的影响,进行试验,得试验结果(产量)如下表,试分析果树品种对产量是否有显着影响.(0.05(2,9) 4.26F =,0.01(2,9)8.02F =)解:r=3,12444n n 321=++=++=n n ,T=120 ,12001212022===n T C 计算统计值?7228.53,38A A A e e SS f F SS f ==≈……方差分析表结论:由于0.018.53(2,9)8.02,A F F ≈>=故果树品种对产量有特别显着影响.2.2700=10.523.56=≈结论: 由以上方差分析知,进器对火箭的射程有特别显着影响;燃料对火箭的射程有显着影响. 3.为了研究某商品的需求量Y 与价格x 之间的关系,收集到下列10对数据:2231,58,147,112,410.5,i i i i i i x y x y x y =====∑∑∑∑∑(1)求需求量Y 与价格x 之间的线性回归方程; (2)计算样本相关系数;(3)用F 检验法作线性回归关系显着性检验. 解:引入记号10, 3.1,5.8n x y ===∴需求量Y 与价格x 之间的线性回归方程为(2)样本相关系数32.80.955634.3248l r-==≈≈- 在0H 成立的条件下,取统计量(2)~(1,2)Ren S FF n S -=-计算统计值22(32.8)15.967.66,74.167.66 6.44R xy xx e yy R S l l S l S ==-≈=-≈-=故需求量Y 与价格x 之间的线性回归关系特别显着.4. 随机调查10个城市居民的家庭平均收入(x)与电器用电支出(y)情况得数据(单位:千元)如下:(1) 求电器用电支出y 与家庭平均收入x 之间的线性回归方程; (2) 计算样本相关系数; (3) 作线性回归关系显着性检验;(4) 若线性回归关系显着,求x =25时, y 的置信度为的预测区间. 解:引入记号10,27,1.9n x y ===∴电器用电支出y 与家庭平均收入x 之间的线性回归方程为(2)样本相关系数 0.9845l r==≈在0H 成立的条件下,取统计量(2)~(1,2)Rn S FF n S -=-e计算统计值2243.6354 5.37,5.54 5.370.17xy xx yy s l l s l s ==≈=-≈-=R e R故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. 相关系数检验法 01:0;:0H R H R =≠故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. (4) 因为0xx =处,0y 的置信度为1α-的预测区间为其中00.025垐 1.42640.123225 1.6536,(8) 2.31,0.1458y t σ=-+⨯====代入计算得当x =25时, y 的置信度为的预测区间为。
第九章相关与回归分析Ⅰ. 学习目的和要求本章所要学习的相关与回归分析是经济统计分析中最常重要的统计方法之一。
具体要求:1.掌握有关相关与回归分析的基本概念;2.掌握单相关系数的计算与检验的方法,理解标准的一元线性回归模型,能够对模型进行估计和检验并利用模型进行预测;3.理解标准的多元线性回归模型,掌握估计、检验的基本方法和预测的基本公式,理解复相关系数和偏相关系数及其与单相关系数的区别;4.了解常用的非线性函数的特点,掌握常用的非线性函数线性变换与估计方法,理解相关指数的意义;5.能够应用Excel软件进行相关与回归分析。
Ⅱ. 课程内容要点第一节相关与回归分析的基本概念一、函数关系与相关关系当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,这种关系称为确定性的函数关系。
当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但仍按某种规律在一定的范围内变化。
这种关系,称为具有不确定性的相关关系。
变量之间的函数关系和相关关系,在一定条件下是可以互相转化的。
116117二、相关关系的种类按相关的程度可分为完全相关、不完全相关和不相关。
按相关的方向可分为正相关和负相关。
按相关的形式可分为线性相关和非线性相关。
按所研究的变量多少可分为单相关、复相关和偏相关。
三、相关分析与回归分析相关分析是用一个指标来表明现象间相互依存关系的密切程度。
回归分析是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。
通过相关与回归分析虽然可以从数量上反映现象之间的联系形式及其密切程度,但是无法准确地判断现象内在联系的有无,也无法单独以此来确定何种现象为因,何种现象为果。
只有以实质性科学理论为指导,并结合实际经验进行分析研究,才能正确判断事物的内在联系和因果关系。
四、相关图相关图又称散点图。
它是以直角坐标系的横轴代表变量X ,纵轴代表变量Y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形。
《医学统计学》习题解答(最佳选择题和简答题)孙振球主编.医学统计学习题解答. 第2版. 北京:人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章 计量资料的统计描述(注:题号上有“方框” 的简答题为基本概念,下同)第三章总体均数的估计与假设检验简答题:第四章多个样本均数比较的方差分析简答题:第五章计数资料的统计描述简答题:第六章二项分布与Poisson分布简答题:第七章χ2检验简答题:1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同?3. 对于四格表资料,如何正确选用检验方法?4. 说明行×列表资料χ2检验应注意的事项?5. 说明R×C表的分类及其检验方法的选择。
第八章秩和检验简答题:5. 两独立样本比较的Wilcoxon秩和检验,当n1>10或n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么?6. 随机区组设计多个样本比较的Friedman M 检验,备择假设H1如何写?为什么?第九章回归与相关简答题:第十章统计表与统计图简答题:5. 统计表与统计图有何联系和区别?6. 茎叶图与频数分布图相比有何区别,有何优点?第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。
第九章 方差分析与回归分析习题参考答案
1. 为研究不同品种对某种果树产量的影响,进行试验,得试验结果(产量)如下表,试分析果树品种对产量是否有显着影响. (0.05(2,9) 4.26F =,0.01(2,9)
8.02F =)
34
2
11
1310ij i j x ===∑∑
解:r=3,
12444n n 321=++=++=n n , T=120 ,120012
1202
2===n T C
3
4
2
211
131********(1)1110110T ij T i j SS x C S n s ===-=-==-=⨯=∑∑或S
322.1112721200724(31)429724A i A A i SS T C S s ==-=-==-=⨯⨯=∑或S
3872110=-=-=A T e SS SS SS
计算统计值722
8.53,
389
A A A e e SS f F SS f =
=≈……
方差分析表
结论:由于0.018.53(2,9)8.02,
A F F ≈>=故果树品种对产量有特别显着影响.
2.
..180x =
43
2
11
2804ij i j x ===∑∑
解:22..4,3,12,180122700l
m n lm C x n =======
43
2211
28042700104(1)119.45
104T ij T i j S x C S n s ===-=-==-=⨯≈∑∑&&或 422
.1
12790270090(1)331090
3A i A A i S x C S m l s ==-=-==-≈⨯⨯=∑或322
.1
12710.5270010.5(1)8 1.312510.5
4B j B B j S x C S l m s ==-=-==-≈⨯=∑或1049010.5 3.5e T A B S S S S =--=--=
计算统计值90310.52
51.43,93.56 3.56
A A
B B A
B e e e e S f S f F F S f S f =
=≈==≈
结论: 由以上方差分析知,进器对火箭的射程有特别显着影响;燃料对火箭的射程有显着影响. 31,58,147,112,410.5,i i i i i i x y x y x y =====(1)求需求量Y 与价格x 之间
的线性回归方程; (2)计算样本相关系数;
(3)用F 检验法作线性回归关系显着性检验.
⎪⎪⎭
⎫
⎝⎛====56.10)9,1(,26.11)8,1(12.5)9,1(,32.5)8,1(01.001.005.005.0F F F F
解:引入记号
10, 3.1,
5.8n x y ===
()()14710 3.1 5.832.8xy i i i i l x x y y x y nx y =--=-=-⨯⨯=-∑∑ 2
222()11210 3.115.9xx i i l x x x nx =-=-=-⨯=∑∑
22
()(1)9 1.766715.9xx i x l x x n s =-=-≈⨯≈∑或
2
222()410.510 5.874.1yy i i l y y y ny =-=-=-⨯=∑∑
22()(1)98.233374.1yy i y l y y n s =-=-≈⨯≈∑或
ˆ(1)
b
Q 32.8ˆˆ2.06, 5.8 2.06 3.112.1915.9xy xx l a y bx l -==≈-=-≈+⨯≈ ∴需求量Y 与价格x 之间的线性回归方程为
ˆy
ˆˆ12.19 2.06a bx x =+≈-
(2)样本相关系数
32.8
0.955634.3248
l r -=
=
≈≈-
01(3)
:0;:0H b H b =≠
在0H 成立的条件下,取统计量(2)~(1,2)R
e
n S F
F n S -=
-
计算统计值
2
2(32.8)15.967.66,
74.167.66 6.44
R xy xx e yy R S l l S l S ==-≈=-≈-=
0.01(2)867.666.4484.05(1,8)11.26R e F n S S F =-≈⨯≈>=
故需求量Y 与价格x 之间的线性回归关系特别显着.
∑∑∑∑∑=====6.556,
64.41,
7644,
19,
27022i
i
i
i
i
i
y
x y
x
y
x
(1) 求电器用电支出y 与家庭平均收入x 之间的线性回归方程; (2) 计算样本相关系数; (3) 作线性回归关系显着性检验;
(4) 若线性回归关系显着,求x =25时, y 的置信度为的预测区间. 解:引入记号
10,
27, 1.9n x y ===
()()556.61027 1.943.6xy i i i i l x x y y x y nx y =--=-=-⨯⨯=∑∑
2
222()76441027354xx i i l x x x nx =-=-=-⨯=∑∑
22
()(1)939.3333
354xx i x l
x x n s =-=-≈⨯≈∑或
2
222()41.6410 1.9 5.54
yy i i l y y y ny =-=-=-⨯=∑∑
22()(1)90.4716 5.54yy i y l y y n s =-=-≈⨯=∑或
ˆ(1)
b
Q 43.6ˆˆ0.1232, 1.90.123227 1.4264354xy xx l a y bx l ==≈=-≈-⨯≈- ∴电器用电支出y 与家庭平均收入x 之间的线性回归方程为
ˆy
ˆˆ 1.42640.1232a bx x =+≈-+ (2)样本相关系数
0.9845l r =
=
≈
01(3)
:0;:0F H b H b =≠检验法
在0H 成立的条件下,取统计量(2)~(1,2)R
n S F
F n S -=
-e
计算统计值
2
243.6354 5.37,
5.54 5.370.17
xy xx yy s l l s l s ==≈=-≈-=R e R
(2)n s F s -=
R
e
0.018 5.370.17252.71(1,8)11.26F ≈⨯≈>=
故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着.
相关系数检验法
01:0;:0H R H R =≠
0.01||0.9845(8)0.765r r =>=由
故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. (4) 因为0x
x =处,0y 的置信度为1α-的预测区间为
2
0垐((2)y t n ασ±-
其中
00.025垐 1.42640.123225 1.6536,
(8) 2.31,0.1458y t σ=-+⨯====
代入计算得当x =25时, y 的置信度为的预测区间为
(1.65360.355)(1.2986,2.0086).=m。