第章方差分析与回归分析习题答案
- 格式:docx
- 大小:113.98 KB
- 文档页数:4
第8章 方差分析与回归分析一、方差分析1.在一个单因子试验中,因子A有三个水平,每个水平下各重复4次,具体数据如下:表8-1试计算误差平方和s e、因子A的平方和S A与总平方和S T,并指出它们各自的自由度.解:此处因子水平数r=3,每个水平下的重复次数m=4,总试验次数为n=mr=12.首先,算出每个水平下的数据和以及总数据和:T1=8+5+7+4=24.T2=6+10+12+9=37.T3=0+1+5+2=8.T=T l+T2+T3=24+37+8=69.误差平方和S e由三个平方和组成:于是而2.在一个单因子试验中,因子A有4个水平,每个水平下重复次数分别为5,7,6,8.那么误差平方和、A的平方和及总平方和的自由度各是多少?解:此处因子水平数r=4,总试验的次数n=5+7+6+8=26,因而有误差平方和的自由度因子A的平方和的自由度总平方和的自由度3.在单因子试验中,因子A有4个水平,每个水平下各重复3次试验,现已求得每个水平下试验结果的样本标准差分别为1.5,2.0,1.6,1.2,则其误差平方和为多少?误差的方差σ2的估计值是多少?解:此处因子水平数r=4,每个水平下的试验次数m=3,误差平方和S e由四个平方组成,它们分别为于是其自由度为,误差方差σ2的估计值为4.在单因子方差分析中,因子A有三个水平,每个水平各做4次重复试验.请完成下列方差分析表,并在显著性水平α=0.05下对因子A是否显著作出检验.表8-2 方差分析表解:补充的方差分析表如下所示:表8-3 方差分析表对于给定的显著性水平,查表知,故拒绝域为,由于,因而认为因子A是显著的.此处检验的p值为5.用4种安眠药在兔子身上进行试验,特选24只健康的兔子,随机把它们均分为4组,每组各服一种安眠药,安眠时间如下所示.表8-4 安眠药试验数据在显著性水平下对其进行方差分析,可以得到什么结果?解:这是一个单因子方差分析的问题,根据样本数据计算,列表如下:表8-5于是根据以上结果进行方差分析,并继续计算得到各均方以及F 比,列于下表:表8-6在显著性水平下,查表得,拒绝域为,由于故认为因子A (安眠药)是显著的,即四种安眠药对兔子的安眠作用有明显的差别.此处检验的p 值为6.为研究咖啡因对人体功能的影响,特选30名体质大致相同的健康男大学生进行手指叩击训练,此外咖啡因选三个水平:每个水平下冲泡l0杯水,外观无差别,并加以编号,然后让30位大学生每人从中任选一杯服下,2h后,请每人做手指叩击,统计员记录其每分钟叩击次数,试验结果统计如下表:表8-7请对上述数据进行方差分析,从中可得到什么结论?解:我们知道,对数据作线性变换不会影响方差分析的结果,这里将原始数据同时减去240,并作相应的计算,计算结果列入下表:表8-8于是可计算得到三个平方和把上述诸平方和及其自由度填入方差分析表,并继续计算得到各均方以及F比:表8-9若取查表知,从而拒绝域为,由于.故认为因子A(咖啡因剂量)是显著的,即三种不同剂量对人的作用有明显的差别.此处检验的p值为7.某粮食加工厂试验三种储藏方法对粮食含水率有无显著影响.现取一批粮食分成若干份,分别用三种不同的方法储藏,过一段时间后测得的含水率如下表:表8-10(1)假定各种方法储藏的粮食的含水率服从正态分布,且方差相等,试在下检验这三种方法对含水率有无显著影响;(2)对每种方法的平均含水率给出置信水平为0.95的置信区间.解:(1)这是一个单因子方差分析的问题,由所给数据计算如下表:表8-11三个平方和分别为。
第8章 方差分析及回归分析1.今有某种型号的电池三批,它们分别是A、B、C三个工厂所生产的,为评比其质量,各随机抽取5只电池为样品,经试验得其寿命(h)如表8-1所示:表8-1试在显著性水平0.05下检验电池的平均寿命有无显著的差异,若差异是显著的,试求均值差和的置信水平为95%的置信区间。
解:以依次表示工厂A、B、C生产的电池的平均寿命。
提出假设:;:不全相等。
由已知得S T,S A,S E的自由度分别为n-1=15-1=14,s-1=2,n-s=15-3=12,从而得方差分析如表8-2所示:表8-2因=17.07>3.89=(2,14),故在显著性水平0.05下拒绝,认为平均寿命的差异是显著的。
由已知得,极限误差E为从而分别得和的一个置信水平为95%的置信区间为(±5.85)=(6.75,18.45),(±5.85)=(-7.65,4.05),(±5.85)=(-20.25,-8.55)。
2.为了寻找飞机控制板上仪器表的最佳布置,试验了三个方案,观察领航员在紧急情况的反应时间(以秒计),随机地选择28名领航员,得到他们对于不同的布置方案的反应时间如表8-3所示:表8-3试在显著性水平0.05下检验各个方案的反应时间有无显著差异,若有差异,试求的置信水平为0.95的置信区间。
解:提出假设::不全相等已知得又的自由度分别为n -1=28-1=27,s -1=3-1=2,n -s =28-3=25,从而得方差分析如表8-4所示:表8-4因=11.3>3.39=(2,14),故在显著性水平=0.05下拒绝,认为差异是显著的。
以下来求置信水平为1-=0.95的置信区间,今2.0595,则从而分别得的一个置信水平为0.95的置信区间为(±1.78)=(0.72,4.28),(±1.95)=(2.55,6.45),(±1.78)=(0.22,3.78)。
1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP/元人均消费水平/元北京辽宁上海江西河南贵州陕西 224601122634547485154442662454973264490115462396220816082035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(0.05α=)。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
解:(1)可能存在线性关系。
(2)相关系数:(3)回归方程:734.6930.309y x=+回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型非标准化系数标准化系数t 显著性B 标准误Beta1 (常量)734.693 139.540 5.265 0.003人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型R R 方调整 R 方标准估计的误差1 .998a.996 .996 247.303a. 预测变量: (常量), 人均GDP。
人均GDP对人均消费的影响达到99.6%。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
2.1 一元线性回归模型有哪些基本假定?答:1. 解释变量 1x , ,2x ,p x 是非随机变量,观测值,1i x ,,2 i x ip x 是常数。
2. 等方差及不相关的假定条件为⎪⎪⎩⎪⎪⎨⎧⎪⎩⎪⎨⎧≠=====j i n j i j i n i E j i i ,0),,2,1,(,),cov(,,2,1,0)(2 σεεε 这个条件称为高斯-马尔柯夫(Gauss-Markov)条件,简称G-M 条件。
在此条件下,便可以得到关于回归系数的最小二乘估计及误差项方差2σ估计的一些重要性质,如回归系数的最小二乘估计是回归系数的最小方差线性无偏估计等。
3. 正态分布的假定条件为⎩⎨⎧=相互独立n i ni N εεεσε,,,,,2,1),,0(~212 在此条件下便可得到关于回归系数的最小二乘估计及2σ估计的进一步结果,如它们分别是回归系数的最及2σ的最小方差无偏估计等,并且可以作回归的显著性检验及区间估计。
4. 通常为了便于数学上的处理,还要求,p n >及样本容量的个数要多于解释变量的个数。
在整个回归分析中,线性回归的统计模型最为重要。
一方面是因为线性回归的应用最广泛;另一方面是只有在回归模型为线性的假设下,才能的到比较深入和一般的结果;再就是有许多非线性的回归模型可以通过适当的转化变为线性回归问题进行处理。
因此,线性回归模型的理论和应用是本书研究的重点。
1. 如何根据样本),,2,1)(;,,,(21n i y x x x i ip i i =求出p ββββ,,,,210 及方差2σ的估计;2. 对回归方程及回归系数的种种假设进行检验;3. 如何根据回归方程进行预测和控制,以及如何进行实际问题的结构分析。
2.2 考虑过原点的线性回归模型 n i x y i i i ,,2,1,1 =+=εβ误差n εεε,,,21 仍满足基本假定。
求1β的最小二乘估计。
答:∑∑==-=-=ni ni i i i x y y E y Q 1121121)())(()(ββ∑∑∑===+-=--=∂∂n i n i ni i i i i i i x y x x x y Q111211122)(2βββ 令,01=∂∂βQ 即∑∑===-n i ni i i i x y x 11210β 解得,ˆ1211∑∑===ni ini ii xyx β即1ˆβ的最小二乘估计为.ˆ1211∑∑===ni ini ii xyx β2.3 证明: Q (β,β1)= ∑(y i-β0-β1x i )2因为Q (∧β0,∧β1)=min Q (β0,β1 )而Q (β0,β1) 非负且在R 2上可导,当Q 取得最小值时,有即-2∑(y i-∧β0-∧β1x i )=0 -2∑(y i-∧β0-∧β1x i ) x i =0又∵e i =y i-( ∧β0+∧β1x i )= y i-∧β0-∧β1x i ∴∑e i =0,∑e i x i =0(即残差的期望为0,残差以变量x 的加权平均值为零)2.4 解:参数β0,β1的最小二乘估计与最大似然估计在εi~N(0, 2 )10ˆˆQQββ∂∂==∂∂i=1,2,……n 的条件下等价。
▪ 习题不能用正交表78(2)L ,因为会产生混杂。
需选用正交表1516(2)L 。
表头设计如下:▪ 说明:也可有其他不同的表头设计(试验方案)。
▪ 习题 由于1AB C D A B A C B C f f f f f f f ⨯⨯⨯=======, 7f =总,故可选用正交表78(2)L ,且不会产生混杂。
表头设计如下:根据直观分析结果,因素的主次顺序为:AXB AXC C B BXC A D A 与B 的二元表,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,A 与C 的二元表,▪根据A与B的二元表,A1 B2的效果最好;▪根据A与C的二元表,A1 C2的效果最好;▪从直观分析结果可以得到,D1效果最好;▪故最优生产条件为:A1 B2 C2 D1▪(3)方差分析由于没有误差列,故不能对各因素进行显著性检验。
但是,我们选择离差平方和最小的因素D所在的列作为误差列,对各因素进行显著性检验,得到结果如下:因素的主次顺序与直观分析的一样,从显著性来看,只有AXB显著,其他的因素或交互作用都不显著。
▪习题其中A ×B 的离差平方和349.85222.29632.148A B SS SS SS ⨯=+=+=A ×B 的自由度,,,,,,344A B f f f ⨯=+=32.14841.973 5.14024.446A B F ⨯==<故A ×B 不显著。
B ×C 的离差平方和81134.7417.6342.371B C SS SS SS ⨯=+=+=B ×C 的自由度,,,,,,8114B C f f f ⨯=+=42.3714 2.601 5.14024.446B CF ⨯==<故B ×C 不显著。
▪ 因素的主次顺序(根据极差大小或F 值大小) A D F BXC AXB B E C ▪ 最优工艺条件的确定:可以根据直观分析结果选择每个因素的最优水平,得到最优工艺条件为:,,,,,,,,,,,,,,,A1,D1,F1,E0,B0,C0,,.,,,,,,,,,,也可以计算各因素的水平效应 根据水平效应来确定,具体如下: 对于因素A ,,,,115221319ˆ9.148927927A K T a=-=-= 224251319ˆ 1.630927927A K T a =-=-=-333721319ˆ7.519927927A K T a =-=-=-故A 的第1水平的效应最大。
方差分析与回归分析习题答案SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#第九章 方差分析与回归分析习题参考答案1. 为研究不同品种对某种果树产量的影响,进行试验,得试验结果(产量)如下表,试分析果树品种对产量是否有显着影响.(0.05(2,9) 4.26F =,0.01(2,9)8.02F =)解:r=3,12444n n 321=++=++=n n ,T=120 ,12001212022===n T C 计算统计值?7228.53,38A A A e e SS f F SS f ==≈……方差分析表结论:由于0.018.53(2,9)8.02,A F F ≈>=故果树品种对产量有特别显着影响.2.2700=10.523.56=≈结论: 由以上方差分析知,进器对火箭的射程有特别显着影响;燃料对火箭的射程有显着影响. 3.为了研究某商品的需求量Y 与价格x 之间的关系,收集到下列10对数据:2231,58,147,112,410.5,i i i i i i x y x y x y =====∑∑∑∑∑(1)求需求量Y 与价格x 之间的线性回归方程; (2)计算样本相关系数;(3)用F 检验法作线性回归关系显着性检验. 解:引入记号10, 3.1,5.8n x y ===∴需求量Y 与价格x 之间的线性回归方程为(2)样本相关系数32.80.955634.3248l r-==≈≈- 在0H 成立的条件下,取统计量(2)~(1,2)Ren S FF n S -=-计算统计值22(32.8)15.967.66,74.167.66 6.44R xy xx e yy R S l l S l S ==-≈=-≈-=故需求量Y 与价格x 之间的线性回归关系特别显着.4. 随机调查10个城市居民的家庭平均收入(x)与电器用电支出(y)情况得数据(单位:千元)如下:(1) 求电器用电支出y 与家庭平均收入x 之间的线性回归方程; (2) 计算样本相关系数; (3) 作线性回归关系显着性检验;(4) 若线性回归关系显着,求x =25时, y 的置信度为的预测区间. 解:引入记号10,27,1.9n x y ===∴电器用电支出y 与家庭平均收入x 之间的线性回归方程为(2)样本相关系数 0.9845l r==≈在0H 成立的条件下,取统计量(2)~(1,2)Rn S FF n S -=-e计算统计值2243.6354 5.37,5.54 5.370.17xy xx yy s l l s l s ==≈=-≈-=R e R故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. 相关系数检验法 01:0;:0H R H R =≠故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. (4) 因为0xx =处,0y 的置信度为1α-的预测区间为其中00.025垐 1.42640.123225 1.6536,(8) 2.31,0.1458y t σ=-+⨯====代入计算得当x =25时, y 的置信度为的预测区间为。
诚信应考 考出水平 考出风格浙江大学城市学院2011 — 2012 学年第一学期期末考试卷《 回归分析 》开课单位: 计算分院 ;考试形式:开卷(A4纸一张);考试时间:2011年01月6日; 所需时间: 120 分钟一.计算题(10分。
)1,考虑过原点的线性回归模型1,1,2,...,i i i y x i n βε=+=误差1,...,n εε仍满足基本假定。
求1β的最小二乘估计。
并求出1β 的期望和方差,写出1β的分布。
1221111111121,1,2,...,ˆ()()2()0ˆi i i nni i i i i i ni i i i ni ii nii y x i n Q y yy x Qy x x x yxβεββββ======+==-=-∂=--=∂=∑∑∑∑∑解:第1页共 6 页二. 证明题(本大题共2小题,每小题7分,共14分。
)1,证明:(1)22()1var()[1]i i xxx x e n L σ-=--(2)2211ˆˆ()2n i ii y y n σ==--∑是2σ的无偏估计。
011111122ˆˆˆ()()1()()1var()var[()()]()1var()var((()))()12cov[,(())](1(i i i i i nn i i j j jj j xx ni i i j j j xx ni i j j j xx ni i j j j xxe y y y x x x x y y x x y n L x x e y x x y n L x x y x x y n L x x y x x y n L x n ββσσ======-=----=----=-+--=++---+-=++∑∑∑∑∑解(1):222122222221212211)()1())2()()()11(12()]()1[1]1ˆˆ(2)()(())21ˆ[()]2()111var()[1]2212n i i j j xx xxi i xx xxi xx ni i i ni i i n n i i i i xx x x x x x L n L x x x x n L n L x x n L E E y y n E y y n x x e n n n L n σσσσσ=====----+--=++-+-=--=--=---==----=-∑∑∑∑∑22(11)n σσ--=三.填空题.(每空2分,共46分)1.为了研究家庭收入和家庭消费的关系,通过调查得到数据如下:6.22893,29.12349,43008,97.29,5422=====∑∑∑xy yxy x1)用最小二乘估计求出线性回归方程的参数估计值0ˆβ= 。
方差分析习题答案【篇一:方差分析习题】lass=txt>班级_______ 学号_______ 姓名________ 得分_________一、单项选择题1、方差分析所要研究的问题是() a、各总体的方差是否相等 b、各样本数据之间是否有显著差异 c、分类型自变量对数值型因变量的影响是否显著 d、分类型因变量对数值型自变量是否显著2、组间误差是衡量因素的不同水平(不同总体)下各样本之间的误差,它()a、只包含随机误差b、只包含系统误差c、既包含随机误差也包含系统误差d、有时包含随机误差,有时包含系统误差3、组内误差() a、只包含随机误差b、只包含系统误差 c、既包含随机误差也包含系统误差d、有时包含随机误差,有时包含系统误差4、在单因素方差分析中,各次实验观察值应()a、相互关联b、相互独立c、计量逐步精确d、方法逐步改进5、在单因素方差分析中,若因子的水平个数为k,全部观察值的个数为n,那么()a、sst的自由度为n b 、ssa的自由度为k c、 sse的自由度为n-k-1 d、sst的自由度等于sse的自由度与ssa的自由度之和。
6、在方差分析中,如果拒绝原假设,则说明()a、自变量对因变量有显著影响b、所检验的各总体均值之间全部相等c、不能认为自变量对因变量有显著影响d、所检验的各样本均值之间全不相等7、在单因素分析中,用于检验的统计量f的计算公式为() a、ssa/sseb、ssa/sst c、msa/msed、mse/msa8、在单因素分析中,如果不能拒绝原假设,那么说明组间平方和ssa () a、等于0 b、等于总平方和c、完全由抽样的随机误差所决定d、显著含有系统误差9、ssa自由度为()a、r-1b、n-1c、n-rd、r-n二、实验分析题1、某公司采用四种颜色包装产品,为了检验不同包装方式的效果,抽样得到了一些数据并进行单因素方差分析实验。
实验依据四种包装方式将数据分为4组,每组有5个观察值,用excel中的数据分析工具,在0.05的显著水平下得到如下方差分析表:方差分析(1)填表:请计算表中序号标出的七处缺失值,并直接填在表上。
试验设计作业1、下表为小麦栽培试验的产量结果(kg),随机区组设计,小区计产面积为12m2,试作分析。
在表示最后结果时需化为每亩产量(kg)。
假定该试验为一完全随机设计,试分析后将其试验误差与随机区组时的误差作一比较,看看划分区组的效果如何?处理区组ⅠⅡⅢⅣA 6.2 6.6 6.9 6.1B 5.8 6.7 6.0 6.3C 7.2 6.6 6.8 7.0D 5.6 5.8 5.4 6.0E 6.9 7.2 7.0 7.4F 7.5 7.8 7.3 7.6 完全随机设计的程序如下:data li_1;do i=1 to 6;do j=1 to 4;input x@@;output;end;end;cards;6.2 6.6 6.9 6.15.86.7 6 6.37.2 6.6 6.8 75.6 5.8 5.4 66.97.2 7 7.47.5 7.8 7.3 7.6;proc anova;class i;model x=i;means i;run;SAS输出结果如下: Sum ofSource DF Squares Mean Square F Value Pr > F Model 5 8.97208333 1.79441667 20.87 <.0001 Error 18 1.54750000 0.08597222Corrected Total 23 10.51958333R-Square Coeff Var Root MSE x Mean0.852893 4.406415 0.293210 6.654167Source DF Anova SS Mean Square F Value Pr > F i 5 8.97208333 1.79441667 20.87 <.0001随机区组设计的程序如下:data li_3;do i=1 to 6;do j=1 to 4;input x@@;output;end;end;cards;6.2 6.6 6.9 6.15.86.7 6 6.37.2 6.6 6.8 75.6 5.8 5.4 66.97.2 7 7.47.5 7.8 7.3 7.6;proc anova;class i j;model x=i j;run;结果如下:Sum ofSource DF Squares Mean Square F Value Pr > F Model 8 9.24333333 1.15541667 13.58 <.0001 Error 15 1.27625000 0.08508333Corrected Total 23 10.51958333R-Square Coeff Var Root MSE x Mean0.878679 4.383576 0.291690 6.654167Source DF Anova SS Mean Square F Value Pr > Fi 5 8.97208333 1.79441667 21.09 <.0001j 3 0.27125000 0.09041667 1.06 0.3943结果分析:随机区组设计的误差要小一些。
第章方差分析与回归分
析习题答案
Document number:WTWYT-WYWY-BTGTT-YTTYU-2018GT
第九章 方差分析与回归分析习题参考答案
1. 为研究不同品种对某种果树产量的影响,进行试验,得试验结果(产量)如下表,试分析果树品种对产量是否有显着影响.
(0.05(2,9) 4.26F =,0.01(2,9)8.02F =)
解:r=3,
12444n n 321=++=++=n n ,
T=120 ,120012
1202
2===n T C 计算统计值?722
8.53,
389
A A A e e SS f F SS f =
=≈……
方差分析表
结论:由于0.018.53(2,9)8.02,
A F F ≈>=故果树品种对产量有特别显着影响.
2.
2700=
10.52
3.56
=≈结论: 由以上方差分析知,进器对火箭的射程有特别显着影响;燃料对火箭的射程有显着影响. 3.为了研究某商品的需求量Y 与价格x 之间的关系,收集到下列10对数据:
31
,58,147,112,410.5,i i i i i i
x y x y x y
=====(1)求
需求量Y 与价格x 之间的线性回归方程; (2)计算样本相关系数;
(3)用F 检验法作线性回归关系显着性检验. 解:引入记号
10, 3.1,
5.8n x y ===
∴需求量Y 与价格x 之间的线性回归方程为
(2)样本相关系数 32.8
0.955634.3248l r
-==
≈≈- 在0H 成立的条件下,取统计量(2)~(1,2)R
e
n S F
F n S -=
-
计算统计值
2
2(32.8)15.967.66,
74.167.66 6.44
R xy xx e yy R S l l S l S ==-≈=-≈-=
故需求量Y 与价格x 之间的线性回归关系特别显着.
4. 随机调查10个城市居民的家庭平均收入(x)与电器用电支出(y)情况得数据(单位:千元)如下:
(1) 求电器用电支出y 与家庭平均收入x 之间的线性回归方程; (2) 计算样本相关系数; (3) 作线性回归关系显着性检验;
(4) 若线性回归关系显着,求x =25时, y 的置信度为的预测区间. 解:引入记号
10,27,
1.9n x y ===
∴电器用电支出y 与家庭平均收入x 之间的线性回归方程为
(2)样本相关系数 0.9845l r
==
≈
在0H 成立的条件下,取统计量(2)~(1,2)R
n S F
F n S -=
-e
计算统计值
2
243.6354 5.37,
5.54 5.370.17
xy xx yy s l l s l s ==≈=-≈-=R e R
故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. 相关系数检验法 0
1:0;:0H R H R =≠
故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. (4) 因为0x
x =处,0y 的置信度为1α-的预测区间为
其中
00.025垐 1.42640.123225 1.6536,
(8) 2.31,0.1458y t σ=-+⨯====
代入计算得当x =25时, y 的置信度为的预测区间为。