(10)第10章方差分析
- 格式:ppt
- 大小:9.83 MB
- 文档页数:82
10方差分析与试验设计方差分析是一种统计学方法,用于比较多个组之间的均值是否有显著差异。
在实验设计中,方差分析可以用来确定不同处理之间的差异是否由于实验因素的变化引起,同时还可以帮助研究人员确定实验因素对结果的影响程度。
方差分析的一个重要应用是试验设计。
试验设计是一种系统地操纵和控制实验因素的方法,旨在确定因素对结果的影响。
通过合理的试验设计和方差分析,研究人员可以确定实验因素对结果的作用,找出最佳的处理组合,并进一步进行优化和改进。
在试验设计中,常用的方差分析方法有单因素方差分析、多因素方差分析和混合设计方差分析。
单因素方差分析是用于比较一个处理因素对结果的影响是否显著。
在单因素方差分析中,研究人员将被试随机分配到不同的处理组中,并对各组进行实验。
通过方差分析,可以检验不同组之间均值是否存在差异,从而确定处理因素的显著性。
多因素方差分析是用于比较两个或更多处理因素对结果的影响是否显著,并确定各因素之间以及因素与交互作用之间的关系。
在多因素方差分析中,研究人员将被试随机分配到多个处理组中,并对各组进行实验。
通过方差分析,可以判断不同因素和因素交互作用对结果的影响是否显著,并进一步分析因素之间的关系。
混合设计方差分析是将固定效应和随机效应结合起来分析的一种方法,适用于同时考虑因子固定效应和随机效应的情况。
在混合设计方差分析中,研究人员将被试随机分配到不同的处理组中,并对各组进行实验。
通过方差分析,可以确定因子的固定效应和随机效应对结果的影响是否显著,并进一步分析这些效应的大小和方向。
方差分析和试验设计在很多领域中都有广泛的应用。
例如,在医学研究中,可以使用方差分析和试验设计方法来比较不同药物的疗效;在工程领域中,可以用于优化生产过程和改进产品质量;在社会科学研究中,可以用于分析不同因素对人们行为的影响。
总之,方差分析和试验设计是统计学中重要的方法,可以帮助研究人员确定因素对结果的影响,找出最优解,并加以优化和改进。
第10章单因素方差分析单因素方差分析(0ne-Way ANOV A),又称一维方差分析,它能够对单因素多个独立样本的均数进行比较,可以用10种检验方法对变量间的均数进行两两比较(即多重比较检验)并给出方差分析表,还可以作出5种类型图形(Type of plots)和2种均数图形(Means plot options)10.1 单因素方差分析的计量资料[例10—1] 某社区随机抽取了30名糖尿病患者、IGT异常人和正常人进行载脂蛋白(mg/dL)测定,结果示于表10—1。
试问3组人群的载脂蛋白测定结果含量是否相同?(倪宗瓒.卫生统计学.第4版,北京:人民卫生出版社,2001.50)本例是一个完全随机设计的单因素方差分析。
已建立SAS数据集文件并保存Sasuser.onewav4。
(1)进入SAS/Win(v8)系统,单击Solutions-Analysis-Analyst,得到分析家窗口。
(2)单击File-open By SAS Name—Sasuser-0neway4—0K,调入数据文件。
(3)在“分析家”窗口单击Statistics-ANOV A-One way ANOV A,得到图10—1所示对话框。
本例因变量(Dependent)为A(载脂蛋白),单击A—Dependent。
自变量(1ndependent):B(3种人的组别),单击B—Independent 。
图10.1 0ne—way ANOV A:0neway4(单因素方差分析)对话框(4)单击Tests按钮,得到图10—2所示对话框。
在此对话框的ANOV A(F—检验)选项中可进行如下设置。
Analysis of variance,方差分析。
Welch’s variance-weighted ANOV A,威尔奇方差—权重方差分析。
Tests for equal variance,相等方差检验,即方差齐性检验。
Barlett’s test,巴特尼特检验。
第十章方差分析一、单项选择题:1.在方差分析中,( )反映的是样本数据与其组平均值的差异。
A.总离差平方和B.组间离差平方和C.抽样误差D.组内离差平方和2.∑∑=⎪⎪⎭⎫⎝⎛k1i 21-j ij n i i x x ——是( )。
A.组内平方和 B.组间平方和C.总离差平方和D.因素B 的离差平方和3.∑∑=⎪⎪⎭⎫⎝⎛k1i 21-j ij n i i x x ——是( )。
A.组内平方和 B.组间平方和 C.总离差平方和D.总方差4.单因素方差分析中,计算F 统计量,其分子与分母的自由度各位( )。
A.k ,nB.k ,n-kC.k-1,n-kD.n-k ,k-15.方差分析基本原理是( )首先提出的。
A.费雪B.皮尔逊C.泰勒D.凯特勒6.组间离差平方和反映的是( )。
A.抽样误差B.系统误差C.随机误差D.总误差7.组内离差平方和反映的是( )。
A.抽样误差B.系统误差C.随机误差D.总误差8.单因素方差分析的对立和假设是( )。
A.μμμk 21===B.差距不显著,,,μμμk 21C.不是全部相等,,,μμμk 21D.全部不相等,,,μμμk 219.单因素方差分析的零假设是( )。
A.μμμk 21===B.差距不显著,,,μμμk 21C.不是全部相等,,,μμμk 21D.全部不相等,,,μμμk 2110.在方差分析中,若F k -n 1,-k 05.0F )(>,则统计推论是( )。
A.各组间的总体均数不全相等B.各组间的总体均数都不相等C.各组间的样本均数都不相等D.各组间的总体方差不全相等11.为研究温度对菌种生产率的影响,将温度控制在三个水平上,则应该使用( )。
A.单因素方差分析B.双因素方差分析C.独立样本t 检验D.三因素方差分析12.为分析学历对收入的影响,调查了50个职工,按学历高低分成四组,使用单因素方差分析,则F 检验临界值为( )。
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第10章SPSS的聚类分析1、根据“高校科研研究.sav ”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。
要求:1)根据凝聚状态表利用碎石图对聚类类数进行研究。
2)绘制聚类树形图,说明哪些省市聚在一起。
3)绘制各类的科研指标的均值对比图。
4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。
采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。
大约聚成4类。
步骤:分析分类系统聚类按如下方式设置……结果:22 5 24 7930.765 9 10 24将系数复制下来后,在EXCEL中建立工作表选中数据列,点击“插入”菜单拆线图碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。
其他略。
确定接下来,添加一个变量CLU4_1,其值为类别值。
(1、2、3、4),再数据汇总设置均值对比,依据聚类解,利用分类汇总,计算各个聚类变量的均值方差分析结果:分析比较均值单因素ANOVA 设置…… 确定2、试说明当变量存在数量级上的差异,进行层次聚类分析时为什么要对数据进行标准化处理?因为数量级将对距离产生较大影响,并影响最终聚类结果。
3、试说明变量之间的高度相关性是否会对层次聚类分析结果造成影响?为什么?会。
如果所选变量之间存在较强的线性关系,能够相互替代,在计算距离时同类变量将重复“贡献”,占有较高权重,而使最终的聚类结果偏向该类变量。
4、试说明K-Mean 聚类分析的基本步骤。
K-Mea ns聚类分析步骤:确定聚类数目K--确定K个初始类中心点--根据距离最近原则进行分类--重新确定K个类中心点--判断是否已经满足终止条件。
是一个反复迭代的分类过程。
在聚类过程中,样本所属的类会不断调整,直至达到最终稳定为止。
5、收集到我国2007年各地区城镇居民家庭平均每人全年消费支出数据,数据文件名为:“消费结构.sav”,变量包括:地区、消费性支出总额、食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信、教育文化娱乐服务、医疗保健、杂项商品和服务支出。
第10章方差分析习题解答一.选择题1. 下列关于方差分析的说法不正确的是( A ).A. 方差分析是一种检验若干个正态分布的均值和方差是否相等的一种统计方法.B. 方差分析是一种检验若干个独立正态总体均值是否相等的一种统计方法.C. 方差分析实际上是一种F 检验.D. 方差分析基于偏差平方和的分解和比较.2. 设,1,2,,;1,2,,ij i ij i X i a j n µε=+== ,2(0,)ij i N εσ ,且ij ε相互独立,进行单因子方差分析是( C ) . A . 对假设012:a H µµµ=== 作检验. B . 对假设222012:a H σσσ=== 作检验. C . 假定2(0,)ij N εσ ,2σ为未知,对假设012:a H µµµ=== 作检验. D . 假定2(0,)ij N εσ 12a µµµµ==== ,µ为未知,对假设222012:a H σσσ=== 作检验.3. 对因子A 取r 个不同的水平进行试验,每个水平观测t 次,结果,1,2,,,1,2,,ij y i r j t == .对()ij r t y ×的偏差有分解:2211111()()()ˆr t r trTijij i i E A i j i j i SS y y y y t y y SS SS ⋅⋅======−=−+−=+∑∑∑∑∑ 其中11111, r t ti i ij i j j y y y y rt t ⋅=====∑∑∑对假设012:r H µµµ=== 进行检验时,如下说法错误 的是( B ) .A .E SS 表示0H 为真时,由随机性引起的y ij 的波动.B .A SS 表示0H 为真时,所引起的由各水平间ij y 波动.C . E SS 表示各水平上随机性误差的总和.D . A SS 表示各水平之间系统误差的总和.4. 对某因素进行方差分析,由所得试验数据算得下表: 方差来源 平方和自由度F 值组间 4623.7 4 组内 4837.25 15 总和9460.9519采用F 检验法检验,且知在0.05α=时F 的临界值0.05(4,15) 3.06F =,则可以认为因素的不同水平对试验结果( B ).A. 没有影响.B. 有显著影响.C. 没有显著影响.D. 不能作出是否有显著影响的判断.5. 设在双因子A 和B 的方差分析模型:ij i j ij X µαβε=+++,10ai i α==∑,10bjj β==∑,2(0,)ij N εσ ,且ij ε相互独立,检验假设:0112:,0rH ααα==== ,和0212:,0sH βββ==== 检验时,下列结论中错误的是( D ) . A . 若拒绝域01H ,则认为因子A 的不同水平对结果有显著影响. B . 若拒绝域02H ,则认为因子B 的不同水平对结果有显著影响.C . 若不拒绝01H 和02H ,则认为因子A 与B 的不同水平的组合对结果无显著影响.D . 若不拒绝01H 或02H ,则认为因子A 与B 的不同水平组合对结果无显著影响.6. 某结果可能受因素A 及B 的影响.现对A 取4个不同的水平, B 取3个不同水平,对A 与B 每一种水平组合重复二次试验,对观测结果的双因子有交互作用的方差分析模型计算得:44.3A SS =,11.5B SS =,27.0A B SS ×=,65.0E SS =.且0.05(2,12) 3.89F =,0.05(3,12) 3.49F =,0.05(6,12) 3.00F =,则在显著性水平0.05α=时,检验的结果是( B ).A. 只有A 因素对结果有显著性影响.B. 只有B 因素对结果有显著性影响.C. 只有交互作用对结果有显著性影响.D. A 、B 及A 和B 的交互作用都对结果无显著性影响.7.设某结果可能受因素A 及B 的影响,现对A 取4个不同的水平, B 取3个不同的水平配对作试验,按双因子方差分析模型的计算结果: 5.29A SS =, 2.22B SS =,7.77T SS =.且0.05(3,6) 4.80F =,0.05(2,6) 5.10F =,则在显著性水平0.05α=时,检验的结果是( C ). A. 只有A 因素的不同水平对结果有显著影响. B. 只有B 因素的不同水平对结果有显著影响.C. A 的不同水平及B 的不同水平都对结果有显著影响.D. A 、B 因素不同水平组合对结果没有显著影响.8. 对因子A 取r 个不同水平,因子B 取s 个不同水平,A 与B 的每种水平组合重复次试验后,对结果进行双因子有重复试验的方差分析,则以下关于各偏差平方和自由度的结论错误的是( D ).A. A 因子的偏差平方和A SS 的自由度为.B.B 因子的偏差平方和B SS 的自由度为.C. 交互作用的偏差平方和A B SS ×的自由度为(1)(1)r s −−.D. 误差平方和E SS 的自由度为(1)(1)(1)r s t −−−. 二.填空题9. 进行单因素方差分析的前提之一是要求表示r 个水平的r 个总体的方差 相等 . 10. 进行方差分析时,将离差平方和211()in r Tiji j SS XX ===−∑∑表示为TA E SS SS SS =+,其中A SS =21()ri ii n XX =−∑,E SS =211()in riji i j XX ==−∑∑.11. 进行方差分析时,将离差平方和211()in rT iji j SS XX ===−∑∑表示为TA E SS SS SS =+,则2ESS σ~2(n r)χ−.12. 进行方差分析时,如果所有2~(,)ij X N µσ,则222111()in r T iji j SSXX σσ===−∑∑~21(1)ri i n χ=−∑.13. 进行方差分析时,选取统计量2 1211()()(1)()(1)()i ri i i A n rE ij i i j n r n X X SS r FSS n r r X X ===−−−==−−−∑∑∑,则F ~(r 1,n r)F −−.14. 在单因素方差分析中,如果因素A 有a 个水平,其中在第i 个水平下作了i n 次试验,12a n n n n +++= ,总的偏差平方和T SS 分解为A SS 和E SS ,则A SS 的自由度为1a −,E SS 的自由度为n a−,检验统计量A F =/(1)/(1)A E SS a SS n −−,若A F 大于给定的临界值水平,则说明 因素A 的a 个水平对试验指标有显著影响 .15. 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中一种方法.在显著水平α=0.05下,通过对每个工人生产的产品数量进行方差分析得到下面的部分结果.请完成方差分析表,由于 1.70 3.354131F =< 或P=0.245946>0.05 ,可判断不同的组装方法对产品数量的影响 不显著 (显著,不显著). 差异源 SS df MS F P-value F crit 组 间 420 2 210 1.70 0.245946 3.354131 组 内 3836 27 142.07 — — — 总 计425629————16. 在双因素方差分析中,因素A 有三个水平,因素B 有四个水平,每个水平搭配各做一次试验.请完成下列方差分析表,在显著水平α=0.05下,由于0.05(25.7,6)508.1A F F ==>,可判断因素A 的影响 显著 (显著,不显著);由于0.05(35.8,6)405.8B F F ==>,可判断因素B 的影响 显著 (显著,不显著). 来 源 平方和 自由度 均方 F 值 因素A 54 2 27 5.78 因素B 82 3 27.33 5.85 误差e 28 6 4.67 — 总 和16411——17. 在某种化工产品的生产过程中,选择3种不同的浓度:1A =2%,2A =4%,3A =6%;4种不同的温度:1B =100C ,2B =240C ,3B =380C ,4B =520C ;在每种浓度与温度配合下各做两次试验,观测产品的收取率.现由试验数据计算出如下结果:总偏差平方和147.8333T SS =,因素A (浓度)的偏差平方和44.3333A SS =,因素B (温度)的偏差平方和11.50B SS =,交互作用A B ×的偏差平方和27.00A B SS ×=,则误差平方和E SS = 65 ,检验统计量A F = 4.09 , B F = 0.708 ,A B F ×= 0.831 ,在显著性水平0.05α=下.由于0.05(2,4.0912) 3.89A F F ==>,可判断因素A 的影响 显著 (显著,不显著);由于0.05(30.7,12)908 3.4B F F ==<,可判断因素B 的影响 不显著 (显著,不显著);由于0.050.831(6,12) 3.00A B F F ×==<,可判断因因素A 与因素B 的交互作用影响不显著 (显著,不显著).18. 为了分析不同操作方法生产某种产品节约原料是否相同,在其余条件尽可能相同的情况下,安排了五种不同的操作方法生产某种产品,测量原料节约额,得到实验结果如下表所示.在显著水平α=0.05下,由于0.00410.05P =<,可判断不同操作方法生产某种产品节约原料 有 (有,无)显著差异.差异源 SS df MS F P-value F crit 操作方法55.5370 4 13.8842 6.05900.00414.8932组内 34.3725 15 2.2915总计89.90951919. 对腐乳的味道、口感等只能通过感观来确定其产品质量.为了检验专业评议员对腐乳评分标准是否存在显著差异,不同的腐乳质量是否存在显著差异,得到4位专业评议员对4种腐乳的评分结果,得到实验结果如下表所示.在显著水平α=0.05下,由于0.0005690.05P =<,可判断专业评议员对腐乳评分标准 有 (有,无)显著差异;由于 1.020.0505E P −=<,可判断不同的腐乳质量 有 (有,无)显著差异.差异源 SS df MS F P-value F crit 专业评议员54 3 18.0000 16.2 0.000569 3.8625 腐乳 148 3 49.3333 44.4 1.02E-053.8625误差 10 9 1.1111总计2121520.为了分析时段、路段以及时段与路段的交互作用对行车时间的影响,某市一名交通警察分别在两个路段和高峰期与非高峰期驾车试验,共获得20个行车时间数据,得到实验结果如下表所示.在显著水平α=0.05下,由于 5.700.056E P =<−,可判断时段因素对行车时间的影响 显著 (显著,不显著);由于0.0001.0805P =<,可判断路段因素对行车时间的影响 显著 (显著,不显著);由于0.9118.0105P =>,可判断时段与路段因素对行车时间交互作用的影响 不显著 (显著,不显著). 差异源SSdfMS F P-value F crit时段 174.05 1 174.05 44.0632 5.7E-06 4.49399 路段 92.45 1 92.45 23.4050 0.00018 4.49399 交互 0.05 1 0.05 0.01260.911814.49399内部 63.20 16 3.95总计329.7519三.应用计算题21.比较四种肥料1234,,,A A A A 对作物产量的影响,每一种肥料做5次试验,得产量(公斤/小区)如下表.试检验四种肥料对产量的影响有无显著差异?肥料 1A2A3A4A样 本 观 测 值5.56.5 8.0 5.5 5.0 6.0 6.5 6.5 6.07.0 7.5 6.0 4.5 6.5 7.0 5.0 7.05.56.05.5解:设使用四种不同肥料后作物的产量2~(,),1,2,3,4i i Y N i µσ=.则需检验的问题为43210:µµµµ===H ,:1H 4321,,,µµµµ不全相等.首先由样本直接计算有关值如下表作物产量计算表肥料样本观测值行和i A T1A 5.5 5.0 6.0 4.5 7.0 28 2A 6.5 6.0 7.0 6.5 5.5 31.5 3A 8.0 6.5 7.5 7.0 6.0 35 4A5.56.56.05.05.528.5 411in ij i j T x ===∑∑1232756.45T C n ==4211771.5756.4515.05in Tiji j SS xC ===−=−=∑∑22222412831.53528.5756.45 6.255555iA A i iT SS C n ==−=+++−=∑15.05 6.258.8E T A SS SS SS =−=−=列出相应的方差分析表.作物产量方差分析表方差来源 平方和 自由度 均方MS F 值临界值因素A 6.25 3 2.08 3.79 0.05(3,16) 3.24F = 0.01(3,16) 5.29F =误差 8.8 16 0.55 总和15.0519由于0.053.79(3,16)A F F =>,认为四种肥料对产量有显著影响.22.取四个种系未成年雌性大白鼠各三只,每只按一种剂量注射雌激素,一月后,解剖秤其子宫重量,结果如下表.试检验不同剂量和不同白鼠种系对子宫重量有无显著影响?解设注射不同剂量的不同白鼠种系的子宫重量2~(,),1,2,3,4ij i j Y N i µαβσ++=;1,2,3j =.则需检验的问题为01234:0A H αααα==== ,11234:,,,A H αααα不全为零 0123:0B H βββ===,1123:,,B H βββ不全为零为了计算各平方和,列出如下表.子宫重量计算表本题中4,3,12a b n ab ====22109810046712T C n ===4321111354210046713075Tiji j SS xC ===−=−=∑∑242222.11(367225314192)1004676457.66733i Ai T SS C ==−=+++−=∑ 23.22211(260358480)100467607444j Bj T SS C==−=++−=∑130756457.6676074543.33E T A B SS SS SS SS =−−=−−=得到相应的无交互作用双因素方差分析表.子宫重量双因素方差分析表方差来源 平方和 自由度 均方MS F 值 临界值因素A(种系) 6457.6732152.5623.770.05(3,6) 4.76F =0.01(3,6)9.78F =因素B60742303733.540.05(2,6) 5.14F =(剂量)0.01(2,6)10.92F =误差E 543.33 6 90.56 总和1307511因为0.0123.77(3,6)A F F =>,认为种系对子宫重量有极显著影响;0.0133.54(2,6)B F F =>,认为剂量对子宫重量有极显著影响.由此可知,种系和剂量对子宫重量都有极显著影响.23.为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项试验,考察三种广告方案和两种广告媒体,获得的销售量数据如下表.试检验广告方案.广告媒体或其交互作用对销售量的影响是否显著.广告方案广告媒体报纸电视 A8,12 12,8 B22,14 26,30 C10,1818,14解 设不同广告方案和广告媒体的产品销售量2~(,)ij i j ij Y N µαβγσ+++,1,2i =,3;1,2j =.则需检验的问题为0111221223132:0A B H γγγγγγ×======,1111221223132:,,,,,A B H γγγγγγ×不全为零. 0123:0A H ααα===,1123:,,A H ααα不全为零, 012:0B H ββ==,112:,B H ββ不全为零, 本题计算过程如下表:销售量数据方差分析计算表2A22,14 (36) 26, 30(56) 9284643A10,18 (28)18, 14(32)603600 列和..j x84 108 154 136642..j x705611664 1872032221113616ijti j t x====∑∑∑32221111()307212ijt i j t x ====∑∑∑ 322.117040ij i j x===∑∑36163072544T SS =−=11336430723444A SS =×−=1187203072486B SS =×−=17040307234448562A B SS ×=×−−−=得如下方差分析表:销售量数据双因素方差分析表方差来源 平方和 自由度 均方和 F 值 广告方案A 344 2 172 10.75 广告媒体B 48 1 48 3 交互效应A B ×56 2 28 1.75 误差 96 6 16 总和54411查表得0.05(2,6) 5.14F =,0.05(1,6) 5.99F =,因此,广告方案对产品销售量的影响显著;广告媒体对产品销售量的影响不显著;广告方案和广告媒体对产品销售量没有交互作用.。