第5章方差分析 分类变量对数值变量的影响 华南理工大学 工程硕士统计学教学课件
- 格式:ppt
- 大小:1.24 MB
- 文档页数:16
第5章方差分析第5章方差分析方差分析是统计学的一个重要范畴,是对观察结果的数据作分析的一种常用的统计方法,目的是检验两个或多个样本均数间差异的显著性意义。
这种命名是因为在检验均数间差异是否具有统计学意义的过程中,我们实际上是通过比较方差而得到结果的。
方差分析主要用于均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用和方差齐性检验。
方差分析具有广泛的用途,例如医学界研究几种药物对某种疾病的疗效可以用方差分析方法去解决。
方差分析的概念在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。
通常是比较不同实验条件下样本均值间差异。
方差分析是检验两个或多个样本均数间差异是否具有统计意义的一种方法。
1.方差分析原理方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:(l)随机误差,例如测量误差造成的差异,称为组内差异。
用变量在各组的均值与该组内变量值之偏(离均)差平方和的总和表示。
记作SS组内。
(2)实验条件, 即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏(离均)差平方和的总和表示。
记作SS组间。
SS组间、SS组内除以各自的自由度得到其均方值即组间均方和组内均方。
一种情况是处理没有作用,即各样本均来自同一总体。
MS组间/MS组内=l。
考虑抽样误差的存在,则有MS组间/MS组内≈l。
另一种情况是处理因素确实有作用。
组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。
那么,组间均方会远远大于组内均方。
MS组间>>MS组内。
MS组间/MS组内比值构成F分布。
用F值与其临界值比较,推断各样本是否来自相同的总体。
2.方差分析的假设检验假设有m个样本,如果原假设H0:样本均数都相同μ1=μ2=μ3= =μm=μ,m个样本有22共同的方差σ。
则m个样本来自具有共同的方差σ和相同的均数μ的总体。
如果经过计算结果组间均方远远大于组内均方的F>F0.05(f组间,f组内),(括号中的两个f是自由度)则p<0.05,推翻原假设,说明样本来自不同的正态总体,说明处理造成均值的差异,有统计意义。
第5章 方差分析5.1 方差分析的意义方差分析是数理统计的基本方法之一,是工农业生产和科学研究中分析数据的一种工具。
方差分析的目的是确定观测对象的影响因子。
如在化工生产或实验中,原料的组成、反应温度、压力、反应时间、反应器类型、催化剂配方等都可能影响产品的收率和质量。
在这些因素中,有的影响大一些,有的影响小一些。
为了使生产过程得以稳定,保证优质高产,确定最佳操作条件,就有必要找出对产品收率或质量有显著影响的那些因素,然后加以控制。
方差分析就是鉴别各因素效应的一种有效方法。
5.2 单因素试验的方差分析及其Excel 程序 5.2.1 问题的提出例5-1 考察温度对某一化工产品收率的影响,选了5种不同的温度,同一温度下做了3次试验,测得结果如表5-l 。
试问温度的变化是否显著影响产品的收率? 这个实验的目的是确定各温度水平间产品的收率有无显著差异。
从表5-1的数据中可以看出,不同温度下的收率是不同的,即使在同一温度下,收率也不一样。
产生这些差异的原因是由于偶然因素的干扰及测量误差所造成的?还是由于实验条件的变化而影响的呢?换句话说,这些差异是试验误差(随机误差)还是条件误差(系统误差)呢?这个问题可以通过方差分析的方法得出结论。
表5-1 例5-1的实验数据表温度(℃)60 65 70 7580收率(%)90 97 96 848492 93 96 838688 92 93 8882平均收率90 94 95 85845.2.2 单因素试验的方差分析方法如果在一项实验中,只有一个因素在改变,而其他因素保持不变的话,我们称之为单因素试验。
因素所处的状态称为水平。
在例5-1中,考察的因素是温度,有5个温度等级,即5个水平。
为不失一般性,设因素A 有J 个水平A 1, A 2,…A j ,…,A J ,在每个水平下都做了I 次测试,水平A j 下第i 次试验数据用表示。
单因素多水平试验安排表j i x ,如表5-2所示。