第三章方差分析
- 格式:doc
- 大小:321.50 KB
- 文档页数:25
第三章方差分析
方差分析是分析试验数据的一种统计方法。在应用中经常要分析各种因素及因素间的交互作用对研究对象某些指标值的影响。在方差分析中,把试验数据的总波动分解为由所考察因素引起的波动和随机因素等引起的波动,然后通过分析比较这些变差(波动)来推断哪些因素对所考察指标的影响是显著的,哪些是不显著的。
第一节单因素方差分析
例 3.1.1为了比较五种牌子的合成木板的耐久性,对每个牌子取四个样品做摩擦试验,测量磨损掉的板材量,磨损量小的牌子质量是较好的。木板磨损数据见以下数据行,根据磨损程度我们从以下几个方面来比较五种牌子。
一.概括多组数据
1.比较各组的常规统计量——使用SORT和MEANS过程
从几个组分别概括数据的方法之一是求各个组的均值、方差、标准差等常用描述统计量。data veneer;
input brand $ wear @@;
cards;
ACME 2.2 ACME 2.1 ACME 2.4 ACME 2.5
CHAMP 2.2 CHAMP 2.3 CHAMP 2.4 CHAMP 2.6
AJAX 2.2 AJAX 2.0 AJAX 1.9 AJAX 2.1
TUFFY 2.4 TUFFY 2.7 TUFFY 2.6 TUFFY 2.7
XTRA 2.3 XTRA 2.5 XTRA 2.3 XTRA 2.4
;
proc print data=veneer;
title'木板数据';
proc sort data=veneer;
by brand;
proc means data=veneer;
by brand;
var wear;
title'木板数据的概括';
run;
输出的部分结果如下:
------------------------------------------- brand=ACME -------------------------------------------
The MEANS Procedure
Analysis Variable : wear
N Mean Std Dev Minimum Maximum
4 2.3000000 0.1825742 2.1000000 2.5000000
------------------------------------------- brand=AJAX -------------------------------------------
Analysis Variable : wear
N Mean Std Dev Minimum Maximum
4 2.0500000 0.1290994 1.9000000 2.2000000
------------------------------------------ brand=CHAMP -------------------------------------------
Analysis Variable : wear
N Mean Std Dev Minimum Maximum
4 2.3750000 0.170782
5 2.2000000 2.6000000
------------------------------------------ brand=TUFFY -------------------------------------------
Analysis Variable : wear
N Mean Std Dev Minimum Maximum
4 2.6000000 0.1414214 2.4000000 2.7000000
------------------------------------------- brand=XTRA -------------------------------------------
The MEANS Procedure
Analysis Variable : wear
N Mean Std Dev Minimum Maximum
4 2.3750000 0.0957427 2.3000000 2.5000000
结果分析:brand=AJAX的平均磨损量最低,brand=TUFFY的平均磨损量最高。但这些平均磨损量的差别是否真正存在,还需要统计检验。
2.用直观图形比较几个组——使用PROC CHART过程
3.使用SAS菜单系统“分析员应用”概括多组数据
二.多组比较—单因子方差分析
1.建立多组比较的假设检验
仅仅简单描述组之间的差别是不够的,还要知道差别有多大,是否具有统计显著差别,即进行假设检验。
0:
A B C D E
Hμμμμμ
====和
1
H:至少有两个均值不同方差分析判断由各组之间的不同引起的变差是否比纯粹由随机因素引起的变差要大。本章的方差分析是一种参数方差分析(用ANOV A过程),不是非参数方法分析(Proc Npar1way过程)。
各组数据的样本量相同则称数据为均衡的,反之则称为非均衡的。
拒绝H0:pα
<,各组均值有显著性差异。
2.用编程方法进行单因子方差分析
方差分析要求数据满足以下假定:
(1)观测是独立的;
(2) 观测为正态总体的样本;
(3) 各组的方差相等。
proc anova data =veneer;
class brand;%把数据分组 model wear=brand;%研究wear 与brand 的关系
title ‘木板数据的方差分析’;
run ;
The ANOVA Procedure
Class Level Information
Class Levels Values
brand 5 ACME AJAX CHAMP TUFFY XTRA
Number of observations 20
Dependent Variable: wear
Source DF Sum of Squares Mean Square F Value Pr > F
Model 4 0.62300000 0.15575000 7.19 0.0019
Error 15 0.32500000 0.02166667
Corrected Total 19 0.94800000
R-Square Coeff Var Root MSE wear Mean
0.657173 6.290428 0.147196 2.340000
Source DF Anova SS Mean Square F Value Pr > F brand 4 0.62300000 0.15575000 7.19 0.0019
结果分析:由于0.00190.10p α=<=,故拒绝H0,于是认为各个牌子的平均磨损有显著性差异。 还可以用非参数方法进行检验,如 proc npar1way data =veneer;
class brand; var wear;
title '木板数据的非参数检验';
run ;
Wilcoxon Scores (Rank Sums) for Variable wear
Classified by Variable brand
Sum of Expected Std Dev Mean
brand N Scores Under H0 Under H0 Score
ACME 4 37.50 42.0 10.495112 9.3750
AJAX 4 12.50 42.0 10.495112 3.1250
CHAMP 4 45.00 42.0 10.495112 11.2500
TUFFY 4 69.00 42.0 10.495112 17.2500
XTRA 4 46.00 42.0 10.495112 11.5000
Kruskal-Wallis Test
Chi-Square 11.9440