当前位置:文档之家› 多因素分析

多因素分析

多因素分析

温州医学院环境与公共卫生学院叶晓蕾

概念

多因素分析是同时对观察对象的两个或两个以上的变量进行分析。

常用的统计分析方法有:

多元线性回归、Logistic回归、COX比例风险回归模型、因子分析、主成分分析,等。

多变量资料数据格式

例号X1X2…X p Y

1X11X12…X1p Y1

2X21X22…X2p Y2

┆┆┆…┆┆

n X n1X n2…X np Y n

Y为定量变量——Linear Regression

Y为二项分类变量——Binary Logistic Regression

Y为多项分类变量——Multinomial Logistic Regression Y为有序分类变量——Ordinal Logistic Regression

Y为生存时间与生存结局——Cox Regression

第十五章多元线性回归

(multiple linear regressoin) P.261

Y,X——直线回归

Y,X1,X2,…X m——多元回归(多重回归)

例:欲研究血压受年龄、性别、体重、性格、

职业(体力劳动或脑力劳动)、饮食、吸烟、

血脂水平等因素的影响。

β0为回归方程的常数项(constant),表示各自变量均为0时y 的平均值;

m 为自变量的个数;

β1、β2、βm 为偏回归系数(Partial regression coefficient )意义:如β1表示在X 2、X 3…… X m 固定条件下,X 1 每增减一个单位对Y 的效应(Y 增减β个单位)。

e 为去除m 个自变量对Y 影响后的随机误差,称残差(residual)。

e

X X X Y m m +++++=ββββ 22110多元回归方程的一般形式

一、多元回归模型

为y 的估计值或预测值(predicted value);b 0为回归方程的常数项(constant),表示各自变量均为0时y 的估计值;m m 22110X b X b X b b Y ?++++= Y

?由样本估计而得的多元回归方程:

b 1、b 2、b m 为偏回归系数(Partial regression coefficient )

意义:如b 1表示在X 2、X 3 …… X m 固定条件下,X 1 每增减一个单位对Y 的效应(Y 增减b 个单位)。

适用条件:

线性(linear)、独立性(independent)、正态性(normal)、等方差(equal variance)——―LINE‖。

线性——自变量与应变量的关系是线性的。用散点图判断。

独立性——任意两个观察值互相独立。常利用专业知识判断。正态性——就自变量的任何一个线性组合,应变量y均服从正

态分布。即要求残差服从正态分布。常用残差图分析。

等方差——就自变量的任何一个线性组合,应变量y的方差均

相同。即要求残差的方差齐性。用散点图或残差图判断。

多元线性回归除具有直线回归的基本性质外,还具有以下特点(用途):

(1)因素筛选:(因素分析)

例如影响高血压的诸多因素中:

1)哪些是主要因素?

2)各因素的作用大小?

(2)提高回归方程的估计精度

多元回归比只有一个自变量的简单直线回归更能缩小应变量Y对其估计值的离差,在预测和统计控制方面应用的效果更好。

(3)控制混杂因素

二、多元回归分析步骤

(1)用各变量的数据建立回归方程

(2)对总的方程进行假设检验

(3)当总的方程有显著性意义时,应对每个自变量的偏回归系数再进行假设检验,若某个自变量的偏回归系数无显著性,则应把该变量剔除,重新建立不包含该变量的多元回归方程。

对新建立的多元回归方程及偏回归系数按上述程序进行检验,直到余下的偏回归系数都具有统计意义为止。最后得到最优方程。

例15-1(P.262)27名糖尿病人的血清总胆固醇、甘油三脂、

空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。

表15-2 27名糖尿病人的血糖及有关变量的测量结果

序号i

总胆固醇甘油三脂胰岛素糖化血血糖(mmol/L)(mmol/L)(μU/ml)红蛋白(%)(mmol/L) X

1

X

2

X

3

X

4

Y

1 5.68 1.90 4.538.211.2

2 3.79 1.647.32 6.98.8

3 6.02 3.56 6.9510.812.3………………

26 5.840.928.61 6.413.3

27 3.84 1.20 6.459.610.4

Coefficients a

5.943 2.829 2.101.047

.142.366.078.390.701.351.204.309 1.721.099-.271.121-.339-2.229.036.638.243.398 2.623.016(Constant)总胆固醇x1甘油三脂x2胰岛素x3糖化血红蛋白x4Model 1B Std. Error Unstandardized Coefficients Beta Standardized

Coefficients

t Sig.Dependent Variable: 血糖y

a. 由上表得到如下多元线性回归方程:

4

321638.0271.0351.0142.0943.5?X X X X Y +-++=1、建立回归方程

2、回归方程的假设检验——F检验

?结果无显著性

1)表明所观察的自变量与应变量不存在线性回归关系;2)也可能由于样本例数过少;

?结果有显著性

表明至少有一个自变量与应变量之间存在线性回归关系。

H0:β1=β2=…=βm= 0

H1:β1、β2、…βm不等于0或不全等于0

ANOVA b

133.711433.4288.278.000a 88.84122 4.038222.55226Regression

Residual

Total Model 1

Sum of Squares

df Mean Square F Sig.Predictors: (Constant), 总胆固醇x1, 胰岛素x3, 糖化血红蛋白x4, 甘油三脂x2

a. Dependent Variable: 血糖y

b.

Coefficients a

5.943 2.829 2.101.047.142.36

6.078.390.701.351.204.309 1.721.099-.271.121-.339-2.229.036.638.243.398 2.623.016

(Constant)

总胆固醇x1

甘油三脂x2

胰岛素x3

糖化血红蛋白x4

Model

1B Std. Error Unstandardized

Coefficients

Beta Standardized Coefficients t Sig.Dependent Variable: 血糖y a. 3、各个偏回归系数的假设检验——t 检验

将总胆固醇(X 1)剔除。

注意:通常每次只剔除关系最弱的一个因素。

对于同一资料,不同自变量的t 值可以相互比较,t 的绝对值越大,或P 越小,说明该自变量对Y 所起的作用越大。

重新建立不包含剔除因素的回归方程

4

32663.0287.0402.0500.6?X X X Y +-+=Coefficients a

6.500 2.396 2.713.012

.402.154.354 2.612.016-.287.112-.360-2.570.017.663.230.413 2.880.008(Constant)甘油三脂x2胰岛素x3糖化血红蛋白x4Model 1B Std. Error Unstandardized Coefficients Beta Standardized

Coefficients

t Sig.Dependent Variable: 血糖y

a. 注意:表中偏回归系数已变化。

对新建立的回归方程进行检验

检验结果有显著性意义。

ANOVA b

133.098344.36611.407.000a

89.45423 3.889222.55226Regression

Residual

Total Model

1Sum of Squares df Mean Square F Sig.Predictors: (Constant), 胰岛素x3, 甘油三脂x2, 糖化血红蛋白x4

a. Dependent Variable: 血糖y

b.

Coefficients a

6.500 2.396 2.713.012

.402.154.354 2.612.016

.663.230.413 2.880.008

-.287.112-.360-2.570.017

(Constant)甘油三脂x2糖化血红蛋白x4胰岛素x3Model 1B Std. Error Unstandardized Coef ficients Beta Standardized

Coef ficients

t Sig.Dependent Variable: 血糖y

a. 对新方程的偏回归系数进行检验

?检验结果均有意义,因此回归方程保留甘油三酯(X 2)、胰岛素(X 3)和糖化血红蛋白(X 4)三个因素。

?最后获得回归方程为:

4

32663.0287.0402.0500.6?X X X Y +-+=

1、决定系数(R 2):总回归SS SS R 2 意义:在y 的总变异中,由x 变量组建立的线性回归方程所能解释的比例。0~1,越大越优。特点:R 2是随自变量的增加而增大。因此,在相近的情况下,以包含的自变量少者为优。三、回归方程的评价2、R ——复相关系数(multiple correlation coefficient )

表示m 个自变量共同对应变量线性相关的密切程

度。0≤R≤1。即Y 与的相关系数。Y ?

3、校正确定系数(adjusted R-square ,R 2a )越大越优。R 2a 不会随无意义的自变量增加而增大。是衡量方程优劣的常用指标。

校正确定系数的计算:

()

MS MS 11p n 1n )R 1(1R 22a -=-----=p 为方程中包含的自变量个数,p≤ m 。

R 2一定时,p ↑→ R 2a ↓P.268

因素分析法

因素分析法(Factor Analysis Approach),又称指数因素分析法,是利用统计指数体系分析现象总变动中各个因素影响程度的一种统计分析方法,包括连环替代法、差额分析法、指标分解法、定基替代法。因素分析法是现代统计学中一种重要而实用的方法,它是多元统计分析的一个分支。使用这种方法能够使研究者把一组反映事物性质、状态、特点等的变量简化为少数几个能够反映出事物内在联系的、固有的、决定事物本质特征的因素。 因素分析法的最大功用,就是运用数学方法对可观测的事物在发展中所表现出的外部特征和联系进行由表及里、由此及彼、去粗取精、去伪存真的处理,从而得出客观事物普遍本质的概括。其次,使用因素分析法可以使复杂的研究课题大为简化,并保持其基本的信息量。 2应用编辑 是通过分析期货商品的供求状况及其影响因素,来解释和预测期货价格变化趋势的方法。期货交易是以现货交易为基础的。期货价格与现货价格之间有着十分紧密的联系。商品供求状况及影响其供求的众多因素对现货市场商品价格产生重要影响,因而也必然会对期货价格重要影响。所以,通过分析商品供求状况及其影响因素的变化,可以帮助期货交易者预测和把握商品期货价格变化的基本趋势。在现实市场中,期货价格不仅受商品供求状况的影响,而且还受其他许多非供求因素的影响。这些非供求因素包括:金融货币因素,政治因素、政策因素、投机因素、心理预期等。因此,期货价格走势基本因素分析需要综合地考虑这些因素的影响。 商品供求状况对商品期货价格具有重要的影响。基本因素分析法主要分析的就是供求关系。商品供求状况的变化与价格的变动是互相影响、互相制约的。商品价格与供给成反比,供给增加,价格下降;供给减少,价格上升。商品价格与需求成正比,需求增加,价格上升;需求减少,价格下降。在其他因素不变的条件下,供给和需求的任何变化,都可能影响商品价格变化,一方面,商品价格的变化受供给和需求变动的影响;另一方面,商品价格的变化又反过来对供给和需求产生影响:价格上升,供给增加,需求减少;价格下降,供给减少,需求增加。这种供求与价格互相影响、互为因果的关系,使商品供求分析更加复杂化,即不仅要考虑供求变动对价格的影响,还要考虑价格变化对供求的反作用。 连环替代法 它是将分析指标分解为各个可以计量的因素,并根据各个因素之间的依存关系,顺次用各因素的比较值(通常即实际值)替代基准值(通常为标准值或计划值),据以测定各因素对分析指标的影响。 例如,设某一分析指标M是由相互联系的A、B、C三个因素相乘得到,报告期(实际)指标和基期(计划)指标为: 报告期(实际)指标M1=A1 * B1 * C1 基期(计划)指标 M0=A0 * B0 * C0 在测定各因素变动指标对指标R影响程度时可按顺序进行: 基期(计划)指标M0=A0 * B0 * C0 (1)

多因素方差分析

多因素方差分析 多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著 表5-7 不同温度与不同湿度粘虫发育历期表 数据保存在“DATA5-2.SAV”文件中,变量格式如图5-1。

1)准备分析数据 在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输数值,如图5-6所示。或者打开已存在的数据文件“DATA5-2.SAV”。 图5-6 数据输入格式 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因素方差分析设置窗口如图5-7。

图5-7 多因素方差分析窗口 3)设置分析变量 设置因变量:在左边变量列表中选“历期”,用向右拉按钮选入到“Dependent Variable:”框中。 设置因素变量:在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量存容量的限制,选择的因素水平组合数(单元数)应该尽量少。 设置随机因素变量:在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量 设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。 设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。 4)选择分析模型 在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。 图5-8 “Univariate Model” 定义分析模型对话框

因素分析法的计算例题多因素分析法研究

因素分析法的计算例题多因素分析法研究 多因素分析法研究 WTT为大家整理的相关的多因素分析法研究资料,供大家参考选择。 多因素分析 研究多个因素间关系及具有这些因素的个体之间的一系列统计分析方法称为多元(因素)分析。主要包括: 多元线性回归(multiple linear regression) 判别分析(disoriminant analysis) 聚类分析(cluster analysis) 主成分分析(principal ponent analysis) 因子分析(factor analysis) 典型相关(canonical correlation) logistic 回归(logistic regression) Cox 回归(COX regression) 1、多元回归分析(multiple linear regression) 回归分析是定量研究因变量对自变量的依赖程度、分析变量之间的关联性并进行预测、预报的基本方法。研究一个因变量对几个自变量的线性依存关系时,其模型称为多元线性回归。函数方程建立有四种方法:全模型法、向前选择法、向后选择法、逐步选择法。 全模型法其数学模型为:ebbbb++++=ppxxxyL22110 式中 y 为因变量, pxxxL21, 为p个自变量,0b为常数项,pbbbL21,为待定参数,

称为偏回归系数(partial regression coefficient)。pbbbL21,表示在其它自变量固定不变的情况下,自变量Xi 每改变一 个单位时,单独引起因变量Y的平均改变量。多因素分析法研究 e为随机误差,又称残差(residual), 它是在Y的变化中不能为自变量所解释的部分 例如:1、现有20名糖尿病病人的血糖(Lmmoly/,)、胰岛素(LmUx/,1)及生长素(Lgx/,2m)的数据,讨论血糖浓度与胰岛素、生长素的依存关系,建立其多元回归方程。 逐步回归分析(stepwise regression analysis) 在预先选定的几个自变量与一个因变量关系拟合的回归中,每个自变量对因变量变化所起的作用进行显著性检验的结果,可能有些有统计学意义,有些没有统计学意义。有些研究者对所要研究的指标仅具有初步知识,并不知道哪些指标会有显著性作用,只想从众多的变量中,挑选出对因变量有显著性意义的因素。 一个较理想的回归方程,应包括所有对因变量作用有统计学意义的自变量,而不包括作用无统计学意义的自变量。建立这样一个回归方程较理想的方法之一是逐步回归分析(stepwise regression analysis)

因子分析方法

因子分析法 1. 因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较 密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不 可观测的,即不是具体的变量) ,以较少的几个因子反映原资料的大部分信息。运用这种研究技 术,我们可以方便地找岀影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响 力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 因子分析法与其他一些多元统计方法的区别: 2?主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析 来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简 化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumpti on s),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子( specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定( spss根据一定的条件自动设定,只要是特征 值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技 术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进 行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的 变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息) 来进入后续的分析,则可 以使用主成分分析。当然,这种情况也可以使用因子得分做到。所以这种区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单 独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份 发对变量简化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

【因素分析法的计算例题】多因素分析法研究

【因素分析法的计算例题】多因素分析法研究 多因素分析法研究 小编为大家整理的相关的多因素分析法研究资料,供大家参考选择。 多因素分析 研究多个因素间关系及具有这些因素的个体之间的一系列统计分析方法称为多元(因素)分析。主要包括: 多元线性回归(multiple linear regression) 判别分析(disoriminant analysis) 聚类分析(cluster analysis) 主成分分析(principal component analysis) 因子分析(factor analysis) 典型相关(canonical correlation) logistic 回归(logistic regression) Cox 回归(COX regression) 1、多元回归分析(multiple linear regression) 回归分析是定量研究因变量对自变量的依赖程度、分析变量之间的关联性并进行预测、预报的基本方法。研究一个因变量对几个自变量的线性依存关系时,其模型称为多元线性回归。函数方程建立有四种方法:全模型法、向前选择法、向后选择法、逐步选择法。 全模型法其数学模型为:ebbbb++++=ppxxxyL22110 式中 y 为因变量, pxxxL21, 为p个自变量,0b为常数项,pbbbL21,为待定参数, 称为偏回归系数(partial regression coefficient)。pbbbL21,表示在其它自变量固定不变的情况下,自变量Xi 每改变一 个单位时,单独引起因变量Y的平均改变量。多因素分析法研究 e为随机误差,又称残差(residual), 它是在Y的变化中不能为自变量所解释的部分 例如:1、现有20名糖尿病病人的血糖(Lmmoly/,)、胰岛素(LmUx/,1)及生长素(Lgx/,2m)的数据,讨论血糖浓度与胰岛素、生长素的依存关系,建立其多元回归方程。 逐步回归分析(stepwise regression analysis) 在预先选定的几个自变量与一个因变量关系拟合的回归中,每个自变量对因

SPSS统计分析教程-多因素方差分析

SPSS统计分析教程-多因素方差分析 多因素方差分析是对一个变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS 调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。但也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此。因素变量是分类变量,可以是数值型也可以是长度不超过8 的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。 表5-7 不同温度与不同湿度粘虫发育历期表相对湿度(%) 温度℃ 重复 1 2 3 4 100 25 91.2 95.0 93.8 93.0 27 87.6 84.7 81.2 82.4 29 79.2 67.0 75.7 70.6 31 65.2 63.3 63.6 63.3 80 25 93.2 89.3 95.1 95.5 27 85.8 81.6 81.0 84.4 29 79.0 70.8 67.7 78.8 31 70.7 86.5 66.9 64.9 40 25 100.2 103.3 98.3 103.8 27 90.6 91.7 94.5 92.2 29 77.2 85.8 81.7 79.7 31 73.6 73.2 76.4 72.5 数据保存在“DATA5-2.SAV”文件中,变量格式如图 5-1。 1)准备分析数据在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入对应的数值,如图5-6 所示。或者打开已存在的数据文件“DATA5-2.SAV”。 图5-6 数据输入格式 2)启动分析过程点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因变量多因素方差分析设置窗口如图5-7。 图5-7 多因素方差分析窗口 3)设置分析变量设置因变量: 在左边变量列表中选“历期”,用向右拉按钮选入到“Depend ent Variable:”框中。 设置因素变量: 在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量。由于内存容量的限制,选择的因素水平组合数(单元数)应该尽量少。 设置随机因素变量: 在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量。 设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。 设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。 4)选择分析模型在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。 图5-8 “Univariate Model” 定义分析模型对话框在Specify Model 栏中,指定分析模型类型。

(整理)多因素分析1.

多因素分析 研究多个因素间关系及具有这些因素的个体之间的一系列统计分析方法称为多元(因素)分析。主要包括: 多元线性回归(multiple linear regression ) 判别分析(disoriminant analysis ) 聚类分析(cluster analysis ) 主成分分析(principal component analysis ) 因子分析(factor analysis ) 典型相关(canonical correlation ) logistic 回归(logistic regression ) Cox 回归(COX regression ) 1、 多元回归分析(multiple linear regression ) 回归分析是定量研究因变量对自变量的依赖程度、分析变量之间的关联性并进行预测、预报的基本方法。研究一个因变量对几个自变量的线性依存关系时,其模型称为多元线性回归。函数方程建立有四种方法:全模型法、向前选择法、向后选择法、逐步选择法。 全模型法其数学模型为:εββββ++++=p p x x x y 22110 式中 y 为因变量, p x x x 21, 为p 个自变量,0β为常数项, p βββ 21,为待定参数,称为偏回归系数(partial regression coefficient )。 p βββ 21,表示在其它自变量固定不变的情况下,自变量X i 每改变一个单位时,单独引起因变量Y 的平均改变量。

ε为随机误差,又称残差(residual), 它是在Y的变化中不能为自变量所解释的部分 例如:1、现有20名糖尿病病人的血糖(L mmol y/ ,)、胰岛素 (L mU x/ , 1)及生长素(L g x/ , 2 μ)的数据,讨论血糖浓度与胰岛素、 生长素的依存关系,建立其多元回归方程。 逐步回归分析(stepwise regression analysis) 在预先选定的几个自变量与一个因变量关系拟合的回归中,每个自变量对因变量变化所起的作用进行显著性检验的结果,可能有些有统计学意义,有些没有统计学意义。有些研究者对所要研究的指标仅具有初步知识,并不知道哪些指标会有显著性作用,只想从众多的变量中,挑选出对因变量有显著性意义的因素。 一个较理想的回归方程,应包括所有对因变量作用有统计学意义的自变量,而不包括作用无统计学意义的自变量。建立这样一个回归方程较理想的方法之一是逐步回归分析(stepwise regression analysis)基本原理:按这个自变量在方程中对因变量作用的大小,由大到小依次引入方程。每引入一个自变量都要对回归方程中每一个已引入的(包括刚被引入的)自变量的作用作统计意义检验,若发现一个或几个已被引入的自变量的作用无统计学意义时,即行剔除。每剔除一个自变量后,也要对留在回归方程中的自变量逐个作统计学意义检验。如果发现方程中还存在作用无统计学意义的自变量时,也予以剔除,直至没有自变量可引入,也没有自变量可从方程中剔除为止。

SPSS多因素方差分析

莇蒂蒂薆袈肀蚄体育统计与SPSS读书笔记(八)—多因素方差分析(1) 虿薅肆螆薁蒃莆具有两个或两个以上因素的方差分析称为多因素方差分析。 蒃薇衿肁莂螇蒀多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方 差分析的时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因 素了:不同教学方法的班级,不同年级。如果再加上性别上的因素,那就成 了三因素了。如果我们把实验前和试验后的数据用一个时间的变量来表示, 那又多了一个时间的因素。如果每个年级都是不同的老师来上,那又多了一 个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑, 并确定自己只研究哪些因素。 螄螈蒂蒅肃芈膀下面用例子的形式来说说多因素方差分析的运用。还是用前面说单 因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。形成年级 和不同教学法班级双因素。 薇蝿莃蒄膇蚀节分析: 芀膂羅羆肁莅芅1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格 都是有重复数据(也就是不只一个数据), 肁蒆腿薂芄螅虿年级 羆羇蝿肂芆薈蚀不同教学方法的班级 袆艿羁螇莇膁膄定性班 螀肄羄薀蚂肂蒇定量班 羃蒄莈衿袁蚄罿定性定量班 羅芇荿羄膅螈芁五年级 莀袀袃蚅蚆螂螁(班级每个人) 莁蚁膆蝿羈袄莆(班级每个人) 袄蚇蚈葿螃袇腿(班级每个人) 袄蒇羀蚁莇肇袂初中二年级 蕿蒁螄薄羆肈蚃(班级每个人) 羁薃肅聿蕿薂莄(班级每个人) 蒂薆袈肀蚄袅蒈(班级每个人) 肆螆薁蒃莆莇蒂高中二年级 衿肁莂螇蒀虿薅(班级每个人) 蒂蒅肃芈膀蒃薇(班级每个人) 莃蒄膇蚀节螄螈(班级每个人) 羅羆肁莅芅薇蝿 2.因为有重复数据,所以存在在数据交互效应的可能。我们来看看交效应的含义:如果在A因素的不同水平上,B因素对因变量的 影响不同,则说明A、B两因素间存在交互作用。交互作用是多因素实验分析的一个非常重要的内容。如因素间存在交互作用而又被忽视,则常会掩盖因 素的主效应的显著性,另一方面,如果对因变量Y,因素A与B之间存在交互作用,则已说明这两个因素都Y对有影响,而不管其主效应是否具有显著性。在统计模型中考虑交互作用,是系统论思想在统计方法中的反映。在大多数 场合,交互作用的信息比主效应的信息更为有用。根据上面的判断。根据上 面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。这里 假设他们之间有交互作用。

相关主题
文本预览
相关文档 最新文档