当前位置:文档之家› SPSS操作方法:逻辑回归

SPSS操作方法:逻辑回归

SPSS操作方法:逻辑回归
SPSS操作方法:逻辑回归

SPSS操作方法之五

SPSS操作方法:逻辑回归

例证8.3: 在一次关于公共交通的社会调查中,一个调查项目是“乘公交车上下班,还是骑自行车上下班”因变量Y=1表示乘车,Y=0表示骑车。自变量X1表示年龄;X2表示表示月收入;X3表示性别,取1时为男性,取0时为女性。调查对象为工薪族群体。数据见下表:试建立Y与自变量之间的Logistic回归。

逻辑回归SPSS操作方法的具体步骤:

1.选择Analyze→Regreessin→Binary Logistic,打开对话框如图1所示:

图1 主对话框Logistic回归。

2.选择因变量Y进入Dependent框内,将自变量选择进入Convariates框。也可以将不同的自变量组放在不同的块(block)中,可以分析不同的自变量组对因变量的贡献。

3.在Mothed框内选择自变量的筛选策略:

Enter表示强行进入法;(本例选择)

Forword和Bacword都表示逐步筛选策略;Forword 为自变量逐步进入,Bacword是自变量逐步剔出。Conditional ;LR; Wald分别表示不同的检验统计量,如Forword Wald表示自变量进入方程的依据是Wald统计量。

4.在Selection中选择一个变量作为条件变量,只有满足条件的变量数据才能参与回归分析。

5.单击Categorical打开Categorical对话框如图2所示:对定性变量的自变量选择参照类。常用的方法是Indicator,即以某个特定的类为参照类,Last表示以最大值对应的类为参照类(系统默认),First表示以最小值对应的类为参照类。选择后点击Continue按钮返回主对话框。(本例不作选择性)

图2 Categorical对话框

6.单击Option按钮,打开Option对话框如图3所示

图3:Option对话框

(1)从Statistics and Plots框中选择输出图和分析结果。

Classification Plots:表示绘制因变量实际值与预测分类值的关系图(本例选择)。

Hosmer-lemeshow goodness-of-fit:表示拟合优度指标(本例选择)。

Casewise Listing of residuals:表示输出各样本数据残差列表,有因变量的观察值,预测值,相应的预测概率,残差(非标准化残差,标准化残差)等。

Correlations of estimations:表示输出估计参数的相关矩阵(本例选择)。

Iteration history:表示输出估计参数迭代过程中的参数与对数似然值(本例选择)。

CI for exp(B):表示输出发生比N%的置信区间(默认95%)。

(2)从Display框中选择输出方式。

At each step 表示输出模型建立过程中的每一步结果(系统默认),At last step 表示只输出最终结果。

(3)从Propbability for Stepwise框中指定自变量进入方程或剔除方程的显著性水平α。Entry表示回归系数Score检验的概率p值小于0.05时相应变量可进入方程;Removal 表示回归系数Score检验的概率p值大于0.1时相应变量应当剔除出回归方程.。

(4)Classification Cutoff设置概率分界值,预测概率大于分界值(默认0.5)时,分类预测值为1, 否则为预测值为0。(本例选择系统默认项)

(5)从Maximum Iterations框内指定极大似然估计的最大迭代次数(默认值是20)

7.单击Save按钮,打开Save对话框如图4所示:从中选择需要保存预测结果到数据窗口。

图4:Save对话框

(1)从Predieted V alues框中,Probalities 表示保存因变量取1 的预测概率值,Croup membership 表示保存分类预测值。(本例选择)

(2)Residuals和Influence表示保存残差及影响点,具体含义与线性回归相同。

选择结束,后可以从输出窗口观看输出结果如下:

以上两个表是数据个数,分类,及因变量的概况。

注意:表3至表6表示只有常数项的模型,没有实际意义,可以不考虑。

表7表示的是迭代历史,表示每一次迭代中-2LL 值和系数值。

表8模型综合检验是模型拟合优度检验的,用-2LL 度量。最好的模型有-2LL=0,步骤1中的“步骤”中的卡方值是当前-2LL 与下一步-2LL 的差值,“块”中的卡方值为当前值-2LL 与后一组变量进入模型后的-2LL 的差值,“模型”中的卡方统计量是当前模型中的-2LL 与只含常数项模型的-2LL 的差值,因所有自变量是强行进入,只有一个步骤,一个块和一个模型,所以三者的卡方值相等。本例中假设检验的P 值等于0.005,小于0.05,故模型中至少有一个回归系数不为0。 从表9中看出-22LN 值不算太大,模型拟合程度一般。

Cox & Snell R 2和 Nagelkerke R 2类似于线性模型中的拟合优度检验。其中: Cox & Snell R 2

=n L

L 2

01)(

Nagelkerke R 2

=

n

L R

Snell Cox 2

02

1)(&

从表中得出Cox & Snell R 2和 Nagelkerke R 2

类不是太高,似合优度一般。

表10 和表11是逻辑方程的拟合程度的检验,由于观察值和理论频数的差异不大,检验通过。但是理论频数都小于5,原因是数据个数太少造成的,所以检验结果有待进一步检验。 表12也称错判矩阵。从表10中看出,如出行方式为坐公交车15人中,预测值为13人,正确率为86.7%。

从表13中可以得到回归系数、回归系数的标准误、Wald 检验统计量、P 值、发生比等。

其中第二个与第三个变量的回归系数没有通过检验。i

i

S S Wald i

βββ2

???

? ??

=为回归系数i β的

标准误。)(βExp 表示一个自变量的发生比,指当其它自变量不变时,该自变量每增加一个单位,将引起发生比扩大)(βExp 。 表14中表示的是回归系数的相关矩阵。

Step number: 1

Observed Groups and Predicted Probabilities

4 ┼ ┼ │ │ │ │ F │ │ R 3 ┼ ┼ E │ │ Q │ │ U │ │ E 2 ┼ 1 0 1 1 ┼ N │ 1 0 1 1 │ C │ 1 0 1 1 │ Y │ 1 0 1 1 │ 1 ┼ 00 0 00 0 0 0 00 01 1 0 0 1 1 1 1 1 1 0 11 ┼ │ 00 0 00 0 0 0 00 01 1 0 0 1 1 1 1 1 1 0 11 │ │ 00 0 00 0 0 0 00 01 1 0 0 1 1 1 1 1 1 0 11 │ │ 00 0 00 0 0 0 00 01 1 0 0 1 1 1 1 1 1 0 11 │ Predicted ─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼────────── Prob: 0 .1 .2 .3 .4 .

5 .

6 .

7 .

8 .

9 1 Group

: 0000000000000000000000000000000000000000000000000011111111111111111111111111111111111111111111111111

Predicted Probability is of Membership for 1 The Cut Value is .50 Symbols: 0 - 0

1 - 1

Each Symbol Represents .25 Cases.

图5 预测分类图

预测分类图中显示预测值的分布,横坐标表示预测概率值,大于0.5的预测值将预测为1,小于0.5的预测值为0。图中0表示实际观察值为Y=0,1表示观察值Y=1,纵向四个同样的数字表示一个样本观察值。

实验题:为研究某商品消费特点和趋势,收集以往的消费数据,数据包括:因变量Y 为是否购买,购买取值为1,否则Y取值为0。自变量有性别,年龄和收入水平。数据见表。试采用逻辑回归的方法进行分析。

SPSS多元线性回归分析实例操作步骤

SPSS统计分析 多元线性回归分析方法操作与分析 实验目得: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率与房屋空置率作为变量,来研究上海房价得变动因素。 实验变量: 以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)与房屋空置率(%)作为变量。 实验方法:多元线性回归分析法 软件:spss19、0 操作过程: 第一步:导入Excel数据文件 1.open datadocument——open data——open; 2、Opening excel data source——OK、

第二步: 1、在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method选择Stepwise、 进入如下界面: 2、点击右侧Statistics,勾选RegressionCoefficients(回归系数)选项组中得Estimates;勾选Residuals(残差)选项组中得Durbin-Watson、Casewise diagnostics默认;接着选择Model fit、Collinearitydiagnotics;点击Continue、

3、点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中得Standardized Resi dual Plots(标准化残差图)中得Histogram、Normal probability plot;点击Continue、 4、点击右侧Save,勾选Predicted Vaniues(预测值)与Residu als(残差)选项组中得Unstandardized;点击Continue、

SPSS多元线性回归分析实例操作步骤

SPSS 统计分析 多元线性回归分析方法操作与分析 实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。 实验变量: 以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。 实验方法:多元线性回归分析法 软件:spss19.0 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open; 2. Opening excel data source——OK.

第二步: 1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method 选择Stepwise. 进入如下界面: 2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue.

3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue. 4.点击右侧Save,勾选Predicted Vaniues(预测值)和Residuals(残差)选项组中的Unstandardized;点击Continue.

SPSS多元线性回归分析教程.doc

线性回归分析的SPSS操作 本节内容主要介绍如何确定并建立线性回归方程。包括只有一个自变量的一元线性回归和和含有多个自变量的多元线性回归。为了确保所建立的回归方程符合线性标准,在进行回归分析之前,我们往往需要对因变量与自变量进行线性检验。也就是类似于相关分析一章中讲过的借助于散点图对变量间的关系进行粗略的线性检验,这里不再重复。另外,通过散点图还可以发现数据中的奇异值,对散点图中表示的可能的奇异值需要认真检查这一数据的合理性。 一、一元线性回归分析 1.数据 以本章第三节例3的数据为例,简单介绍利用SPSS如何进行一元线性回归分析。数据编辑窗口显示数据输入格式如下图7-8(文件7-6-1.sav): 图7-8:回归分析数据输入 2.用SPSS进行回归分析,实例操作如下: 2.1.回归方程的建立与检验 (1)操作 ①单击主菜单Analyze / Regression / Linear…,进入设置对话框如图7-9所示。从左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x选入到自变量(Independent)框中。在方法即Method一项上请注意保持系统默认的选项Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。具体如下图所示:

图7-9 线性回归分析主对话框 ②请单击Statistics…按钮,可以选择需要输出的一些统计量。如Regression Coefficients(回归系数)中的Estimates,可以输出回归系数及相关统计量,包括回归系数B、标准误、标准化回归系数BETA、T值及显著性水平等。Model fit项可输出相关系数R,测定系数R2,调整系数、估计标准误及方差分析表。上述两项为默认选项,请注意保持选中。设置如图7-10所示。设置完成后点击Continue返回主对话框。 图7-10:线性回归分析的Statistics选项图7-11:线性回归分析的Options选项 回归方程建立后,除了需要对方程的显著性进行检验外,还需要检验所建立的方程是否违反回归分析的假定,为此需进行多项残差分析。由于此部分内容较复杂而且理论性较强,所以不在此详细介绍,读者如有兴趣,可参阅有关资料。 ③用户在进行回归分析时,还可以选择是否输出方程常数。单击Options…按钮,打开它的对话框,可以看到中间有一项Include constant in equation可选项。选中该项可输出对常数的检验。在Options对话框中,还可以定义处理缺失值的方法和设置多元逐步回归中变量进入和排除方程的准则,这里我们采用系统的默认设置,如图7-11所示。设置完成后点击Continue返回主对话框。 ④在主对话框点击OK得到程序运行结果。

SPSS如何进行线性回归分析操作 精品

SPSS如何进行线性回归分析操作 本节内容主要介绍如何确定并建立线性回归方程。包括只有一个自变量的一元线性回归和和含有多个自变量的多元线性回归。为了确保所建立的回归方程符合线性标准,在进行回归分析之前,我们往往需要对因变量与自变量进行线性检验。 也就是类似于相关分析一章中讲过的借助于散点图对变量间的关系进行粗略的线性检验,这里不再重复。另外,通过散点图还可以发现数据中的奇异值,对散点图中表示的可能的奇异值需要认真检查这一数据的合理性。 一、一元线性回归分析 用SPSS进行回归分析,实例操作如下: 1.单击主菜单Analyze / Regression / Linear…,进入设置对话框如图7-9 所示。从左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x选入到自变量(Independent)框中。在方法即Method一项上请注意保持系统默认的选项Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。具体如下图所示:

2.请单击Statistics…按钮,可以选择需要输出的一些统计量。如Regression Coefficients(回归系数)中的Estimates,可以输出回归系数及相关统计量,包括回归系数B、标准误、标准化回归系数BETA、T值及显著性水平等。Model fit 项可输出相关系数R,测定系数R2,调整系数、估计标准误及方差分析表。上述两项为默认选项,请注意保持选中。设置如图7-10所示。设置完成后点击Continue返回主对话框。

线性回归分析的SPSS操作

第六节线性回归分析的SPSS操作 本节内容主要介绍如何确定并建立线性回归方程。包括只有一个自变量的一元线性回归和和含有多个自变量的多元线性回归。为了确保所建立的回归方程符合线性标准,在进行回归分析之前,我们往往需要对因变量与自变量进行线性检验。也就是类似于相关分析一章中讲过的借助于散点图对变量间的关系进行粗略的线性检验,这里不再重复。另外,通过散点图还可以发现数据中的奇异值,对散点图中表示的可能的奇异值需要认真检查这一数据的合理性。 一、一元线性回归分析 1.数据 以本章第三节例3的数据为例,简单介绍利用SPSS如何进行一元线性回归分析。数据编辑窗口显示数据输入格式如下图7-8(文件7-6-1.sav): 图7-8:回归分析数据输入 2.用SPSS进行回归分析,实例操作如下: 2.1.回归方程的建立与检验 (1)操作 ①单击主菜单Analyze / Regression / Linear…,进入设置对话框如图7-9所示。从左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x选入到自变量(Independent)框中。在方法即Method一项上请注意保持系统默认的选项Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。具体如下图所示:

图7-9 线性回归分析主对话框 ②请单击Statistics…按钮,可以选择需要输出的一些统计量。如Regression Coefficients(回归系数)中的Estimates,可以输出回归系数及相关统计量,包括回归系数B、标准误、标准化回归系数BETA、T值及显著性水平等。Model fit 项可输出相关系数R,测定系数R2,调整系数、估计标准误及方差分析表。上述两项为默认选项,请注意保持选中。设置如图7-10所示。设置完成后点击Continue返回主对话框。 图7-10:线性回归分析的Statistics选项图7-11:线性回归分析的Options选项 回归方程建立后,除了需要对方程的显著性进行检验外,还需要检验所建立的方程是否违反回归分析的假定,为此需进行多项残差分析。由于此部分内容较复杂而且理论性较强,所以不在此详细介绍,读者如有兴趣,可参阅有关资料。 ③用户在进行回归分析时,还可以选择是否输出方程常数。单击Options…按钮,打开它的对话框,可以看到中间有一项Include constant in equation可选项。选中该项可输出对常数的检验。在Options对话框中,还可以定义处理缺失值的方法和设置多元逐步回归中变量进入和排除方程的准则,这里我们采用系统的默认设置,如图7-11所示。设置完成后点击Continue返回主对话框。

相关主题
文本预览
相关文档 最新文档