spss多元线性回归实例要点
- 格式:doc
- 大小:1.11 MB
- 文档页数:16
t i e an dl l t 多元回归分析在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。
可以建立因变量y 与各自变量x j (j=1,2,3,…,n)之间的多元线性回归模型:其中:b 0是回归常数;b k (k =1,2,3,…,n)是回归参数;e 是随机误差。
多元回归在病虫预报中的应用实例:某地区病虫测报站用相关系数法选取了以下4个预报因子;x 1为最多连续10天诱蛾量(头);x 2为4月上、中旬百束小谷草把累计落卵量(块);x 3为4月中旬降水量(毫米),x 4为4月中旬雨日(天);预报一代粘虫幼虫发生量y (头/m2)。
分级别数值列成表2-1。
预报量y :每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。
预报因子:x 1诱蛾量0~300头为l 级,301~600头为2级,601~1000头为3级,1000头以上为4级;x 2卵量0~150块为1级,15l~300块为2级,301~550块为3级,550块以上为4级;x 3降水量0~10.0毫米为1级,10.1~13.2毫米为2级,13.3~17.0毫米为3级,17.0毫米以上为4级;x 4雨日0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。
表2-1x 1x 2x 3x 4y 年 蛾量 级别 卵量 级别 降水量 级别 雨日 级别 幼虫密度级别1960102241121 4.31211011961300144030.111141196269936717.511191196318764675417.14745541965431801 1.9121111966422220101013119678063510311.82322831976115124020.612171197171831460418.444245419728033630413.433226319735722280213.224216219742641330342.243219219751981165271.84532331976461214017.515328319777693640444.7432444197825516510101112数据保存在“DATA6-5.SAV”文件中。
spss多元回归分析案例SPSS多元回归分析案例。
在统计学中,多元回归分析是一种用于探究多个自变量与因变量之间关系的方法。
通过多元回归分析,我们可以了解不同自变量对因变量的影响程度,以及它们之间的相互作用情况。
在本篇文档中,我将通过一个实际案例来介绍如何使用SPSS软件进行多元回归分析。
案例背景:假设我们是一家电子产品公司的市场营销团队,在推出新产品之前,我们希望了解不同因素对产品销量的影响。
我们收集了一些数据,包括产品的售价、广告投入、竞争对手的售价、季节等因素,以及产品的销量作为因变量。
数据准备:首先,我们需要将数据录入SPSS软件中。
在SPSS中,我们可以通过导入Excel文件的方式将数据导入到软件中,并进行必要的数据清洗和处理。
确保数据的准确性和完整性对于后续的多元回归分析非常重要。
模型建立:接下来,我们需要建立多元回归模型。
在SPSS中,我们可以通过依次选择“分析”-“回归”-“线性回归”来进行多元回归分析。
在“因变量”栏中输入销量,然后将所有自变量依次输入到“自变量”栏中。
在建立模型之前,我们还需要考虑是否需要进行变量转换或交互项的添加,以更好地拟合数据。
模型诊断:建立模型后,我们需要对模型进行诊断,以确保模型的准确性和有效性。
在SPSS中,我们可以通过查看残差的正态性、异方差性以及自相关性来进行模型诊断。
如果模型存在严重的偏差或违反了多元回归分析的假设,我们需要进行相应的修正或改进。
模型解释:最后,我们需要解释多元回归模型的结果。
在SPSS的输出结果中,我们可以看到各个自变量的系数、显著性水平、调整R方等统计指标。
通过这些指标,我们可以了解不同自变量对销量的影响程度,以及它们之间的相互作用情况。
同时,我们还可以进行各种假设检验,来验证模型的有效性和可靠性。
结论:通过以上多元回归分析,我们可以得出不同自变量对产品销量的影响程度,以及它们之间的相互作用情况。
这些结果对于我们制定产品的定价策略、广告投放策略以及市场营销策略都具有重要的指导意义。
农民收入影响因素的多元回归分析自改革开放以来,虽然中国经济平均增长速度为9.5 % ,但二元经济结构给经济发展带来的问题仍然很突出。
农村人口占了中国总人口的70 %多,农业产业结构不合理,经济不发达,以及农民收入增长缓慢等问题势必成为我国经济持续稳定增长的障碍。
正确有效地解决好“三农”问题是中国经济走出困境,实现长期稳定增长的关键。
其中,农民收入增长是核心,也是解决“三农”问题的关键。
本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,寻找其根源,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。
一、回归模型的建立(1)数据的收集根据实际的调查分析,我们在影响农民收入因素中引入3个解释变量。
即:X2-财政用于农业的支出的比重,X3-乡村从业人员占农村人口的比重,X4 -农作物播种面积1991223.2510.2650.92149585.8 1992233.1910.0551.53149007.1 1993265.679.4951.86147740.7 1994335.169.252.12148240.6 1995411.298.4352.41149879.3 1996460.688.8253.23152380.6 1997477.968.354.93153969.2 1998474.0210.6955.84155705.7 1999466.88.2357.16156372.8 2000466.167.7559.33156299.9 2001469.87.7160.62155707.9 2002468.957.1762.02154635.5 2003476.247.1263.721524152004499.399.6765.64153552.6 2005521.27.2267.59155487.7(1)回归模型的构建Y i=1+2X2+3X3+4X4+u i二、回归模型的分析(1)多重共线性检验系数a(2)模型异方差的检验异方差产生的原因有:数据质量原因、模型设定原因。
SPSS多元线性回归分析实例操作步骤多元线性回归是一种常用的统计分析方法,用于探究多个自变量对因变量的影响程度。
SPSS(Statistical Package for the Social Sciences)是一款常用的统计软件,可以进行多元线性回归分析,并提供了简便易用的操作界面。
本文将介绍SPSS中进行多元线性回归分析的实例操作步骤,帮助您快速掌握该分析方法的使用。
步骤一:准备数据在进行多元线性回归分析之前,首先需要准备好相关的数据。
数据应包含一个或多个自变量和一个因变量,以便进行回归分析。
数据可以来自实验、调查或其他来源,但应确保数据的质量和可靠性。
步骤二:导入数据在SPSS软件中,打开或创建一个新的数据集,然后将准备好的数据导入到数据集中。
可以通过导入Excel、CSV等格式的文件或手动输入数据的方式进行数据导入。
确保数据被正确地导入到SPSS中,并正确地显示在数据集的各个变量列中。
步骤三:进行多元线性回归分析在SPSS软件中,通过依次点击"分析"-"回归"-"线性",打开线性回归分析对话框。
在对话框中,将因变量和自变量移入相应的输入框中。
可以使用鼠标拖拽或双击变量名称来快速进行变量的移动。
步骤四:设置分析选项在线性回归分析对话框中,可以设置一些分析选项,以满足具体的分析需求。
例如,可以选择是否计算标准化回归权重、残差和预测值,并选择是否进行方差分析和共线性统计检验等。
根据需要,适当调整这些选项。
步骤五:获取多元线性回归分析结果点击对话框中的"确定"按钮后,SPSS将自动进行多元线性回归分析,并生成相应的分析结果。
结果包括回归系数、显著性检验、残差统计和模型拟合度等信息,这些信息可以帮助我们理解自变量对因变量的贡献情况和模型的拟合程度。
步骤六:解读多元线性回归分析结果在获取多元线性回归分析结果之后,需要对结果进行解读,以得出准确的结论。
多元回归分析在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。
可以建立因变量y与各自变量x j(j=1,2,3,…,n)之间的多元线性回归模型:其中:b0是回归常数;b k(k=1,2,3,…,n)是回归参数;e是随机误差。
多元回归在病虫预报中的应用实例:某地区病虫测报站用相关系数法选取了以下4个预报因子;x1为最多连续10天诱蛾量(头);x2为4月上、中旬百束小谷草把累计落卵量(块);x3为4月中旬降水量(毫米),x4为4月中旬雨日(天);预报一代粘虫幼虫发生量y(头/m2)。
分级别数值列成表2-1。
预报量y:每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。
预报因子:x1诱蛾量0~300头为l级,301~600头为2级,601~1000头为3级,1000头以上为4级;x2卵量0~150块为1级,15l~300块为2级,301~550块为3级,550块以上为4级;x3降水量0~10.0毫米为1级,10.1~13.2毫米为2级,13.3~17.0毫米为3级,17.0毫米以上为4级;x4雨日0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。
表2-1x1 x2 x3 x4 y年蛾量级别卵量级别降水量级别雨日级别幼虫密度级别1960 1022 4 112 1 4.3 1 2 1 10 1 1961 300 1 440 3 0.1 1 1 1 4 1 1962 699 3 67 1 7.5 1 1 1 9 1 1963 1876 4 675 4 17.1 4 7 4 55 4 1965 43 1 80 1 1.9 1 2 1 1 1 1966 422 2 20 1 0 1 0 1 3 1 1967 806 3 510 3 11.8 2 3 2 28 3数据保存在“DATA6-5.SAV”文件中。
1)准备分析数据在SPSS数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密度”变量,并输入数据。
【精品】SPSS统计实验报告多元线性回归分析
本文旨在通过多元线性回归分析,深入研究X、Y、Z三个变量之间的关系,以探究这三个变量对结果的影响。
本实验中样本数量为100人,本文采用SPSS22.0计算软件进行多元线性回归分析,统计计算结果如下:
(一)检验变量X、Y、Z三个变量是否有关:
Sig.=.633。
结果显示,该值大于0.05,表明X、Y、Z三者之间没有显著统计关系;
(二)确定拟合模型:
以X、Y、Z三个变量回归拟合,得出模型为:y=1.746+0.660X+0.783Y+0.430Z。
(三)检验回归模型的有效性:
1. 回归系数的统计量检验
模型的R方为.668,该值表明,X、Y、Z三个自变量可以解释本回归模型的67.0%的变化量;
2.F检验
结果显示,f分数为20.670,Sig.=.000,结果显示,f分数小于阈值0.05,因此可以接受回归模型;
检验结果显示,当其他X、Y、Z三个自变量的条件不变的情况下,X、Y、Z三个自变量对Y的影响是有显著性的。
综上所述,本文使用SPSS22.0计算软件进行多元线性回归分析,探究X、Y、Z三个变量之间的关系。
结果显示,X、Y、Z三者之间没有显著统计关系;拟合模型为:
y=1.746+0.660X+0.783Y+0.430Z;最后,证实X、Y、Z三个自变量对Y的影响是有显著性的。
SPSS中多元回归分析实例解析多元回归分析是一种统计方法,用于研究一个因变量与多个自变量之间的关系。
在SPSS中,可以使用该方法来构建、估计和解释多元回归模型。
下面将以一个实例来解析SPSS中的多元回归分析。
假设我们想要研究一个教育投资项目的效果,该项目包括多个自变量,例如教育资金、教育设施、学生人数等,并且我们希望预测该项目对学生学习成绩的影响。
首先,我们需要准备好数据并导入SPSS中。
数据应包含每个教育投资项目的多个观测值,以及与之相关的自变量和因变量。
例如,可以将每个项目作为一个观测值,并将教育资金、教育设施、学生人数等作为自变量,学生学习成绩作为因变量。
在SPSS中,可以通过选择“Analyze”菜单中的“Regression”选项来打开回归分析对话框。
然后,选择“Linear”选项来进行多元回归分析。
接下来,可以将自变量和因变量添加到对话框中。
在自变量列表中,选择教育资金、教育设施、学生人数等自变量,并将它们移动到“Independent(s)”框中。
在因变量框中,选择学生学习成绩。
然后,点击“OK”按钮开始进行分析。
SPSS将输出多元回归的结果。
关键的统计指标包括回归系数、显著性水平和拟合度。
回归系数表示每个自变量对因变量的影响程度,可以根据系数的大小和正负来判断影响的方向。
显著性水平表示自变量对因变量的影响是否显著,一般以p值小于0.05为标准。
拟合度指示了回归模型对数据的拟合程度,常用的指标有R方和调整后的R方。
在多元回归分析中,可以通过检查回归系数的符号和显著性水平来判断自变量对因变量的影响。
如果回归系数为正且显著,表示该自变量对因变量有正向影响;如果回归系数为负且显著,表示该自变量对因变量有负向影响。
此外,还可以使用其他方法来进一步解释和验证回归模型,例如残差分析、模型诊断等。
需要注意的是,在进行多元回归分析时,需要满足一些前提条件,例如自变量之间应该独立、与因变量之间应该是线性关系等。
spss多元回归分析案例SPSS多元回归分析是一种常用的统计方法,可以通过分析多个自变量对一个或多个因变量的影响程度,帮助研究者理解变量之间的关系以及预测变量之间的变化情况。
以下是一个关于人们消费意愿的多元回归分析的案例。
假设我们想研究人们的消费意愿受到收入水平、年龄和受教育水平的影响程度。
我们收集了100个参与者的数据,包括他们的收入、年龄、受教育水平以及消费意愿。
下面将介绍如何使用SPSS进行多元回归分析。
首先,在SPSS软件中打开数据文件,并选择"回归"菜单下的"线性回归"选项。
然后将因变量(消费意愿)拉入"因变量"框中,将自变量(收入、年龄、受教育水平)拉入"自变量"框中。
其次,点击"统计"按钮,在弹出的对话框中勾选"无多重共线性检验"、"离群值"和"样本相关矩阵"选项,并点击"确定"按钮。
接下来,点击"模型"按钮,在弹出的对话框中选择"全量"和"因素样本相关系数"选项,并点击"确定"按钮。
然后,点击"保存"按钮,在弹出的对话框中输入保存路径和文件名,并勾选"标准化残差"、"标准化预测值"和"离群值的DFITS"选项,并点击"确定"按钮。
最后,点击"OK"按钮开始进行多元回归分析。
在分析结果中,我们可以查看每个自变量的回归系数、标准误、t值以及显著性水平。
还可以查看整体模型的解释力、统计显著性和调整R 平方。
根据分析结果,我们可以得出结论:收入水平、年龄和受教育水平对消费意愿有显著影响。
收入水平对消费意愿的影响最大,其次是受教育水平,年龄对消费意愿的影响较小。
SPSS19.0实战之多元线性回归分析(2011-12-09 12:19:11)转载▼分类:软件介绍标签:文化线性回归数据(全国各地区能源消耗量与产量)来源,可点击协会博客数据挖掘栏:国泰安数据服务中心的经济研究数据库。
1.1数据预处理数据预处理包括的内容非常广泛,包括数据清理和描述性数据汇总,数据集成和变换,数据归约,数据离散化等。
本次实习主要涉及的数据预处理只包括数据清理和描述性数据汇总。
一般意义的数据预处理包括缺失值填写和噪声数据的处理。
于此我们只对数据做缺失值填充,但是依然将其统称数据清理。
1.1.1数据导入与定义单击“打开数据文档”,将xls格式的全国各地区能源消耗量与产量的数据导入SPSS中,如图1-1所示。
图1-1 导入数据导入过程中,各个字段的值都被转化为字符串型(String),我们需要手动将相应的字段转回数值型。
单击菜单栏的“ ”-->“ ”将所选的变量改为数值型。
如图1-2所示:图1-2 定义变量数据类型1.1.2数据清理数据清理包括缺失值的填写和还需要使用SPSS分析工具来检查各个变量的数据完整性。
单击“ ”-->“ ”,将检查所输入的数据的缺失值个数以及百分比等。
如图1-3所示:图1-3缺失值分析图1-4 描述性数据汇总得到如表1-2所示的描述性数据汇总。
N 极小值极大值均值标准差方差能源消费总量3 38.50 6175.924 38142034.412煤炭消费量3 28.99 7472.259 55834651.378焦炭消费量30 19 5461 874.61 1053.008 1108824.853原油消费量30 0 5555 1099.01 1273.265 1621202.562图1-5 数据标准化我们还可以通过描述性分析中的“ ”来得到各个变量的众数,均值等,还可以根据这些量绘制直方图。
我们选取个别变量(能源消费总量)的直方图,可以看到我们因变量基本符合正态分布。
线性回归分析的SPSS操作本节内容主要介绍如何确定并建立线性回归方程。
包括只有一个自变量的一元线性回归和和含有多个自变量的多元线性回归。
为了确保所建立的回归方程符合线性标准,在进行回归分析之前,我们往往需要对因变量与自变量进行线性检验。
也就是类似于相关分析一章中讲过的借助于散点图对变量间的关系进行粗略的线性检验,这里不再重复。
另外,通过散点图还可以发现数据中的奇异值,对散点图中表示的可能的奇异值需要认真检查这一数据的合理性。
一、一元线性回归分析1.数据以本章第三节例3的数据为例,简单介绍利用SPSS如何进行一元线性回归分析。
数据编辑窗口显示数据输入格式如下图7-8(文件7-6-1.sav):图7-8:回归分析数据输入2.用SPSS进行回归分析,实例操作如下:2.1.回归方程的建立与检验(1)操作①单击主菜单Analyze / Regression / Linear…,进入设置对话框如图7-9所示。
从左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x选入到自变量(Independent)框中。
在方法即Method一项上请注意保持系统默认的选项Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。
所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。
具体如下图所示:图7-9 线性回归分析主对话框②请单击Statistics…按钮,可以选择需要输出的一些统计量。
如Regression Coefficients(回归系数)中的Estimates,可以输出回归系数及相关统计量,包括回归系数B、标准误、标准化回归系数BETA、T值及显著性水平等。
Model fit项可输出相关系数R,测定系数R2,调整系数、估计标准误及方差分析表。
上述两项为默认选项,请注意保持选中。
设置如图7-10所示。
设置完成后点击Continue返回主对话框。
图7-10:线性回归分析的Statistics选项图7-11:线性回归分析的Options选项回归方程建立后,除了需要对方程的显著性进行检验外,还需要检验所建立的方程是否违反回归分析的假定,为此需进行多项残差分析。
SPSS19.0实战之多元线性回归分析
(2011-12-09 12:19:11)
转载▼
分类:软件介绍
标签:
文化
线性回归数据(全国各地区能源消耗量与产量)来源,可点击协会博客数据挖掘栏:国泰安数据服务中心的经济研究数据库。
1.1数据预处理
数据预处理包括的内容非常广泛,包括数据清理和描述性数据汇总,数据集成和变换,数据归约,数据离散化等。
本次实习主要涉及的数据预处理只包括数据清理和描述性数据汇总。
一般意义的数据预处理包括缺失值填写和噪声数据的处理。
于此我们只对数据做缺失值填充,但是依然将其统称数据清理。
1.1.1数据导入与定义
单击“打开数据文档”,将xls格式的全国各地区能源消耗量与产量的数据导入SPSS中,如图1-1所示。
图1-1 导入数据
导入过程中,各个字段的值都被转化为字符串型(String),我们需要手动将相应的字段转回数值型。
单击菜单栏的“ ”-->“ ”将所选的变量改为数值型。
如图1-2所示:
图1-2 定义变量数据类型
1.1.2数据清理
数据清理包括缺失值的填写和还需要使用SPSS分析工具来检查各个变量的数据完整性。
单击“ ”-->“ ”,将检查所输入的数据的缺失值个数以及百分比等。
如图1-3所示:
图1-3缺失值分析
图1-4 描述性数据汇总得到如表1-2所示的描述性数据汇总。
N 极小
值极大值均值标准差方差
能源消
费总量
30 911 26164 9638.50 6175.924 38142034.412
煤炭消
费量
30 332 29001 9728.99 7472.259 55834651.378
焦炭消
费量
30 19 5461 874.61 1053.008 1108824.853
原油消
费量
30 0 5555 1099.01 1273.265 1621202.562
图1-5 数据标准化
我们还可以通过描述性分析中的“ ”来得到各个变量的众数,均值等,还可以根据这些量绘制直方图。
我们选取个别变量(能源消费总量)的直方图,可以看到我们因变量基本符合正态分布。
如图1-6所示:
图1-6能源消费总量
1.2 回归分析
我们本次实验主要考察地区能源消费总额(因变量)与煤炭消费量、焦炭消费量、原油消费量、原煤产量、焦炭产量、原油产量之间的关系。
以下的回归分析所涉及只包括以上几个变量,并使用标准化之后的数据。
1.2.1参数设置
1. 单击菜单栏“ ”-->“ ”-->“ ”,将弹出如图1-7所示的对话框,将通过选择因变量和自变量来构建线性回归模型。
因变量:标准化能源消费总额;自变量:标准化煤炭消费量、标准化焦炭消费量、标准化原油消费量、标准化原煤产量、标准化焦炭产量、标准化原油产量。
自变量方法选择:进入,个案标签使用地名,不使用权重最小二乘法回归分析—即WLS权重为空。
图1-7选择线性回归变量还需要设置统计量的参数,我们选择回归系数中的“ ”和其他项中的“ ”。
选中估计可输出回归系数B及其标准误,t值和p值,还有标准化的回归系数beta。
选中模型拟合度复选框:模型拟合过程中进入、退出的变
量的列表,以及一些有关拟合优度的检验:R,R2和调整的R2, 标准误及方差分析表。
如图1-8所示:
图1-8 设置回归分析统计量
3.在设置绘制选项的时候,我们选择绘制标准化残差图,其中的正态概率图是rankit图。
同时还需要画出残差图,Y轴选择:ZRESID,X轴选择: ZPRED。
如
图1-9所示:
图1-9设置绘制
左上框中各项的意义分别为:
·“DEPENDNT”因变量
·“ZPRED”标准化预测值
·“ZRESID”标准化残差
·“DRESID”删除残差
·“ADJPRED”调节预测值
·“SRESID”学生化残差
·“SDRESID”学生化删除残差
4. 许多时候我们需要将回归分析的结果存储起来,然后用得到的残差、预测值等做进一步的分析,“保存”按钮就是用来存储中间结果的。
可以存储的有:预测值系列、残差系列、距离(Distances)系列、预测值可信区间系列、波动统计量系列。
本次实验暂时不保存任何项。
5. 设置回归分析的一些选项,有:步进方法标准单选钮组:设置纳入和排除标准,可按P值或F值来设置。
在等式中包含常量复选框:用于决定是否在模型中包括常数项,默认选中。
如图1-10所示:
图1-10 设置选项
1.2.2结果输出与分析
在以上选项设置完毕之后点击确定,SPSS将输出一系列的回归分析结果。
我们来逐一贴出和分析,并根据它得到最后的回归方程以及验证回归模型。
1. 表1-3所示,是回归分析过程中输入、移去模型记录。
具体方法为:enter (进入)
输入/移去的变量
模型输入的变量移去
的变
量方法
1 Zscore(原油产
量), Zscore(原煤
产量), Zscore(焦
炭消费量),
Zscore(原油消费
量), Zscore(煤炭
消费量),
Zscore(焦炭产量)
. 输入
表1-3 输入的变量
2.表1-4所示是模型汇总,R称为多元相关系数,R方(R2)代表着模型的拟
合度。
2.我们可以看到该模型是拟合优度良好。
模型汇总
模型汇总
模型R R 方调整R
方
标准估计
的误差Sig.
1 .96
2 .925 .905 .30692707 .000
表1-4 模型汇总
3.表1-5所示是离散分析。
,F的值较大,代表着该回归模型是显著。
也称为失拟性检验。
模型平方和df 均方 F
1 回归25.660 6 4.277 45.397
残差2.072 22 .094
总计27.732 28
表1-5 离散分析
4.表1-6所示的是回归方程的系数,根据这些系数我们能够得到完整的多元回归方程。
观测以下的回归值,都是具有统计学意义的。
因而,得到的多元线性回归方程:Y=0.008+1.061x1+0.087 x2+0.157 x3-0.365 x4-0.105 x5-0.017x6
(x1为煤炭消费量,x2为焦炭消费量,x3为原油消费量,x4为原煤产量,x5为原炭产量,x6为原油产量,Y是能源消费总量)
结论:能量消费总量由主要与煤炭消费总量所影响,成正相关;与原煤产量成一定的反比。
系数
图1-11残差图
可以看出各散点随机分布在e=0为中心的横带中,证明了该模型是适合的。
同时我们也发现了两个异常点,就是广东省和四川省,这种离群点是值得进一步研究的。
还有一种残差正态概率图(rankit图)可以直观地判断残差是否符合正态分布。
如图1-12所示:
图1-12 rankit(P-P)图它的直方图如图1-13所示:
图1-13 rankit(直方)图。