第9章含定性变量的回归模型

格式：ppt
大小：633.00 KB
文档页数：60

下载文档原格式

自变量中含有定性变量的回归分析

有相同旳斜率，但有不同旳截距
图1 不同教育程度人员保健支出示意图
• （2）乘法方式——斜率旳变化
• 例：根据消费理论，消费水平C主要取决于收入水平X。但在一种较长旳时期，人们旳消费倾向会发生变化，尤其是在自然灾害、战争等反常年份，消费倾向往往出现变化。这种消费倾向旳变化可经过在收入旳系数中引入虚拟变量来考察。
Model
1
(Constant)
B
Std. Error
930.495 466.974
X1
387.616
62.565
X2
1262.693 314.127
a. Dependent Variable: Y
Standardized Coefficients
Beta
.931 .604
t 1.993 6.195 4.020
F 21.357
Sig. .001a
Model Summary
Adjusted Std. Error of R R Square R Square the Estimate .927a .859 .819 459.048 dictors: (Constant), X2, X1
Unstandardized Coefficients
Sig. .069 .001 .004 .005 .003 .002 .015
• 回归方程旳解释 • 当案例在两个分类变量都等于0时，即文化程度为文盲，居住地在农村
时，此种情况称为参照类（其他情况将与此进行比较），其回归方程为： • 表白全部参照类妇女年龄每上升1岁，其曾生子女数旳平均变化量为
则其几何图形如图2所示。
图2 不同年份消费倾向示意图
假如在模型中同步使用加法和乘法两种方式引入虚拟变量，则回归线旳截距和斜率都会变化。

应用回归分析-第9章课后习题答案

应⽤回归分析-第9章课后习题答案第9章含定性变量的回归模型思考与练习参考答案9.1 ⼀个学⽣使⽤含有季节定性⾃变量的回归模型，对春夏秋冬四个季节引⼊4个0-1型⾃变量，⽤SPSS 软件计算的结果中总是⾃动删除了其中的⼀个⾃变量，他为此感到困惑不解。

出现这种情况的原因是什么？答：假如这个含有季节定性⾃变量的回归模型为：tt t t kt k t t D D D X X Y µαααβββ++++++=332211110其中含有k 个定量变量，记为x i 。

对春夏秋冬四个季节引⼊4个0-1型⾃变量，记为D i ，只取了6个观测值，其中春季与夏季取了两次，秋、冬各取到⼀次观测值，则样本设计矩阵为：=000110010110001010010010100011)(616515414313212111k k k k k k X X X X X X X X X X X XD X,显然，(X,D)中的第1列可表⽰成后4列的线性组合，从⽽(X,D)不满秩，参数⽆法唯⼀求出。

这就是所谓的“虚拟变量陷井”，应避免。

当某⾃变量x j 对其余p-1个⾃变量的复判定系数2j R 超过⼀定界限时，SPSS 软件将拒绝这个⾃变量x j 进⼊回归模型。

称Tol j =1-2j R 为⾃变量x j 的容忍度（Tolerance ），SPSS 软件的默认容忍度为0.0001。

也就是说，当2j R ＞0.9999时，⾃变量x j 将被⾃动拒绝在回归⽅程之外，除⾮我们修改容忍度的默认值。

=k βββ 10β=4321ααααα⽽在这个模型中出现了完全共线性，所以SPSS软件计算的结果中总是⾃动删除了其中的⼀个定性⾃变量。

9.2对⾃变量中含有定性变量的问题，为什么不对同⼀属性分别建⽴回归模型，⽽采取设虚拟变量的⽅法建⽴回归模型？答：原因有两个，以例9.1说明。

⼀是因为模型假设对每类家庭具有相同的斜率和误差⽅差，把两类家庭放在⼀起可以对公共斜率做出最佳估计；⼆是对于其他统计推断，⽤⼀个带有虚拟变量的回归模型来进⾏也会更加准确，这是均⽅误差的⾃由度更9.3 研究者想研究采取某项保险⾰新措施的速度y对保险公司的规模x1和保险公司类型的关系（参见参考⽂献【3】）。

第九章相关与回归分析

第9章相关与回归分析【教学内容】相关分析与回归分析是两种既有区别又有联系的统计分析方法。

本章阐述了相关关系的概念与特点;相关关系与函数关系的区别与联系;相关关系的种类;相关关系的测定方法(直线相关系数的含义、计算方法与运用);回归分析的概念与特点;回归直线方程的求解及其精确度的评价;估计标准误差的计算。

【教学目标】1、了解相关与回归分析的概念、特点和相关分析与回归分析的区别与联系；2、掌握相关分析的定性和定量分析方法；3、掌握回归模型的拟合方法、对回归方程拟合精度的测定和评价的方法。

【教学重、难点】1、相关分析与回归分析的概念、特点、区别与联系；2、相关与回归分析的有关计算公式和应用条件。

第一节相关分析的一般问题一、相关关系的概念与特点（一）相关关系的概念在自然界与人类社会中,许多现象之间是相互联系、相互制约的,表现在数量上也存在着一定的联系。

这种数量上的联系和关系究其实质,可以概括为两种不同类型,即函数关系与相关关系。

相关关系:是指现象之间客观存在的,在数量变化上受随机因素的影响,非确定性的相互依存关系。

例如,商品销售额与流通费用率之间的关系就是一种相关关系。

（二）相关关系的特点1、相关关系表现为数量相互依存关系。

2、相关关系在数量上表现为非确定性的相互依存关系。

二、相关关系的种类1、相关关系按变量的多少,可分为单相关和复相关2、相关关系从表现形态上划分,可分为直线相关和曲线相关3、相关关系从变动方向上划分,可分为正相关和负相关4、按相关的密切程度分,可分为完全相关、不完全相关和不相关三、相关分析的内容相关分析是对客观社会经济现象间存在的相关关系进行分析研究的一种统计方法。

其目的在于对现象间所存在的依存关系及其所表现出的规律性进行数量上的推断和认识,以便为回归分析提供依据。

相关分析的内容和程序是:(1)判别现象间有无相关关系(2)判定相关关系的表现形态和密切程度第二节相关关系的判断与分析一、相关关系的一般判断（一）定性分析对现象进行定性分析,就是根据现象之间的本质联系和质的规定性,运用理论知识、专业知识、实际经验来进行判断和分析。

计量经济学回归分析模型

计量经济学回归分析模型计量经济学是经济学中的一个分支，通过运用数理统计和经济理论的工具，研究经济现象。

其中回归分析模型是计量经济学中最为常见的分析方法之一、回归分析模型主要用于确定自变量与因变量之间的关系，并通过统计推断来解释这种关系。

回归分析模型中的关系可以是线性的，也可以是非线性的。

线性回归模型是回归分析中最为常见和基础的模型。

它可以表示为:Y=β0+β1X1+β2X2+...+βkXk+ε其中，Y代表因变量，X1,X2,...,Xk代表自变量，β0,β1,β2,...,βk代表回归系数，ε代表随机误差项。

回归模型的核心是确定回归系数。

通过最小二乘法估计回归系数，使得预测值与实际观测值之间的差异最小化。

最小二乘法通过使得误差的平方和最小化来估计回归系数。

通过对数据进行拟合，我们可以得到回归系数的估计值。

回归分析模型的应用范围非常广泛。

它可以用于解释和预测经济现象，比如价格与需求的关系、生产力与劳动力的关系等。

此外，回归分析模型还可以用于政策评估和决策制定。

通过分析回归系数的显著性，可以判断自变量对因变量的影响程度，并进行政策建议和决策制定。

在实施回归分析模型时，有几个重要的假设需要满足。

首先，线性回归模型要求因变量和自变量之间存在线性关系。

其次，回归模型要求自变量之间不存在多重共线性，即自变量之间没有高度相关性。

此外，回归模型要求误差项具有同方差性和独立性。

在解释回归分析模型的结果时，可以通过回归系数的显著性来判断自变量对因变量的影响程度。

显著性水平一般为0.05或0.01，如果回归系数的p值小于显著性水平，则说明该自变量对因变量具有显著影响。

此外，还可以通过确定系数R^2来评估模型的拟合程度。

R^2可以解释因变量变异的百分比，值越接近1，说明模型的拟合程度越好。

总之，回归分析模型是计量经济学中非常重要的工具之一、它通过分析自变量和因变量之间的关系，能够解释经济现象和预测未来走势。

在应用回归分析模型时，需要满足一定的假设条件，并通过回归系数和拟合优度来解释结果。

应用回归分析.ppt

统计依赖关系
正相关线性相关不相关相关系数：
负相关 1 XY 1
正相关非线性相关不相关
负相关
2019年8月28
感谢你的观看
有因果关系回归分析无因果关系相关分析
9
1 .1 变量间的统计关系
• 注意（1）不线性相关并不意味着不相关。（2）有相关关系并不意味着一定有因果关系。（3）相关分析对称地对待任何（两个）变量，
2019年8月28
感谢你的观看
18
1 .4 建立实际问题回归模型的过程
五.模型的检验与修改
检验: 1. 回归方程
2. 回归系数
3. 拟合优度
4. 随机误差项序列的相关性异方差
修改:从设置变量是否合理开始—是否遗漏变量,变量间的依赖性是否强,样本容量是否少,理论模型是否合适等等.
六. 回归模型的应用
函数关系
商品的销售额与销售量之间的关系 y = px 圆的面积与半径之间的关系
S=R2
、原原材材料料消价耗格额(x与3)之产间量的(x关1) 系、单位产量消耗(x2) y = x1 x2 x3
2019年8月28
感谢你的观看
5
1 .1 变量间的统计关系
y（万元）
6000 5000 4000 3000 2000 1000
0 0
y = 1000x
123456 x（万辆）
图1.1 函数关系图
2019年8月28
感谢你的观看
6
1 .1 变量间的统计关系
相关关系的例子
子女身高 (y)与父亲身高(x)之间的关系收入水平(y)与受教育程度(x)之间的关系粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系

第9章相关与回归分析

第九章相关与回归分析习题一、单选题1．下面的函数关系是（）。

A、销售人员测验成绩与销售额大小的关系B、圆周的长度决定于它的半径C、家庭的收入和消费的关系D、数学成绩与统计学成绩的关系2．若要证明两变量之间线性相关程度是高的，则计算出的相关系数应接近于（）。

A、+1B、0C、0.5D、+1或-13．回归系数和相关系数的符号是一致的，其符号均可用来判断现象（）。

A、线性相关还是非线性相关B、正相关还是负相关C、完全相关还是不完全相关D、单相关还是复相关4．在线性相关的条件下，自变量的均方差为2，因变量均方差为5，而相关系数为0.8时，则其回归系数为( )。

A、8B、0.32C、2D、12.55．下面现象间的关系属于相关关系的是（）。

A、圆的周长和它的半径之间的关系B、价格不变条件下,商品销售额与销售量之间的关系C、家庭收入愈多,其消费支出也有增长的趋势D、正方形面积和它的边长之间的关系6．下列关系中，属于正相关关系的是（）。

A、合理限度内，施肥量和平均单产量之间的关系B、产品产量与单位产品成本之间的关系C、商品的流通费用与销售利润之间的关系D、流通费用率与商品销售量之间的关系7．相关分析是研究（）。

A、变量之间的数量关系B、变量之间的变动关系C、变量之间的相互关系的密切程度D、变量之间的因果关系8．在回归直线y=a+bx中，b<0，则x与y之间的相关系数( )。

A、r=0B、r=lC、0<r<1D、-1<r<09．在回归直线y=a+bx中，b表示（）。

A、当x增加一个单位时，y增加a的数量B、当y增加一个单位时，x增加b的数量C、当x增加一个单位时，y的平均增加量D、当y增加一个单位时，x的平均增加量10．当相关系数r=0时，表明（）。

A、现象之间完全无关B、相关程度较小C、现象之间完全相关D、无直线相关关系11．下列现象相关密切程度最高的是（）。

A、某商店的职工人数与商品销售额之间的相关系数0.87B、流通费用水平与利润率之间的相关关系为-0.94C、商品销售额与利润率之间的相关系数为0.51D、商品销售额与流通费用水平的相关系数为-0.8112．估计标准误差是反映（）。

回归模型的要素

回归模型的要素
回归模型是一种统计分析方法，用于建立变量之间的关系模型。

它基于变量之间的线性关系假设，并通过拟合数据来估计模型参数。

回归模型包含以下要素：
1. 因变量（Dependent Variable）：也称为被解释变量或目标变量，它是我们想要预测或解释的变量。

2. 自变量（Independent Variables）：也称为解释变量或预测变量，它们是用来解释或预测因变量的变量。

回归模型可以包含一个或多个自变量。

3. 线性关系（Linear Relationship）：回归模型假设因变量与自变量之间存在线性关系，即自变量的变化对因变量的影响是线性的。

4. 残差（Residuals）：在回归模型中，残差是指观测值与模型预测值之间的差异。

回归模型的目标是通过最小化残差的平方和来找到最佳拟合线。

5. 模型参数（Model Parameters）：回归模型的参数是用来描述自变量与因变量之间关系的数值。

在线性回归模型中，参数表示自变量对因变量的影响程度。

6. 截距（Intercept）：截距是回归模型中的常数项，表示在自变量为零时，因变量的预测值。

它反映了因变量在没有自变量影响时的基准水平。

通过确定回归模型的要素，并进行数据拟合和参数估计，我
们可以使用回归模型来预测或解释因变量的变化。

含定性变量的回归模型

含定性变量的回归模型一、自变量中含有定性变量的回归模型在回归分析中，对一些自变量是定性变量的情形先量化处理，引入只取0和1 两个值的虚拟自变量。

例如，在研究粮食产量问题，需考虑正常年份和干旱年份，对这个问题就可以引入虚拟变量D ，令D=1表示正常年份，D=0表示干旱年份。

当在某些场合定性自变量可能取多类值时，例如考虑销售量的季节性影响，季节因素分为春、夏、秋、冬4种情况。

为了用定性自变量反映四个季度，可以引入自变量⎩⎨⎧==，其他，春季0111x x ，⎩⎨⎧==，其他，夏季0122x x ，⎩⎨⎧==，其他，秋季0133x x ，⎩⎨⎧==，其他，冬季0144x x ，如果这样引入会出现一个问题，即自变量4321,,,x x x x 之和恒等于1，构成了完全多重共线性。

所以，一个定性变量有k 类可能的取值时，只需要引入k-1个0-1型自变量。

所以在分析季节因素的时候，引入3个0-1自变量即可。

例1 某经济学家想调查文化程度对家庭储蓄的影响，在一个中等收入的样本框中，随机调查了13户高学历家庭与14户中低学历的家庭，因变量y 为上一年家庭储蓄增加额，自变量x1为上一年家庭总收入，自变量x2表示家庭学历，高学建立y 对x1,x2的线性回归模型，回归方程为：yˆ=-7976+3826x1-3700x2 这个结果表明，中等收入的家庭每增加1万元收入，平均拿出3826元作为储蓄。

高学历家庭每年的平均储蓄额少于低学历的家庭，平均少3700元。

如果不引入家庭学历定性变量x2，仅用y 对家庭年收入x1做一元线性回归，得判定系数R^2=0.618，拟合效果不好。

家庭年收入x1是连续型变量，它对回归的贡献也是不可缺少的。

如果不考虑家庭年收入这个自变量，13户高学历家庭的平均年储蓄增加额为3009.31元，14户低学历家庭的平均年储蓄增加额为5059.36元，这样会认为高学历家庭每年的储蓄额比低学历的家庭平均少5059.36-3009.31=2050.05元，而用回归法算出的数值是3824元，两者并不相等。

简单线性回归模型的基本假定

简单线性回归模型的基本假定简单线性回归模型是最常用的、也是最简单的回归分析模型，用于分析两个变量之间的相关性，可以帮助判断两个变量之间的线性关系。

简单线性回归模型用一条直线去描述两变量之间的关系，模型也被称为“回归直线”。

1、正态性：简单线性回归模型要求回归预测值的分布满足正态分布，而根据正态分布定理，可以预料，在平均值附近所出现离散点几率会比平均值远处出现离散点几率更高。

2、线性性：简单线性回归模型要求关系是线性的，也就是说，变量之间的关系应该是一条直线，这个假定也有一个严格的名字叫做：“线性模型自变量和因变量之间存在线性关系”。

3、独立性：简单线性回归模型假定解释变量和因变量之间的关系，它们之间是独立的。

这个假定的意思就是：解释变量不会影响因变量，因变量也不会影响解释变量，两者之间是独立的。

也就是说，解释变量变化不会影响因变量的变化，因变量的变化也不会影响解释变量的变化。

4、自变量的多数值：简单线性回归模型也假定自变量的取值有大量的变化，因此自变量的取值必须是大量的变化，要么从较低的值变化到较高的值，要么从较高的值变化到较低的值。

5、定性变量：假定解释变量可以为定性变量。

简单线性回归模型可以处理定性变量，即类别变量和虚拟变量，对定性变量处理的方法与对定量变量处理的方法基本相同。

6、常数项：要求回归模型包含一个常数项，因为解释变量的值可能会影响因变量的值，即便没有任何解释变量参与其中。

7、无共线性：简单线性回归模型要求解释变量之间没有强的多重共线性，即解释变量之间不能存在高度相关的关系。

8、无异常值：简单线性回归模型要求解释变量和因变量之间不存在太多的异常值，因为异常值可能会影响模型的拟合度。

第九章相关与回归分析《统计学原理》PPT课件

［公式9—4］
r xy n • xy
x y
［公式9—5］
返回到内容提要
第三节回归分析的一般问题
一、回归分析的概念与特点
(一)回归分析的概念
现象之间的相关关系，虽然不是严格的函数关系，但现象之间的一般关系值，可以通过函数关系的近似表达式来反映，这种表达式根据相关现象的实际对应资料，运用数学的方法来建立，这类数学方法称回归分析。
单相关是指两个变量间的相关关系，如自变量x和因变量y的关系。
复相关是指多个自变量与因变量间的相关关系。
(二)相关关系从表现形态上划分，可分为直线相关和曲线相关
直线相关是指两个变量的对应取值在坐标图中大致呈一条直线。
曲线相关是指两个变量的对应取值在坐标图中大致呈一条曲线，如抛物线、指数曲线、双曲线等。
0.578
a y b x 80 0.578 185 3.844
n
n7
7
yˆ 3.844 0.578x
二、估计标准误差 (一)估计标准误差的概念与计算估计标准误差是用来说明回归直线方程代表性大小的统计分析指标。其计算公式为：
Syx
y yˆ 2
n
［公式9—8］
实践中，在已知直线回归方程的情况下，通常用下面的简便公式计算估计标准误差：
［例９—２］根据相关系数的简捷公式计算有：
r
n xy x y
n x2 x2 n y2 y2
7 218018580
0.978
7 5003 1852 7 954 802
再求回归直线方程：
yˆ a bx
b
n xy x y
n x2 x2
7 2180 18580 7 50031852

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

a
of t he Est imate 1288. 68
R Square .879
Square .869
a. Predic tors : (Cons tant ), X2, X1
ANOVA Model 1 Regress ion Res idual Total Sum of Squares 290372875.924 39856639. 705 330229515.630 df 2 24 26 Mean Square 145186437.962 1660693.321 F 87.425 Sig. .000
§9.2 自变量定性变量回归模型的应用
对β2的显著性检验的显著性概率Sig=0.153，β2没有通过显著性检验，不能认为β2非零。用y对x做一元线性回归，计算结果为：
C oeffici en ts U ns tandardized C oef f icients B (C ons tant) X 6.795 -6.318E-03 Std. Error .324 .001 -. 976 Standardized C oef f icients Bet a t 20.963 -10. 90 Sig. .000 .000
§9.2 自变量定性变量回归模型的应用
二、回归系数相等的检验例9.3 回到例9.1的问题，例9.1引入0-1型自变量的方法是假定储蓄增加额y对家庭收入的回归斜率β1与家庭年收入无关，家庭年收入只影响回归常数项β0，这个假设是否合理，还需要做统计检验。检验方法是引入如下含有交互效应的回归模型： yi=β 0+β 1xi1+β 2xi2+β 3xi1xi2+ε i(9.8)
§9.3 因变量是定性变量的回归模型
在许多社会经济问题中，所研究的因变量往往只有两个可能结果，这样的因变量也可用虚拟变量来表示，虚拟变量的取值可取0或1。一、定性因变量的回归方程的意义设因变量y是只取0，1两个值的定性变量，考虑简单线性回归模型 yi=β 0+β 1xi+ε i 在这种y只取0，1两个值的情况下，因变量均值 E(yi)=β 0+β 1xi有着特殊的意义。 (9.12)
两个自变量x1与x2的系数都是显著的，判定系数 R2=0.879，回归方程为：
ˆ y =-7976+3826x1-3700x2
§9.1 自变量中含有定性变量的回归模型
这个结果表明，中等收入的家庭每增加1万元收入，平均拿出3826元作为储蓄。高学历家庭每年的平均储蓄额少于低学历的家庭，平均少3700元。如果不引入家庭学历定性变量x2，仅用y对家庭年收入 x1做一元线性回归，得判定系数R2=0.618，拟合效果不好。
第九讲虚拟变量模型的进一步讨论
——含定性变量的回归模型
9.1
9.2 9.3 9.4 9.5
自变量中含有定性变量的回归模型
自变量定性变量回归模型的应用因变量是定性变量的回归模型 Logistic(逻辑斯蒂)回归多类别Logistic回归
9.6
因变量是顺序变量的回归
§9.1 自变量中含有定性变量的回归模型
其中y为上一年家庭储蓄增加额， x1为上一年家庭总收入， x2表示家庭学历，
高学历家庭x2=1,低学历家庭x2=0。
§9.2 自变量定性变量回归模型的应用
回归模型（9.8）式可以分解为对高学历和对低学历家庭的两个线性回归模型，分别为：高学历家庭x2=1,
yi=β 0+β 1xi1+β 2+β 3xi1+ε
8950 9865 9866 10235 10140
3.9 4.8 4.6 4.8 4.2
0 0 0 0 0
§9.1 自变量中含有定性变量的回归模型
在线性回归对话框，建立y对x1、x2的线性回归，输出结果：
Mod el Su mmary Std. Error Adjus ted R Model 1 R .938
x 3 1, x3 0,
春季其它
x 2 1, x2 0,
x 4 1, x4 0,
夏季其它
冬季其它
秋季其它
§9.1 自变量中含有定性变量的回归模型
可是这样做却产生了一个新的问题，即 x1+x2+x3+x4=1，构成完全多重共线性。解决这个问题的方法很简单，我们只需去掉一个 0-1型变量，只保留3个0-1型自变量即可。例如去掉 x4，只保留x1、x2、x3。对一般情况，一个定性变量有k类可能的取值时，需要引入k-1个0-1型自变量。当k=2时，只需要引入一个0-1型自变量即可。
D D
i i
1,
当 x
i i
500 500
0, 当 x
§9.2 自变量定性变量回归模型的应用
引入两个新的自变量
xi1=xi xi2=(xi-500)Di
这样回归模型转化为标准形式的二元线性回归模型： yi=β 0+β 1xi1+β 2xi2+ε i （9.3）式可以分解为两个线性回归方程：当x1≤500时，E(y)=β 0+β 1x1 (9.3)
§9.1 自变量中含有定性变量的回归模型
二、复杂情况
某些场合定性自变量可能取多类值，例如某商厦策划营销
方案，需要考虑销售额的季节性影响，季节因素分为春、
夏、秋、冬4种情况。为了用定性自变量反应春、夏、秋、冬四季，我们初步设想引入如下4个0-1自变量：
x 1 1, x1 0 ,
粮食产量的回归模型为：
yi=β 0+β 1xi+β 2Di+ε i
其中干旱年份的粮食平均产量为：
E(yi|Diห้องสมุดไป่ตู้0)=β 0+β 1xi
正常年份的粮食平均产量为：
E(yi|Di=1)=(β0+β2)+β1xi
§9.1 自变量中含有定性变量的回归模型
例9.1 某经济学家想调查文化程度对家庭储蓄的影响，在一个中等收入的样本框中，随机调查了13户高学历家庭与14户中低学历的家庭，因变量y为上一年家庭储蓄增加额，自变量x1为上一年家庭总收入，自变量x2表示家庭学历，高学历家庭x2=1,低学历家庭x2=0，
§9.2 自变量定性变量回归模型的应用
以上只是根据散点图从直观上判断本例数据应该用折线回归拟合，这一点还需要做统计的显著性检验，这只需对（9.2）式的回归系数β2做显著性检验。
Coeffici ents Uns tandardized Coef f icients B (Cons tant) X X2 5.895 -3.954E-03 -3.893E-03 Std. Error .604 .001 .002 -. 611 -. 388 Standardized Coef f icients Bet a t 9.757 -2.65 -1.69 Sig. .000 .045 .153
i i
=（β 0+β 2）+（β 1+β 3）xi1+ε 低学历家庭x2=0， yi=β 0+β 1xi1+ε
i
§9.2 自变量定性变量回归模型的应用
要检验两个回归方程的回归系数(斜率)相等，等价于检验 H0：β 3=0，当拒绝H0时，认为β 3≠0，这时高学历与低学历家庭的储蓄回归模型实际上被拆分为两个不同的回归模型。当接受H0时，认为β 3=0，这时高学历与低学历家庭的储蓄回归模型是如下形式的联合回归模型： yi=β0+β1xi1+β2xi2+εi
§9.2 自变量定性变量回归模型的应用
由图9.1可看出数据在生产批量xp=500时发生较大变化，即批量大于500时成本明显下降。我们考虑由两段构成的分段线性回归,这可以通过引入一个0-1型虚拟自变量实现。假定回归直线的斜率在xp=500处改变，建立回归模型 yi=β0+β1xi+β2(xi-500)Di+εi 来拟合，其中
§9.2 自变量定性变量回归模型的应用
一、分段回归例9.2 表9.3给出某工厂生产批量xi与单位成本yi(美元)的数据。试用分段回归建立回归模型。
序号 1 2 y 2.57 4.4 X(= x1) 650 340 x2 150 0
3
4 5
4.52
1.39 4.75
400
800 300
0
300 0
当x1＞500时，E(y)=(β0-500β2)+(β1+β2)x1
§9.2 自变量定性变量回归模型的应用
§9.2 自变量定性变量回归模型的应用
在线性回归对话框用普通最小二乘法拟合模型(9.3)式得回归方程为：
ˆ y
=5.895-0.00395x1-0.00389x2
利用此模型可说明生产批量小于500时，每增加1个单位批量，单位成本降低0.00395美元；当生产批量大于500时，每增加1个单位批量，估计单位成本降低 0.00395+0.00389=0.00784(美元)。
一、简单情况首先讨论定性变量只取两类可能值的情况，例如研究粮食产量问题，y为粮食产量，x为施肥量，另外再考虑气候问题，分为正常年份和干旱年份两种情况，对这个问题的数量化方法是引入一个0-1型变量D，令： Di=1 Di=0 表示正常年份表示干旱年份
§9.1 自变量中含有定性变量的回归模型
§9.2 自变量定性变量回归模型的应用
Coeffici ents Uns tandardized Coef f icients B (Cons tant) X1 X2 X3 -8763. 936 4057.151 -776.939 -787.564 Std. Error 1270.878 359.284 2514.459 663.367 .977 -. 111 -. 443 Standardized Coef f icients Bet a t -6.896 11.292 -. 309 -1.187 Sig. .000 .000 .760 .247

第9章含定性变量的回归模型

合集下载

自变量中含有定性变量的回归分析

应用回归分析-第9章课后习题答案

第九章相关与回归分析

计量经济学回归分析模型

应用回归分析.ppt

第9章相关与回归分析

回归模型的要素

含定性变量的回归模型

简单线性回归模型的基本假定

第九章相关与回归分析《统计学原理》PPT课件

文档推荐

最新文档

第9章 含定性变量的回归模型

合集下载

自变量中含有定性变量的回归分析

应用回归分析-第9章课后习题答案

第九章 相关与回归分析

计量经济学回归分析模型

应用回归分析.ppt

第9章 相关与回归分析

回归模型的要素

含定性变量的回归模型

简单线性回归模型的基本假定

第九章 相关与回归分析 《统计学原理》PPT课件

文档推荐

最新文档

第9章含定性变量的回归模型

第九章相关与回归分析

第9章相关与回归分析

第九章相关与回归分析《统计学原理》PPT课件