应用数理统计-4回归分析(楚)
- 格式:ppt
- 大小:1.08 MB
- 文档页数:77
第11章 回归分析设x 为普通变量,Y 为随机变量。
如果当x 变化时,Y 随着x 的变化大体上按某种趋势变化,则称x 与Y 之间存在相关关系,即),0(~,)(2σεεN x f Y +=例如,某地人均收入x 与某种商品的消费量Y 之间的关系;森林中树木的断面直径x 与高度Y 之间的关系;某种商品的价格x 与销售量Y 之间的关系;施用氮肥、磷肥、钾肥数量1x ,2x ,3x 与某种农作物产量Y 之间的关系。
在生产实践和科学研究中,常常有这样的问题:由实验或测量得到变量间的一批离散样点,要求由此建立变量之间的近似函数关系或得到样点之外的数据。
我们确定的函数要求在某种距离意义下的误差达到最小(通常用最小二乘法,即考虑使各数据点误差平方和最小)。
由一个(或几个)普通变量来估计或预测某个随机变量的取值时,所建立的数学模型及所进行的统计分析称为回归分析。
§11.1 一元线性回归假设有一批关于x 与Y 的离散样点),(,),,(),,(2211n n y x y x y x集中在一条直线附近,说明x 与Y 之间呈线性相关关系,即),0(~,2σεεN bx a Y ++=称为一元线性回归模型。
一、模型中的参数估计 1、b a ,的估计 首先引进记号∑∑∑∑∑=====-=-=-===ni i i xy ni i yy ni i xx ni ini iyx n y x S y n y S x n x S y n y x n x 11221221111按最小二乘法可得到xxxyS S b =ˆ x b y a ˆˆ-= 称x b a yˆˆˆ+=为Y 关于x 的一元线性回归方程。
2、2σ的估计)ˆ(21ˆ22xx yy S b S n --=σ求出关于的一元线性回归方程。
解:先画出散点图如下计算出 3985193282503.6714510======xy yy xx S S S y x n483.0ˆ==xxxyS S b 735.2ˆˆ-=-=x b y a所求的回归方程是x y483.0735.2ˆ+-=。
应用回归分析第四版答案【篇一:应用回归分析人大版前四章课后习题答案详解】应用回归分析(1-4章习题详解)(21世纪统计学系列教材,第二(三)版,何晓群,刘文卿编著中国人民大学出版社)目录1 回归分析概述 ....................................................................................................... (6)1.1 变量间统计关系和函数关系的区别是什么? (6)1.2 回归分析与相关分析的区别与联系是什么? (7)1.3回归模型中随机误差项?的意义是什么? (7)1.4线性回归模型的基本假设是什么? (7)1.5 回归模型的设置理论根据是什么?在回归变量设置中应该注意哪些问题? (8)1.6收集,整理数据包括哪些内容? (8)1.7构造回归理论模型的基本根据是什么? (9)1.8为什么要对回归模型进行检验? (9)1.9回归模型有哪几个方面的应用? (10)1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合? (10)2 一元线性回归 ....................................................................................................... . (10)2.1一元线性回归模型有哪些基本假定? (10)2.2考虑过原点的线性回归模型足基本假定,求ny??*x??i1ii,i?1,2,...n 误差?1,?2,...?n仍满?1的最小二乘估计。
.............................................................................. 11 n2.3证明?e?o,?xe?0. .................................................................................. . (11)i?1ii?1ii2.4回归方程e(y)????x的参数?,?o101的最小二乘估计与最大似然估计在什么条件下等价?给出理由? (12)2.5证明??0是??0的无偏估计。
《应用数理统计》吴翊李永乐第四章-回归分析课后作业参考答案————————————————————————————————作者:————————————————————————————————日期:第四章 回归分析课后作业参考答案4.1 炼铝厂测得铝的硬度x 与抗张强度y 的数据如下:i x68 53 70 84 60 72 51 83 70 64 i y288 298 349 343 290 354 283 324 340 286(1)求y 对x 的回归方程(2)检验回归方程的显著性(05.0=α) (3)求y 在x =65处的预测区间(置信度为0.95) 解:(1) 1、计算结果一元线性回归模型εββ++=x y 10只有一个解释变量其中:x 为解释变量,y 为被解释变量,10,ββ为待估参数,ε位随机干扰项。
()()()()685.222,959.4116,541.35555.76725.19745.109610,5.3151,5.671221212112121211=-==-====-=-==-=--==-=-======∑∑∑∑∑∑∑∑========n Q U L Q L L U y n yyy L y x n y x y y x x L x n xxx L n y n y x n x ee yy e xxxyni ini i yy ni i i n i i i xy ni ini i xx ni i n i i σ使用普通最小二乘法估计参数10,ββ上述参数估计可写为95.193ˆˆ,80.1ˆ101=-===x y L L xxxy βββ 所求得的回归方程为:x y80.195.193ˆ+= 实际意义为:当铝的硬度每增加一个单位,抗张强度增加1.80个单位。
2、软件运行结果 根据所给数据画散点图9080706050xi360340320300280y i由散点图不能够确定y 与x 之间是否存在线性关系,先建立线性回归方程然后看其是否能通过检验线性回归分析的系数模型 非标准化系数标准化系数T 值 P 值95% 系数的置信区间β值 学生残差 β值下限上限 1 常数项 193.951 46.796 4.145 0.003 86.039 301.862x1.8010.6850.6812.629 0.030 0.2213.381由线性回归分析系数表得回归方程为:x y801.1951.193ˆ+=,说明x 每增加一个单位,y 相应提高1.801。
10.1
一、简单情况
粮食产量的回归模型为:
的影响,在一个中等收入的样本框中,随机调查了13
建立
这个结果表明,中等收入的家庭每增加1万元收入,平
二、复杂情况
某些场合定性自变量可能取多类值,例如某商厦策划营销
x
+x 1
一、分段回归
例
化,即批量大于500时成本明显下降。
我们考虑由两段构成
引入两个新的自变量
图10.2
§
线回归拟合,这一点还需要做统计的显著性检验,这只需
二、回归系数相等的检验例10.3
回归模型(
庭的两个线性回归模型,分别为:
(10.8)
输出结果
另外,表
没有通过显著性检验,并且比β
个可能结果,这样的因变量也可用虚拟变量来表示,虚拟变量的取值可取
由于y
二、定性因变量回归的特殊问题
1.
2.
3.
布,所以因变量均值受到如下限制:
一、分组数据的
针对
限制在
所有连续型随机变量的分布函数都符合要求,我们
=
p P
(
接作为回归模型中的因变量。
例
序号
Logistic
计算出经验回归方程为
性变量的回归模型,但是仍然存在一个不足之处,就是
用加权最小二乘法得到的
二、未分组数据的
设y是0-1型变量,x
于是y
0-1型分布,概率函数为:
对数似然
函数
例10.5 查项目是
序号1 2
以下是
Variable B S.E. Wald df Sig R Exp(B)。
第4章违背基本假设的情况思考与练习参考答案4.1 试举例说明产生异方差的原因。
答:例4.1:截面资料下研究居民家庭的储蓄行为Y i=β0+β1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。
由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。
例4.2:以某一行业的企业为样本建立企业生产函数模型Y i=A iβ1K iβ2L iβ3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
4.2 异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。
其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。
在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。
然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。
由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。
所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。
第四章 回归分析课后作业参考答案4.1 炼铝厂测得铝的硬度x 与抗张强度y 的数据如下:i x68 53 70 84 60 72 51 83 70 64 i y288 298 349 343 290 354 283 324 340 286(1)求y 对x 的回归方程(2)检验回归方程的显著性(05.0=α) (3)求y 在x =65处的预测区间(置信度为0.95) 解:(1) 1、计算结果一元线性回归模型εββ++=x y 10只有一个解释变量其中:x 为解释变量,y 为被解释变量,10,ββ为待估参数,ε位随机干扰项。
()()()()685.222,959.4116,541.35555.76725.19745.109610,5.3151,5.671221212112121211=-==-====-=-==-=--==-=-======∑∑∑∑∑∑∑∑========n Q U L Q L L U y n yyy L y x n y x y y x x L x n xxx L n y n y x n x ee yy e xxxyni ini i yy ni i i n i i i xy ni ini i xx ni i n i i σ使用普通最小二乘法估计参数10,ββ上述参数估计可写为95.193ˆˆ,80.1ˆ101=-===x y L L xxxy βββ 所求得的回归方程为:x y80.195.193ˆ+= 实际意义为:当铝的硬度每增加一个单位,抗张强度增加1.80个单位。
2、软件运行结果 根据所给数据画散点图过检验由线性回归分析系数表得回归方程为:x y801.1951.193ˆ+=,说明x 每增加一个单位,y 相应提高1.801。
(2) 1、计算结果①回归方程的显著性检验(F 检验):0H 线性回归效果不显著 :1H 线性回归效果显著()91.62/=-=n Q UF e在给定显著性水平05.0=α时,()()F F n F <==--32.58,12,195.01α,所以拒绝0H ,认为方程的线性回归效果显著 ②回归系数的显著性检验(t 检验)0:10=βH 0:11≠βH()628.22/ˆ1=-=n Q L t e xx β在给定显著性水平05.0=α时,()()t t n t<==--306.282975.021α,所以拒绝0H ,认为回归系数显著,说明铝的硬度对抗张强度有显著的影响。