应用回归分析3-11运行结果
- 格式:doc
- 大小:22.50 KB
- 文档页数:2
回归分析结果解释1 / 1下边的回归剖析结果,红色字体表示解说文字SUMMARY OUTPUT回归统计Multiple R有关系数判断系数。
表示因变量的总改动中, 有 72.63% R Square是因为自变量的改动惹起的 ; 或许说 , 该回归模型能够解说因变量总改动的 72.63% R 用 Adjusted R修正判断系数 . 防止增添自变量而高估 2. Square 于多元回归模型拟合优度的比较 标准偏差 表示观察值与预计值的均匀离差 观察值10 观察值的个数方差剖析部分用来对回归方程做明显性查验,看自变量整体和因变量有无明显的线性关系。
查验方法是:若P< , 则因变量与自变量之间存在线性关系;不然不存在线性关系方差剖析自由度平方和均方F 查验中统F 值对应的 P 值计量取值dfSS MSFSignificanceF回归剖析 1残差 8总计9该部分结果主要用来获得回归方程的参数以及进行回归系数的明显性查验 。
查验方法是: 若P< , 则因变量与该自变量之间存在线性关系;不然不存在线性关系。
系数t 查验中统t 值对应的 P 值计量取值Coefficients 标准偏差t StatP-valueLower 95%Intercept航班正点率 /%回归方程截距的取值。
即 a的取值。
表示自变量为 0 时因变量的均值回归系数查验所用的p 值回归系数的取值。
即 b 的取值。
表示当 x 每改动一 个单位时, y 的均匀改动值。
《应用回归分析》第三版数据文件(总24页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--《应用回归分析》(第三版)数据下载第2章例题表火灾损失表例题.第51页表第54页表表表第3章表例题表北京开发区数据52518782534271221207428例题表年份y x1x2x3x4x519782313010188881491197929833502195863891980343368825319220419814013941279995300198244542583054999221983391473633581060441984554565239051103531985744702048791121101986997785955521085791987131093136386112429198814421173880381226451989128313176900511380719901660143849663957121991217816557109699508119922886202231298599693199333832488215949105458第85页表序号降低成本率y(%)流动资金x1(万元)固定资金x2(万元)优良品率x3(%)竣工面积x4(万m2)劳动生产率x5(元/人)施工产值x6(万元)16761 27133 36946 44968 56810 66416 76911 87124 96540第88页表编号货运总量y(万吨)工业总产值x1(亿元)农业总产值x2(亿元)居民非商品支出x3(亿元)11607035 22607540 32106540 42657442 52407238 62206845 72757842 81606636 92757044 102506542表国内生产总值GDP和三次产业数据单位:亿元资料来源:2005年《中国统计年鉴》,未经2005年经济普查修订。
《应用回归分析》部分课后习题答案第一章回归分析概述1.1 变量间统计关系和函数关系的区别是什么?答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么?答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。
区别有 a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。
在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。
b.相关分析中所涉及的变量y与变量x全是随机变量。
而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。
C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。
而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么?答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么?答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。
2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^23.正态分布的假定条件为相互独立。
4.样本容量的个数要多于解释变量的个数,即n>p.1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题?答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。
应⽤回归分析-第7章课后习题参考答案第7章岭回归思考与练习参考答案7.1 岭回归估计是在什么情况下提出的?答:当⾃变量间存在复共线性时,|X’X |≈0,回归系数估计的⽅差就很⼤,估计值就很不稳定,为解决多重共线性,并使回归得到合理的结果,70年代提出了岭回归(Ridge Regression,简记为RR)。
7.2岭回归的定义及统计思想是什么?答:岭回归法就是以引⼊偏误为代价减⼩参数估计量的⽅差的⼀种回归⽅法,其统计思想是对于(X ’X )-1为奇异时,给X’X 加上⼀个正常数矩阵D, 那么X’X+D接近奇异的程度就会⽐X ′X 接近奇异的程度⼩得多,从⽽完成回归。
但是这样的回归必定丢失了信息,不满⾜blue 。
但这样的代价有时是值得的,因为这样可以获得与专业知识相⼀致的结果。
7.3 选择岭参数k 有哪⼏种⽅法?答:最优k 是依赖于未知参数β和2σ的,⼏种常见的选择⽅法是:○1岭迹法:选择0k 的点能使各岭估计基本稳定,岭估计符号合理,回归系数没有不合乎经济意义的绝对值,且残差平⽅和增⼤不太多;○2⽅差扩⼤因⼦法:11()()()c k X X kI X X X X kI --'''=++,其对⾓线元()jj c k 是岭估计的⽅差扩⼤因⼦。
要让()10jj c k ≤;○3残差平⽅和:满⾜()SSE k cSSE <成⽴的最⼤的k 值。
7.4 ⽤岭回归⽅法选择⾃变量应遵循哪些基本原则?答:岭回归选择变量通常的原则是:1. 在岭回归的计算中,我们通常假定涉及矩阵已经中⼼化和标准化了,这样可以直接⽐较标准化岭回归系数的⼤⼩。
我们可以剔除掉标准化岭回归系数⽐较稳定且绝对值很⼩的⾃变量;2. 当k 值较⼩时,标准化岭回归系数的绝对值并不很⼩,但是不稳定,随着k的增加迅速趋近于零。
像这样岭回归系数不稳定、震动趋于零的⾃变量,我们也可以予以剔除;3.去掉标准化岭回归系数很不稳定的⾃变量。
实验六应用回归分析应用回归分析实验报告六学生姓名李梦学号 xx1315046 院系数学与统计学院专业统计学课程名称应用回归分析任课教师尚林二O一三三年六月十二日日1.Logistic 函数常用于拟合某种消费品的拥有率,表 8.17 是北京市每百户家庭平均拥有的照相机数,试针对以下两种情况拟合Logistic 回归函数。
tb buy1 011?? (1)已知,用线性化方法拟合(2)u ,用非线性最小二乘法拟合。
从经济学的意义知道,u 是拥有率的上限,初值可取为 100;b0>0,0<b1<1,初值请读者自己选择。
表 8.17 年份 t y 年份 t y 1978 1 7.5 1988 11 59.6 1979 2 9.8 19 ___ 12 62.2 1980 3 11.4 1990 13 66.5 1981 4 13.3 1991 14 72.7 1982 5 17.2 1992 15 77.2 1983 6 20.6 1993 16 82.4 1984 7 29.1 1994 17 85.4 1985 8 34.6 1995 18 86.8 1986 9 47.4 1996 19 87.2 1987 10 55.5 :解:(1)u=100 时的线性拟合,对tb buy1 011?? 函数线性化得到:1 0ln ln )1 1ln( b t bu y? ? ? 作 y1 关于 t 的线性回归分析 R 2 =0.988 趋于 1,进一步计算得到:768 . 0 , 157 . 01 0? ? b b ,ty768 . 0 * 157 . 010011^??由图可知回归效果比较令人满意。
(2)u ,用非线性最小二乘法拟合。
从经济学的意义知道,u 是拥有率的上限,初值可取为 100;b0>0,0<b1<1,初值请读者自己选择。
R 2 =0.995>0.988,得到回归效果比线性拟合要好,u=91.062,b0=0.211,b1=0.727 回归方程:ty727 . 0 * 211 .0062 . 9111?? 2 .某省 ___ 1990 年 9 月在全省范围内进行了一次公众安全感问卷调查, ___【10】选取了调查表中的一个问题进行分析。
资料范本本资料为word版本,可以直接编辑和打印,感谢您的下载应用回归分析(第三版)何晓群刘文卿课后习题答案完整版地点:__________________时间:__________________说明:本资料适用于约定双方经过谈判,协商而共同承认,共同遵守的责任与义务,仅供参考,文档可直接下载或修改,不需要的部分可直接删除,使用时请详细阅读内容第二章一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答:假设1、解释变量X是确定性变量,Y是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性:E(εi)=0 i=1,2, …,nVar (εi)=s2 i=1,2, …,nCov(εi, εj)=0 i≠j i,j= 1,2, …,n假设3、随机误差项ε与解释变量X之间不相关:Cov(Xi, εi)=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0, s2 ) i=1,2, …,n2.2 考虑过原点的线性回归模型Yi=β1Xi+εi i=1,2, …,n误差εi(i=1,2, …,n)仍满足基本假定。
求β1的最小二乘估计解:得:2.3 证明(2.27式),Sei =0 ,SeiXi=0 。
证明:其中:即: Sei =0 ,SeiXi=02.4回归方程E(Y)=β0+β1X的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。
答:由于εi~N(0, s2 ) i=1,2, …,n所以Yi=β0 + β1Xi + εi~N(β0+β1Xi , s2 )最大似然函数:使得Ln(L)最大的,就是β0,β1的最大似然估计值。
同时发现使得Ln(L)最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。
值得注意的是:最大似然估计是在εi~N(0, s2 )的假设下求得,最小二乘估计则不要求分布假设。
所以在εi~N(0, s2 ) 的条件下,参数β0,β1的最小二乘估计与最大似然估计等价。
应用回归分析课后答案第二章一元线性回归2.14 解答:EXCEL结果:SUMMARY OUTPUT回归统计Multiple R0.944911R Square0.892857Adjusted R Square0.857143标准误差0.597614观测值5方差分析df SS MS F Significance F回归分析18.9285718.928571250.015392残差3 1.0714290.357143总计410Coefficients标准误差t Stat P-value Lower 95%Upper 95%下限95.0%上限95.0% Intercept-0.214290.6962-0.307790.778371-2.4299 2.001332-2.4299 2.001332 X Variable 10.1785710.03571450.0153920.0649130.292230.0649130.29223RESIDUAL OUTPUT观测值预测Y残差1 1.571429-0.571432 1.5714290.4285713 3.357143-0.357144 3.3571430.6428575 5.142857-0.14286SPSS结果:(1)散点图为:(2)x 与y 之间大致呈线性关系。
(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑ 2n 01i=11(())n-2i y x ββ∧∧=-+∑=2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1169049363110/3=++++=6.1σ∧=≈ (5)由于211(,)xxN Lσββ∧t σ∧==服从自由度为n-2的t 分布。
第3章多元线性回归思考与练习参考答案3.1见教材P64-65 3.2讨论样本容量n 与自变量个数P 的关系,它们对模型的参数估计 有何影响?答:在多元线性回归模型中,样本容量 n 与自变量个数P 的关系是: n>>P 。
如果n<=p 对模型的参数估计会带来很严重的影响。
因为: 1.在多元线性回归模型中,有P+1个待估参数P,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。
2.解释变量X 是确定性变量,要求rank(X) p 1 n ,表明设计矩阵X 中的自变量列之间不相关,即矩阵X 是一个满秩矩阵。
若ran k(X) p 1,则解释变量之间线性相关,(XX)1是奇异阵,则的估计不稳定。
证明:我们能断定这个回归方程就很理想吗?2答:不能。
复相关系数 R 与样本决定系R 数都是用来表示回归方程对原始数据拟合程度的好坏。
样本决定系数取值在【0,1】区间内,22一般来说,R 越接近1,即R 取值越大,说明回归拟合的效果越好。
23.3证明?2SSE/ n p 1随机误差项£的方差2的无偏估计。
21 1 Q 于 ----------- SSE ---------- n P 1 n P 1nn n2 2E( e ) D(e) (1i 1i 1 i 1 dnE( ?2) —1—E( e 2)(ee)nh ii ) J p 1 i 1n2 2(1 h ii ) (nnh ii )i 12(n P 1)3.4 一个回归方程的复相关系数R=0.99,样本决定系数2R但由于R 的大小与样本容量n 和自变量个数p 有关,当n 与p 的值22接近时, R 容易接近1,说明R 中隐含着一些虚假成分。
而当样本2容量n较小,自变量个数P较大时,尽管R很大,但参数估计效果2很不稳定。
所以该题中不能仅仅因为R 很大而断定回归方程很理想。
3.5 如何正确理解回归方程显著性检验拒绝H0,接受H0?答:一般来说,当接受假设H o时,认为在给定的显著性水平a之下, 自变量X1, X2,…,X p对因变量y无显著性影响,贝y通过X1, X2,…,X p去推断y 就无多大意义。