统计学课件 (11)第11章 一元线性回归
- 格式:ppt
- 大小:5.12 MB
- 文档页数:101
第十一章 回 归 分 析本章以一元线性回归模型为重点介绍回归分析方法,对于一元线性回归模型所建立的理论与方法作适当的修改便可推广到多元线性回归模型。
§1 回归的概念一、变量之间的关系现实中,各种变量相互依赖、相互影响,存在着某种关系。
如:价格与需求量、利率与投资、收入与消费,等等。
大致可以归纳为两类关系:确定性关系(函数关系),非确定性关系(统计关系)。
1. 确定性关系:变量之间存在着某种完全确定的关系。
如:总收益Y 与产量X 之间的关系:X P Y ⋅=当价格一定时,Y 由X 完全确定。
表现在图形上,()Y X ,的所有点位于一条直线上。
一般地:()n X X X f Y ,,21= (多元函数)2. 非确定性关系:变量之间由于受到某些随机因素的影响而呈现出一种不确定的关系。
如:农业产量主要受到降雨量、施肥量、温度等的影响,但决定产量的并非完全是这些因素,还要受到许多其它因素的影响,如冰雹、蝗灾等自然灾害。
非确定性关系可以分为两大类:1) 相关关系:两个变量处于完全对等的位置,且两个变量皆为随机变量,常用相关系数来度量。
如:计量经济学成绩与统计学成绩,物价水平和股票价格,等等。
2) 回归关系:一个变量的变化是另一个变量变化的原因,而不是相反。
如:消费量Y 与可支配收入X 之间便是一种回归关系。
一般来讲,随着可支配收入的增加,消费增加,可支配收入是影响消费的主要因素,但并非唯一的因XYPX Y =素,影响消费的因素还有消费习惯、地区差异、年龄构成、宗教信仰等等。
同样收入的家庭,有的支出多,有的支出少,即使是同一家庭,其每个月的收入相同的话,各个月的支出也不会完全一样。
这样,对应于一个X 的值,Y 有多个不同的值相对应,X 与Y 呈现出不确定性的关系。
此时:()u X f Y += (u 为随机影响)表现在图形上,()Y X ,的点不是完全处于一条直线(或曲线)上,而是围绕在一条理论线的两旁变化。
第11章一元线性回归(相关与回归)学习指导一、本章基本知识梳理基本知识点含义或公式相关关系 客观现象之间确实存在的、但在数量表现上不是严格对应的依存关系。
函数关系 客观现象之间确实存在的、而且数量表现上是严格对应的依存关系。
因果关系有相关关系的现象中能够明确其中一种现象(变量)是引起另一种现象(变量)变化的原因,另一种现象是这种现象变化的结果。
起影响作用的现象(变量)称为“自变量”;而受自变量影响发生变动的现象(变量)称为“因变量”。
因果关系∊相关关系,但相关关系中还包括互为因果关系的情况。
相关关系的种类 按涉及变量多少分为单相关、复相关;按相关方向分为正相关、负相关;按相关形态分为线性相关、非线性相关等。
线性(直线) 相关系数 简称相关系数,反映具有直线相关关系的两个变量关系的密切程度。
()()∑∑∑∑∑∑∑---==2222y yn x xn yx xy n SS S r yx xy相关系数的 显著性检验 ——t 检验 ()().2;,212:0:,0:020221Hn t t Hn t t rn r t HH,拒绝不能拒绝检验统计量-〉-〈--=≠=ααρρ回归方程中的 参数β0和β1为回归直线的截距、起始值,表示在没有自变量x 的影响(即x =0)时,其他各种因素对因变量y 的平均影响;β1为回归系数、斜率,表示自变量x 每变动一个单位,因变量y 的平均变动量。
β1的最小平方估计:∑∑∑∑∑⎪⎭⎫ ⎝⎛--=221x x n yx xy nβ估计标准误差反映因变量实际值与其估计值之间的平均差异程度,表明其估计值对实际值的代表性强弱。
其值越大,实际值与估计值之间的平均差异程度越大,估计值的代表性越差。
()代替。
用大样本条件下,分母可;n n yyS e 2ˆ2--=∑总离差平方和S S T反映因变量的n 个观察值与其均值的总离差。
回归离差平方和S S R 反映自变量x 的变化对因变量y 取值变化的影响;或者说,是由于x 与y 之间的线性关系引起的y 取值的变化,也称为可解释的平方和。