rXY
特点:样本相关系数是根据从总体中抽取的随机样 本的观测值计算出来的,是对总体相关系数的估计,它 是个随机变量。
相关系数的特点:
相关系数的取值在-1与1之间。 当r=0时,表明X与Y没有线性相关关系。 当 时,表明X与Y存在一定的线性相关关 系; 若 表明X与Y 为正相关; 若 表明X与Y 为负相关。 当 时,表明X与Y完全线性相关; 若r=1,称X与Y完全正相关; 若r=-1,称X与Y完全负相关。
三、回归系数的估计
u是随机变量其分布性质不确定,必须作某些 假定,其估计才有良好性质,其检验才可进行。 估计的原则是使参数估计值“尽可能地接近” 总体参数真实值。
简单线性回归的基本假定
假定1:零均值假定。 假定2:同方差假定。 假定3:无自相关假定。
假定4:随机扰动
假定5:正态性假定
相关系数的检验方法
给定显著性水平 , 查自由度为 n-2 的临界值 若 ,表明相关系数 r 在统计上是显著 的,应否定 而接受 的假设; 反之,若 ,应接受 的假设。
二、总体回归函数与样本回归函数
1、若干基本概念
● Y的条件分布: Y在X取某固定值条件下的分布。 ●对于X的每一个取值,都有Y的条件期望与之对应,在 坐标图上 Y的条件期望的点随X而变化的轨迹所形成的 直线或曲线,称为回归线。 ●如果把Y的条件期望 表示为X的某种函 数: , 这个函数称为回归函数。 ●如果其函数形式是只有一个自变量的线性函数, 如 , 称为简单线性回归函数。
0
10 X
20
30
二、相关关系的类型
● 从涉及的变量数量看 简单相关 多重相关(复相关) ● 从变量相关关系的表现形式看 线性相关——散布图接近一条直线(左图) 非线性相关——散布图接近一条曲线(右图)