相关关系的两个变量, 且相应于n组观测值的n个点(xi,yi)(i=1,2,…, n)大致分布在一条直线附近,求在整体上与这n个最 接近的一条直线.设此直线方程为y^=bx+a. (*)这里在 y的上方加记号“^”,是为了区分实际值y,表示当x取 值xi(i=1,2,…n)时,y相应的观察值为yi,而直 线上对应于xi的纵坐标是yi^=bxi+a. (*)式叫做y对x的 回归直线方程,a、b叫做回归系数.
2.3.1变量间的相关关系
讲授新课 一:变量之间的相关关系
1.两变量之间的关系 (1)函数关系: 当自变量取值一定时,因变量取值由它唯一确定
正方形面积S与其边长x之间的函数关系S=x2 ,
对自变量边长的每一个确定值,都有唯一确定的面
积的值与之对应。
确定关系
(2)相关关系:
当自变量取值一定时,因变量的取值带有一定
问题归结为:a,b取什么值时Q最小,即总体和最小.下面是 计算回归方程的斜率和截距的一般公式.
根据最小二乘法和上述公式可以求回归方程.
4、最小二乘法的步骤:
(1)收集样本数据,(xi,yi).
(2)作散点图,确定x、y具有线性相关关系. ( 3 ) 设 回 归 直 线 方 程 y ˆ = b x + a , 令 x = x ( ii= 1 , 2 , , n ) 得 到 y ˆi = b x i+ a ( i= 1 , 2 , n )
水稻产量y 330 345 365 405 445 450 455
y 水稻产量
500
450
400
350
300 10 20
30
40
(施化肥量)
50
x
3、最小二乘法
假设我们已经得到两个具有线性相关的变量的一组数 据(x1,y1),(x2,y2),…(xn,yn).