高中数学复习课(一)统计案例教学案新人教A选修1-2
- 格式:doc
- 大小:374.00 KB
- 文档页数:13
复习课(一) 统计案例
回归分析
(1)变量间的相关关系是高考解答题命题的一个,主要考查变量间相关关系的判断,求解回归方程并进行预报估计,题型多为解答题,有时也有小题出现.
(2)掌握回归分析的步骤的是解答此类问题的关键,另外要掌握将两种非线性回归模型转化为线性回归分析求解问题.
[考点精要]
1.一个重要方程
对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归直线方程为y ^=b ^x +a ^.
其中b ^=
∑i =1
n
x i -x
y i -y
∑i =1
n
x i -x
2
,a ^=y -b ^
x .
2.重要参数
相关指数R 2
是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好.
3.两种重要图形 (1)散点图:
散点图是进行线性回归分析的主要手段,其作用如下:
一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系;
二是判断样本中是否存在异常. (2)残差图:
残差图可以用来判断模型的拟合效果,其作用如下:
一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高.
二是确认样本点在采集中是否有人为的错误.
[典例] (全国卷Ⅲ)如图是我国2008年到2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:∑i =1
7
y i =9.32,∑i =1
7
t i y i =40.17,
∑i =1
7
y i -y
2
=0.55,7≈2.646.
参考公式:相关系数r =
∑i =1
n
t i -t
y i -y
∑i =1
n
t i -t
2
∑i =1
n y i -y
2
,
回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^
=
∑i =1
n
t i -t
y i -y
∑i =1
n
t i -t
2
,a ^=y -b ^
t .
[解] (1)由折线图中数据和附注中参考数据得
t =4,∑i =1
7
(t i -t )2
=28,
∑i =1
7
y i -y
2
=0.55,
∑i =1
7 (t i -t )(y i -y )=∑i =1
7
t i y i -t ∑i =1
7
y i =40.17-4×9.32=2.89,
r ≈
2.89
2×2.646×0.55
≈0.99.
因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.
(2)由y =9.32
7
≈1.331及(1)得
b ^
=
∑i =1
7
t i -t
y i -y
∑i =1
7
t i -t
2
=2.8928
≈0.103, a ^
=y -b ^
t ≈1.331-0.103×4≈0.92.
所以y 关于t 的回归方程为y ^
=0.92+0.10t . 将2016年对应的t =9代入回归方程得 y ^
=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨. [类题通法]
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤是先画出散点图,并对样本点进行相关性检验,在此基础上选择适合的函数模型去拟合样本数据,从而建立较好的回归方程,并且用该方程对变量值进行分析;有时回归模型可能会有多种选择(如非线性回归模型),此时可通过残差分析或利用相关指数R 2
来检查模型的拟合效果,从而得到最佳模型.
[题组训练]
1.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( )
A .r 2 B .0 C .r 2<0 D .r 2=r 1 解析:选C 画散点图,由散点图可知X 与Y 是正相关,则相关系数r 1>0,U 与V 是负相关,相关系数r 2<0,故选C . 2.寒假中, 某同学为组织一次爱心捐款, 在网上给网友发了张帖子, 并号召网友转发,下表是发帖后一段时间收到帖子的人数统计: 天数x 1 2 3 4 5 6 7 人数y 7 11 21 24 66 115 325 (1)作出散点图,并猜测x 与y 之间的关系. (2)建立x 与y 的关系, 预报回归模型. (3)如果此人打算在帖子传播10天时进行募捐活动, 根据上述回归模型, 估计可去多少人.