当前位置:文档之家 > 【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

回归分析的基本思想及其初步应用

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

预习课本P2~8,思考并完成以下问题 1.什么是回归分析?

2.什么是线性回归模型?

3.求线性回归方程的步骤是什么?

[新知初探]

1.回归分析 (1)回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)回归方程的相关计算

对于两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).设其回归直线方程为y ^=b ^x +a ^,其中a ^,b ^

是待定参数,由最小二乘法得

b ^=

i =1

n (x i -x )(y i -y )

i =1

n (x i -x )

2

∑i =1n

x i y i -nxy

∑i =1

n

x 2i -n x

2

a ^=y -

b ^

x . (3)线性回归模型

线性回归模型?

????

y =bx +a +e ,

E (e )=0,D (e )=σ2,其中a ,b 为模型的未知参数,通常e 为随机变量,称为随机误差.x 称为解释变量,y 称为预报变量.

[点睛] 对线性回归模型的三点说明

(1)非确定性关系:线性回归模型y =bx +a +e 与确定性函数y =a +bx 相比,它表示y 与x 之间是统计相关关系(非确定性关系),其中的随机误差e 提供了选择模型的准则以及在

模型合理的情况下探求最佳估计值a ,b 的工具.

(2)线性回归方程y ^=b ^x +a ^中a ^,b ^的意义是:以a ^

为基数,x 每增加1个单位,y 相应地平均增加b ^

个单位.

2.线性回归分析

(1)残差:对于样本点(x i ,y i )(i =1,2,…,n )的随机误差的估计值e ^i =y i -y ^

i 称为相应于点(x i ,y i )的残差,i =1

n (y i -y ^

i )2称为残差平方和.

(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.

(3)R 2=1-

i =1

n (y i -y ^

i )2

i =1

n (y i -y )2

越接近1,表示回归的效果越好. [小试身手]

1.判断下列命题是否正确.(正确的打“√”,错误的打“×”) (1)残差平方和越小,线性回归方程的拟合效果越好.( )

(2)在画两个变量的散点图时,预报变量在x 轴上,解释变量在y 轴上.( ) (3)R 2越小,线性回归方程的拟合效果越好.( ) 答案:(1)√ (2)× (3)×

2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________.

答案:正相关

3.在残差分析中,残差图的纵坐标为________. 答案:残差

4.如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于________,解释变量和预报变量之间的相关系数等于________.

答案:0 1或-1

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

[典例] 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(1)

(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^

; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. [解] (1)散点图如图:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(2)∑i =1n

x i y i =6×2+8×3+10×5+12×6=158,

x =

6+8+10+124=9,y =2+3+5+6

4

=4,

∑i =1

n

x 2i =62+82+102+122

=344.

b ^=158-4×9×4344-4×92=1420=0.7,a ^=y -b ^x =4-0.7×9=-2.3, 故线性回归方程为y ^

=0.7x -2.3.

(3)由(2)中线性回归方程知,当x =9时,y ^

=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

求线性回归方程的三个步骤

(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系. (2)求回归系数:若存在线性相关关系,则求回归系数.

(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明. [活学活用]

某工厂1~8月份某种产品的产量与成本的统计数据见下表:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(1)画出散点图;

(2)y 与x 是否具有线性相关关系?若有,求出其回归方程. 解:(1)由表画出散点图,如图所示.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x 和y 线性相关关系显著,下面求其回归方程,首先列出下表.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

计算得x =6.85,y =157.25.

∴b ^

∑i =18

x i y i -8xy

∑i =1

8

x 2i -8x

2

8 764.5-8×6.85×157.25

382.02-8×6.852

≈22.17,

a ^=y -

b ^

x =157.25-22.17×6.85≈5.39, 故线性回归方程为y ^

=22.17x +5.39.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

1.在一段时间内,某种商品的价格x 元和需求量y 件之间的一组数据为:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

求出y 对x

解:x =1

5(14+16+18+20+22)=18,

y =1

5

(12+10+7+5+3)=7.4.

∑i =1

5

x 2i =142+162+182+202+222

=1 660, ∑i =1

5

x i y i =14×12+16×10+18×7+20×5+22×3=620,

可得回归系数b ^=

∑i =15

x i y i -5xy

∑i =1

5

x 2i -5x

2

620-5×18×7.4

1 660-5×182

=-1.15.

所以a ^

=7.4+1.15×18=28.1

所以回归直线方程:y ^

=-1.15x +28.1. 列出残差表:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

则i =1

5(y i -y ^

i )2=0.3,i =1

5(y i -y )2=53.2.

R 2=1-

i =1

5(y i -y ^

i )2

i =1

5(y i -y )

2

≈0.994.

所以回归模型的拟合效果很好. 题点二:非线性回归分析

2.为了研究某种细菌随时间x 变化繁殖个数y 的变化,收集数据如下

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(1) (2)求y 与x 之间的回归方程. 解:(1)散点图如图所示:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(2)由散点图看出样本点分布在一条指数函数y1=c1e c2x的周围,于是令z=ln y,则

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

由计算器算得,z=0.69x+1.112,则有y=e0.69x+1.112.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(1)当两个变量已明显呈线性相关关系时,则无需作散点图,就可直接求回归直线方程,否则要先判定相关性再求回归方程.判断拟合效果的好坏需要利用R2确定,R2越接近1,说明拟合效果越好.

(2)非线性回归方程的求法

①根据原始数据(x,y)作出散点图;

②根据散点图,选择恰当的拟合函数;

③作恰当的变换,将其转化成线性函数,求线性回归方程;

④在③的基础上通过相应的变换,即可得非线性回归方程.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

层级一学业水平达标

1.在对两个变量x,y进行线性回归分析时,有下列步骤:

①对所求出的回归直线方程作出解释;

②收集数据(x i,y i),i=1,2,…,n;

③求线性回归方程;

④求相关系数;

⑤根据所搜集的数据绘制散点图.

如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是()

A.①②⑤③④B.③②④⑤①

C.②④③①⑤D.②⑤④③①

解析:选D对两个变量进行回归分析时,首先收集数据(x i,y i),i=1,2,…,n;根

据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①,故选D .

2.有下列说法:

①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②R 2来刻画回归的效果,R 2值越大,说明模型的拟合效果越好;

③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.

其中正确命题的个数是( ) A .0 B .1 C .2

D .3

解析:选D ①选用的模型是否合适与残差点的分布有关;对于②③,R 2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好.

3.下图是根据变量x ,y 的观测数据(x i ,y i )(i =1,2,…,10)得到的散点图,由这些散点图可以判断变量x ,y 具有相关关系的图是( )

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

A .①②

B .①④

C .②③

D .③④

解析:选D 根据散点图中点的分布情况,可判断③④中的变量x ,y 具有相关的关系. 4.(重庆高考)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )

A .y ^=0.4x +2.3

B .y ^

=2x -2.4 C .y ^=-2x +9.5 D .y ^

=-0.3x +4.4

解析:选A 依题意知,相应的回归直线的斜率应为正,排除C ,D .且直线必过点(3,3.5)代入A ,B 得A 正确.

5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )

A .11.4万元

B .11.8万元

C .12.0万元

D .12.2万元

解析:选B 由题意知,x =8.2+8.6+10.0+11.3+11.9

5

=10,

y =

6.2+

7.5+

8.0+8.5+

9.8

5

=8,

∴a ^

=8-0.76×10=0.4,

∴当x =15时,y ^

=0.76×15+0.4=11.8(万元). 6.以下是某地区的降雨量与年平均气温的一组数据:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

或“不具有”)

解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

答案:不具有

7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1

2x +1上,则这组样本数据

的样本相关系数为________.

解析:根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1. 答案:1

8.下列说法正确的命题是________(填序号). ①回归直线过样本点的中心(x ,y );

②线性回归方程对应的直线y ^=b ^x +a ^

至少经过其样本数据点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;

③在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高; ④在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好. 解析:由回归分析的概念知①④正确,②③错误. 答案:①④

9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;

(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)

解:(1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =1

6(90+84+83+80+75+

68)=80,

从而a ^

=y +20x =80+20×8.5=250, 故y ^

=-20x +250. (2)由题意知,工厂获得利润

z =(x -4)y =-20x 2+330x -1 000=-20????x -3342+361.25,所以当x =334=8.25时,z max =361.25(元).

即当该产品的单价定为8.25元时,工厂获得最大利润.

10.关于x 与y 有以下数据:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

已知x 与y 线性相关,由最小二乘法得b ^

=6.5, (1)求y 与x 的线性回归方程;

(2)现有第二个线性模型:y ^

=7x +17,且R 2=0.82.

若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由. 解:(1)依题意设y 与x 的线性回归方程为y ^=6.5x +a ^

. x =2+4+5+6+8

5

=5,

y =

30+40+60+50+70

5

=50,

∵y ^=6.5x +a ^

经过(x ,y ), ∴50=6.5×5+a ^,∴a ^

=17.5,

∴y 与x 的线性回归方程为y ^

=6.5x +17.5. (2)由(1)的线性模型得y i -y ^

i 与y i -y 的关系如下表:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

所以i =1

5(y i -y ^

i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.

i =1

5(y i -y )2=(-20)2+(-10)2+102+02+202=1 000.

所以R 21=1-

i =1

5(y i -y ^

i )2

i =1

5(y i -

y )

2

=1-155

1 000

=0.845. 由于R 21=0.845,R 2=0.82知R 21>R 2

所以(1)的线性模型拟合效果比较好.

层级二 应试能力达标

1.在建立两个变量y 与x 的回归模型中,分别选择4个不同模型,求出它们相对应的R 2如表,则其中拟合效果最好的模型是( )

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

A .模型1

B .模型2

C .模型3

D .模型4 解析:选B 线性回归分析中,相关系数为r ,|r |越接近于1, 相关程度越大; |r |越小,相关程度越小,故其拟合效果最好.故选B .

2.如果某地的财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过( )

A .10亿

B .9亿

C .10.5亿

D .9.5亿

解析:选C ∵x =10时,y =0.8×10+2+e =10+e , 又∵|e |≤0.5,∴y ≤10.5.

3.某咖啡厅为了了解热饮的销售量y (个)与气温x (℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

由表中数据,得线性回归方程y ^

=-2x +a .当气温为-4 ℃时,预测销售量约为( ) A .68 B .66 C .72

D .70

解析:选A ∵x =14(18+13+10-1)=10,y =1

4(24+34+38+64)=40,∴40=-

2×10+a ,∴a =60,当x =-4时,y =-2×(-4)+60=68.

4.甲、乙、丙、丁4位同学各自对A ,B 两变量进行回归分析,分别得到散点图与残差平方和i =1

n (y i -y ^

i )2如下表:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

哪位同学的试验结果体现拟合A ,B 两变量关系的模型拟合精度高( ) A .甲 B .乙 C .丙

D .丁

解析:选D 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2的表达式中i =1

n (y i -y )2为确定的数,则残差平

方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.故选D .

5.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =e bx

+a

的周围,令z ^=ln y ,求得回归直线方程为z ^

=0.25x -2.58,则该模型的回归方程为

________.

解析:因为z ^=0.25x -2.58,z ^=ln y ,所以y =e 0.25x -

2.58. 答案:y =e 0.25x -

2.58

6.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^

=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.

解析:以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^

=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.

答案:0.254

7.下表是某年美国旧轿车价格的调查资料.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

解:设x 表示轿车的使用年数,y 表示相应的平均价格,作出散点图.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

由散点图可以看出y 与x 具有指数关系, 令z =ln y ,变换得

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

作出散点图:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

由图可知各点基本上处于一直线,由表中数据可求出线性回归方程: z ^

=8.166-0.298x .

因为旧车的平均价格与使用年数具有指数关系,其非线性回归方程为y ^=e 8.166-0.298x

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

8.某公司利润y (单位:千万元)与销售总额x (单位:千万元)之间有如下对应数据:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(1)画出散点图; (2)求回归直线方程;

(3)估计销售总额为24千万元时的利润. 解:(1)散点图如图:

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(2)列下表,并利用科学计算器进行有关计算.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

于是b ^=346.3-7×21×2.1

3 447-7×212≈0.104.

a ^

=2.1-0.104×21=-0.084, 因此回归直线方程为y ^

=0.104x -0.084.

(3)当x =24时,y =0.104×24-0.084=2.412(千万元).

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

[核心必知]

1.预习教材,问题导入

根据以下提纲,预习教材P 10~P 15的内容,回答下列问题. 阅读教材P 10“探究”的内容,思考: (1)是否吸烟、是否患肺癌是什么变量? 提示:分类变量.

(2)吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗? 提示:不是.

(3)如何研究吸烟是否对患肺癌有影响?

提示:独立性检验.

2.归纳总结,核心必记

(1)分类变量

变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.

(2)列联表

①定义:列出的两个分类变量的频数表称为列联表.

②2×2列联表

一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(3)等高条形图

①图形与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.

②通过直接计算或观察等高条形图发现

a

a+b

c

c+d

相差很大,就判断两个分类变量之间

有关系.

(4)独立性检验

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

(1)有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗?为什么?

提示:观点不正确.犯错误的概率不超过0.01说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数.

(2)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗?

提示:不一定.所有的推断只代表一种可能性,不代表具体情况.

(3)下面是2×2列联表.

【人教A版】2018学年高中数学选修1-2全套教学案(含答案)

则表中a,b

提示:a=46-13=33,b=33+a=33+33=66.

[课前反思]

(1)分类变量的定义是什么?

(2)列联表的定义是什么?2×2列联表中的各个数据有什么意义?

(3)什么是等高条形图,有什么作用?