山东省武城县第二中学高中数学《1.2回归分析的基本思想及其初步应用》学案 新人教B版选修12
- 格式:doc
- 大小:498.51 KB
- 文档页数:5
1.2应用举例编者: 校审: 组长:一、[学习关键词]能运用正弦定理、余弦定理的知识与方法解决一些与测量和几何计算有关的实际问题. 二、[课前自主梳理] 1.仰角与俯角与目标视线在同一铅垂平面内的水平视线和目标视线的夹角,目标视线在水平视线上方时叫,目标视线在水平视线下方时叫,如图.2.方位角和方向角 从方向转到目标方向线的水平角叫,方位角的范围是[0,2π]. 从指定方向线到目标方向线所成的小于90°的水平角叫,如北偏东30°,南偏东45°.3.坡角与坡度如图,坡面与水平面所成的二面角叫,坡面的铅直高度与水平宽度之比叫(i =h l).三、[课堂合作研习]例1 如图所示,在山顶铁塔上B处测得地面上一点A的俯角为α,在塔底C处测得A处的俯角为β.已知铁塔BC部分的高为h,求出山高CD..例2 如图所示,A、B是水平面上的两个点,相距800 m,在A点测得山顶C的仰角为45°,∠BAD=120°,又在B点测得∠ABD=45°,其中D点是点C到水平面的垂足,求山高CD.例3 如图,墙上有一个三角形灯架OAB,灯所受的重力为10 N,且OA、OB都是细杆,只受沿杆方向的力.试求杆OA、OB所受的力.例4 甲船在A点发现乙船在北偏东60°的B处,乙船以每小时a海里的速度向北行驶,已知甲船的速度是每小时3a海里,问甲船应沿着什么方向前进,才能最快与乙船相遇?[巩固练习]1.如图,在河岸AC测量河的宽度BC,测量下列四组数据,较适宜的是( )A.a,c,α B.b,c,α C.c,a,β D.b,α,γ2.如图,某人向东方向走了x千米,然后向右转120°,再朝新方向走了3千米,结果他离出发点恰好13千米,那么x的值是________.3.甲、乙两楼相距20 m,从乙楼底望甲楼顶的仰角为60°,从甲楼顶望乙楼顶的俯角为30°,则甲、乙两楼的高分别是________m,________m.4.如图所示,设A、B两点在河的两岸,一测量者在A的同侧,在A所在的河岸边选定一点C,测出AC的距离为50 m,∠ACB=45°,∠CAB=105°,则A、B两点的距离为________m.5.江岸边有一炮台高30 m,江中有两条船,船与炮台底部在同一水面上,由炮台顶部测得俯角分别为45°和30°,而且两条船与炮台底部连线成30°角,则两条船相距________m.1.2应用举例[强化训练]1.海上有A、B两个小岛相距10 n mile,从A岛望C岛和B岛成60°的视角,从B岛望C岛和A岛成75°的视角,则B、C间的距离是( )A.10 3 n mile B.1063n mileC.5 2 n mile D.5 6 n mile2.甲骑电动自行车以24 km/h的速度沿着正北方向的公路行驶,在点A处望见电视塔S在电动车的北偏东30°方向上,15 min后到点B处望见电视塔在电动车的北偏东75°方向上,则电动车在点B时与电视塔S的距离是( )A.6 km B.3 3 km C.3 2 km D.3 km3.如图,为测得河对岸塔AB的高,先在河岸上选一点C,使C在塔底B的正东方向上,测得点A的仰角为60°,再由点C沿北偏东15°方向走10 m到位置D,测得∠BDC=45°,则塔AB的高是( ) A.10 m B.10 2 m C.10 3 m D.10 6 m4.在某个位置测得某山峰仰角为θ,对着山峰在地面上前进600 m后测得仰角为2θ,继续在地面上前进200 3 m以后测得山峰的仰角为4θ,则该山峰的高度为( )A.200 m B.300 m C.400 m D.100 3 m5.某人在C点测得某塔在南偏西80°,塔顶仰角为45°,此人沿南偏东40°方向前进10 m到D,测得塔顶A 的仰角为30°,则塔高为( )A.15 m B.5 m C.10 m D.12 m6.要测量底部不能到达的东方明珠电视塔的高度,在黄浦江西岸选择甲、乙两观测点,在甲、乙两点分别测得塔顶的仰角分别为45°,30°,在水平面上测得电视塔与甲地连线及甲、乙两地连线所成的角为120°,甲、乙两地相距500 m,则电视塔在这次测量中的高度是( )A.100 2 m B.400 m C.200 3 m D.500 m7.如图所示,为了测定河的宽度,在一岸边选定两点A、B,望对岸标记物C,测得∠CAB=30°,∠CBA=75°,AB=120 m,则河的宽度为______m.8.某人在塔的正东方沿着南偏西60°的方向前进40 m以后,望见塔在东北方向.若沿途测得塔的最大仰角为30°,求塔的高度.9.如图所示,货轮在海上以40 km/h的速度由B向C航行,航行的方位角是140°.A处有一灯塔,其方位角是110°,在C处观察灯塔A的方位角是35°,由B到C需航行半个小时,求C到灯塔A的距离.1.2应用举例 [强化训练答案]1.答案 D解析 由题意知,在△ABC 中,AB =10(n mile),A =60°,B =75°,则C =180°-A -B =45°.由正弦定理,得BC =AB sin A sin C =10sin 60°sin 45°=5 6 (n mile).2.答案 C解析 由题意知,AB =24×14=6(km),∠BAS =30°,∠ASB =75°-30°=45°.由正弦定理,得BS =AB sin ∠BAS sin ∠ASB =6sin 30°sin 45°=32(km).3.答案 D解析 在△BCD 中,CD =10(m),∠BDC =45°,∠BCD =15°+90°=105°,∠DBC =30°, 由正弦定理,得BC sin 45°=CDsin 30°, BC =CD sin 45°s in 30°=102(m).在Rt △ABC 中,tan 60°=ABBC,AB =BC tan 60°=106(m). 4.答案 B解析 法一 如图,△BED ,△BDC 为等腰三角形,BD =ED =600(m),BC =DC =2003(m).在△BCD 中,由余弦定理可得cos2θ=6002+032-322×600×2003=32, ∴2θ=30°,4θ=60°. 在Rt △ABC 中,AB =BC ·sin4θ=2003×32=300(m),故选B. 法二 由于△BCD 是等腰三角形,12BD =DC cos2θ,即300=2003cos2θ.cos2θ=32,2θ=30°,4θ=60°. 在Rt △ABC 中,AB =BC ·sin4θ=2003×32=300(m),故选B.5.答案 C解析如图,设塔高为h,在Rt△AOC中,∠ACO=45°,则OC=OA=h.在Rt△AOD中,∠ADO=30°,则OD= 3 h.在△OCD中,∠OCD=120°,CD=10,由余弦定理得OD2=OC2+CD2-2OC·CD cos∠OCD,即(3h)2=h2+102-2h×10×cos120°,∴h2-5h-50=0,解得h=10或h=-5(舍).6.答案 D解析由题意画出示意图,设高AB=h m,在Rt△ABC中,由已知得BC=h m,在Rt△ABD中,由已知得BD=3h,在△BCD中,由余弦定理BD2=BC2+CD2-2BC·CD·cos∠BCD得,3h2=h2+5002+h·500,解之得h=500 (m).故选D.7.答案60解析在△ABC中,∠CAB=30°,∠CBA=75°,∴∠ACB=75°.∠ACB=∠ABC.∴AC=AB=120 (m).如图,作CD⊥AB,垂足为D,则CD即为河的宽度.由正弦定理得AC sin ∠ADC =CDsin ∠CAD,∴120sin 90°=CD sin 30°, ∴CD =60(m). ∴河的宽度为60 m.8.解 在△BCD 中,CD =40 m ,∠BCD =90°-60°=30°, ∠DBC =45°+90°=135°. 由正弦定理,得CD sin ∠DBC =BDsin ∠BCD,∴BD =CD ·sin∠BCD sin ∠DBC =40sin 30°sin 135°=202(m).在Rt △ABE 中,tan ∠AEB =ABBE,AB 为定值,故要使∠AEB 最大,需要BE 最小, 即BE ⊥CD ,这时∠AEB =30°.在△BCD 中,∠BDE =180°-135°-30°=15°, ∴BE =BD ·sin∠BDE=202sin 15°=10(3-1)(m). 在Rt △ABE 中,AB =BE tan ∠AEB=10(3-1)·tan 30°=103(3-3)(m).答 塔的高度为103(3-3) m.9.解 在△ABC 中,BC =40×12=20(km),∠ABC =140°-110°=30°, ∠ACB =(180°-140°)+35°=75°, ∴∠BAC =75°. 由正弦定理,得AC sin 30°=BCsin 75°,∴AC =BC sin 30°sin 75°=10sin 45°cos 30°+cos 45°sin 30° =406+2=10(6-2)(km).答 C 到灯塔A 的距离为10(6-2)km.。
回归分析的基本思想及其初步应用(第三课时)(第四课时)一、目标:1、使学生会根据观测数据的特点来选择回归模型2、使学生通过探究体会到有些非线性模型通过变换可以转化为线性回归模型。
3、初步体会不同模型拟合数据的效果。
二、教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
三、教学基本流程:回忆建立模型的基本步骤①例2 问题背景分析画散点图。
②观察散点图,分析解释变量与预报变量更可能是什么函数关系。
③学生讨论后建立自己的模型④引导学生探究如果不是线性回归模型如何估计参数。
能否利用回归模型通过探究体会有些不是线性的模型通过变换可以转化为线性模型⑤对数据进行变换后,对数据(新)建立线性模型⑥转化为原来的变量模型,并通过计算相关指数比较几个不同模型的拟合效果⑦总结建模的思想。
鼓励学生大胆创新。
⑧布置课后作业:习题1.1 1、附例2的解答过程:解:依题意,把温度作为解释变量x ,产卵个数y作为预报变量 , 作散点图,由观察知两个变量不呈线性相关关系。
但样本点分布在某一条指数函数 y=c1e c2 x周围.令 z=lny , a=lnc1 , b=c2则 z=bx+a此时可用线性回归来拟合 z=0.272x-3.843因此红铃虫的产卵数对温度的非线性回归方程为Y=e0.272x-3.8431、1回归分析的基本思想及其初步应用(习题课)(第五课时)目标:通过习题巩固所学知识过程:1、复习有关知识2、典型例题:例1:某班5名学生的数学和化学成绩如下表所示,对x与y进行回归分析,并预报某学生数学成绩为75分时,他的化学成绩。
A B C D E数学x 88 76 73 66 63 化学y 78 65 71 64 61解略。
例2:某医院用光电比色计检验尿汞时,得尿汞含量 (mg/l) 与消光系数的结果如下:(1)求回归方程。
回归分析的基本思想及其初步应用教学设计
【教学目标】
在《数学③(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,最小二乘法求回归直线方程等内容.在人教A版选修1-2第一章第一节“回归分析的基本思想及其初步应用”这一节中进一步介绍回归分析的基本思想及其初步应用.这部分内容《教师用书》共计4课时,第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果,并能从残差分析角度讨论回归模型的拟合效果;第二课时:从相关系数、相关指数角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用. 本节课是第一课时的内容.
1、知识目标
认识随机误差;认识残差
2、能力目标
(1)会使用电脑画散点图、求回归直线方程;
(2)能正确理解回归方程的预报结果.
3、情感目标
通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.
【教学重点】回归分析的基本方法、随机误差e的认识、残差
【教学难点】回归分析的基本方法
【教学方法】启发式教学法
【教学手段】多媒体辅助教学【教学过程设计】。
1、1回归分析的基本思想及其初步应用。
教学目标:通过典型案例,掌握回归分析的基本步骤。
教学重点:熟练掌握回归分析的步骤。
教学难点:求回归系数 a , b教学方法:讲练。
教学过程:一、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
二、新课:1、回归分析的基本步骤:(1) 画出两个变量的散点图。
(2) 求回归直线方程。
(3) 用回归直线方程进行预报。
2、举例:例1、题(略) 用小黑板给出。
解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x 。
体重为因变量 y ,作散点图(如图)(2)列表求 ,ˆ0.849ˆ85.712x yba ≈≈-回归直线方程 y=0.849x-85.712对于身高172cm 女大学生,由回归方程可以预报体重为y=0.849*172-85.712=60.316(kg) 预测身高为172cm 的女大学生的体重为约60。
316kg问题:身高为172cm 的女大学生的体重一定是60。
316kg 吗?(留下一节课学习) 例2:(提示后做练习、作业)研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下:水深xm 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10 流速ym/s1.70 1.79 1.88 1.952.03 2.10 2.16 2.21(1)求y 对x 的回归直线方程;(2)预测水深为1。
95m 时水的流速是多少?解:(略)三、小结四、作业: 例2、 预习。
1.2.2 组合(第2课时)一、【学习关键词】掌握排列、组合的一些常见模型和解题方法.二、【课前自主梳理】1.整体分类.对事件进行整体分类,从集合的意义讲,分类要做到各类的并集等于全集,以保证分类的不遗漏,任意两类的交集等于空集,以保证分类的不重复,计算结果时,使用分类加法计数原理.2.局部分步.整体分类以后,对每一类进行局部分步,分步要做到步骤连续,以保证分步的不遗漏,同时步骤要独立,以保证分步的不重复,计算每一类的相应结果时,使用分步乘法计数原理.3.考察顺序.区别排列与组合的重要标志是“有序”与“无序”,无序的问题用组合解答,有序的问题用排列解答.4.辩证地看待“元素”与“位置”.排列、组合问题中的元素与位置没有严格的界定标准,哪些事件看成元素或位置,随解题者的思维方式的变化而变化,要视具体情况而定.有时“元素选位置”,问题解决得简捷,有时“位置选元素”,效果会更好.三、【课堂合作研习】例1.有12本不同的课外书,分给甲、乙、丙三名同学,求在下列条件下,各有多少种不同的分法?(1)甲得5本,乙得4本,丙得3本;(2)一人得5本,一人得4本,一人得3本;(3)甲、乙、丙各得4本.例2.某次足球赛共10支球队参加,分三个阶段进行:(1)小组赛:经抽签分成甲、乙两组,每组5队进行单循环比赛,以积分及净剩球数取前两名;(2)半决赛:甲组第一名与乙组第二名,乙组第一名与甲组第二名作主客场交叉淘汰赛(每两队主客场各赛一场)决出胜者;(3)决赛:两个胜队参加决赛一场,决出胜负.问全部赛程共需比赛多少场?例3.把四个不同的小球放入三个分别标有1~3号的盒子中:(1)不许有空盒子的放法有多少种?(2)允许有空盒子的放法有多少种?(3)若把四个小球分别标上1~4的标号,不许有空盒子且任意一个小球都不能放入标有相同标号的盒子中,共有多少种不同的放法?四、【巩固练习】1.凸十边形的对角线的条数为( ) A.10 B.35 C.45 D.902.在直角坐标系xOy平面上,平行直线x=m(m=0,1,2,3,4),与平行直线y=n(n=0,1,2,3,4)组成的图形中,矩形共有( ) A.25个B.100个C.36个 D.200个3.某班级要从4名男生、2名女生中选派4人参加某次社区服务,如果要求至少有1名女生,那么不同的选派方案种数为( )A.14 B. 24 C.28 D.484.现有16张不同的卡片,其中红色、黄色、蓝色、绿色卡片各4张,从中任取3张,要求这3张卡片不能是同一种颜色,且红色卡片至多1张,不同取法的种数为( )A.232 B.252 C.472 D.4845.在50件产品中有4件是次品,从中任意抽出5件,至少有3件是次品的抽法共有_____种.6.某运动队有5对老搭档运动员,现抽派4个运动员参加比赛,则这4人都不是老搭档的抽派方法数为________.五、【强化训练】1.已知集合A={1,2,3,4,5,6},B={1,2}.若集合M满足B M A,则这样的不同的集合M共有( )A.12个B.13个C.14个D.15个2.编号为1、2、3、4、5、6、7的七盏路灯,晚上用时只亮三盏灯,且任意两盏亮灯不相邻,则不同的开灯方案有( ) A.60种B.20种C.10种D.8种3.已知圆上9个点,每两点连一线段,所有线段在圆内的交点有( ) A.36个B.72个C.63个D.126个4.将7名学生分配到甲、乙两个宿舍中,每个宿舍至少安排两名学生,那么互不相同的分配方案共有( ) A.252种B.112种C.20种D.56种5.空间有10个点,其中有5个点共面(除此之外再无4点共面),以每4个点为顶点作一个四面体,一共可作________个四面体.(用数字作答)6.在某次数字测验中,记座号为n(n=1,2,3,4)的同学的考试成绩为f(n).若f(n)∈{70,85,88,90,98,100},且满足f(1)<f(2)≤f(3)<f(4),则这4位同学考试成绩的所有可能有________种.7.从1,2,3,4这四个数中一次随机地取两个数,则其中一个数是另一个数的两倍的概率是________.8.从2,3,5,7四个数中任取两个不同的数相乘,有m个不同的积;任取两个不同的数相除,有n个不同的商,则m∶n=________.9.在一次数学竞赛中,某学校有12人通过了初试,学校要从中选出5人去参加市级培训,在下列条件下,有多少种不同的选法?(1)任意选5人;(2)甲、乙、丙三人必须参加;(3)甲、乙、丙三人不能参加;(4)甲、乙、丙三人只能有1人参加;(5)甲、乙、丙三人至少1人参加.【强化训练答案】1.C 2.C 3.D 4.B 5.205 6.35 7.1/3 8. 1:29.解(1)C512=792(种)不同的选法.(2)甲、乙、丙三人必须参加,只需从另外的9人中选2人,共有C29=36(种)不同的选法.(3)甲、乙、丙三人不能参加,只需从另外的9人中选5人,共有C59=126(种)不同的选法.(4)甲、乙、丙三人只能有1人参加,分两步,先从甲、乙、丙中选1人,有C13=3(种)选法,再从另外的9人中选4人有C49种选法,共有C13C49=378(种)不同的选法.(5)(直接法)可分为三类:第一类:甲、乙、丙中有1人参加,共有C13C49种;第二类:甲、乙、丙中有2人参加,共有C23C39种;第三类:甲、乙、丙3人均参加,共有C33C29种.共有C13C49+C23C39+C33C29=666(种)不同的选法.。
回归分析的基本思想及其初步应用预习课本P2~8,思考并完成以下问题(1)什么是回归分析?(2)什么是线性回归模型?(3)求线性回归方程的步骤是什么?[新知初探]1.回归分析(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).设其回归直线方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数,由最小二乘法得b ^=∑i =1nx i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -nx y∑i =1nx 2i -n x 2,a ^=y -b ^x . (3)线性回归模型线性回归模型⎩⎪⎨⎪⎧y =bx +a +e ,E e =0,D e=σ2,其中a,b 为模型的未知参数,通常e 为随机变量,称为随机误差.x 称为解释变量,y 称为预报变量.[点睛] 对线性回归模型的二点说明(1)非确定性关系:线性回归模型y =bx +a +e 与确定性函数y =a +bx 相比,它表示y 与x 之间是统计相关关系(非确定性关系),其中的随机误差e 提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a,b 的工具.(2)线性回归方程y ^=b ^x +a ^中a ^,b ^的意义是:以a ^为基数,x 每增加1个单位,y 相应地平均增加b ^个单位. 2.线性回归分析(1)残差:对于样本点(x i ,y i )(i =1,2,…,n)的随机误差的估计值 e ^i =y i -y ^i 称为相应于点(x i ,y i )的残差,∑i =1n(y i -y ^i )2称为残差平方和.(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差, 横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.(3)R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2越接近1,表示回归的效果越好.[小试身手]1.判断(正确的打“√”,错误的打“×”)(1)残差平方和越小, 线性回归方程的拟合效果越好.( )(2)在画两个变量的散点图时, 预报变量在x 轴上,解释变量在y 轴上.( ) (3)R 2越小, 线性回归方程的拟合效果越好.( )答案:(1)√ (2)× (3)×2.在如图所示的四个散点图中,适合用线性回归模型拟合其中两个变量的是( )A .①②B .①③C .②③D .③④答案:B3.在两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A .模型1的相关指数R 2为0.98 B .模型2的相关指数R 2为0.80 C .模型3的相关指数R 2为0.50 D .模型4的相关指数R 2为0.25 答案:A4.如果发现散点图中所有的样本点都在一条直线上, 则残差平方和等于________, 解释变量和预报变量之间的相关系数等于________.答案:0 1或-1求线性回归方程[典例] 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据x 6 8 10 12 y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程 y ^=b ^x +a ^; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. [解] (1)散点图如图:(2)∑i =1nx i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =1nx 2i =62+82+102+122=344. b ^=158-4×9×4344-4×92=1420=0.7, a ^=y -b ^x =4-0.7×9=-2.3, 故线性回归方程为y ^=0.7x -2.3. (3)由(2)中线性回归方程知, 当x =9时,y ^=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.求线性回归方程的三个步骤(1)算:根据数据计算x ,y ,∑i =1nx 2i,∑i =1nx i y i ;(2)代:代入公式求b ^,a ^的具体数值; (3)求:由上面的计算结果求方程y ^=b ^x +a ^.[注意] 回归直线一定过样本点的中心(x ,y ),这在很多问题的求解中起着很重要的作用. 1.某饮料店的日销售收入y(单位:百元)与当天平均气温x(单位:摄氏度)之间有下列数据:x -2 -1 0 1 2 y54221甲、乙、丙三位同学对上述数据进行了研究,分别得到了x 与y 之间的三个线性回归方程:①y ^=-x +2.8,②y ^=-x +3,③y ^=-1.2x +2.6.其中正确的是( )A .①B .②C .③D .①③解析:选A 回归方程y ^=b ^x +a ^表示的直线必过点(x ,y ),即必过点(0,2.8),而给出的三个线性回归方程中,只有①表示的直线过点(0,2.8),故正确的是①.2.某班5名学生的数学和物理成绩如下表:学生 学科成绩ABCDE数学成绩x 88 76 73 66 63 物理成绩y7865716461(1)画出散点图;(2)求物理成绩y 对数学成绩x 的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. 解:(1)散点图如图所示.(2)因为x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8,∑i =15x i y i =88×78+76×65+73×71+66×64+63×61=25 054,∑i =15x 2i =882+762+732+662+632=27 174. 所以b ^=∑i =15x i y i -5xy∑i =15x 2i -5x 2=25 054-5×73.2×67.827 174-5×73.22≈0.625, a ^= y -b ^x ≈67.8-0.625×73.2=22.05. 所以y 对x 的回归直线方程是y ^=0.625x +22.05. (3)因为x =96,所以y ^=0.625×96+22.05≈82, 即可以预测他的物理成绩是82.线性回归分析[典例] 为研究质量x(6个物体进行测量,数据如表所示:x 5 10 15 20 25 30 y7.258.128.959.9010.911.8(1)作出散点图,并求出y 关于x 的线性回归方程; (2)求出R 2; (3)进行残差分析. [解] (1)散点图如图所示.因为x =16×(5+10+15+20+25+30)=17.5,y =16×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,∑i =16x 2i =52+102+152+202+252+302=2275,∑i =16x i y i =5×7.25+10×8.12+15×8.95+20×9.90+25×10.9+30×11.8=1 076.2.所以b ^=∑i =16x i y i -6x] y]∑i =16x 2i -6x2=1 076.2-6×17.5×9.4872 275-6×17.52≈0.183,a ^=y -b ^x =9.487-0.183×17.5≈6.285,所以所求线性回归方程为y ^=6.285+0.183x. (2)列表如下:y i -y ^i 0.05 0.005 -0.08 -0.045 0.04 0.025y i -y-2.24 -1.37 -0.54 0.41 1.41 2.31所以∑i =16(y i -y ^i )2≈0.013 18,∑i =16(y i -y )2=14.678 4.所以R 2≈1-0.013 1814.678 4≈0.999 1,所以回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量成线性关系.给出两个变量的回归方程,一般有三种方法来判断拟合效果: (1)残差平方和法:残差平方和越小,拟合效果越好;(2)残差图法:残差图中的点分布的带状区域宽度越窄,拟合精度越高; (3)相关指数法:相关指数R 2越接近于1,模型的拟合效果越好. 在一段时间内,某种商品的价格x 元和需求量y 件之间的一组数据为:x 14 16 18 20 22 y1210753求出y 对x 解:x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4.∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,可得回归系数b ^=∑i =15x i y i -5x-y-∑i =15x 2i -5x 2=620-5×18×7.41 660-5×182=-1.15.所以a ^=7.4+1.15×18=28.1所以回归直线方程:y ^=-1.15x +28.1. 列出残差表:y i -y ^i 0 0.3 -0.4 -0.1 0.2 y i -y4.62.6-0.4-2.4-4.4则∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2.R 2=1-∑i =15y i -y ^i2∑i =15y i -y2≈0.994.所以回归模型的拟合效果很好.非线性回归分析[典例] 在一次抽样调查中测得5个样本点,数值如下表:x 0.25 0.5 1 2 4 y1612521试建立y 与x 之间的回归方程.[解] 作出变量y 与x 之间的散点图如图1所示.由图可知变量y 与x 近似地呈反比例函数关系, 设y =k x ,令t =1x,则y =kt.由y 与x 的数据表可得y 与t 的数据表如下:t 4 2 1 0.5 0.25 y1612521作出y 与t 由图可知y 与t 呈近似的线性相关关系.又t =1.55,y =7.2,∑i =15t i y i =94.25,∑i =15t 2i =21.312 5.∴b ^=∑i =15t i y i -5ty∑i =15t 2i -5t 2=94.25-5×1.55×7.221.312 5-5×1.552≈4.134 4.a ^=y -b ^t ≈7.2-4.134 4×1.55≈0.791 7, ∴y ^=4.134 4t +0.791 7.∴y 与x 的回归方程是y ^=4.134 4x+0.791 7.求非线性回归方程的步骤(1)确定变量,作出散点图;(2)根据散点图,选择恰当的拟合函数;(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程; (4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果; (5)根据相应的变换,写出非线性回归方程. [活学活用]若将函数y =ax b转化为线性函数u =c +bv,则所作的变换是( ) A .u =ln y,v =ln a,c =ln x B .u =ln x,v =ln y,c =ln a C .u =ln a,v =ln x,c =ln y D .u =ln y,v =ln x,c =ln a解析:选D 对y =ax b两边取对数,得ln y =ln a +bln x. 令u =ln y,v =ln x,c =ln a,得u =c +bv.层级一 学业水平达标1.在对两个变量x,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(x i ,y i ),i =1,2,…,n ; ③求线性回归方程; ④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x,y 具有线性相关的结论,则在下列操作顺序中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤D .②⑤④③①解析:选D 对两个变量进行回归分析时,首先收集数据(x i ,y i ),i =1,2,…,n ;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①, 故选D.2.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②R 2来刻画回归的效果,R 2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果, 可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好. 其中正确命题的个数是( ) A .0 B .1 C .2D .3解析:选D ①选用的模型是否合适与残差点的分布有关; 对于②③, R 2的值越大, 说明残差平方和越小, 随机误差越小,则模型的拟合效果越好.3.下图是根据变量x,y 的观测数据(x i ,y i )(i =1,2,…,10)得到的散点图,由这些散点图可以判断变量x,y 具有相关关系的图是( )A .①②B .①④C .②③D .③④解析:选D 根据散点图中点的分布情况,可判断③④中的变量x,y 具有相关的关系.4.对具有线性相关关系的变量x,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是y ^=13x +a,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a 的值是( )A.116B.18C.14D.12解析:选B 依题意可知样本点的中心为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a,解得a =18.5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元) 8.2 8.6 10.0 11.3 11.9 支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程y ^=b ^x +a ^,其中b ^=0.76,a ^=y --b ^x -.据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:选B 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元). 6.以下是某地区的降雨量与年平均气温的一组数据:年平均 气温(℃) 12.5112.8412.8413.6913.3312.7413.05年降雨 量(mm)542 507 813 574 701 432 464根据这组数据可以推断,该地区的降雨量与年平均气温________相关关系.(填“具有”或“不具有”)解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系.答案:不具有7.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,大小关系为________________.解析:由相关系数的定义以及散点图所表达的含义可知r 2<r 4<0<r 3<r 1. 答案:r 2<r 4<0<r 3<r 18.下列说法正确的命题是________(填序号). ①回归直线过样本点的中心(x ,y );②线性回归方程对应的直线y ^=b ^x +a ^至少经过其样本数据点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; ③在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高; ④在回归分析中,R 2为0.90的模型比R 2为0.86的模型拟合的效果好. 解析:由回归分析的概念知①④正确,②③错误. 答案:①④9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,从而a ^=y +20x =80+20×8.5=250, 故y ^=-20x +250.(2)由题意知, 工厂获得利润z =(x -4)y =-20x 2+330x -1 000=-20⎝ ⎛⎭⎪⎫x -3342+361.25,所以当x =334=8.25时,z max =361.25(元).即当该产品的单价定为8.25元时,工厂获得最大利润.10.假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料.若由资料知y 对x (1)回归方程y ^=b ^x +a ^的回归系数a ^,b ^; (2)估计使用年限为10年时,维修费用是多少. 解:(1)制表如下:由表中数据可得x =4,y =5,∑i =15x 2i=90,∑i =15x i y i =112.3,于是有b ^=112.3-5×4×590-5×42=12.310=1.23, a ^=y -b ^x =5-1.23×4=0.08. (2)回归直线方程为y ^=1.23x +0.08,当x =10时,y ^=1.23×10+0.08=12.38,即估计使用年限为10年时,维修费用是12.38万元.层级二 应试能力达标1.在建立两个变量y 与x 的回归模型中,分别选择4个不同模型,求出它们相对应的R 2如表,则其中拟合效果最好的模型是( )A .模型1C .模型3D .模型4解析:选B 线性回归分析中,相关系数为r,|r|越接近于1, 相关程度越大; |r|越小, 相关程度越小,故其拟合效果最好. 故选B.2.如果某地的财政收入x 与支出y 满足线性回归方程y =bx +a +e(单位:亿元),其中b =0.8,a =2,|e|≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过( )A .10亿B .9亿C .10.5亿D .9.5亿解析:选C ∵x =10时,y =0.8×10+2+e =10+e, 又∵|e|≤0.5,∴y≤10.5.3.某咖啡厅为了了解热饮的销售量y(个)与气温x(℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:由表中数据,得线性回归方程y ^=-2x +a.当气温为-4 ℃时,预测销售量约为( ) A .68 B .66 C .72D .70解析:选A ∵x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,∴40=-2×10+a,∴a =60,当x =-4时,y =-2×(-4)+60=68.4.甲、乙、丙、丁4位同学各自对A,B 两变量进行回归分析,分别得到散点图与残差平方和i =1n (y i -y ^i )2如下表:甲乙丙丁散点图残差平方和115106124103A .甲B .乙C .丙D .丁解析:选D 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2的表达式中 i =1n(y i -y )2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.故选D.5.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =e bx +a的周围,令z^=ln y,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为________.解析:因为z ^=0.25x -2.58,z ^=ln y,所以y =e 0.25x -2.58. 答案:y =e0.25x -2.586.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x +1代x,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2547.为了研究某种细菌随时间x 变化繁殖个数y 的变化,收集数据如下时间x/天1 2 3 4 5 6繁殖个数y 6 12 25 49 95 190(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图; (2)求y 与x 之间的回归方程. 解:(1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y 1=c 1ec 2x 的周围,于是令z =ln y,则x 1 2 3 4 5 6 z1.792.483.223.894.555.25由计算器算得,z ^=0.69x +1.112,则有y ^=e 0.69x +1.112.8.关于x 与y 有以下数据:x 2 4 5 6 8 y3040605070已知x 与y 线性相关,由最小二乘法得b =6.5. (1)求y 关于x 的线性回归方程;(2)现有第二个线性模型:y ^=7x +17,且相关指数R 2=0.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好?请说明理由.解:(1)依题意设y 关于x 的线性回归方程为y ^=6.5x +a ^,x =15(2+4+5+6+8)=5,y =15(30+40+60+50+70)=50,∵直线y ^=6.5x +a ^经过样本点的中心(x ,y ), ∴50=6.5×5+a ^,∴a ^=17.5,∴y 与x 的线性回归方程为y ^=6.5x +17.5.(2)由(1)的线性模型得y i -y ^i 与y i -y 的值如下表:y i -y ^i -0.5 -3.5 10 -6.5 0.5 y i -y-20-101020∴∑i =15 (y i -y ^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,∑i =15(y i -y )2=(-20)2+(-10)2+102+02+202=1 000,∴R 21=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1551 000=0.845.由R 21=0.845,R 2=0.82知R 21>R 2, ∴(1)的线性模型拟合效果比较好.。
3.1 回归剖析的基本思想及其初步应用(二)一、基本说明1所属模块:高中数学选修 2-32年级:高二年级3 教材第一版单位:人民教育第一版社A4所属的章节:第三章第一节5 学时数:40分钟多媒体教室二、教课方案教课目标:经过典型事例的研究,进一步认识回归剖析的基本思想、方法及初步应用.教课要点:经过研究使学生领会有些非线性模型经过变换能够转变为线性回归模型,认识在解决实质问题的过程中找寻更好的模型的方法 .教课难点:认识常用函数的图象特色,选择不一样的模型建模,并经过比较有关指数对不一样的模型进行比较.教课过程:一、复预引入问题 1:成立回归模型的一般基本步骤是哪五步?问题 2:残差及有关指数R2如何对回归方程拟合程度进行剖析?问题 3:依据例 2 所给的样本数据作散点图,并察看散点图,判断样本数据组( x i , y i ) 拥有线性关系吗?二、讲解新课:例 2、一只红铃虫的产孵数y 和温度 x 有关,现采集了7 组数据列于表3-3 中,温度 x/℃21232527293235产卵数 y/个711212466115325(1)试成立产卵数y 与温度 x 之间的回归方程;并展望温度为28o C 时产卵数量。
(2)你所成立的模型中温度在多大程度上解说了产卵数的变化?设计企图:由散点图,联合线性回归模型的回归剖析的基本步新知识生长点。
(学生描绘步骤,教师演示剖析数据,议论拟合函数模型。
)骤,诱出350300250数200卵产 15010050010203040温度研究 1:剖析散点图,预计样本数据组(x i , y i ) 的回归方程的拟合模型。
1、议论:察看右图中的散点图,发现样本点并无散布在某个带状地区内,即两个变量不呈线性有关关系,所以不可以直接用线性回归模型y=ax+b 来成立两个变量之间的关系 .2、研究非线性回归方程确实定:① 假如散点图中的点散布在一个直线状带形地区,能够选线性回归模型来建模;假如散点图中的点散布在一个曲线状带形地区,就需选择非线性回归模型来建模.y=bx 2+a, 也象某一条指数函数曲线y=C1e C2x ② 依据已有的函数知识,能够发现样本点散布象某一条抛物线(此中 c1 ,c2是待定的参数),故可考虑用以上两个模型来拟合两个变量.③抛物型:将 y=bx 2+a 进行平方变换:令 t=x 2,产卵数 y 和温度 x 之间二次函数模型y=bx2+a 就转变为产卵数 y 和温度的平方 t 之间线性回归模型 y=bt+a温度21232527293235温度的平方 t44152962572984110241225产卵数 y / 个711212466115325产卵数 y/ 个350300250200150100t 500150300450600750900 1050 1200 1350察看互换数据后的散点图能够发现抛物线模型的拟合成效不是很好,由于散点图不可一条直线。
1.1.2 回归分析的基本思想及其初步应用课标转述:①通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验的基本思想、方法及初步应用。
②通过对现行案例(如“质量控制”“新药是否有效"等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用.③通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。
④通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及初步应用学习目标:1、会建立回归模型,进而学习相关指数(相关指数R2、残差分析)2、会求上述的相关指数:3、从实际问题发现已有知识不足,激发好奇心、求知欲,培养勇于求知的良好个性品质.学习重、难点:残差分析,相关指数R2的计算、建立回归模型的步骤.学习过程:一、复习准备:1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响。
2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的两个统计量:残差、相关指数R2.二、自主学习:1。
残差:(1)残差的定义(2)残差的作用2.绘残差图6 7 8从残差图看:⑴那些点为可疑点?发现可疑点该如何办?⑵如何判断模型拟合程度?3。
相关指数R2R2=R 2越大,意味着残差平方和21ˆ()nii y y=-∑ ,即模型的拟合效果 ;R 2越小,意味着残差平方和21ˆ()nii y y=-∑ ,即模型的拟合效果 .。
例如例1,R 2≈表明“ ”或者 “ ”预报时需要注意下列问题:1. 2. 3. 4。
三.、例题解析:例2 关于x 与Y 有如下数据:x Y 种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好。
四、课堂小结:从这节课你学到了什么?请自己尝试总结如下: 1. 2.五。
课后作业p8 练习。
1.2 回归分析的基本思想及其初步应用知★识★梳★理 1.线性回归模型(1)函数关系是一种 关系,而相关关系是一种 关系. (2)回归分析是对具有 关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据),(11y x ,),(22y x ,…,),(n n y x ,回归直线的斜率和截距的最小二乘估计公式分别为=bˆ ,=a ˆ , 称为样本点的中心.(4)线性回归模型e a bx y ++=,其中a 和b 为模型的未知参数,e 称为 ,在统计中,自变量x 称为 ,因变量y 称为 . 2.残差的概念对于样本点),(,),,(),,(2211n n y x y x y x ⋅⋅⋅而言,它们的随机误差为i e = ,i =1,2,…,n ,其估计值为=i eˆ=,i =1,2,…,,n i eˆ称为相应于点),(i i y x 的残差.★★★基础达标★★★1.下列两个变量之间的关系是相关关系的是( ).A .速度一定时,位移与时间B .单位面积的产量为常数时,土地面积与总产量C .身高与体重D .电压一定时,电流与电阻2.[2014·重庆卷] 已知变量x 与y 正相关,且由观测数据算得样本平均数5.3,3==y x ,则由该观测数据算得的线性回归方程可能是( )A .3.24.0ˆ+=x yB .4.22ˆ-=x yC .5.92ˆ+-=x yD .4.43.0ˆ+-=x y3.设),(,),,(),,(2211n n y x y x y x ⋅⋅⋅是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是 ( ). A .直线l 过点),(y xB .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同4.在一组样本数据),(,),,(),,(2211n n y x y x y x ⋅⋅⋅ (21,,2x x n ≥,…,n x 不全相等)的散点图中,若所有样本点),,2,1)(,(n i y x i i ⋅⋅⋅=都在直线121+=x y 上,则这组样本数据的样本相关系数为 ( ).A .-1B .0C .21D .1 5.[2014·韶关一模] 设某大学的女生体重)(kg y 与身高)(cm x 具有线性相关关系,根据一组样本数据),,2,1)(,(n i y x i i ⋅⋅⋅=,用最小二乘法建立的线性回归方程为71.8585.0ˆ-=x y,给出下列结论:①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心),(y x ; ③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 其中,正确结论的序号是______________.6.(2014·江西重点中学联考)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程ˆ=y .7.(2014·济南模拟)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x (单位:万元)和年教育支出y (单位:万元),调查显示年收入x 与年教育支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:2.015.0ˆ+=x y.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元.8.四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论: ①y 与x 负相关且 2.347 6.423y x =-; ②y 与x 负相关且 3.476 5.648y x =-+; ③y 与x 正相关且 5.4378.493y x =+; ④y 与x 正相关且 4.326 4.578y x =--. 其中一定不正确...的结论的序号是 . 9.(2012·福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价(1)(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)10.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,算得10180ii x==∑,10120i i y ==∑,101184i i i x y ==∑,1021720i i x ==∑.(Ⅰ)求家庭的月储蓄y 对月收入x 的线性回归方程a x b yˆˆˆ+=; (Ⅱ)判断变量x 与y 之间是正相关还是负相关;(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程a x b yˆˆˆ+=中,∑∑==--=ni ini ii n xy x n yx b 1221ˆ,x b y aˆˆ-=,★★★能力提升★★★11.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为93.7319.7+=∧x y ,用这个模型预测这孩子10岁时的身高,则正确的叙述是( )A 、身高一定是145.83cmB 、身高在145.83cm 以上C 、身高在145.83cm 以下D 、身高在145.83cm 左右12.若施肥量x (kg )之间的回归直线方程为x y4250ˆ+=,当施肥量为50kg 时,预计小麦产量为.13.若一组观测值),(,),,(),,(2211n n y x y x y x ⋅⋅⋅之间满足i i i e a bx y ++=),,2,1(n i ⋅⋅⋅=,且i e 恒为0,则2R 为.14.关于x 与y 有以下数据:已知x 与y 线性相关,由最小二乘法得5.6=b, (1)求y 关于x 的线性回归方程.(2)现有第二个线性模型:177ˆ+=x y,且相关指数82.02=R ,若与(1)的线性模型比较,哪一个线性模型拟合效果比较好?请说明理由.1.1 回归分析的基本思想及其初步应用答案知★识★梳★理 1.(1)确定性;非确定性(2)相关(3)∑∑==---ni ini iix x y yx x 121)())(( x by ˆ- ),(y x (4)随机误差 解释变量 预报变量2.a bx y i i -- i i y y ˆ- a x b y ii ˆˆ-- 3.∑∑==---n i ini i iy yyy1212)()ˆ(1 1★★★基础达标★★★1.C 解析:A 、B 、D 中两个变量间的关系都是确定的,所以是函数关系;C 中的两个变量间是相关关系,对于身高一样的人,体重仍可以不同,故选C.2.A 解析:因为变量x 与y 正相关,则在线性回归方程中,x 的系数应大于零,排除B ,D ;将5.3,3==y x 分别代入A ,B 中的方程只有A 满足,故选A.3.A 解析:由样本的中心(y x ,)落在回归直线上可知A 正确;x 和y 的相关系数表示为x 与y 之间的线性相关程度,不表示直线l 的斜率,故B 错;x 和y 的相关系数应在-1到1之间,故C 错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故D 错.4.D 解析:所有点均在直线上,则样本相关系数最大即为1,故选D. 5.①②③6.68 解析:由已知可计算求出30=x ,而回归直线方程必过点),(y x ,则759.543067.0=+⨯=y ,设模糊数字为a ,则75589817562=++++a ,计算得68=a .7.0.15 解析:回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.8.①④ 解析:y 与x 正相关,回归直线,直线斜率大于0,y 与x 负相关,回归直线系数小于0. 9.解析:(1)由于5.8)(61654321=+++++=x x x x x x x ,80)(61654321=+++++=y y y y y y y , 所以2505.82080=⨯+=-=x b y a ,从而回归直线方程为25020ˆ+-=x y. (2)设工厂获得的利润为L 元,依题意得)25020(4)25020(+--+-=x x x L25.361)433(2010003302022+--=-+-=x x x .当且仅当25.8=x 时,L 取得最大值. 故当单价定为8.25元时,工厂可获得最大利润.10.解析:(I )由题意知10=n ,8108011===∑=n i i x n x ,∑====n i i y n y 1210201,808107202212=⨯-=-∑=x n xni i, 2428101841=⨯⨯-=-∑=y x n y x ni i .由此作3.08024==b ,4.083.02-=⨯-=-=x b y a , 故所求回归方程为4.03.0-=x y .(II )由于变量y 的值随x 的值增加而增加03.0>=b ,故x 与y 之间是正相关. (III )将7=x 代入回归方程可以预测该家庭的月储蓄为7.14.073.0=-⨯=y . ★★★能力提升★★★11.D 解析:10=x 时,83.145=y ,它是一个估测值,故选D.12.450kg 解析:250ˆ=y+4×50=450. 13.1 解析:i i yy ˆ=故101)()ˆ(112122=-=---=∑∑==n i ini i iyyyR . 14.解析:(1)依题意设y 关于x 的线性回归方程为a x y ˆ5.6ˆ+=, 5)86542(51=++++=x , 50)7050604030(51=++++=y ,∵a x yˆ5.6ˆ+=经过样本点的中心),(,∴a ˆ55.650+⨯=,∴5.17ˆ=a , ∴y 与x 的线性回归方程为5.175.6ˆ+=x y. (2)由(1)的线性模型得y y ˆ-与y y -的关系如下表: 所以∑==+-++-+-=-12222221555.0)5.6(10)5.3()5.0()ˆ(i i iyy. ∑==+++-+-=-51222222100020010)10()20()(i iy y.所以.845.010001551)()ˆ(151251221=-=---=∑∑==i ii i iy yyyR 由于845.021=R ,82.02=R 知221R R >,所以(1)的线性模型拟合效果比较好.。
1.2 回归分析的基本思想及其初步应用知★识★梳★理 1.线性回归模型(1)函数关系是一种 关系,而相关关系是一种 关系. (2)回归分析是对具有 关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据),(11y x ,),(22y x ,…,),(n n y x ,回归直线的斜率和截距的最小二乘估计公式分别为=bˆ ,=a ˆ , 称为样本点的中心.(4)线性回归模型e a bx y ++=,其中a 和b 为模型的未知参数,e 称为 ,在统计中,自变量x 称为 ,因变量y 称为 . 2.残差的概念对于样本点),(,),,(),,(2211n n y x y x y x ⋅⋅⋅而言,它们的随机误差为i e = ,i =1,2,…,n ,其估计值为=i eˆ=,i =1,2,…,,n i eˆ称为相应于点),(i i y x 的残差.★★★基础达标★★★1.下列两个变量之间的关系是相关关系的是( ).A .速度一定时,位移与时间B .单位面积的产量为常数时,土地面积与总产量C .身高与体重D .电压一定时,电流与电阻2.[2014·重庆卷] 已知变量x 与y 正相关,且由观测数据算得样本平均数5.3,3==y x ,则由该观测数据算得的线性回归方程可能是( )A .3.24.0ˆ+=x yB .4.22ˆ-=x yC .5.92ˆ+-=x yD .4.43.0ˆ+-=x y3.设),(,),,(),,(2211n n y x y x y x ⋅⋅⋅是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是 ( ). A .直线l 过点),(y xB .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同4.在一组样本数据),(,),,(),,(2211n n y x y x y x ⋅⋅⋅ (21,,2x x n ≥,…,n x 不全相等)的散点图中,若所有样本点),,2,1)(,(n i y x i i ⋅⋅⋅=都在直线121+=x y 上,则这组样本数据的样本相关系数为 ( ).A .-1B .0C .21D .1 5.[2014·韶关一模] 设某大学的女生体重)(kg y 与身高)(cm x 具有线性相关关系,根据一组样本数据),,2,1)(,(n i y x i i ⋅⋅⋅=,用最小二乘法建立的线性回归方程为71.8585.0ˆ-=x y,给出下列结论:①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心),(y x ; ③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 其中,正确结论的序号是______________.6.(2014·江西重点中学联考)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程9.5467.0ˆ+=x y. 零件数x (个)1020304050加工时间y (min)6275 81 897.(2014·济南模拟)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x (单位:万元)和年教育支出y (单位:万元),调查显示年收入x 与年教育支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:2.015.0ˆ+=x y.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元.8.四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且$2.347 6.423y x =-; ②y 与x 负相关且$3.476 5.648y x =-+; ③y 与x 正相关且$5.4378.493y x =+; ④y 与x 正相关且$ 4.326 4.578y x =--. 其中一定不正确...的结论的序号是 . 9.(2012·福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件) 90 84 83 80 75 68(1)求回归直线方程,其中; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)10.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,算得10180ii x==∑,10120i i y ==∑,101184i i i x y ==∑,1021720i i x ==∑.(Ⅰ)求家庭的月储蓄y 对月收入x 的线性回归方程a x b yˆˆˆ+=; (Ⅱ)判断变量x 与y 之间是正相关还是负相关;(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程a x b yˆˆˆ+=中,∑∑==--=ni ini ii xn xy x n yx b 1221ˆ,x b y aˆˆ-=,★★★能力提升★★★11.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为93.7319.7+=∧x y ,用这个模型预测这孩子10岁时的身高,则正确的叙述是( )A 、身高一定是145.83cmB 、身高在145.83cm 以上C 、身高在145.83cm 以下D 、身高在145.83cm 左右12.若施肥量x (kg )之间的回归直线方程为x y4250ˆ+=,当施肥量为50kg 时,预计小麦产量为.13.若一组观测值),(,),,(),,(2211n n y x y x y x ⋅⋅⋅之间满足i i i e a bx y ++=),,2,1(n i ⋅⋅⋅=,且i e 恒为0,则2R 为.14.关于x 与y 有以下数据:x 24 5 6 8 y3040605070已知x 与y 线性相关,由最小二乘法得5.6=b, (1)求y 关于x 的线性回归方程.(2)现有第二个线性模型:177ˆ+=x y,且相关指数82.02=R ,若与(1)的线性模型比较,哪一个线性模型拟合效果比较好?请说明理由.1.1 回归分析的基本思想及其初步应用答案 知★识★梳★理 1.(1)确定性;非确定性 (2)相关(3)∑∑==---ni ini iix x y yx x 121)())(( x by ˆ- ),(y x (4)随机误差 解释变量 预报变量2.a bx y i i -- i i y y ˆ- a x b y ii ˆˆ-- 3.∑∑==---n i ini i iy yyy1212)()ˆ(1 1★★★基础达标★★★1.C 解析:A 、B 、D 中两个变量间的关系都是确定的,所以是函数关系;C 中的两个变量间是相关关系,对于身高一样的人,体重仍可以不同,故选C.2.A 解析:因为变量x 与y 正相关,则在线性回归方程中,x 的系数应大于零,排除B ,D ;将5.3,3==y x 分别代入A ,B 中的方程只有A 满足,故选A.3.A 解析:由样本的中心(y x ,)落在回归直线上可知A 正确;x 和y 的相关系数表示为x 与y 之间的线性相关程度,不表示直线l 的斜率,故B 错;x 和y 的相关系数应在-1到1之间,故C 错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故D 错.4.D 解析:所有点均在直线上,则样本相关系数最大即为1,故选D. 5.①②③6.68 解析:由已知可计算求出30=x ,而回归直线方程必过点),(y x ,则759.543067.0=+⨯=y ,设模糊数字为a ,则75589817562=++++a ,计算得68=a . 7.0.15 解析:回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.8.①④ 解析:y 与x 正相关,回归直线,直线斜率大于0,y 与x 负相关,回归直线系数小于0. 9.解析:(1)由于5.8)(61654321=+++++=x x x x x x x ,80)(61654321=+++++=y y y y y y y ,所以2505.82080=⨯+=-=x b y a ,从而回归直线方程为25020ˆ+-=x y. (2)设工厂获得的利润为L 元,依题意得)25020(4)25020(+--+-=x x x L25.361)433(2010003302022+--=-+-=x x x .当且仅当25.8=x 时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.10.解析:(I )由题意知10=n ,8108011===∑=n i i x n x ,∑====n i i y n y 1210201, 808107202212=⨯-=-∑=x n xni i, 2428101841=⨯⨯-=-∑=y x n y x ni i .由此作3.08024==b ,4.083.02-=⨯-=-=x b y a , 故所求回归方程为4.03.0-=x y .(II )由于变量y 的值随x 的值增加而增加03.0>=b ,故x 与y 之间是正相关. (III )将7=x 代入回归方程可以预测该家庭的月储蓄为7.14.073.0=-⨯=y . ★★★能力提升★★★11.D 解析:10=x 时,83.145=y ,它是一个估测值,故选D.12.450kg 解析:250ˆ=y+4×50=450. 13.1 解析:i i yy ˆ=故101)()ˆ(112122=-=---=∑∑==n i ini i iy yyyR . 14.解析:(1)依题意设y 关于x 的线性回归方程为a x yˆ5.6ˆ+=, 5)86542(51=++++=x , 50)7050604030(51=++++=y ,∵a x yˆ5.6ˆ+=经过样本点的中心),(y x ,∴a ˆ55.650+⨯=,∴5.17ˆ=a , ∴y 与x 的线性回归方程为5.175.6ˆ+=x y. (2)由(1)的线性模型得y y ˆ-与y y -的关系如下表: i i yy ˆ- -0.5 -3.5 10 -6.5 0.5 y y i --20-101020所以∑==+-++-+-=-12222221555.0)5.6(10)5.3()5.0()ˆ(i i iyy. ∑==+++-+-=-51222222100020010)10()20()(i iy y.所以.845.010001551)()ˆ(151251221=-=---=∑∑==i ii i iy yyyR 由于845.021=R ,82.02=R 知221R R >,所以(1)的线性模型拟合效果比较好.。