13278kj_人教A版高中数学选修2-3 回归分析的基本思想及其初步应用
- 格式:ppt
- 大小:510.50 KB
- 文档页数:32
教学设计3.1 回归分析的基本思想及其初步应用错误!教材分析1.教材的地位和作用高中新课程中增加了有关统计学初步的内容,先后出现在必修3和选修12(文科)、选修23(理科)中.《数学3(必修)》中的“统计”一章,给出了运用统计的方法解决问题的思路.“线性回归分析”是其介绍的一种分析、整理数据的方法.在这一部分中,学习了如何画散点图、利用最小二乘法的思想、利用计算器求回归直线方程、利用回归直线方程进行预报等内容.然而在大量的实际问题中,两个变量不一定都呈线性相关关系,它们可能呈指数关系或对数关系等非线性关系,本节就是在学习了如何建立线性回归模型的基础上,探索如何建立非线性关系的回归模型.通过本节的学习,使学生了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,学会以科学的态度评价两个变量的相互关系,培养学生运用所学内容解决实际问题的能力.2.课时划分《回归分析的基本思想及其初步应用》的教学分四个课时完成.第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果;第二课时:从相关系数、相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用.第一课时教学目标知识与技能通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.过程与方法让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用;通过使用转化后的数据,利用计算器求相关指数,使学生体会使用计算器处理数据的方法.情感、态度与价值观从实际问题中发现已有知识的不足,激发好奇心、求知欲;通过寻求有效的数据处理方法,开阔学生的思路,培养学生的探索精神和转化能力;通过案例的分析,使学生了解回归分析在生活实际中的应用,增强数学“取之生活,用于生活”的意识,提高学习兴趣.重点难点教学重点:理解回归分析的基本思想,掌握求回归直线方程的步骤以及对随机误差e的认识.教学难点:掌握利用回归分析的基本思想处理实际问题的方法,理解随机误差的来源和对预报变量的影响.错误!错误!“名师出高徒"这句谚语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?活动设计:学生独立思考回答问题.学情预测:学生可能会说“有名气的老师不一定能教出厉害的学生".教师提问:为什么?学情预测:两者之间有一定的关系,但不是必然关系,即名师也不一定出高徒,二者之间是相关关系.设计意图:复习两个变量之间的关系,为线性分析做好铺垫.提出问题:我们知道函数关系是一种确定性关系,而相关关系是一种非确定性关系.上面所提的“名师"与“高徒"之间的关系就是相关关系.那么,在一般情况下,人的身高与体重之间是什么关系?试设计一个方案,来分析某大学女大学生的身高与体重之间的关系,并以此为依据来预报身高172 cm的女大学生的体重.学生活动:学生独立思考,小组合作交流讨论.活动结果:可以采用统计的方法解决这一问题,先采用随机抽样的方法,从在校女大学生中抽取样本,记录其身高和体重,然后通过所得数据建立线性回归模型,并根据所得模型来预报身高为172 cm女生的体重.其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.设计目的:合理设计问题,使学生进一步掌握用统计方法解决问题的基本步骤:提出问题、收集数据、分析整理数据、进行预测或决策.错误!若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:。
回归分析的基本思想及其初步应用知识集结知识元线性回归方程知识讲解1.线性回归方程【概念】线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认为关于的回归函数的类型为线性函数.【实例解析】例:对于线性回归方程,则=解:,因为回归直线必过样本中心(),所以.故答案为:58.5.方法就是根据线性回归直线必过样本中心(),求出,代入即可求.这里面可以看出线性规划这类题解题方法比较套路化,需要熟记公式.【考点点评】这类题记住公式就可以了,也是高考中一个比较重要的点.例题精讲线性回归方程例1.'为了增强消防意识,某部门从男职工中随机抽取了50人,从女职工中随机抽取了40人参加消防知识测试,按优秀程度制作了如下2×2列联表:(1)完成2×2列联表,并判断是否有99.9%的把握认为消防知识是否优秀与性别有关;(2)为参加市里举办的消防知识竞赛,该部门举行了预选赛,已知在消防知识测试中优秀的职工通过预选赛的概率为,现从消防知识测试中优秀的职工中选3人参加预选赛,设随机变量X表示这3人中通过预选赛的人数,求X的分布列与数学期望.附:'例2.'为了研究广大市民对共享单车的使用情况,某公司在我市随机抽取了100名用户进行调查,得到如下数据:认为每周使用超过3次的用户为“喜欢骑共享单车”.(1)分别估算男、女“喜欢骑共享单车”的概率;(2)请完成下面的2×2列联表,并判断能否有95%把握,认为是否“喜欢骑共享单车”与性别有关.附表及公式:,其中n=a+b+c+d.'例3.'新高考3+3最大的特点就是取消文理科,除语文、数学、外语之外,从物理、化学、生物、政治、历史、地理这6科中自由选择三门科目作为选考科目.某研究机构为了了解学生对全理(选择物理、化学、生物)的选择是否与性别有关决定从某学校高一年级的650名学生中随机抽取男生、女生各25人进行模拟选科经统计,选择全理的人数比不选全理的人数多10人(1)请完成下面的2×2列联表;(2)估计有多大把握认为选择全理与性别有关,并说明理由.附:,其中n=a+b+c+d'回归分析知识讲解1.回归分析【知识点的知识】1、回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.记为:=x+.求回归直线方程的一般步骤:①作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系;②求回归系数;③写出回归直线方程,并利用回归直线方程进行预测说明.2、回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法.建立回归模型的基本步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系).③由经验确定回归方程的类型.④按一定规则估计回归方程中的参数(最小二乘法);⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,模型是否合适等.例题精讲回归分析例1.'为了增强消防意识,某部门从男职工中随机抽取了50人,从女职工中随机抽取了40人参加消防知识测试,按优秀程度制作了如下2×2列联表:(1)完成2×2列联表,并判断是否有99.9%的把握认为消防知识是否优秀与性别有关;(2)为参加市里举办的消防知识竞赛,该部门举行了预选赛,已知在消防知识测试中优秀的职工通过预选赛的概率为,现从消防知识测试中优秀的职工中选3人参加预选赛,设随机变量X表示这3人中通过预选赛的人数,求X的分布列与数学期望.附:'例2.'(2019春∙玉溪期末)为了研究广大市民对共享单车的使用情况,某公司在我市随机抽取了100名用户进行调查,得到如下数据:认为每周使用超过3次的用户为“喜欢骑共享单车”.(1)分别估算男、女“喜欢骑共享单车”的概率;(2)请完成下面的2×2列联表,并判断能否有95%把握,认为是否“喜欢骑共享单车”与性别有关.附表及公式:,其中n=a+b+c+d.'例3.'(2019春∙玉林期末)新高考3+3最大的特点就是取消文理科,除语文、数学、外语之外,从物理、化学、生物、政治、历史、地理这6科中自由选择三门科目作为选考科目.某研究机构为了了解学生对全理(选择物理、化学、生物)的选择是否与性别有关决定从某学校高一年级的650名学生中随机抽取男生、女生各25人进行模拟选科经统计,选择全理的人数比不选全理的人数多10人(1)请完成下面的2×2列联表;(2)估计有多大把握认为选择全理与性别有关,并说明理由.附:,其中n=a+b+c+d'相关系数知识讲解1.相关系数【知识点的知识】1、概念:相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度.于是,著名统计学家卡尔•皮尔逊设计了统计指标﹣﹣相关系数.相关系数是用以反映变量之间相关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.2、相关系数用r表示,计算公式为其中:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.3、残差:相关指数R2用来刻画回归的效果,其计算公式是在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.显然,R2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好.【解题方法点拨】建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个是预报变量;(2)画出解释变量和预报变量的散点图,观察它们之间的关系;(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程:=x+);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否适当.当回归方程不是形如:=x+时,我们称之为非线性回归方程.例题精讲相关系数例1.对于线性相关系数r,叙述正确的是___;①|r|∈(0,+∞),|r|越大,相关程度越强,反之,相关程度越弱;②r∈(-∞,+∞),r越大,相关程度越强,反之,相关程度越弱;③|r|≤1且|r|越接近于1,相关程度越强;|r|越接近于0,相关程度越弱;④以上说法都不对例2.下列说法中正确的是_____(填序号)。
第四课时教学目标 知识与技能通过典型案例的探究,进一步了解回归分析的基本思想和求回归方程的步骤. 过程与方法通过对回归模型的选择,使学生进一步体会建立回归模型的步骤,体会各个步骤的功能和重要性. 情感、态度与价值观通过案例的分析,培养学生的探索精神,提高对数据的处理能力,并且使学生了解回归分析在生活实际中的应用,增强数学的应用意识,提高学习兴趣.重点难点教学重点:掌握在解决实际问题的过程中寻找更好的模型的方法,总结求回归方程的步骤,会用合适的方法进行模型分析.教学难点:如何根据散点图选择合适的回归模型并对其拟合效果进行检验. 错误! 错误!(1)试建立y 与x 之间的回归方程;(2)若体重超过相同身高男性体重平均值的1。
2倍为偏胖,低于平均值的0。
8为偏瘦,那么这个地区一名身高为175 cm ,体重为82 kg 的在校男生的体重是否正常?学生活动:合作交流,探讨方案并计算检验. 学情预测:方案一:计算相关系数r≈0。
96>0。
75,故y 与x 之间具有很强的线性相关性. 设y 与x 之间的回归方程为错误! =错误! x +错误! ,则错误! =错误!≈0.431 9,错误! =错误!-错误! 错误!≈-25.679,故回归方程为: 错误! =0.431 9x -25.679。
当x =175时,错误! ≈55.15。
因为55.15×1。
2=66。
18<82,故这名男生偏胖.方案二:画出散点图如图所示:由表中数据可得z与x之间的回归直线方程为错误!=0.693+0.020x,则有错误!=e0。
693+0。
020x.当x=175时,错误!≈66.22,由于66.22×1.2=79。
464〈82,所以这名男生偏胖.设计目的:复习回归分析的基本步骤,让学生体会回归思想在实际问题中的应用,在操作过程中锻炼学生的数据处理能力.错误!提出问题:虽然两种解法的结论是一致的,但分析过程同学们可以发现,两种解法中求得的体重平均值是不同的,试分析两种模型哪种更合适?学生活动:讨论交流.学情预测:可能学生会出现争论:一种观点:原因出在选取的回归模型不同,从散点图上观察,选取指数型模型可能更好,得到的答案可信度可能更高.另一种观点:计算x与y的相关系数可得:r≈0。
3.1回归分析的基本思想及其初步应用(共计4课时) 授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。
2、过程与方法 本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R 的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。
3、情感、态度与价值观 通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。
加强与现实生活的联系,以科学的态度评价两个变量的相关系。
教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。
体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。
培养学生运用所学知识,解决实际问题的能力。
三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
导入新课在《数学3》中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为:画散点图求回归直线方程用直线方程进行预报提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?函数关系是一种确定性关系,而相关关系是一种非确定性关系.那么,这节课我们就学习对具有相关关系的两个变量进行统计分析的一种常用方法——回归分析.1.1回归分析的基本思想及其初步应用教学目标知识目标通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.了解回归模型和函数模型的区别.任何模型只能近似描述实际问题.了解残差分析和指标R2的含义.能力目标具有初步应用回归分析的能力.情感目标通过对回归分析的基本思想的学习,能够在现实生活中应用此思想.教学重难点(1)了解线性回归模型与函数模型的差异;(2)了解判断刻画模型拟合效果的方法-相关指数和残差分析.解释残差变量的含义,了解偏差平方和分解的思想.探究对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),我们知道回归直线y=bx+a 的斜率和截距的最小二乘估计分别为ˆˆˆn i i i=1n 2i i=1(x -x)(y -y)b =,(x-x)a=y -bx,∑∑其中n ni ii=1i=111x=x,y=y,(x,y) n n∑∑称为样本点的中心,你能推导出这两个计算公式吗?回归直线过样本点的中心从已经学过的知识我们知道,斜距和斜率分别是使aˆb ˆˆi i i i Q(α,β)=y -y=y -(βx +α)取最小时的值.由于α,β∑n 2i i i=1Q(α,β)=[y -βx -(y -βx)+(y -βx)-α]n 2i i i i i=12{[y -βx -(y -βx)]+2[y -βx -(y -βx)][(y -βx)-α]+[(y -βx)-α]}⨯=∑ni i i=1ni i i=1[y -βx -(y -βx)](y -βx -α) =(y -βx -α)[y -βx -(y -βx)]∑∑注意到n ni i i=1i=1=(y -βx -α)[y -βx -n(y -βx)]∑∑=(y -βx-α)[ny -n βx-n(y -βx)]=0,n n 2i i i i i=1i=12=[y -βx -(y -βx)]+2[y -βx -(y -βx)](y -βx-α)+n(y -βx-α),∑∑继续∑n22i i i=1Q(α,β)=[y -βx -(y -βx)]+n(y -βx -α),因此∑∑∑22nn n22i i i i i=1i=1i=1=β(x -x)-2β(x -x)(y -y)+(y -y)+n(y -βx-α)⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦∑∑∑∑∑∑2nn22i i i i n2i=1i=1i nn 22i=1i i i=1i=12ni i=1(x -x)(y -y)[(x -x)(y -y)]=n(y -βx -α)+(x -x)β--(x -x)(x -x) +(y -y)继续在上式中,后两项和无关,而前两项为非负数,因此要使Q 取得最小值,当且仅当前两项的值均为0,即有∑∑nii i=1n2ii=1(x-x)(y -y)β=(x-x)这正是我们所要推导的公式.α,β例题1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.解答第一步:画散点图020406080150155160165170175180身高/cm体重/k g第二步:求回归方程第三步:代值计算探究身高为172c m的女大学生的体重一定是60.316kg 吗?如果不是,其原因是什么?计算器得:故线性回归方程:当x=172时,0.849.b-85.712,a==ˆˆ85.712.-0.849x y=ˆˆy0.849172-85.712 60.316(kg)=⨯=020406080150155160165170175180身高/cm体重/k g显然,身高172cm 的女大学生的体重不一定是60.316kg ,但一般可以认为她的体重在60.316kg 左右,下图中的样本点和回归直线的相互位置说明了这一点.由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用线性回归模型y=bx+a+e来表示,这里a和b为模型的未知参数,e 是y与bx+a之间的误差.通常e为随机变量,称为随机误差.它的均值E(e)=0,方差D(e)=σ2>0,这样线性回归的完整表达式为y=bx+a+eE(e)=0,D(e)=σ2.注意存在误差的原因(1)随机误差,其大小取决于随机误差的方差. 在线性回归模型中,随机误差e 的方差 2越小,用bx+a 预报真实值y 的精度越高.(2)和为斜率和截距的估计值,它们与真实值a 和b 之间也存在误差.b ˆa ˆ要牢记!探究在线性回归模型中,e 是用bx+a 预报真实值y 的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢?在实际应用中,我们用回归方程a ˆxb ˆyˆ+=中的估计bx+a. 由于随机误差e=y-(bx+a),所以是e 的估计值. 对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )yˆy ˆ-y eˆ=而言,它们的随机误差为e i =y i -bx i -a ,i=1,2,…,n ,其估计值为n,1,,2,...,i a ˆx b ˆy y ˆy e ˆi i i i =--=-=i eˆ称为相应于点(x i ,y i )的残差(residual).要牢记!思考如何发现数据中的错误?如何衡量模型的拟合效果?(1)可以利用残差图来分析残差特性;(2)可以利用.ˆˆnn22i i i2i =1i =1nn 22i i i =1i =1(y -y )(y -y)R =1-=(y -y)(y -y)∑∑∑∑来刻画回归的效果.何为残差图?残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.编号12345671020304050607080-10-20-30-40-50-6090100要牢记!对R 2的理解(1)在含有一个解释变量的线性模型中,R 2恰好等于相关系数r 的平方.(2)对于已经获取的样本数据,R 2表达式中的为确定的数.因此R 2越大,意味着残差平方和越小,即模型的拟合效果越好;反之,越差.∑=n1i 2i )y -(y ∑=n1i 2i)y -(y要牢记!用身高预报体重时,需要注意以下问题(1)回归方程只适用于我们所研究的样本总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出解释变量和预报变量的散点图,观察它们之间的关系;(3)由经验确定回归方程的类型;(4)按一定规则估计回归方程中的参数;(5)得出结果后分析残差图是否有异常,若有异常,检查数据是否有误,或模型是否合适等.要牢记!为了对x 、Y 两个变量进行统计分析,现有以下两种线性模型和试比较哪一个模型拟合的效果更好.例题2关于X 与Y 有如下数据:x 24568y3040605070ˆy=6.5x +17.5ˆy =7x +17分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.ˆ∑∑52i i 2i=1152ii=1(y -y )155R =1-=1-=0.8451000(y-y)22R =1-ˆ∑∑52i i i=152i i=1(y -y )180=1-=0.821000(y -y),84.5%>82%,所以甲选用的模型拟合效果较好.解答课堂小结1.数学知识(1)建立回归模型及残差图分析的基本步骤;(2)不同模型拟合效果的比较方法;(3)相关指数和残差的分析.2. 数学思想数形结合的思想,化归思想及整体思想.3.数学方法数形结合法,转化法,换元法.高考链接1. (2007年浙江)某校有学生2000人,其中高三学生500人,为了了解学生身体素质情况,采用按年级分层抽样的方法,从该学生中抽取一个200人的样本,则样本中高三学生的人数为_________.解析:本题考查抽样的方法. 由已知抽样比200/2000=1/10,故样本中高三学生数为500*(1/10)=50.2.(2007年广东)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y 2.534 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法y=bx+a .求出y关于x的线性回归方程ˆˆ(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?解析:(1)如下图01234567012345产量能耗66.54.5645342.53(2)y x in1i i =⨯+⨯+⨯+⨯=∑= 4.546543x =+++= 3.544.5432.5y =+++=866543i2222n1i 2x =+++=∑=ˆ266.5-4 4.5 3.566.5-63b ===0.786-4 4.586-81⨯⨯⨯ˆˆa=Y-bX =3.5-0.7 4.5=0.35⨯故线性回归方程为y=0.7x+0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35.课堂练习1.选择(1)下列说法中正确的有:()C①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(由函数关系),在散点图上各个点均在一条直线上A. ①②B. ②③C. ①③D. ①②③解析:若r>0,表示两个相关变量正相关,x增大时,y也相应增大,故①正确. r<0,表示两个变量负相关,x增大时,y也相应减小,故②错误. |r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故③正确.(2)对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合A效果最好的模型是()A.模型Ⅰ的相关系数r为0.98B.模型Ⅱ的相关系数r为0.80C.模型Ⅲ的相关系数r为0.50D.模型Ⅳ的相关系数r为0.25解析:根据相关系数的定义和计算公式可知,|r|≦1,且|r|越接近于1,相关程度越大,拟合效果越好;|r|越接近于0,相关程度越小,拟合效果越弱.(3)对有线性相关关系的两个变量建立的回归直线方程中,回归系数()A.可以小于0 B.小于0 C.能等于0 D.只能等于0a xb y ˆˆˆ+=b ˆ解析: 时,得r=0,这时不具有线性相关性,但能大于0,也能小于0.ˆb0=ˆbA2.解答题(1)现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试中的数学成绩(y),数据如下:学生号12345678910 x12010811710410311010410599108 y84648468696869465771试问这10个学生的两次数学考试成绩是否具有显著性线性相关关系?查表得自由度为10-2=8相应的相关关系临界值由知,两次数学考试成绩有显著性的线性相关关系.∑==101i 2i116584x∑==101i 2i47384y107.8x =68y =73796yx 101i ii∑==易得则相关系数为解答227379610107.868r 0.7506(11658410107.8)(473841068)-⨯⨯=≈-⨯-⨯0.05r 0.6021 =0.05r r >(2)观察两相关量得如下数据:x-1-2-3-4-553421 y-9-7-5-3-115379求两变量间的回归方程.i 12345678910x i -1-2-3-4-553421y i -9-7-5-3-115379x i y i 9141512551512149解答列表:∑∑∑10101022ii iii=1i=1i=1x =0,y =0,=110,=330,=110.y y xx∑∑10i i i=11022i i=1-10x y 110-100b ===1110-100-10y x x x ⨯⨯⨯a =y -bx =0-b 0=0⨯ˆy=x .所求回归直线方程为习题解答1. 画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.2. 分析残差可以帮助我们解决以下几个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错;(2)分析残差图可以发现模型选择是否合适.3.(1)解释变量和预报变量的关系是线性函数关系;(2)R2=1.。