高中数学选修二 北师大版 线性回归方程 教案
- 格式:doc
- 大小:148.50 KB
- 文档页数:5
线性回归方程教学目标:(1)了解非确定性关系中两个变量的统计方法; (2)掌握散点图的画法及在统计中的作用; (3)掌握回归直线方程的实际应用。
教学重点: 线性回归方程的求解。
教学难点: 回归直线方程在现实生活与生产中的应用。
教学过程: 一、复习练习1.下例说法不正确的是( B )A.在线性回归分析中,x 和y 都是变量;B.变量之间的关系若是非确定关系,那么x 不能由y 唯一确定;C.由两个变量所对应的散点图,可判断变量之间有无相关关系;D.相关关系是一种非确定性关系.2.已知回归方程81.05.0ˆ-=x y,则x =25时, y 的估计值为__11.69____. 3.三点)24,11(),20,7(),10,3(的线性回归方程是 ( D ) A x y 75.175.1ˆ-= B x y 75.575.1ˆ+=C x y 75.575.1ˆ-=D x y 75.175.1ˆ+=4.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下: 模型1:x y 46+=:;模型2:e x y ++=46. (1)如果1,3==e x ,分别求两个模型中y 的值; (2)分别说明以上两个模型是确定性模型还是随机模型. 解 (1)模型1:y=6+4x=6+4×3=18; 模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x 值一定得到相同的y 值.所以是确定性模型;模型2中相同的x 值,因 δ不同,且δ为误差项是随机的,所以模型2是随机性模型。
二、典例分析例1、一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:零件个数x (个) 10 20 30 40 50 607080 90 100加工时间y (分)62 68 75 81 89 95 102 108 115 122请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程.解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:1010102211155,91.7,38500,87777,55950i i i i i i i x y x y x y ========∑∑∑1011022211055950105591.70.66838500105510i ii i i x y x yb x x==--⨯⨯∴==≈-⨯-∑∑91.70.6685554.96a y bx =-=-⨯≈因此,所求线性回归方程为0.66854.96y bx a x =+=+ 例2、已知10只狗的血球体积及红血球数的测量值如下:x45 42 46 48 42 35 58 40 39 50y6.53 6.30 9.527.50 6.99 5.90 9.49 6.20 6.598.72x (血球体积,ml ),y (红血球数,百万)(1)画出上表的散点图;(2)求出回归直线方程并画出图形.解:1(45424648423558403950)44.5010x =+++++++++=1(6.53 6.309.527.50 6.99 5.909.49 6.20 6.558.72)10y =+++++++++=7.37设回归直线方程为y bx a =+则10110221100.17510i ii ii x y x yb xx==-==-∑∑ a y bx =-= -0.418所以所求回归直线的方程为0.1750.148y x =-例3、以下是收集到的新房屋销售价格y 与房屋的大小x 的数据:房屋大小x (2m ) 80 105 110 115] 135 销售价格y (万元)18.42221.624.829.2(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程,并在散点图中加上回归直线;(3)计算此时(,)Q a b 和(2,0.2)Q 的值,并作比较. 解:(1)(2)55115,545,109,116,23.2,i i i i n x x y y =======∑∑5521160952,12952ii i i i xx y ====∑∑25129525451160.1962,23.20.1962109 1.8166560952545b a ⨯-⨯=≈=-⨯≈⨯-所以,线性回归方程为0.1962 1.8166y x =+ (3) (1.8166,0.1962) 5.171,(2,0.2)7.0Q Q ≈≈由此可知,求得的 1.8166,0.9162a b ==是函数Q(a,b)取最小值的a ,b 值.三、课堂练习1.为了考察两个变量x 和y 之间的线性相关性,甲乙两位同学各自独立做了10次和15次实验,并且利用线性回归直线分别为1l ,2l ,已知两人获得的实验数据中,变量x 和y 的数据平均值都相等,且分别为s,t 那么下例说话正确的是( )A .直线1l 和2l 一定有公共点(s,t)B .直线1l 和2l 相交,但交点不一定是(s,t)销售价格y(万元)05101520253035050100150销售价格y(万元)C .必有1l // 2lD .1l 和2l 与必定重合2.已知关于某设备的使用年限x 与所支出的维修费用y (万元),有如下统计资料: 使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0设y 对x 程线性相关关系.试求:(1)线性回归方程ˆy bx a =+的回归系数a,b ; (2)估计使用年限为10年时,维修费用多少?四、回顾小结:求线性回归方程的步骤:(1)x y (2)x y x y (3)i i i i 计算平均数、,计算与的积,求,计算,,∑∑∑x y ii 22(4)将上述有关结果代入公式,求b ,a 写出回归直线方程. 五、课外作业: 课本第82页第9题.。
高二数学教案《线性回归》【教案一】教学目标【知识和技能】1.能识别两个变量间关系是确定性关系还是相关关系。
2.会画散点图,并能利用散点图判断是否存在回归直线。
3.知道如何系统地处理数据。
掌握回归分析的一般步骤。
4.能运用E某cel表格处理数据,求解线性回归直线方程。
5.了解最小二乘法的思想,会根据给出的公式求线性回归方程。
6.培养收集数据、处理数据的能力;对具有相关关系的一组变量中应变量发展趋势的预测估计能力。
【过程和方法】1.使学生在经历较为系统的数据处理的全过程中学会如何处理数据。
2.提高学生运用所学知识与方法、运用现代化信息技术解决实际问题的能力。
【情感、态度和价值观】1.认识到线性回归知识在实际生活中的实践价值,感受生活离不开数学。
2.体验信息技术在数学探究中的优越性。
3.增强自主探究数学知识的态度。
4.发展学生的数学应用意识和创新意识。
5.培养学生的严谨、合作、创新的学习态度和科学精神。
【教学重点、难点】线性回归分析的基本思想;运用E某cel表格处理数据,求解回归直线方程。
【教学课型】多媒体课件,网络课型教学内容学生已经学习了初步的统计知识,如抽样方法,对样本进行特征量(均值、方差)分析;具备一定的比较、抽象、概括能力;具备基本计算机操作技能;对现实生活中的线性相关关系有一定的感性认识。
线性回归问题涉及的知识有:描点画散点图,一次函数、二次函数的知识,最小二乘法的思想及其算法问题,运用E某cel表格处理数据等。
教学资源教师围绕本课知识设计一个问题(如小卖部热珍珠奶茶的销售问题),这个问题必须应用所预期的学科知识才能解决,又与学生的先前经验密切相关。
教师准备四个教学课件:学生阅读(幻灯片)、教师讲解(幻灯片)、课堂练习(E某cel)、线性回归直线的探究(几何画板)。
每位同学带好课本和教师预期分发的一份学案。
学案主要包括设计的引入问题,教学过程中所遇到的主要问题,推导回归直线方程的公式的计算表格,运用E某cel表格处理数据的操作步骤,课堂练习以及作业,教学评价等。
线性回归分析教案一、引言线性回归是一种常用的统计分析方法,用于研究两个连续型变量之间的线性关系。
在实际应用中,线性回归广泛用于经济学、社会学、医学等领域,用于预测和解释变量之间的关系。
本教案将介绍线性回归的基本原理、模型设定和参数估计方法,以帮助学生深入理解线性回归的概念和应用。
二、教学目标1.了解线性回归的基本原理和假设。
2.学习线性回归模型的设定和参数估计方法。
3.能够使用统计软件实现线性回归模型的计算。
4.掌握线性回归模型的解释和预测能力。
5.理解线性回归模型的运用场景和限制条件。
三、教学内容1.线性回归的基本原理1.1 线性关系的定义1.2 线性回归模型的基本假设1.3 线性回归模型的优点和局限性2.线性回归模型的设定2.1 简单线性回归模型及其参数估计2.2 多元线性回归模型及其参数估计2.3 线性回归模型的变量选择方法3.线性回归模型的参数估计3.1 最小二乘法估计3.2 参数估计的性质和假设检验3.3 模型评估和诊断4.线性回归模型的解释和预测4.1 理解回归系数的含义4.2 判断模型对观测数据的拟合程度4.3 利用回归模型进行预测五、教学方法1.理论讲解与示范通过讲解线性回归的基本原理和模型设定,带领学生了解线性回归模型的概念和应用。
同时,通过实例演示和统计软件的使用展示线性回归模型的计算过程。
2.实践操作与练习在课堂上,安排学生利用统计软件进行线性回归模型的实际计算,并结合具体数据集进行模型拟合和预测操作。
通过实际操作提高学生对线性回归模型的应用能力。
3.案例分析与讨论将一些实际问题、经济数据或社会调查数据与线性回归模型结合,引导学生对模型结果进行解读和讨论,提高学生对模型解释和应用的理解。
六、教学评估1.课堂小测验在课程结束前进行一次小测验,考察学生对线性回归的理解程度和应用能力。
2.作业和项目布置线性回归相关的作业和项目,要求学生独立完成线性回归模型的建立和分析,以检验学生对所学知识的掌握程度。
3.1回归分析(教案)教学目标:1. 通过对统计案例的探究,会对两个随机变量进行线性回归分析.2. 理解相关系数的含义,会计算两个随机变量的线性相关系数,会通过线性相关系数判断它们之间的线性相关程度.3. 通过对数据之间散点图的观察,能够对两个随机变量进行可线性化的回归分析. 教学重点:散点图的画法,回归直线方程的求解方法;相关系数的求法与应用. 教学难点回归直线方程的求解方法; 相关系数的求法与应用; ;能够对两个随机变量进 行可线性化的回归分析. 教法:启发诱导式第一课时(回归分析)教学过程 一、问题情境客观事物是相互联系的过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系 二、新授在必修课程中,我们已经学习了最小二乘法,并会建立变量之间的线性回归方程.引导学生阅读教材,然后完成知识点的填充.(一) 知识讲解 1.相关关系的概念两个变量间的关系可分为确定关系和非确关系,前者又称为函数关系,后者又称为相关关系.2.回归方程设有n 对观测数据(,)i i x y (1,2,3,,)i n = ,根据线性回归模型,对于每一个i x ,对应的随机偏差项()i i i y a bx ε=-+,我们希望总偏差越小越好,即要使21nii ε=∑越小越好.所以,只要求出使21(,)()niii Q y x αββα==--∑取得最小值时的α,β值作为a ,b 的估计值,记为 a,b . 注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离.用什么方法求 a,b ? 回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求a ,b 的方法:最小二乘法.利用最小二乘法可以得到 a,b 的计算公式为 1122211()()()()n ni i i i i i n ni ii i x x y y x y nx y b x x x n x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ , 其中11n i i x x n ==∑,11ni i y y n ==∑由此得到的直线 y a bx =+ 就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中 a ,b 分别为a ,b 的估计值, a 称为回归截距,b 称为回归系数, y 称为回归值.(二) 举例应用 例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.解:为了简化数据,先将年份减去1949,并将所得值用x 表示,对应人口数用y表示,得到下面的数据表:作出11个点(),x y 构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系.根据公式(1)可得14.453,527.591.b a ⎧≈⎪⎨≈⎪⎩ 这里的 ,ab 分别为,a b 的估 计值,因此线性回归方程 为 527.59114.453y x =+由于2004年对应的55x =,代入线性回归方程 527.59114.453y x =+可得1322.506y =(百万),即2004年的人口总数估计为13.23亿. 对应练习:课本6P 练习小结:1.线性相关的概念;2.理解回归方程的系数来历;3.求回归方程的步骤. 作业:课本15P 习题1-1,1题的第二问第二节相关系数教学过程: 一.问题情境对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?为了回答这个问题,我们需要对变量x 与y 的线性相关性进行检验(简称相关性检验),那么就需要学习相关系数来处理. 二、新授(一)知识点讲解1.相关系数的计算公式:对于x ,y 随机取到的n 对数据(,)i i x y (1,2,3,,)i n = ,样本相关系数r 的计算公式为()()nniii ix x y y x y nx yr ---==∑∑.()22.相关系数r 的性质: (1)||1r ≤;(2)||r 越接近与1,x ,y 的线性相关程度越强; (3)||r 越接近与0,x ,y 的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. (二) 应用举例要分析学生高中入学的数学成绩对高一年级数学学习的影响,在高一年级学生中随机抽取10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩如下表:(2)如果x 与y 之间具有线性相关关系,求线性回归方程;(3)若某学生入学数学成绩为80分,试估计他高一期末数学考试成绩.解:(1)因为()16367767010x =⨯+++= ,()16578757610y =⨯+++= , 101()()1894xy i i i L x x y y ==--=∑,2101()2474xx i i L x x ==-=∑,1021()2056yy i i L y y ==-=∑.因此求得相关系数为10()()0.840iix x y y L r --===∑.结果说明这两组数据的相关程度是比较高的;点评:解决这类问题的解题步骤:(1)作出散点图,直观判断散点是否在一条直线附近; (2)求相关系数r ;(3)计算 a,b ,写出线性回归方程. 对应练习:课本9P 练习五.回顾小结:1.相关系数的计算公式与回归系数b计算公式的比较; 2.相关系数的性质;3.探讨相关关系的基本步骤.六.课外作业:1516P -习题1-1第2题.第三节可线性化的回归分析教学过程: 一.问题情境前面我们学习的是利用线性回归方程与相关系数判断两个随机变量间的相关关系的,那么能否利用散点图将其他的常见函数拟合成线性关系呢?这也是我们本节课将要学习的可线性化的回归分析问题 二、新授(一)知识点讲解在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1)b y a x =+,令'y y =,1'x x=,则有''y a bx =+. (2)by ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+.(3)bx y ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+. (4)b xy ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.(二)应用举例某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本x (万元)与人均产出y (万元)的数据:(1)设y 与x 之间具有近似关系b y ax ≈(,a b 为常数),试根据表中数据估计a 和b 的值; (2)估计企业人均资本为16万元时的人均产出(精确到0.01).分析:根据x ,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对b y ax ≈的两边取对数,就能将其转化为线性关系.解(1)在b y ax ≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,lg x X =,则z A bX ≈+.相关数据计算如图327--所示.仿照问题情境可得A ,b 的估计值 A ,b 分别为 0.2155,1.5677,A b ⎧=-⎪⎨=⎪⎩ 由 lg 0.2155a =-可得 0.6088a≈,即a ,b 的估计值分别为0.6088和1.5677.(2)由(1)知 1.56770.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P页)当16x =时, 1.56770.60881647.01y =⨯≈(万元),故当企业人均资本为16万元时,人均产值约为47.01万元. 2.练习:13P 练习. 五.回顾小结:1. 线性回归模型y a bx ε=++与确定性函数y a bx =+相比,它表示y 与x 之间是统计相关关系(非确定性关系)其中的随机误差ε提供了选择模型的准则以及在模型合理的情况下探求最佳估计值 a,b 的工具; 2. 线性回归方程 y abx =+ 中 a ,b 的意义是:以 a 为基数,x 每增加1个单位,y 相应地平均增加b个单位; 3.求线性回归方程的基本步骤. 六.课外作业:16P 第4题.。
1.3可线性化的回归分析铜鼓中学数学备课组 3课时 多媒体教学创设问题情境,提出3个问题⇒引导学生解答问题,引出数列的有关概念⇒通过例1及变式训练,使学生进一步认识数列的有关概念⇒通过例2及变式训练,使学生掌握数列的通项公式的求法⇒通过例3及互动探究,让学生掌握利用通项公式确定数列的项的问题⇒完成当堂双基达标,巩固所学知识并进行反馈矫正⇒归纳整理,进行课堂小结,整体认识所学知识1.函数y =ax b 两边取自然对数,结果如何? 【提示】 ln y =ln a +b ln x .2.对上述问题作适当变换,得出一个线性函数. 【提示】 令u =ln y ,v =ln x ,c =ln a ,则u =c +b v . 3.作变换,将函数y =a e bx 线性化. 【提示】 ∵y =a e bx , ∴ln y =ln a +bx ,∴作变换:u =ln y ,c =ln a ,则u =c +bx . 4.作变换,将函数y =a e bx 线性化.【提示】 ∵y =a e b x ,∴ln y =ln a +bx,∴作变换u =ln y ,c =ln a ,v =1x ,则u =c +b v .5.作变换,将函数y =a +b ln x 线性化. 【提示】 ∵y =a +b ln x , ∴作变换v =ln x ,则y =a +b v .对于非线性回归模型一般可转化为线性回归模型,从而得到相应的回归方程.常见的有: (1)幂函数曲线y =ax b ,则作变换u =ln_y ,v =ln_x ,c =ln_a ,得线性函数u =c +b v . (2)指数曲线y =a ·e bx ,则作变换u =ln y ,c =ln a ,得线性函数u =c +b v . (3)倒指数曲线y =a e b x ,则作变换u =ln y ,c =ln a ,v =1x ,得线性函数u =c +b v .(4)对数曲线y =a +b ln x ,则作变换v =ln x ,得线性函数y =a +b v .某地今年上半年患某种传染病人数y 与月份x 之间满足的函数关系模型为y =a e bx ,确定这个函数解析式.【思路探究】 函数模型为指数型函数,可转化为线性函数,从而求出. 【自主解答】 设u =ln y ,c =ln a ,则u =c +bx . 由已知得下表:∑i =1x i =21,∑i =1u i ≈25.361 1,∑i =1x 2i =91,∑i =1u 2i ≈107.346 7,∑i =1x i u i ≈90.343 8,x =3.5,u ≈4.226 9,b =∑6i =1x i u i -6x u∑6i =1x 2i -6x2=90.343 8-6×3.5×4.226 991-6×3.52≈0.090 2,c =u -b x =4.226 9-0.090 2×3.5=3.911 2, ∴u =3.911 2+0.090 2x , ∴y =e 3.911 2·e 0.090 2x .基础函数模型为指数函数型,可两边取对数转化为线性函数关系式,求出回归方程.在彩显影中,由经验可知:形成染料光学密度y 与析出银的光学密度x 由公式y =A e b x (b <0)表示.现测得试验数据如下:【解】 由题意知,对于给定的公式y =A e b x (b <0)两边取自然对数,得ln y =ln A +bx .与线性回归方程相对照可以看出,只要取u =1x ,v =ln y ,a =ln A ,就有v =a +bu .这是v 关于u 的线性回归直线方程,对此我们再套用相关性检验,求出回归系数b 和a .题目中所给出的数据由变量置换u =1x,v =ln y ,得到如下数据:可以求得:r ≈0.998.由于|r |≈0.998接近于1,可知u 和v 具有很强的线性相关性.再求出b ≈-0.146,a ≈0.548.所以A =e a=e 0.548,y =e0.548e -0.146x =e0.548-0.146x.、某地区不同身高的未成年男性的体重平均值如下表:(2)能否建立适当的函数模型使它能比较近似地反映这个地区未成年男性体重y kg与身高x cm的函数关系?试写出这个函数模型的解析式;(3)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高为175 cm,体重为78 kg的在校男生的体重是否正常?【思路探究】可先依据表中数据画出散点图,从图中观察探究其适合那种函数模型,确定函数模拟,作变换转化为有线性相关关系的量,再由公式计算所求量.【自主解答】(1)作出散点图如下(2)从散点图可看出函数曲线符合指数曲线y=a e bx.设u=ln y,c=ln a,则u=c+bx.∑i =1x i =1 380,∑i =1u i =35.542 8,∑i =1x 2i =173 000,∑i =1x i u i =4 369.283,x=115,u =2.961 9,b =∑12i =1x i ui -12x u∑12i =1x 2i -12x2=4 369.283-12×115×2.961 9173 000-12×1152≈0.019 6,c =u -b x =2.961 9-0.019 6×115=0.7079,∴u =0.707 9+0.019 6x ,y =e 0.707 9·e 0.019 6x . (3)∵x =175时,u =4.137 9, ∴y =e u =e 4.137 9≈62.671 1.7862.671 1≈1.245>1.2,此男子偏胖.1.在实际问题中,当变量之间的相关关系不是线性相关关系时,不能用线性回归方程描述它们之间的相关关系,需要进行非线性回归分析.2.可线性化的回归分析:非线性回归问题的非线性回归方程一般很难求,因此把非线性回归化线性回归是解决问题的好方法;把非线性回归化为线性回归,再利用线性回归的方法确定参数a 及b 的估计值.寒假中,某同学为组织一次爱心捐款,于2013年2月1日在网上给网友发了张帖子,(2)建立x 与y 的关系,预报回归模型;(3)如果此人打算在2013年2月12日(即帖子传播时间共10天)进行募捐活动,根据上述回归模型,估计可去多少人.【解】(1)散点图略.从散点图可以看出x与y不具有线性相关关系,同时可发现样本点分布在某一个指数函数曲线y=k e mx的周围,其中k、m是参数.(2)对y=k e mx两边取对数,把指数关系变成线性关系.令z=ln y,则变换后的样本点分布在直线z=bx+a(a=ln k,b=m)的周围,这样就可以利用线性回归模型来建立x与y之间的非线性回归方程了,数据可以转化为求得回归直线方程为z=0.620x+1.133,∴y=e0.620x+1.133.(3)截止到2013年2月12日,x=10,此时y=e0.620×10+1.133≈1 530(人).∴估计可去1 530人.转化与化归思想在可线性化的回归分析中的应用下表为收集到的一组数据:(2)建立x与y的关系,预报回归模型;(3)利用所得模型,预报x=40时y的值.【思路点拨】(1)可直接依据表中数据画出散点图;(2)可利用换元法,将两个变量转化为两个新的变量且成线性关系;得出关系式,再转化为x,y的关系式;(3)利用(2)中的式子,即可求出.【规范解答】(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1e c2x的周围,其中c1、c2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z=ln y,则有变换后的样本点应分布在直线z=bx+a,a=ln c1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x 21232527293235 z 1.946 2.398 3.045 3.178 4.190 4.745 5.784 求得回归直线方程为z=0.272x-3.849,∴y=e0.272x-3.849.(3)当x=40时,y=e0.272x-3.849≈1 131.在寻找两变量之间的关系时,通过散点图先确定其关系满足的函数模型,如果不满足线性关系,则通过换元转化为线性关系,求出新元的关系式,再转化为原来的两个变量的关系.可化为线性回归的几种常用曲线 (1)幂函数曲线y =ax b ; (2)指数函数曲线y =ak bx ; (3)倒指数曲线y =a ·e bx ;(4)对数曲线y =a +b ln x .1.对于指数曲线y =a e bx 方程,令u =ln y ,c =ln a 经过非线性化回归分析之后,可以转化成的形式为( )A .u =c +bxB .u =b +cxC .y =b +cxD .y =c +bx【解析】 对指数曲线y =a e bx 方程两边同时取对数,然后将u =ln y ,c =ln a 代入,不难得出u =c +bx .【答案】 A2.指数曲线y =a e bx 的图像可以是( )【解析】 ∵y =a e bx 为指数曲线, ∴y >0恒成立,∴排除选项C. 又∵x ∈R ,∴A 、D 错误. 【答案】 B3.x ,y 的取值如下表:【解析】 作出散点图从图中可以看出,可选用y =x 2来进行拟合. 【答案】 y =x 24.在试验中得到变量y 与x 数据如下表:由试验知,y 与1x 之间具有线性相关关系,试求y 与x 之间的回归曲线方程,并预测当x 0=0.038时y 0的值.【解】 令u =1x,由题目所给数据可得下表所示的数据:计算得b =0.29,a =34.32, 所以y =34.32+0.29u . 所求曲线方程为y =34.32+0.29x. 当x 0=0.038时,y 0=34.32+0.290.038≈41.95.一、选择题1.倒指数曲线y =a e bx的图像为( )【解析】 y =a e bx ,当a >0,b >0时,图像为A.【答案】 A 2.有下列说法:①线性回归分析就是由样本点去寻找一条直线贴近这些样本点的数学方法; ②利用样本点的散点图可以直观地判断两个变量之间的关系是否是线性相关关系; ③通过回归方程y =bx +a 及其回归系数b ,可以估计和观测变量的取值和变化趋势; ④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.其中正确命题的个数是( ) A .1个 B .2个 C .3个D .4个【解析】 由线性回归分析的意义知①、②、③正确,④错误. 【答案】 C3.幂函数曲线y =x b ,当b >1时的图像为( )【解析】 当b >1时,图像为选项A ,当0<b <1时为选项B ,当b <0时为选项C ,当b =1时为选项D.【答案】 A4.对于回归分析,下列说法错误的是( )A .在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B .线性相关系数可以是正的或负的C .回归分析中,如果r 2=1或r =±1,说明x 与y 之间完全线性相关D .样本相关系数r ∈(-∞,+∞)【解析】 由相关系数性质知,B 、C 正确.A 正确,因为拟合函数不是唯一的.D 错,因为相关系数|r |≤1.【答案】 D5.可以对下列数据x 、y 之间的关系进行拟合的函数( )A.y =2+13xB .y =2e xC .y =2e 1xD .y =2+ln x【解析】 ∵y =2e 1x为减函数,∴选项C 错.又∵y =2e x 的增长速度极快,∴选项B 错误.由增长速度可知A 错,D 正确. 【答案】 D 二、填空题6.x ,y 的取值如下表:则x ,y 【解析】 由x 与y 值的对应关系可知:该函数应为指数函数,由其近似值可知y =2x较合适.【答案】 y =2x7.在研究硝酸钠的可溶性程度时,观察它在不同温度的水中的溶解度,得观测结果如下:【解析】 将表中数据代入公式,可得b =∑5i =1x i y i -5x y∑5i =1x 2i -5x2≈0.880 9.【答案】 0.880 9 8.下列说法①当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系;②把非线性回归化为线性回归为我们解决问题提供一种方法;③当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系; ④当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决.其中正确的序号为________.【解析】 此题考查解决线性相关问题的基本思路,当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系,只是要通过适当的变换使其转化为线性相关问题,用线性回归分析问题来解决.因此②③④正确,①错误.【答案】 ②③④ 三、解答题9.某种书每册的成本费y 元与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费y 与印刷册数的倒数1x 之间是否具有线性相关关系?如有,求出y对x 的回归方程.【解】 把1x 置换成z ,则有z =1x ,从而z 与y 的数据为:∴有z =110(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1y =110(10.15+5.52+4.08+2.85+2.11+1.62+1.41+1.30+1.21+1.15)=3.14, ∑10i =1z 2i =12+0.52+0.3332+0.22+0.12+0.052+0.0332+0.022+0.012+0.0052≈1.415, ∑10i =1y 2i =10.152+5.522+4.082+2.852+2.112+1.622+1.412+1.302+1.212+1.152=171.803,∑10i =1z i y i =1×10.15+0.5×5.52+0.333×4.08+0.2×2.85+0.1×2.11+0.05×1.62+0.033×1.41+0.02×1.30+0.01×1.21+0.005×1.15≈15.221,∴r ≈0.999 8.∵|r |≈0.999 8接近于1,∴z 对y 具有很强的线性相关关系. ∴b ≈8.976,a ≈1.12.∴所求的z 与y 的回归方程为y =8.976z +1.12. 又∵z =1x ,∴y =8.976x+1.12.10.在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y 与x 【解】 画出散点图如下图1所示,观察可知y 与x 近似是反比例函数关系. 设y =k x (k ≠0),令t =1x,则y =kt .图1 图2可得到y 关于t 的数据如下表:画出散点图如图2所示,观察可知t 和y 有较强的线性相关性,因此可利用线性回归模型进行拟合,易得:b =∑5i =1t i y i -5t y∑5i =1t 2i -5t2≈4.134 4,a =y -b t ≈0.791 7, 所以y =4.134 4t +0.791 7, 所以y 与x 的回归方程是y =4.134 4xt +0.791 7 11.为了研究某种细菌随时间x 变化繁殖的个数y ,收集数据如下:(1)(2)试求回归方程.【解】(1)根据数据得散点图,如图所示.(2)根据数的散点图可以发现样本点不是分布在某一条直线附近,而是分布在一条曲线附近.根据已学的函数知识,可以发现样本点分布在某一指数型函数y=c1e c2x(c1>0,c2>0)附近,则将函数两边取对数得ln y=c2x+ln c1,则令u=ln y,得u=c2x+ln c1,根据数据可得x和u的数据表:由上面x和u的数据表可得x和u的散点图,如下图所示.从图中可以发现x和u之间有很强的线性相关关系,因此可以用线性回归模型来拟合它们之间的关系.根据公式得到线性回归方程为:u=1.112+0.690 9x,即ln y=1.112+0.690 9x,则得y=e0.690 9x+1.112.故我们可以利用y=e0.690 9x+1.112来描述天数x与繁殖个数y之间的关系.(教师用书独具)(12分)在一化学反应过程中某化学物质的反应速度y(单位:g/分)与一种催化剂的量x(单位:g)有关,现收集了8组数据列于表中,试建立y与x之间回归方程.【思路探究】(1)由表中数据可作出散点图,并通过散点图来分析两个变量间的关系;(2)两个变量间的关系是非线性的,要结合函数模型的应用来选择函数,然后利用变量代换化为直线型,从而解决问题.【自主解答】根据收集的数据作散点图:2分根据x与y的散点图也可以认为样本点集中在某一条指数型函数曲线y=c1e c2x的周围. 4分令z=ln y,则z=c2x+ln c1,即变换后样本点应该分布在直线z=bx+a(a=ln c1,b=c2)的周围,由y与x数据表可得z与x的数据表:作出z与x的散点图8分由散点图可观察到样本数据点大致在一条直线上,所以可用线性回归方程来拟合它.由z与x数据表,得到线性回归方程,z=0.181 2x-0.848 5,10分所以非线性回归方程为y=e0.181 2x-0.848 5. 11分因此,该化学物质反应速度对催化剂的量的非线性回归方程为y=e0.181 2x-0.848 5.12分2.解决非线性回归分析问题的方法步骤(1)确定变量:确定变量x,y;(2)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;(3)变量置换:通过变量置换把非线性问题转化为线性回归问题;(4)写出非线性回归方程.为了研究某种细菌繁殖的个数y(个)与时间x(天)的关系,收集数据如下:(2)建立时间与细菌繁殖个数之间的回归方程.【解】(1)以时间为横轴,细菌繁殖个数为纵轴绘制散点图如下.由图猜想样本点分布在一条指数函数曲线y=c e bx的周围.(2)令z=ln y,a=ln c,则z=bx+a且变换后的样本数据表如下:y=e0.69x+1.112.拓展阅读脚印与统计在这个逐步实现现代化的社会里,统计信息越来越多,这促使人们去探索对一些统计信息进行分析、推断的方法.在《福尔摩斯探案集》中著名的一个探案故事《血字的研究》有这样的情节:福尔摩斯应英格兰探长的求助,帮忙侦破一起杀人案.一到案发现场,福尔摩斯就开始仔细地搜寻罪犯的脚印,其理由是他可以根据一个人的脚印长度来估计他的身高.这里就用到了统计的有关知识.因为,统计学家经过对大量数据的统计分析得出这样的结论:一个人的身高大约是其脚印长度的7倍.另外步幅长度与身高也有一定关系.人的脚印与人的体形、性别也有一定的关系.人脚的大小和手臂前臂的长度差不多,如果知道一个人的身高,就可以算出他脚印的长度;如果不知道一个人的身高,可以通过他脚印的长度推算出他的身高.《血字的研究》是柯南道尔于1886年写成,可见有关根据人的脚印长度估计其身高的方法在那时已经初步成型.由于这一方法对于破案起着至关重要的作用,所以在犯罪率不断升高的今天,刑警到达案发现场的第一件事情也是仔细地搜寻罪犯的脚印.。
线性回归方程1.下列关系中,是相关关系的为(填序号).①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号).①直线l1,l2有交点(s,t) ②直线l1,l2相交,但是交点未必是(s,t)③直线l1,l2由于斜率相等,所以必定平行④直线l1,l2必定重合3.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线yˆ=bˆx+aˆ及回归系数bˆ,可以估计和预测变量的取值和变化趋势.④任一组数据都有回归直线方程其中正确命题的序号是 .4.已知回归方程为yˆ=0.50x-0.81,则x=25时,yˆ的估计值为 .5.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是 .6.回归方程yˆ=1.5x-15,则下列说法正确是 .①y=1.5x-15 ②15是回归系数a③1.5是回归系数a ④x=10时,y=07.某地区调查了2~9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为yˆ=8.25x+60.13,下列叙述正确的是 .①该地区一个10岁儿童的身高为142.63 cm②该地区2~9岁的儿童每年身高约增加8.25 cm③该地区9岁儿童的平均身高是134.38 cm④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高8.三点(3,10),(7,20),(11,24)的回归方程是 .9.某人对一地区人均工资x(千元)与该地区人均消费y(千元)进行统计调查,y与x有相关关系,得到回归直线方程yˆ=0.66x+1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为 .10.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑=81i ix=52,∑=81i iy=228,∑=812i i x =478,∑=81i ii yx =1 849,则其线性回归方程为 .11.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 .12.已知关于某设备的使用年限x 与所支出的维修费用y (万元),有如下统计资料:若y 对x 呈线性相关关系,则回归直线方程yˆ=b ˆx +a ˆ表示的直线一定过定点.13 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨)标准煤的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程yˆ=b ˆx +a ˆ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)3.某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少?(3)假定产量为6 000件时,单位成本为多少元?一、填空题二、解答题9.期中考试结束后,记录了5名同学的数学和物理成绩,如下表:(1)数学成绩和物理成绩具有相关关系吗?(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点.10.(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线.11.某公司利润y与销售总额x(单位:千万元)之间有如下对应数据:(1)画出散点图;(2)求回归直线方程;(3)估计销售总额为24千万元时的利润.,12.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大?。
高中数学线性回归概念教案1. 理解线性回归的基本概念和原理2. 掌握线性回归的计算方法和应用技巧3. 能够通过实例理解线性回归在实际问题中的应用教学重点:1. 线性回归的定义和特点2. 最小二乘法求解线性回归方程3. 线性回归在实际问题中的应用教学难点:1. 线性回归的计算方法和应用技巧2. 如何通过实例理解线性回归在实际问题中的应用教学准备:1. 教学课件2. 实例数据3. 计算工具、软件教学内容:一、线性回归的定义和特点1. 线性回归是一种用于分析变量之间线性关系的统计方法2. 线性回归模型可以表示为y = β0 + β1x1 + β2x2 + ... + βnxn + ε3. 线性回归的基本假设包括线性关系、正态分布、独立性等二、最小二乘法求解线性回归方程1. 最小二乘法是一种常见的求解线性回归方程的方法2. 最小二乘法的核心思想是使残差平方和最小化来求解回归系数3. 求解线性回归方程的步骤包括建立模型、计算回归系数、评估模型等三、线性回归在实际问题中的应用1. 线性回归可以用于预测和控制变量之间的关系2. 实际问题中的线性回归应用包括销售预测、市场分析等3. 通过实例数据进行线性回归分析,可以更好地理解线性回归的应用技巧和方法教学步骤:1. 引入线性回归的基本概念和原理,并进行概念讲解2. 通过实例数据演示最小二乘法求解线性回归方程的方法3. 分组讨论,学生分析实际问题中的线性回归应用4. 带领学生进行实例数据分析和线性回归计算5. 总结课程内容,答疑解惑教学评估:1. 学生课堂表现2. 课后作业完成情况3. 学生对线性回归应用的理解和运用能力教学反思:1. 教学内容是否贴近实际应用2. 学生对线性回归的理解程度和应用能力3. 教学方法和手段是否合理有效。
高中数学线性回归教案教学目标:
1. 了解线性回归的基本概念和原理;
2. 学会使用最小二乘法进行线性回归分析;
3. 掌握线性回归模型的建立和应用。
教学重点:
1. 理解线性回归的意义;
2. 学会求解线性回归模型中的系数;
3. 掌握线性回归模型的应用。
教学难点:
1. 学会使用最小二乘法求解线性回归系数;
2. 理解线性回归模型的推导过程。
教学准备:
1. 教师准备PPT讲解线性回归的基本概念和原理;
2. 课堂上需要使用电脑进行实例演示;
3. 学生需要准备笔记本记录重要知识点。
教学过程:
1. 引入:通过实例引入线性回归的概念;
2. 讲解线性回归模型的建立和求解过程;
3. 使用最小二乘法进行线性回归模型的求解;
4. 通过实例演示线性回归模型的应用;
5. 总结线性回归的主要知识点。
教学延伸:
1. 学生可以通过实际数据进行线性回归分析;
2. 学生可以进一步了解多元线性回归和非线性回归。
课堂反馈:
1. 学生通过实例演示线性回归的能力;
2. 学生通过习题练习线性回归的应用。
教学资源:
1. 电脑和投影仪;
2. 练习题目和实例数据。
教学评价:
1. 通过课堂表现评价学生对线性回归的掌握情况;
2. 通过作业评价学生对线性回归的应用能力。
可线性化的回归分析淮北市第十二中学代长见一、教学目标:1通过典型案例的探究,进一步了解回归分析的根本思想、方法及初步应用。
2会将非线性回归模型经过变换转化为线性回归模型,进而进行回归分析。
二、教学重点:1通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。
2了解在解决实际问题的过程中寻找更好的模型的方法。
三、教学难点:1通过常用函数的图象特点,选择不适宜的模型建模。
2能够将非线性回归模型经过变换转化为线性回归模型,进而进行回归分析。
四、教学方法:讨论交流,探析归纳五、教学过程:〔一〕、复习引入:1线性回归方程:及性质其中:-1≤r≤1;值越大,变量的线性相关程度就越高;值越接近于0,线性相关程度就越低。
当时,两变量正相关;当时,两变量负相关;当时,两变量线性不相关。
〔二〕、新课讲解:1问题提出:如何寻求非线性回归方程?2 探究非线性回归方程确实定:下表按年份给出了年我国出口贸易量〔亿美元〕的数据,根据此表你能预测2021年我国的出口贸易量么?画出散点图:从散点图中观察,数据与直线的拟合性不好,假设用直线来预测,误差将会很大。
而图像近似指数函数,呈现出非线性相关性。
分析:考虑函数来拟合数据的变化关系,将其转化成线性函数,两边取对数:假设记:那么上式就变成了,即回到了线性回归方程。
记1981年为=1,1982年为=2,‥变换后的数据如下表:对上表数据求线性回归方程得:即。
由此可得:,解决非线性回归问题的方法及步骤:1确定变量:确定解释变量为,预报变量为;2画散点图:通过观察散点图并与学过的函数幂、指数、对数函数、二次函数作比拟,选取拟合效果好的函数模型;3变量置换:通过变量置换把非线性问题转化为线性回归问题;4分析拟合效果:通过计算相关指数或相关系数等来判断拟合效果;5写出非线性回归方程.3常见的曲线方程及相应的化为线性回归方程的换元公式.〔1〕,令,,那么有.〔2〕,令,,,那么有.〔3〕,令,,,那么有.〔4〕,令,,,那么有.〔5〕,令,,那么有.〔三〕、稳固练习:下表是一组实验数据:〔四〕、归纳总结:1非线性回归方程:对某些特殊的非线性关系,可以通过变换,将非线性回归转化为线性回归,然后用线性回归的方法进行研究,最后再转换为非线性回归方程。
1 回归分析一、教学目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用。
二、教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
三、教学方法:讨论交流,探析归纳四、教学过程:(一)、复习引入:1、给出例题:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程.(学生描述步骤,教师演示)2、讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系.(二)、新课探究:1. 探究非线性回归方程的确定:① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量.③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,而z 与x 间的关系如下:观察z 与x 方程来拟合.④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843z x =-,因此红铃虫的产卵数对温度的非线性回归方程为0.272 3.843x y e -=.⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.2. 小结:(1)、用回归方程探究非线性回归问题的方法、步骤.(2)、化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式.(1)b y a x =+,令'y y =,1'x x =,则有''y a bx =+. (2)b y ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+.(3)bx y ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+.(4)bx y ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.(三)、巩固练习:为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:(1(2)试求出预报变量对解释变量的回归方程。
北师大版选修二 线性回归方程 教案
一、教学目标:会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。
二、教学重难点:会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。
三、教学方法:探析归纳,讲练结合 四、教学过程
(一)、知识归纳与梳理 1、线性回归:
(1)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。
注:与函数关系不同,相关关系是一种非确定性关系。
(2)回归分析:对具有相关关系的两个变量进行统计分析的方法。
(3)散点图:表示具有相关关系的两个变量的一组数据的图形。
(4)回归直线方程:a bx y +=
,其中⎪
⎪
⎩
⎪⎪
⎨⎧
-=--=∑∑==x b y a x n x y x n y x b n i i n
i i i 21
2
1, ∑==n i i x n x 11。
相应的直线叫回归直线,对两个变量所进行的上述统计叫做回归分析。
相关系数的性质:(1)|r|≤1。
(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小。
2、独立性检验
①22⨯列联表:列出的两个分类变量X 和Y ,它们的取值分别为12{,}x x 和12{,}y y 的样本频数表称为22⨯列联表1
构造随机变量2
χ()()()()()
2
n ad bc a b c d a c b d -=++++(其中n a b c d =+++)
得到2
χ常与以下几个临界值加以比较: 如果
2 2.706χ>,就有0090的把握因为两分类变量X 和Y 是有关系;
如果 2
3.841χ> 就有0095的把握因为两分类变量X 和Y 是有关系; 如果
2 6.635χ> 就有0099的把握因为两分类变量X 和Y 是有关系;
如果2
2.706χ≤,就认为没有充分的证据说明变量X 和Y 是有关系. (二)、典例探析
例1、一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一组数据: 1)画出散点图;2)检验相关系数r 的显著性水平;3)求月总成本y 与月产量x 之间的回归直线方程.
解:
1)画出散点图:
,y =1217.34=2.8475,∑=712i i x =29.808,∑=712
i i y =99.2081,∑=7
1
i i i y x =54.243
2)r=
∑∑∑===---121
121
222212
1
)
12)(12(12i i i i i i
i y y x x y
x y
x
0.997891=
在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r 0 05=0.576<0.997891, 这说明每月产品的总成本y (万元)与该月产量x (万件)之间存在线性相关关系.
3)设回归直线方程a bx y
+=ˆ, 利用⎪⎪⎪⎩⎪⎪⎪
⎨⎧
-=--=∑∑==x
b y a x x y x y x b i i i i i 12
1
2212
1
1212,计算a ,b ,得b ≈1.215, a=x b y -≈0.974,
∴回归直线方程为:974.0215.1ˆ+=x y
例2、在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
女性中有。