当前位置:文档之家› 求回归直线方程的三种方法

求回归直线方程的三种方法

求回归直线方程的三种方法
求回归直线方程的三种方法

求回归直线方程的三种方法

在求具有线性相关关系的两个变量之间的回归方程时,由于所给两个变量的数据较多并且量大,致使运算量大且繁杂,常常使我们望而生“畏”,望而生“烦”.如何尽快的求出回归直线方程呢?下面例析求回归直线方程的几种方法,以供参考. 例:测得某地10对父子身高(单位:英寸)如下:

父亲身高(x ) 60 62 64 65 66 67 68 70 72 74 儿子身高(y ) 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70

如果x 与y 之间具有线性相关关系,求回归直线方程;如果父亲的身高为78英寸,试估计儿子的身高.

分析一:对于两个变量,在确定具有线性相关关系后,可以利用“最小二乘法”来求回归方程.用“最小二乘法”求回归直线方程的关键在于正确地利用回归方程中系数公式

1

2

21

?n

i i

i n

i i x y nx y

b

x nx

=--=-∑∑,??a

y bx =-求出系数a b ,,这样回归方程也就建立起来了. 为了使计算更加有条理,我们通过制作表格来先计算出

1

n i

i x =∑、1

n i

i y =∑、2

1

n

i

i x

=∑、

21

n

i

i y

=∑和1n

i i i x y =∑;再计算出11n i i y y n ==∑,11n

i i x x n ==∑;最后利用公式1

n

x x i i i L x y ==∑,

1n

xy i i i L x y nx y ==-∑ ,列式计算,再利用公式计算?xy

xx

L b L =;最后写出回归直线方程:?y

bx a =+. 解法一:先将两个变量的数字在表中计算出来,如下表所示:

由上表可计算,66866.810x ==,670.1

67.0110y ==,10144842.4i i i x y ==∑,10

21

44794i i x ==∑,10

2

1

44941.93i i y ==∑,代入公式10

12

2

21

44842.41066.867.0179.72

?0.4646447941066.8171.6

i i

i n

i

i x y nx y

b x

nx

==--??=

=

==-?-∑∑ ∴??67.010.464666.835.975a

y bx =-=-?≈ 因而所求得回归直线方程为:?0.464635.975y

x =+. 当78x =时,?0.4646735.97572.2138y

=?+= 所以当父亲的身高为78英寸时,估计儿子的身高约为72.2138英寸.

评注:“最小二乘法”是求回归直线方程常用的方法,在回归直线方程?y

bx a =+中,a b ,是回归直线方程中的系数,其中b 是回归直线的斜率,表示自变量变化1个单位时因

变量的平均变化值.在数值计算的过程中可以用计算器来帮助完成复杂的计算结果. 分析二:在求回归直线方程时,所给的数据一般较多,运算量大,我们可以借助函数型

计算器来代替人工完成这复杂的数字计算,以提高运算速度. 解法二:用计算器求这个回归直线方程:

所以所求回归直线方程为:?0.464635.977y

x =+ 当78x =时,?0.46467835.97772.2158y

=?+= 所以当父亲的身高为78英寸时,估计儿子的身高约为72.2158英寸.

评注:用函数型计算器求回归直线方程,避免了繁琐的计算,节省了时间,因而大大的提高了解题的速度.

分析三:在直角坐标系中描出数据的散点图,直观判断散点图在一条直线附近;用线性回归方程拟合二者的关系,这一过程还可以用Excel 软件来帮助我们完成,实现上机操作. 解法三:运用计算机中的Excel 软件:

1.输入数据x y ,

x 60 62 64 65 66 67 68 70 72 74 y 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70

2.选择数据,生成散点图

在菜单中选定“插入”中的“图表”,选择“xy 散点图”,连续点击“下一步”,可得到如下所示的散点图:

3.建立回归直线

选中“图表”中的“添加趋势线”,点击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”,得到回归直线. 4.求得回归直线方程

双击回归直线,弹出“趋势线格式”,单击“选项”,选定“显示公式”,最后单击“确定”就得到回归直线方程.如下图示:

所求回归直线方程为:0.464635.977y x =+; 当78x =时,0.46467835.97772.2158y =?+=,

所以当父亲的身高为78英寸时,估计儿子的身高约为72.2158英寸

评注 :在运用计算机中的Excel 软件求回归直线方程时,只要严格按照运算程序一步步进行下去,最终总能求出回归直线方程并且得到如上图的图象.

总之,求回归直线方程的方法是较多的,既有最常用的“最小二乘法”,又有简便易行的计算器法,还有用计算机软件来完成的方法,这些方法在以后的学习中同学们要逐步体会.

求回归直线方程(教学知识)

“求直线的回归方程”的教学设计 一.教学内容分析 本节课的主要内容为用最小二乘法求线性回归方程。所以,在内容重点的侧重上,本节课与上节课有较大的区别:上节课侧重于估算方法设计,在不同的数据处理过程中,体会回归直线作为变量相关关系代表这一概念特征;本节课侧重于估算方法评价与实际应用,在评价中使学生体会核心思想,理解核心概念。 考虑到本节课的教学侧重点与新课程标准的要求,对线性回归方程系数的计算公式,可直接给出。由于公式的复杂性,一方面,既要通过教学设计合理体现知识发生过程,不搞“割裂”;另一方面,要充分利用计算机或计算器,简化繁琐的求解系数过程,简化过于形式化的证明说理过程。 基于上述内容分析,确定本节课的教学重点为知道最小二乘法思想,并能根据给出的线性回归方程的系数公式建立线性回归方程。 二.教学目标分析 本节课要求学生了解最小二乘法思想,掌握根据给出的线性回归方程系数公式建立线性回归方程,理解线性回归方程概念和回归思想,在以上过程中体会随机思想: 1.能用数学符号刻画出“从整体上看,各点与此直线的点的偏差”的表达方式; 2.知道最小二乘法的思想,了解其公式的推导过程; 3.能结合具体案例,根据回归方程系数公式建立回归方程; 4.利用回归方程预测,体现用“确定关系研究相关关系”的回归思想; 三.重点,难点分析 在经历用不同估算方法描述两个变量线性相关的过程后,在学生现有知识能力范围内,如何选择一个最优方法,成为知识发展的逻辑必然。知识发展的要求与学生能力和经验的欠缺成为本节课将会遇到的最大矛盾。在教学中,要防止两种倾向:一是直接套用回归系数公式求解回归方程而回避说理过程;二是过多纠缠于数学刻画过程,甚至在课堂内花大量时间对回归系数公式进行证明说理。这两种倾向,都脱离了实际情况,前者忽略了“最小二乘法思想”,迷失了本节课的教学目标;后者人为拔高教材要求,脱离了本节课教学要求。 所以,本节课的教学难点是:如何通过数学方法刻画“从整体上看,各点与此直线的距离最小”并在此过程中了解最小二乘法思想。通过“降次举特例说明,进行合情推理”是学生突破此难点的一个方法。 四.教学过程设计 1.课题引入 问题1:(投影上节课探究结果)如何评价这些“直线”的优劣?理由呢? 问题2:能否从几何直观角度用文字语言叙述你的理由?

求回归直线方程之欧阳家百创编

“求直线的回归方程”的教学设计 欧阳家百(2021.03.07) 一.教学内容分析 本节课的主要内容为用最小二乘法求线性回归方程。所以,在内容重点的侧重上,本节课与上节课有较大的区别:上节课侧重于估算方法设计,在不同的数据处理过程中,体会回归直线作为变量相关关系代表这一概念特征;本节课侧重于估算方法评价与实际应用,在评价中使学生体会核心思想,理解核心概念。 考虑到本节课的教学侧重点与新课程标准的要求,对线性回归方程系数的计算公式,可直接给出。由于公式的复杂性,一方面,既要通过教学设计合理体现知识发生过程,不搞“割裂”;另一方面,要充分利用计算机或计算器,简化繁琐的求解系数过程,简化过于形式化的证明说理过程。 基于上述内容分析,确定本节课的教学重点为知道最小二乘法思想,并能根据给出的线性回归方程的系数公式建立线性回归方程。 二.教学目标分析 本节课要求学生了解最小二乘法思想,掌握根据给出的线性回归方程系数公式建立线性回归方程,理解线性回归方程概念和回归思想,在以上过程中体会随机思想: 1.能用数学符号刻画出“从整体上看,各点与此直线的点的偏差”的表达方式; 2.知道最小二乘法的思想,了解其公式的推导过程; 3.能结合具体案例,根据回归方程系数公式建立回归方程; 4.利用回归方程预测,体现用“确定关系研究相关关系”的回归思想; 三.重点,难点分析 在经历用不同估算方法描述两个变量线性相关的过程后,在学生现有知识能力范围内,如何选择一个最优方法,成为知识发展的逻辑必然。知识发展的要求与学生能力和经验的欠缺成为本节课将会遇到的最大矛盾。在教学中,要防止两种倾向:一是直接套用回归系数公式求解回归方程而回避说理过程;二是过多纠缠于数学刻画过程,甚至在课堂内花大量时间对回归系数公式进行证明说理。这两种倾向,都脱离了实际情况,前者忽略了“最小二乘法思想”,迷失了本节课的教学目标;后者人为拔高教材要求,脱离了本节课教学要求。 所以,本节课的教学难点是:如何通过数学方法刻画“从整体上看,各点与此直线的距离最小”并在此过程中了解最小二乘法思想。通过“降次举特例说明,进行合情推理”是学生突破此难点的一个方法。 四.教学过程设计 1.课题引入 问题1:(投影上节课探究结果)如何评价这些“直线”的优劣?理由呢? 问题2:能否从几何直观角度用文字语言叙述你的理由?

用最小二乘法求线性回归方程

最小二乘法主要用来求解两个具有线性相关关系的变量的回归方程,该方法适用于求解与线性回归方程相关的问题,如求解回归直线方程,并应用其分析预报变量的取值等.破解此类问题的关键点如下: ①析数据,分析相关数据,求得相关系数r,或利用散点图判断两变量之间是否存在线性相关关系,若呈非线性相关关系,则需要通过变量的变换转化构造线性相关关系. ②建模型.根据题意确定两个变量,结合数据分析的结果建立回归模型. ③求参数.利用回归直线y=bx+a的斜率和截距的最小二乘估计公式,求出b,a,的值.从而确定线性回归方程. ④求估值.将已知的解释变量的值代入线性回归方程y=bx+a中,即可求得y的预测值. 注意:回归直线方程的求解与应用中要注意两个方面:一是求解回归直线方程时,利用样本点的中心(x,y)必在回归直线上求解相关参数的值;二是回归直线方程的应用,利用回归直线方程求出的数值应是一个估计值,不是真实值. 经典例题: 下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.

为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为1,2.,……,17)建立模型①:y=+;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:y=99+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠并说明理由. 思路分析:(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果,(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测. 解析:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为 =–+×19=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为 =99+×9=(亿元). (2)利用模型②得到的预测值更可靠.理由如下: (i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–+上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利

一个求回归直线方程的简单方法

一个求回归直线方程的简单方法 科技信息高校理科研究 一 个求回归直线方程明简单方法 华北电力大学柳燕 [摘要]求回归直线方程是统计学中经常用到的一个统计方法,大量的数据处理也可以有一些简单的方法,例如利用常用的数学记 号,经过推导与整理,便得到了简洁易用的公式. [关键词]统计分析回归直线方程相关性 由于自然界中的许多事物间都包含着某种相互依存的内部规律, 这种联系反映到数学上,就是变量间的关系.变量的关系分为两大类: 有确定性关系和非确定性关系.数学的任务之一就是从数量上来解释 和分析这些关系.回归分析就是一种处理变量与变量间相互关系的数 学方法,也是数据处理中最为常用的一种统计方法.它是用数学方法从 大量观测数据中找出变量间近似关系的定量表达式,并由此利用这个 定量表达式去研究我们所未知的东西.研究两个变量间的相互关系的, 称为一元回归分析,在回归分析中,最简单也是最基本的情形是线性回 归,而一元线性回归所要找寻的是与变量相匹配的线性回归直线.这 里,我们用计算器上的统计键就可以轻而易举地得到这条直线方程. 回归的发现源自于19世纪末期对社会统计学的研究.那时,统计 学家发现,有许多数据都与正态曲线拟合的很好.但是这无所不在的正 态性却给高尔登带来了一个困惑,他发现亲子两代各自的身高数据,都 遵从同一的正态分布,但理论上,遗传把一种性态(例如身高)的优势传 递给下一代,则应该在后代中出现两极分化,即高个子的后代个子更 高,矮个子的后代个子更矮,或者说,高个子与矮个子的比例应该日渐 增加,而中等身材的比例应该日渐下降,但事实却是一代代的身高始终 呈现出稳定的正态分布.怎么解释这一现象呢?为此,高尔登想出了一

线性回归方程高考题

线性回归方程高考题 1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 (吨)与相应的生产能耗(吨标准煤)的几组对照数据: (1)请画出上表数据的散点图; ( 2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程; (3)已知该厂技改前 100 吨甲产品的生产能耗为 90吨标准煤.试根据( 2)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤 ? (参考数值:) 2、假设关于某设备的使用年限x 和所支出的维修费用y(万元)统计数据如下 : 若有数据知y 对x 呈线性相关关系 . 求 : (1)填出下图表并求出线性回归方程 =bx+a 的回归系数 , ;

(2)估计使用 10 年时,维修费用是多少 . 3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验, 得到的数据如下: 1)在给定的坐标系中画出表中数据的散点图; 2)求出 y 关于 x 的线性回归方程,并在坐标系中画出回归直 线; 3)试预测加工 10 个零件需要多少时间? 4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数 之间的一组数据关系如下表:

已知:. (Ⅰ)画出散点图; (1I)求纯利与每天销售件数之间的回归直线方程. 5、某种产品的广告费用支出与销售额之间有如下的对应数据: (1)画出散点图: (2)求回归直线方程; (3)据此估计广告费用为 10 时,销售收入的值. 6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x (吨)与相 应的生产能耗 y(吨标准煤)的几组对照数据: I )请画出上表数据的散点图; (II )请根据上表提供的数据,求出y关于x的线性回归方程;(III )已知该厂技术改造前 100吨甲产品能耗为 90 吨标准煤 . 试根据(II )求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技术

回归直线方程的三种推导方法

. 回归直线方程的三种推导方法 巴州二中母润萍 回归直线方程是新课改新增内容之一,在必修数学3中对两个具有线性相关关系的变量利用回归分析的方法进行了研究,书中直接给出了回归直线方程系数的公式,在选修2-3中给出了回归直线方程的截距和斜率的最小二乘法估计公式的另一种形式的推导方法,根据所学知识,我总结了3种推导回归直线方程的方法: 设x 与y 是具有线性相关关系的两个变量,且相应于样本的一组观测值的n 个点的坐标分别是:112233()()()()n n x y x y x y x y ,,,,,,,,,设所求的回归方程为i i y bx a =+,(123)i n =,,,,.显然,上面的 各个偏差的符号有正、有负,如果将他们相加会相互抵消一部分,因此他们的和不能代表n 个点与回归直线的整体上的接近程度,因而采用n 个偏差的平方和Q 来表示n 个点与相应直线(回归直线)在整体上的接近程度,即 求出当Q 取最小值时的a b ,的值,就求出了回归方程. 下面给出回归方程的推导方法一: 一、先证明两个在变形中用到的公式 公式(一) 2 2 21 1 ()n n i i i i x x x nx ==-=-∑∑,其中 12n x x x x n ++ += 证明: 2222 121 ()()()()n i n i x x x x x x x x =-=-+-+ +-∑∵ 2 22212 1 2 () 2n n x x x x x x nx nx n ++ +=+++-+ 2 2 2 22222 221 2 1 2 1()2()n n n i i x x x nx nx x x x x nx ==++ +-+=++ +=-∑ 2 2 21 1()n n i i i i x x x nx ==-=-∑∑∴. 公式(二) 1 1 ()()n n i i i i i i x x y y x y nx y ==--=-∑∑ 证明: 11221 ()()()()()()()() n i i n n i x x y y x x y y x x y y x x y y =--=--+--+ +--∑∵ 11221122()()n n n n x y x y x y x y y x x y y x x y y x nx y =++ +-+++++++ 12121[()()]n i i n n i x y x x x y y y y x nx y ==-++ ++++++∑ 1 2121 () ()n n n i i i x x x y y y x y n y x nx y n n =++ +++ +?? =-+ +????∑ 1 1 2n n i i i i i i x y nxy nxy x y nxy ===-+=-∑∑, 1 1 ()()n n i i i i i i x x y y x y nx y ==--=-∑∑∴. 二、推导:将Q 的表达式的各项先展开,再合并、变形 2222112233()()()()n n Q y bx a y bx a y bx a y bx a =--+--+--+ +-- 22 2 2121122()[2()2()] n y y y y bx a y bx a =+++-+++展开 2 2 22 1 1 1 1 1 222n n n n n i i i i i i i i i i i y b x y a y b x ab x na ======--+++∑∑∑∑∑合并同类项 222211 11122n n i i n n n i i i i i i i i i y x na na b b x b x y y n n =====?? ? ?=--+-+ ? ?? ?∑∑∑∑∑以a b ,的次数为标准整理 22 22 1 1 1 2()2n n n i i i i i i i na na y bx b x b x y y ====--+-+∑∑∑转化为平均数 x y , 222 22 1 1 1 [()]()2n n n i i i i i i i n a y bx n y bx b x b x y y ====----+-+∑∑∑配方法 2 2 2 2 2 22 1 1 1 [()]22n n n i i i i i i i n a y bx ny nbxy nb x b x b x y y ====---+-+-+∑∑∑展开 2 2 2 2 221 1 1 [()]()2()() n n n i i i i i i i n a y bx b x nx b x y nxy y ny ====--+---++∑∑∑整理 22 2 2 1 1 1 [()]()2()()()n n n i i i i i i i n a y bx b x x b x x y y y y ====--+----+-∑∑∑用公式(一)、(二)变形

线性回归方程

环球雅思学科教师辅导讲义讲义编号:组长签字:签字日期:

又y 对x 的线性回归方程表示的直线恒过点(x -,y - ), 所以将(176,176)代入A 、B 、C 、D 中检验知选C. 答案 C 3.(2011·陕西)设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个 样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( ). A .x 和y 的相关系数为直线l 的斜率 B .x 和y 的相关系数在0到1之间 C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 D .直线l 过点(x -,y -) 解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的 绝对值越接近1,两个变量的线性相关程度越强,所以A 、B 错误.C 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以C 错误.根据回 归直线方程一定经过样本中心点可知D 正确,所以选D. 答案 D 4.(2011·广东)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系: 时间x 1 2 3 4 5 命中率y 0.4 0.5 0.6 0.6 0.4 小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________. 解析 小李这5天的平均投篮命中率 y -=0.4+0.5+0.6+0.6+0.4 5 =0.5, 可求得小李这5天的平均打篮球时间x -=3.根据表中数据可求得b ^=0.01,a ^ = 0.47,故回归直线方程为y ^ =0.47+0.01x ,将x =6代入得6号打6小时篮球的 投篮命中率约为0.53. 答案 0.5 0.53 5.(2011·辽宁)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^ =0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元. 解析 由题意知[0.254(x +1)+0.321]-(0.254x +0.321)=0.254. 答案 0.254

求回归直线方程的三种方法

求回归直线方程的三种方法 在求具有线性相关关系的两个变量之间的回归方程时,由于所给两个变量的数据较多并且量大,致使运算量大且繁杂,常常使我们望而生“畏”,望而生“烦”.如何尽快的求出回归直线方程呢?下面例析求回归直线方程的几种方法,以供参考. 例:测得某地10对父子身高(单位:英寸)如下: 父亲身高(x ) 60 62 64 65 66 67 68 70 72 74 儿子身高(y ) 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70 如果x 与y 之间具有线性相关关系,求回归直线方程;如果父亲的身高为78英寸,试估计儿子的身高. 分析一:对于两个变量,在确定具有线性相关关系后,可以利用“最小二乘法”来求回归方程.用“最小二乘法”求回归直线方程的关键在于正确地利用回归方程中系数公式 1 2 21 ?n i i i n i i x y nx y b x nx =--=-∑∑,??a y bx =-求出系数a b ,,这样回归方程也就建立起来了. 为了使计算更加有条理,我们通过制作表格来先计算出 1 n i i x =∑、1 n i i y =∑、2 1 n i i x =∑、 21 n i i y =∑和1n i i i x y =∑;再计算出11n i i y y n ==∑,11n i i x x n ==∑;最后利用公式1 n x x i i i L x y ==∑, 1n xy i i i L x y nx y ==-∑ ,列式计算,再利用公式计算?xy xx L b L =;最后写出回归直线方程:?y bx a =+. 解法一:先将两个变量的数字在表中计算出来,如下表所示: 由上表可计算,66866.810x ==,670.1 67.0110y ==,10144842.4i i i x y ==∑,10 21 44794i i x ==∑,10 2 1 44941.93i i y ==∑,代入公式10 12 2 21 44842.41066.867.0179.72 ?0.4646447941066.8171.6 i i i n i i x y nx y b x nx ==--??= = ==-?-∑∑ ∴??67.010.464666.835.975a y bx =-=-?≈ 因而所求得回归直线方程为:?0.464635.975y x =+. 当78x =时,?0.4646735.97572.2138y =?+= 所以当父亲的身高为78英寸时,估计儿子的身高约为72.2138英寸.

回归直线方程的推导

回归直线方程的推导 山东 王加祥 范玉峰 设x 与y 是具有线性相关关系的两个变量,且相应于样本的一组观测值的n 个点的坐标分别是:112233()()()()n n x y x y x y x y ,, ,,,,,,,下面给出回归方程的推导. 设所求的回归方程为i i y bx a =+,(123)i n =,,,,.显然,上面的各个偏差的符号有正、 有负,如果将他们相加会相互抵消一部分,因此他们的和不能代表n 个点与回归直线的整体上的接近程度,因而采用n 个偏差的平方和Q 来表示n 个点与相应直线(回归直线)在整体上的接近程度, 即2 222222331 1 ()()()()()n n i i i n n i i i Q y y y bx a y bx a y bx a y bx a ===-=--+--+--+ +--∑∑. 求出当Q 取最小值时的a b ,的值,就求出了回归方程. 一、先证明两个在变形中用到的公式 公式(一)2 2 21 1 ()n n i i i i x x x nx ==-=-∑∑,其中12n x x x x n ++ += 证明:2222121 ()()()()n i n i x x x x x x x x =-=-+-+ +-∑∵ 2 22 2 1212() 2n n x x x x x x nx nx n ++ +=+++-+ 2 2 2 222222212 1 2 1 ()2()n n n i i x x x nx nx x x x x nx ==++ +-+=++ +=-∑ 2 2 21 1 ()n n i i i i x x x nx ==-=-∑∑∴. 公式(二)1 1 ()()n n i i i i i i x x y y x y nx y ==--=-∑∑ 证明:11221 ()()()()()()()()n i i n n i x x y y x x y y x x y y x x y y =--=--+--+ +--∑∵ 11221122()()n n n n x y x y x y x y y x x y y x x y y x nxy =++ +-++++ +++ 12121[()()]n i i n n i x y x x x y y y y x nx y ==-++ ++++++∑ 1 2121 () ()n n n i i i x x x y y y x y n y x nx y n n =++ +++ +?? =-+ +???? ∑ 11 2n n i i i i i i x y nx y nx y x y nx y ===-+=-∑∑, 1 1 ()()n n i i i i i i x x y y x y nx y ==--=-∑∑∴. 二、推导:将Q 的表达式的各项先展开,再合并、变形 2222112233()()()()n n Q y bx a y bx a y bx a y bx a =--+--+--+ +--

高中数学例题:回归直线方程的求解

高中数学例题:回归直线方程的求解 例3.在钢铁中碳含量对于电阻的效应的研究中,得到如下表所示的一组数据: (1)画出散点图; (2)求回归方程. 【解析】由散点图知能用回归直线拟合样本数据,然后,利用表中的数据,可以得到b ,a 计算公式中所需的数据,代入易得b ,a . (1)作出散点图如下图所示. (2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据可求得 711 3.800.54377i i x x ===≈∑,711145.4 20.7777 i i y y ===≈∑,7 2 1 2.595i i x ==∑, 7 1 85.61i i i x y ==∑. 则7 17 2 2 21 785.6170.54320.77 12.552.59570.543 7i i i i i x y x y b x x ==--??= = ≈-?-∑∑, 20.7712.550.54313.96a y bx =-=-?≈.

所以回归方程为12.5513.96y x =+. 【总结升华】 求线性回归直线方程的步骤为: 第一步:列表i i i i x y x y ,,; 第二步:计算2 11 n n i i i i i x y x x y ==∑∑,, ,   ; 第三步:代入公式计算b a ,的值; 第四步:写出直线方程. 举一反三: 【变式1】 某产品的广告费用x 与销售额y 的统计数据如下表: 根据上表可得回归方程中的为9.4,据此模型预报广告 费用为6万元时销售额为 A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元 【答案】选B 【解析】423549263954 3.5,4244 x y ++++++= === 429.4 3.59.1a y bx ∴=-=-?=,∴回归方程为9.49.1y x =+, ∴当6x =时,9.469.1y =?+=65.5,故选B . 【变式2】 观察两相关变量得如下数据: 求两变量间的回归方程. ??y bx a =+b

相关主题
文本预览
相关文档 最新文档