高二数学变量间的相关关系
- 格式:ppt
- 大小:448.50 KB
- 文档页数:14
高二数学课本电子版一、变量间的相关关系1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.二、两个变量的线性相关1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.三、解题方法1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断.2.对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性.3.由相关系数r判断时|r|越趋近于1相关性越强.1、圆的定义:平面内到一定点的距离等于定长的点的集合叫圆,定点为圆心,定长为圆的半径.2、圆的方程(1)标准方程,圆心,半径为r;(2)一般方程当时,方程表示圆,此时圆心为,半径为当时,表示一个点;当时,方程不表示任何图形.(3)求圆方程的方法:一般都采用待定系数法:先设后求.确定一个圆需要三个独立条件,若利用圆的标准方程,需求出a,b,r;若利用一般方程,需要求出D,E,F;另外要注意多利用圆的几何性质:如弦的中垂线必经过原点,以此来确定圆心的位置.3、高中数学必修二知识点总结:直线与圆的位置关系:直线与圆的位置关系有相离,相切,相交三种情况:(1)设直线,圆,圆心到l的距离为,则有;;(2)过圆外一点的切线:k不存在,验证是否成立k存在,设点斜式方程,用圆心到该直线距离=半径,求解k,得到方程【一定两解】。
正相关是指两个变量变动方向相同,一个变量由大到小或由小到大变化时,另一个变量亦由大到小或由小到大变化。
具体来说,当一个变量随着另一个变量的变化而发生相同方向的变化(两个变量同时变大或变小)时,我们说这两个变量之间存在正相关关系。
在统计学中,常用相关系数r来表示两变量之间的相关关系。
当r为正时,表示两变量正相关,即当一个变量增加(或减少)时,另一个变量也相应增加(或减少)。
相关系数r的值介于-1与1之间,其绝对值越大,说明两变量之间的相关程度越高。
请注意,以上内容仅供参考,如需更专业的解释,建议咨询统计学专业人士。
2.3.1变量之间的相关关系教学目标:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
教学重点:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
教学过程:案例分析:一般说来,一个人的身高越高,他的人就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系。
为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表。
(1)根据上表中的数据,制成散点图。
你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系。
(3)如果一个学生的身高是188cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下。
,同学5:我先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多。
1015202530cm ,)160162164166168170172174176178180182同学8:取一条直线,使得在它附近的点比较多。
在这里需要强调的是,身高和右手一拃长之间没有函数关系。
我们得到的直线方程,只是对其变化趋势的一个近似描述。
对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长。
这是十分有意义的。
课堂练习:第77页,练习A,练习B小结:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
课后作业:第84页,习题2-3A第1(1)、2(1)题,。
变量间相关关系题型举例变量间相关关系是非随机变量与随机变量之间的关系,而函数关系可以看成是两个非随机变量之间的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,它可能是伴随关系.因此,不能把相关关系等同于函数关系.变量间相关关系有哪些常考题型呢?本文为同学们举例说明.题型一相关关系的判断例1为了研究质量对弹簧长度的影响,对6根相同的弹簧进行测量,所得数据如下:质量(g) 5 10 15 20 25 30弹簧长度(cm)7.25 8.12 8.95 9.90 10.90 11.80判断它们是否有相关关系,若有画出回归直线.解:散点图如下:由散点图可以看出变量对应的点大致分布在一条直线附近,因此可以得出结论,质量与弹簧长度这两个变量具有相关关系.解后反思:判断有无相关关系,一种常用的简便方法就是绘制散点图.题型二求线性回归方程例2假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0若由资料知y对x呈线性相关关系.试求:(1)线性回归方程y bx a =+的回归系数a b ,; (2)估计使用年限为10年时,维修费用是多少? 分析:直接利用公式求线性回归方程的系数a b ,. 解:(1)制表如下:于是有2112.354512.31.23905410b -⨯⨯===-⨯;5 1.2340.08a y bx =-=-⨯=.(2)回归直线方程为 1.230.08y x =+.当10x =年时, 1.23100.0812.30.0812.38y =⨯+=+=(万元). 即估计使用10年时,维修费用是12.38万元.解后反思:因为y 对x 呈线性相关关系,所以可以用一元线性相关的方法解决问题.(1)利用公式:1221ni ii nii x ynx y b xnx==-=-∑∑,a y bx =-来计算回归系数,有时为了方便,制表时常对应求出2i i i x y x ,,以利于求和. (2)获得线性回归方程后,取10x =即得所求.(3)本题应借用计算器计算,并列出表格,再按分析时的步骤进行求解. 题型三 利用回归直线方程对总体进行估计例3 在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间x 之间相应的一组观察值如下表:(s)x5 10 15 20 30 40 50 60 70 90 120(μm)y 6 10 10 13 16 17 19 23 25 2946(1)画出表中数据的散点图; (2)求y 对x 的回归直线方程;(3)试预测腐蚀时间为100s 时腐蚀深度是多少? 解:(1)散点图如图所示:(2)先把数据列成表: 序号1 2 3 4 5 6 7 8 9 10 11 ∑x5 10 15 20 30 40 50 60 70 90 120 510 y6101013161719232529462142x25 100 225 400 900 1600 2500 3600 4900 8100 14400 36750 2y36 100 100 169 256 289 36152962584121165422xy30 100 150 260 480 680950 1380 1750 2610 5520 13910由上表可得5102141111x y ==,,代入公式得 2510214139101111110.304510367501111b -⨯⨯=≈⎛⎫-⨯ ⎪⎝⎭, 2145100.304 5.361111a =-⨯=. 故y 对x 的回归直线方程为0.304 5.36y x =+,回归系数0.304b =,它的意义是:腐蚀时间x 每增加1个单位,深度y 平均增加0.304个单位. (3)根据上面求得的回归直线方程,当腐蚀时间为100s 时,0.304100 5.3635.76(μm)y =⨯+=,即腐蚀深度大约是35.76μm .点评:通常在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认具有线性相关关系后,再求其回归直线方程. 对相关关系的理解还应当注意以下几点:1.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.2.求线性回归方程y bx a =+的关键是求回归系数a 和b ,其中回归系数b 可借助于计算器完成,因为a y bx =-,即y bx a =+,所以点()x y ,一定满足线性回归方程,即回归直线一定过点()x y ,. 3.求线性回归方程的步骤(1)先把数据制成表,从表中计算出22212nx y x x x +++,,,1122n n x y x y x y +++的值;(2)计算回归系数a b ,;(3)写出线性回归方程:y bx a =+.。
选修一数学知识点归纳高二高中数学是学生们学习的一门重要科目,其中数学知识点繁多而又复杂。
在高二阶段,学生们需要加深对数学知识的理解与掌握,为此,本文将对高二数学中的几个重要的选修一知识点进行归纳总结。
1. 不等式与数轴图在选修一数学中,不等式与数轴图是一个基础而又重要的概念。
对于不等式的理解,我们可以通过数轴图进行可视化表示。
数轴图以数轴为基础,通过在数轴上标记并绘制不等式的解集,帮助我们更好地理解不等式的性质。
在解决不等式问题时,可以通过数轴图的方法来推理和推导解集,从而得到准确的答案。
2. 三角函数三角函数是选修一数学中必不可少的部分。
它们以角度作为自变量,输出对应的函数值。
在高二阶段,我们将主要学习正弦函数、余弦函数和正切函数。
熟练掌握这些函数的定义、性质和图像有助于我们解决与三角函数相关的各类问题。
同时,还需要注意掌握三角函数的基本公式与变换规律,以及如何应用它们来解决实际问题。
3. 平面向量平面向量是高二数学中的另一重要知识点。
它们具有大小和方向的特点,并可以进行向量的加法、减法和数乘等运算。
在学习平面向量时,重点掌握向量的表示方法、向量之间的几何关系和向量的数量积等概念。
理解这些概念后,我们可以应用平面向量来解决平面几何、力学以及物理等领域中的各类问题。
4. 导数与函数的变化率导数是数学中的一个重要概念,即函数在某一点处的变化率。
在选修一数学中,我们将深入学习函数的导数以及导数的应用。
通过学习导数,我们可以了解函数的变化趋势、极值点、凹凸性以及函数与其导函数之间的关系。
理解导数的概念和性质对于我们解决各类数学问题至关重要,如求曲线的斜率、优化问题以及曲线的图像分析等。
5. 解析几何在高二数学的选修一中,解析几何是一个重要而又实用的数学工具。
它是利用坐标系统中的代数方法来进行几何证明和计算的一种方法。
在学习解析几何时,我们需要掌握平面坐标系和空间坐标系的表示方法,了解直线和曲线的方程以及它们的几何性质。
高中数学变量间关联教案
教学目标:
1. 熟练掌握变量间的关联性概念;
2. 能够运用相关概念解决实际问题;
3. 提高学生的数学推理和解决问题能力。
教学内容:
1. 变量间的关联性概念介绍;
2. 如何判断变量之间的关联程度;
3. 使用相关系数等工具进行变量间的关联性分析。
教学步骤:
一、导入(5分钟)
通过一个实际的例子引入变量间的关联性概念,激发学生的思考和探索欲望。
二、概念讲解(15分钟)
1. 讲解变量的概念及其分类;
2. 介绍相关系数的定义和计算方法;
3. 分析变量之间的线性关联和非线性关联。
三、案例分析(20分钟)
1. 案例一:某城市的降雨量和地表径流量之间的关系;
2. 案例二:身高和体重之间的关联性分析。
四、实践操作(15分钟)
让学生自行从网上或书籍中搜索相关数据,利用相关系数等工具对两个变量之间的关联性进行分析。
五、总结与展望(5分钟)
总结今天的学习内容,鼓励学生多关注身边的变量间的关联关系,培养数学思维。
教学评估:
1. 学生对变量间关联性概念的理解;
2. 学生分析案例的能力;
3. 学生的实践操作结果和分析能力。
拓展延伸:
1. 鼓励学生自主探索更多关于变量间关联性的案例;
2. 可以让学生设计自己的实验或调查,收集数据进行相关性分析;
3. 拓展学生的数学思维,探讨更多实际应用场景下变量间的关联性。
(注:以上内容仅供参考,具体实施时应根据学生实际情况做出调整。
)。
高二数学必修二统计知识点统计学是一门研究数据收集、整理、分析和解释的学科。
在高中数学的必修二中,统计学是一个重要的内容模块。
本文将介绍高二数学必修二中的统计知识点,帮助你更好地理解和掌握这些概念和方法。
1. 数据收集数据收集是统计学的第一步,也是统计研究的基础。
常见的数据收集方法包括实地观察、问卷调查、抽样调查等。
在实际应用中,我们常常需要注意数据的可靠性和有效性,确保数据的准确性和代表性。
2. 数据整理和可视化在数据收集后,我们需要对数据进行整理和整体性的展示。
数据整理包括数据的分类、排序、计数和汇总等。
常用的数据整理方法包括频数表、频率分布表和统计图表等。
统计图表主要包括条形图、折线图、饼图等,可以直观地展示数据的特征和规律。
3. 描述统计描述统计是对数据进行总结和分析的过程。
常见的描述统计量包括均值、中位数、众数、极差、方差和标准差等。
这些统计量可以帮助我们了解数据的集中程度、离散程度和分布形态等特征。
4. 概率与统计概率与统计是统计学的重要分支,也是高中数学中的必修内容。
概率是描述随机事件发生可能性的数学工具,而统计则是根据已有数据对未知情况进行推断和预测的方法。
常见的概率与统计问题包括条件概率、事件的相互关系、随机变量和概率分布等。
5. 抽样与推断抽样与推断是统计学的核心内容之一。
抽样是指从总体中选取一部分个体进行观察和测量的过程,而推断是通过已有样本数据对总体特征进行推理和估计。
常用的抽样方法包括简单随机抽样、分层抽样和系统抽样等。
推断方法主要包括点估计和区间估计等。
6. 相关与回归分析相关与回归分析是统计学中用于研究变量之间关系的方法。
相关分析是用来刻画两个变量之间相关程度的统计方法,而回归分析则是根据已有数据建立数学模型来分析变量之间的因果关系。
常用的相关与回归分析方法包括线性回归、多元回归和 logistic 回归等。
高二数学必修二统计知识点主要包括数据收集、数据整理和可视化、描述统计、概率与统计、抽样与推断、相关与回归分析等内容。
两个变量的相关关系与回归分析的基本思想北京市日坛中学 胡芳 杨平 北京市朝阳区教研中心 王文英教学目标设置①理解回归直线的意义,探索回归直线方程的推导,会利用图形计算器求回归方程、进行统计预测,能理解预报结果;②认识随机误差和残差,能根据残差图分析观测数据有无异常并简单判断回归方程的预测精度; ③感受统计知识在解决实际问题中的应用价值,体验图形计算器在数学探究中的优越性,提高自主探究能力.学生学情分析授课班级是我校高二年级重点班,学生的数学基础比较扎实,有一定的分析问题和解决问题的能力,同时,该班学生已经使用了近两年的CASIO FX-CG20图形计算器,初步形成根据教学内容自主地运用手持技术进行实验和探究的意识.因为在前面的教学活动中,已经渗透了两个变量相关关系的概念,学生能对实际生活中的两个变量简单进行相关关系判断.在本节课前,我充分利用学生已有的知识体验,指导学生在年级范围内测量和收集记录了学生的左臂长与身高的数据,通过教学使他们参与到自己收集的数据进行数据处理的全过程,注重学生从感性认识到理性认识的探索过程,在学生的学法上采用探究式教学,不断地从新旧知识的矛盾冲突中激发学生的探究热情.由于该班学生已具备了一定的数学思辨能力,因此在课堂教学中注重培养学生数学思维的严谨性,突出数学学科特点,重视学生数学思辩能力的培养,在教学过程中通过问题和数据的分析验证,不断引导学生进行数学量化分析,培养学生学数学、用数学的意识.根据学生的学习基础和接受能力,设定本节课的教学重点和教学难点为: 教学重点:回归直线方程的意义、推导及应用. 教学难点:随机误差e 和残差e的认识.教学策略分析本节课采用师生互动探究式教学.教师遵循“教师为主导、学生为主体”的原则,结合授课班级学生的求知心理和已有的认知水平开展教学.教师通过引导学生收集数据,进行实际操作,建立函数回归模型,实际验证引导矛盾,再次残差分析,完备知识体系的过程,通过问题式教学环境的创设,由学生归纳出两个变量回归分析的方法,让学生主动地获取知识,教师只起适当引导作用,使教师的主导作用和学生的主体作用都必须得到充分发挥.1.由于学生对两个变量的回归分析概念只有感性认知(大学里还将继续学习),因此教学中更重视的是从感性认识到理性认识的实验探索和数据处理分析过程,不断地从新旧知识的矛盾冲突中激发学生的探究热情,充分利用学生已有的知识体验,遵循学生的心理认知规律,由于课堂时间的限制,附录中为学生提供了两种不同的证明方法,丰富并完备学生的认知.2.由教师层层递进性的创设问题情景,让学生带着问题走进课堂,师生共同探究完成,在问题的解决中培养学生的反思能力,通过引导学生分析线性回归直线的探究,形成对解决求回归直线方程的策略,利用图形计算器得到回归方程直线,不仅有了理论性的认识,更在实际运算中为学生提供了一种有效工具,从而归纳出对两个线性相关变量进行的方法和一般步骤.又引导学生通过图形计算器验证数据,导出矛盾,指导学生反思得到残差分析,从而进一步强化两个变量回归分析的认知,并利用CASIO 图形计算器从数和形两个方面进行探究,不断开拓学生的思维空间.3.重视激发学生求知欲.注意引导学生积极体验,自己产生问题意识,并展开探究、尝试,总结,从而主动获取知识.本节课的重难点都是围绕着两个变量的回归分析进行研究,由于授课班级学生思维比较活跃,有一定的思辨基础和反思能力,因此我注意拓展了教材内容,当两个变量呈现非线性关系,如何进行回归分析?学生利用CASIO 图形计算器是可以自己简单的进行判断,从而引导学生不断深入思考,从多个角度丰富思维图形计算器支持本节课技术支持采用了 CASIO FX-CG20图形计算器.CASIO FX-CG20图形计算器提供了强大的数据分析功能,对学生学习和把握两个变量的相关关系分析有重要的帮助:一方面,在进行数据输入和分析后,对两个变量的相关系数和函数模型的选择提供了有力的技术支持,本节课如果没有图形计算器的介入,是不可能在一节课上完成教学任务的;另一方面,在研究出理想的函数模型后,利用图形计算器进行实际验证,导出矛盾,引入残差的概念,从学生的实际操作中完成知识的升华.CASIO FX-CG20图形计算器对本节课探究性学习的价值主要体现于以下几点:1.数据分析性功能:本机课涉及到大量的数据处理分析,计算量非常大,如果按照课本提供的方式进行处理,那么本节课的教学内容要用6个课时,而利用CASIO 图形计算器,可以很容易地进行数据处理和数据验证,这种媒体功能可以不用在计算机教室就可以让学生自己动手操作实现,由学生在教师的指导下完成对自己身边的实际数据的处理,圆满的完成学生对本节课的探究任务.2.直观性功能:学生在输入数据后,要合理分析数据散点图,并对自己的函数模型进行相关性分析,但学生对于相关系数的认识是不足的,不可能要求学生的课堂上对每一种模型的相关系数进行验证,而学生通过图形计算器计算,作出的相关系数与函数图像和散点图的吻合程度,在直观上帮助学生理解了相关分析的概念,学生从数和形可以很容易地得到结论.3.解惑性功能:通过手持技术操作下的验证试验,学生可以发现“错误产生在哪里”,从而在知识的认知上完成了螺旋式上升.问题5中对学生选择的最合理的函数模型进行验证,可以发现结论与实测数据的差距很大,这一点是学生容易产生困惑的地方,在新定义残差后,学生使用图形计算机作出数据残差图,研究分析残差i e,从而发现数据中的错误并判断模型的拟合效果,进一步巩固理解对两个变量回归分析的完整性.4.由过去的教师演示试验变成学生的亲身动手操作,使学生经历了知识的发生、发展的过程,激发学生的学习兴趣.教学过程:1.问题引入:我们以前学习了对一个变量进行统计分析的方法,今天我们研究具有相关关系的两个变量的数据处理和分析的方法.有人发现日常生活中有一个规律:当一个人左臂长的值比较大时其身高值也大,当一个人左臂长的值比较小时其身高值也比较小,为了研究这个规律是否具有一般性,我们上节课后在高二年级收集了40组数据,并绘制了散点图,发现这两个变量之间具有正相关关系. 2.新课教学:(1)描述回归直线的概念问题1:观察散点图,这些样本点的分布有什么特征?指导学生描述:从整体上看样本点集中分布在一条直线附近. 注意两点:①周围——附近;②是所有点吗?如果样本点的分布从整体上看在一条直线的附近,那么这两个变量之间存在线性相关关系.由于这条直线位于样本点的中间位置,所以这条直线可作为两个变量具有线性相关关系的数据代表.如果可以求出这条直线方程就可以比较清楚地了解两个变量间的相关性,并利用它来统计分析两个变量线性相关.(2)学生活动:探究回归直线方程问题2:一个变量中心位置的平均数只有一个,那么在散点图中心位置的直线有几条呢?(一条)如何在散点图中确定这条直线,满足样本点从整体上分布在这条直线的附近呢?请在下面的散点图中画出这条直线,并说明原因. 预案:①取一条直线尽可能多的通过散点;②取一条直线让两侧的散点分布数量相同;③以左端点为一端,分别连接最高点和最低点,取这两条直线所确定的角的角平分线;④在居中的位置找出两点连线;⑤多取出几组点连线,测量出他们的斜率和纵截距,计算平均值. 设一组具有线性相关关系的样本数据为(),i i i P x y ()1i n =⋅⋅⋅,直线方程为y bx a =+.根据你的想法用数量关系来刻画各样本点与直线的关系,便于我们计算出这条直线方程. 通过学生活动,发现操作困难,因此提出:问题3:如何在数学上刻画“样本点在分布直线的附近”呢? 让学生观察得出“点到直线的距离和最小”.师生合作探究:由于i i PN 的计算公式比较复杂,因此求1ni ii PN=∑的最小值困难比较大.问题4:在距离公式中,什么条件下的距离公式比较简捷呢?(平行于两轴)那么如何转化i i PN继续探究:①向两轴作平行线,产生i i PM 与'ii PM ,是否可以求1ni ii PM=∑和1'ni ii PM =∑的最小值?②以1ni ii PM=∑ 1ni i i y y ==-∑的最小值为例,如何求含绝对值性质的最值?有什么可以借鉴的呢?③借助方差,可以转化为求()21ni i i y bx a =--∑的最小值.设()21ni i i Q y bx a ==--∑,这样问题就归结为:当,a b 取何值时,Q 最小.④18世纪由德国数学家高斯解决,得到:()()()1122211n ni i i i i i n n i ii i x x y y x y nx y b x x x nx a y bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑(详细推导过程参见学案后阅读材料)知识背景介绍:根据公式可以确定这条直线方程从散点图上看,不管可控变量如何变化,样本点整体上始终在这条直线附近.在生活中对于这种现象比较常见,比如我们都知道父母身高对子女身高存在遗传影响.实际上这个问题早在1889年就由英国著名的统计学家Francils Galton 进行了研究,他发现身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们的父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来人们把由一个变量的变化去推测另一个变量的变化的方法称为回归方法,把代表两个变量线性相关的直线叫做回归直线(学生阅读教材P87). 实例分析:2010年5月,我国篮球巨人姚明的女儿出生,由于姚明身高2米26,叶莉身高1米90,他们的宝宝因此被看做是中国体坛第一宝宝,关于其未来身高的预测一直被球迷津津乐道,许多人都想预测姚明的女儿身高会不会超过她的父母.根据Francils Galton 的回归分析,我们可以知道姚明的孩子作为个体现象,其身高在她成人前我们不能准确知道,但根据统计中总体分布中的规律性,我们可以判断姚明的孩子不一定比她的父母高.(3)学生活动:回归直线方程的应用这个公式形式上非常复杂,我们可以利用图形计算器简化运算.请你运用图形计算器对收集的数据进行回归分析,进行实际检验.问题5:为什么我们的预测结果与实际值之间存在误差呢?从散点图看到,样本点呈条状分布,散布在回归直线的附近,而不是在回归直线上,所以可以用一次函数a bx y +=近似刻画它们关系.但由于所有的样本点()i i y x ,不共线,说明y 与a bx +之间存在误差,记为)(a bx y e +-=,通常e 为随机变量,称为随机误差.问题6:产生随机误差e 的原因是什么?①忽略了其它因素的影响,如影响身高y 的因素不只是左臂长x ,可能有其他因素;②用线性回归模型近似真实模型所引起的误差,即线性回归直线方程中,a b ∧∧的与真实的b a ,之间存在误差; ③左臂长x 的度量误差.因此左臂长x 和身高y 的关系可以用线性回归模型e a bx y ++=来表示(这里b a ,是模型的未知参数),也就是说在函数模型里因变量y 完全由自变量x 确定,而在回归模型里y 的值由x 和随机误差e 共同确定,即x 只能解释部分y 的变化,因此我们称y 为预报变量,x 为解释变量.显然在现实生活中线性回归模型适用范围比一次函数模型适用范围大得多.当以上三项误差越小,说明我们的回归模型的拟合效果越好.当随机变量恒等于0时,线性回归模型变成为一次函数模型,因此一次函数模型是线性回归模型的特殊形式,而线性回归模型是一次函数模型的一般形式.问题7:在线性回归模型中,e 是用a bx +预报真实值y 的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢?实际上我们用回归方程 y bx a =+ 中的估计a bx +,因为)(a bx y e +-=,所以对于样本点()11,,x y ()()22,,n n x y x y ⋅⋅⋅,它们的随机误差为,i i y bx a =--i e 1,2,...,i n =,其估计值为i e ∧=i i i i y y y b x ∧∧-=-,1,2,...a i n ∧-=,称i e ∧为相应于点(),i i x y 的残差.我们可以通过残差i e ∧来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.问题8:如何研究分析残差i e ∧,从而发现数据中的错误并判断模型的拟合效果?操作图形计算器,分析学生左臂长和身高的原始数据以及相应的残差数据. ①利用残差图来分析残差特性.可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。