相关性--北师大z
- 格式:ppt
- 大小:417.00 KB
- 文档页数:14
相关性-北师大版必修3教案课程背景相关性是高中数学中的一个重要概念,也是后续学习数学课程的基础,因此,相关性的教学对于学生以后的学习过程具有非常重要的意义。
本教案是北师大版必修3数学课程的相关性教案。
教学目标1.知识目标:了解相关系数的定义,计算方法及其特点,学会如何计算相关系数。
2.技能目标:能够应用相关系数的概念以及计算方法来解决实际问题。
3.情感目标:增强学生的数学兴趣和探究精神,提高学生的数学思维能力。
教学重点1.相关系数的定义及计算方法。
2.协方差的概念与性质。
3.相关系数与协方差之间的关系。
教学难点1.相关系数与协方差之间的关系理解。
2.相关系数在实际问题中的应用。
教学过程导入环节在引导学生体验和思考两个变量之间联系的实际问题中,自然而然地引出了相关性。
讲解环节1.相关系数的定义及计算方法–引入样本方差、标准差的概念。
–讲解协方差的概念,表示两个变量的变化趋势是否一致。
–讲解相关系数的定义及计算方法。
2.协方差的概念与性质–引入协方差矩阵的概念。
–讲解协方差的性质。
3.相关系数与协方差之间的关系–讲解相关系数与协方差之间的公式关系及其推导。
拓展环节通过实际问题中相关系数的应用和实例的演示,让学生进一步加深对相关性概念的理解和应用。
实验环节在实验中,班级分成若干组,每组随机抽取两项数据,并用Excel等工具计算相关系数。
总结环节通过回答问题和举例,巩固并深入理解相关系数的概念及其计算方法。
并提出不同的问题来提高学生学习兴趣。
课后作业1.完成课本上 P69 练习。
2.搜集实际问题并应用相关系数进行计算和分析。
教学效果评估教师根据学生的课堂表现、测试成绩和实验结果,进行课堂效果的评估。
对于所发现的问题进行及时调整和改进。
结论本教案通过引导学生思考实际问题和运用数学原理来教授相关性的知识,同时通过实例等教学方法增加学生的学习兴趣。
这些都有助于让学生更好地理解相关性的概念和应用,并帮助他们为将来的学习打下扎实的基础。
§2成对数据的线性相关性2.1 相关系数2.2 成对数据的线性相关性分析必备知识基础练知识点一相关系数及其应用1.两个变量y与x的回归模型中,分别计算了4组数据的相关系数r(如下表所示),其中拟合效果最好的是( )A.第一组C.第三组D.第四组2.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )A.r2<r1<0 B.0<r2<r1C.r2<0<r1D.r2=r13.随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加,下表是某购物网站2020年1~8月促销费用x(单位:万元)和产品销量y(单位:万件)的具体数据:(1)(精确到0.01);(2)建立y关于x的回归方程(系数精确到0.01),如果该公司计划在2020年9月份实现产品销量超6万件,预测至少需要投入促销费用多少万元(结果精确到0.01).参考数据: (x i-11)(y i-3)=74.5, (x i-11)2=340, (y i-3)2=16.5, 340 ≈18.4, 16.5 ≈4.1,其中x i,y i分别为第i个月的促销费用和产品销量,i=1,2,3, (8)知识点二判断线性相关的强弱4.维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.5.为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI 值、总胆固醇TC 指标值(单位:mmol /L ),空腹血糖CLU 指标值(单位:mmol /L )如表所示.BMI 值的线性相关程度.参考公式:相关系数r =∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2∑i =1n(y i -y -)2 .参考数据:x - =33,y - =6,z -=8,(x i -x - )2=244, (y i -y - )2≈3.6,(z i -z - )2=5.4, (x i -x - )(y i -y -)=28.3, (x i -x - )(z i -z -)=35.4, 244≈15.6, 3.6 ≈1.9, 5.4 ≈2.3.6.下表为收集到的一组数据:(1)作出x 与(2)建立x 与y 的关系,预报回归模型; (3)利用所得模型,预报x =40时y 的值.关键能力综合练一、选择题1.对变量X ,Y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①;对变量U ,V 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断( )A .变量X 与Y 正相关,U 与V 正相关B .变量X 与Y 正相关,U 与V 负相关C .变量X 与Y 负相关,U 与V 正相关D .变量X 与Y 负相关,U 与V 负相关2.相关变量x ,y 的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y =∧b 1x +∧a 1,相关系数为r 1;方案二:剔除点(10,21),根据剩下数据得到线性回归方程y =∧b 2x +∧a 2,相关系数为r 2,则( )A .0<r 1<r 2<1B .0<r 2<r 1<1C .-1<r 1<r 2<0D .-1<r 2<r 1<0 3.下列命题中:①线性回归方程y =bx +a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; ②在回归分析中,相关系数为0.80的模型比相关系数为0.98的模型的拟合效果要好; ③在回归方程y =0.5x -8中,变量x =2时,变量y 的值一定是-7.其中假命题的个数是( )A.1 B.2 C.3 D.04.x和y的散点图如图所示,则下列说法中所有正确的命题为( )A.x,y是负相关关系B.在该相关关系中,若用y=拟合时的相关系数为r1,用y=bx+a拟合时的相关系数为r2,则r1>r2C.x,y之间不能建立线性回归方程D.由散点图,可以断定x=11时的y值一定比x=10时的y值要小5.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i,y i)(i=1,2,…,20)得到散点图如图所示:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+b e x D.y=a+b ln x二、填空题6.如果散点图中的所有样本点都落在一条斜率为非零实数的直线上,r是相关系数,则r=________.7.对某高三学生在连续多次数学测试中的成绩(单位:分)进行统计得到如下散点图.下面关于这位同学的数学成绩的分析中,正确命题的序号是________.①该同学的数学成绩总的趋势是在逐步提高;②该同学在这连续九次数学测试中的成绩的最高分与最低分的差超过40分;③该同学的数学成绩与测试次数具有线性相关性,且相关系数0<r<1.8.某化工厂产生的废气经过过滤后排放,以模型y=p0e-kx去拟合过滤过程中废气的污染物浓度y mg/L与时间x h之间的一组数据,为了求出回归方程,设z=ln y,其变换后得到线性回归方程z=-0.5x+2+ln 300,则当经过 6 h后,预报废气的污染物浓度为________.三、解答题9.我国大力发展校园足球,为了解某地区足球特色学校的发展状况,社会调查小组得到如下统计数据:(1) (已知:0.75≤|r|≤1,则认为y 与x 的线性相关性很强;0.3≤|r|<0.75,则认为y 与x 的线性相关性一般;|r|≤0.25,则认为y 与x 的线性相关性较弱)(2)求y 关于x 的线性回归方程,并预测该地区2024年足球特色学校的个数(精确到个). 参考公式和数据:r =∑i =1n(x i -x)(y i -y )∑i =1n(x i -x)2∑i =1n(y i -y)2,∑i =15(x i -x )2=10,∑i =15(y i -y )2=1.3,13 ≈3.605 6,∧b=∑i =1n(x i -x)(y i -y )∑i =1n (x i -x )2,a ∧=y -∧bx .学科素养升级练1.[多选题]如图所示是某市2020年4月至2021年3月每月最低气温与最高气温的折线统计图,已知每月最低气温与最高气温的样本相关系数r =0.83,则下列结论正确的是(若|r|>0.75,则线性相关程度较强)( )A .每月最低气温与最高气温有较强的线性相关性,且二者为正线性相关B .月温差(月最高气温-月最低气温)的最大值出现在10月C .9~12月的月温差相对于5~8月,波动性更大D .每月最高气温与最低气温的平均值在所统计的前6个月里逐月增加2.[学科素养——数据分析]已知某地区某种昆虫产卵数和温度有关.现收集了一只该品种昆虫的产卵数y(个)和温度x(℃)的7组观测数据,其散点图如图所示:根据散点图,结合函数知识,可以发现产卵数y 和温度x 可用方程y =e bx +a来拟合,令z =ln y ,结合样本数据可知z 与温度x 可用线性回归方程来拟合.根据收集到的数据,计算得到如下值:27743.53718211.946.418表中z i =ln y i ,z =17(1)求z 和温度x 的回归方程(回归系数结果精确到0.001);(2)求产卵数y 关于温度x 的回归方程;若该地区一段时间内的气温在26~36 ℃(包括26 ℃与36 ℃),估计该品种一只昆虫的产卵数的范围.(参考数据:e 3.282≈27,e 3.792≈44,e 5.832≈341,e 6.087≈440,e 6.342≈568),附:对于一组数据(ω1,v 1),(ω2,v 2),…,(ωn ,v n ),其回归方程∧b =∧b +∧b ω的斜率和截距的最小二乘估计分别为∧b=∑i =1n(ωi -ω)(v i -v )∑i =1n(ωi -ω)2,α∧=v -∧bω .2.1 相关系数2.2 成对数据的线性相关性分析必备知识基础练1.解析:线性相关系数的绝对值|r|越接近1,线性相关程度越强,所以拟合效果最好的是第一组.答案:A 2.解析:对于变量X 与Y 而言,Y 随着X 的增大而增大,故变量Y 与X 正相关,即r 1>0;对于变量U 与V 而言,V 随着U 的增大而减小,故变量V 与U 负相关,即r 2<0.故r 2<0<r 1.答案:C3.解析:(1)根据表中的数据绘制散点图如图,从散点图可以看出这些点大致分布在一条直线附近,所以可用线性回归模型y =bx +a 拟合y 与x 的关系.由题意知,x =18 ×(2+3+6+10+13+21+15+18)=11,y =18×(1+1+2+3+3.5+5+4+4.5)=3,所以相关系数r =∑i =18(x i -x)(y i -y )∑i =18(x i -x)2∑i =18(y i -y)2=74.5340×16.5≈0.99,由相关系数的值接近于1,说明变量y 与x 的线性相关性很强. (2)由(1)知,可用线性回归方程y =bx +a 建立y 与x 的关系,易知b =∑i =18(x i -x)(y i -y )∑i =18(x i -x )2=74.5340≈0.22, a =y -b x =3-0.22×11=0.58,所以y 关于x 的线性回归方程为y =0.22x +0.58. 令0.22x +0.58≥6,解得x≥24.64.即实现产品销量超6万件,预测至少需要投入促销费用24.64万元. 4.解析:列表如下x - =1687 =24,y - =202.947,=4 900.16-7×24×202.9474 144-7×2425 892.013 6-7×(202.947)2≈0.96.由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.5.解析:变量Y 与X 的相关系数r≈28.315.6×1.9 ≈0.95.变量Z 与X 的相关系数r′≈35.415.6×2.3≈0.99,可以看出TC 指标值与BMI 值、CLU 指标值与BMI 值都是高度正相关.6.解析:(1)作出散点图如图,从散点图可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线的周围,其中c 1,c 2为待定的参数.(2)对两边取对数,得ln y =ln c 1+c 2x ,令z =ln y ,则有变换后的样本点应分布在直线z =bx +a(a =ln c 1,b =c 2)的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程了,数据可以转化为x 21 23 25 27 29 32 35 z1.9462.3983.0453.1784.1904.7455.784求得线性回归方程为∧z =0.272x -3.849,∴∧y=e 0.272x -3.849. (3)当x =40时,∧y=e 0.272×40-3.849≈1 131.关键能力综合练1.解析:在题图①中,所有点都在一条直线的附近,且直线的斜率为负值,所以变量X 与Y 负相关;同理,变量U 与V 正相关.故选C .答案:C2.解析:由散点图得这两个变量呈负相关,所以r 1,r 2<0.因为剔除点(10,21)后,剩下的数据更具有线性相关性,所以|r 2|更接近1,所以-1<r 2<r 1<0.故选D .答案:D3.解析:对于①,回归直线不一定经过其样本数据点,但一定经过(x ,y ),所以①不正确;对于②,用相关系数r 的绝对值判断模型的拟合效果,|r|越大,模型的拟合效果越好,所以②不正确;对于③,在回归方程y =0.5x -8中,变量x =2时,y =-7,但实际值可能不是-7,所以③不正确.故选C .答案:C4.解析:在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故A 正确;由散点图知用拟合比用y =bx +a 拟合效果要好,则r 1>r 2,故B 正确;x ,y 之间可以建立线性回归方程,但拟合效果不好,故C 错误;D 中只能估计,不能断定.答案:AB5.解析:由散点图可以看出,随着温度x 的增加,发芽率y 增加到一定程度后,变化率越来越小,符合对数型函数的图象特征.答案:D6.解析:当散点图中的所有点都落在一条斜率为非零实数的直线上时,变量间的相关性最强,|r|=1,所以r =±1.答案:±17.解析:根据散点图可知该同学的数学成绩与测试次数具有正相关关系,所以①③均正确;第一次的成绩在90分以下,第九次的成绩在130分以上,所以②正确.答案:①②③8.解析:当x =6时,∧z =-1+ln 300=ln 300e ,所以=300e.答案:300e9.解析:(1)由题得x =15 ×(2014+2015+2016+2017+2018)=2016,y =15×(0.30+0.60+1.00+1.40+1.70)=1,∴r =∑i =15(x i -x)(y i -y )∑i =15(x i -x)2∑i =15(y i -y)2=3.610× 1.3≈3.63.605 6≈0.998>0.75.∴y 与x 的线性相关性很强.(2)设y 关于x 的线性回归方程为∧y =∧a +∧bx ,b ∧=∑i =15(x i -x)(y i -y )∑i =15(x i -x )2=3.610=0.36, ∧a=y -b ∧x =1-0.36×2 016=-724.76, ∴y 关于x 的线性回归方程是y ∧=0.36x -724.76.当x =2024时,y ∧=0.36×2024-724.76=3.88,预测该地区2024年足球特色学校有388个.学科素养升级练1.解析:每月最低气温与最高气温的样本相关系数r =0.83,可知每月最低气温与最高气温有较强的线性相关性,且二者为正线性相关.由所给的折线图可以看出月温差(月最高气温-月最低气温)的最大值出现在10月.9~12月的月温差相对于5~8月,波动性更大.每月的最高气温与最低气温的平均值在所统计的前5个月里逐月增加,在第6个月开始减少,所以A ,B ,C 正确,D 错误.答案:ABC2.解析:(1)因为z 与温度x 可以用线性回归方程来拟合,故可设∧z =∧a +∧b x ,则∧b =∑i =17(x i -x)(z i -z )∑i =17 (x i -x )2=46.418182≈0.255, 所以∧a =z -∧b x =3.537-0.255×27=-3.348, 故z 关于x 的线性回归方程为∧z=0.255x -3.348. (2)由(1)可得ln y =0.255x -3.348,所以产卵数y 关于温度x 的回归方程为∧y=e 0.255x -3.348, 当x =26时,∧y=e 0.255×26-3.348=e 3.282≈27; 当x =36时,∧y=e 0.255×36-3.348=e 5.832≈341. 因为函数y =e 0.255x -3.348为增函数,所以气温在26~36 ℃时,估计该品种一只昆虫的产卵数的范围是[27,341]内的正整数.。
相关性一、教学目标1.通过收集现实问题中两个变量的数据作出散点图,利用散点图直观认识变量间的相关关系.2.经历用不同的估算方法来描述两个变量线性相关的过程.二、设计思路与教学建议相关性问题是日常生活中普遍存在的问题,教科书从生活的问题展开讨论.生活中,有些变量之间存在明显的函数关系,这对于研究这两个变量之间关系是非常重要的;有些变量之间不满足函数关系,但是它们之间又存在着一种明显的依赖关系,例如人的身高与体重,一般说来,身高越高的人体重越重,但是又没有明显的函数关系.而在日常生活中,我们经常会遇到:在你测量体重时,电子仪器会给你提示――你很健康;或者,你偏胖,需要加强锻炼等等.那么,这些电子仪器又是如何凭借身高与体重情况,对人的健康情况作出判断的呢?电子仪器通常是凭借人的身高与体重的经验公式来作出判断的,这个经验公式反映的就是人的身高与体重之间的依赖关系.当然,两个变量之间的依赖关系有疏有密,这个内容在选修系列中将作进一步讨论.教科书所提供的问题情境中的变量之间通常是存在着较为紧密的相关性.在必修部分我们只讨论这种情形.当然,两个变量之间的相关性可以用一条直线或曲线来进行拟合.如果两个变量之间的依赖关系是近似一条直线,那么这两个变量就是线性相关的;如果两个变量之间的依赖关系是近似一条曲线,那么这两个变量就是非线性相关的;如果两个变量之间不存在明显的依赖关系,那么这两个变量就是不相关的.本教科书主要讨论线性相关的情形.本节教科书首先从生活的问题展开,提出相关性问题.接着,从一个实际的例子展开讨论,重点放在散点图和用不同的方法来拟合两个变量之间的线性关系.在下一节课,主要讨论如何用最小二乘法来对两个变量的线性关系进行拟合.【问题提出】P53先从生活中存在明显函数关系的两个变量开始,函数关系能比较理想和准确地反映两个变量之间的关系;接着,引出不存在明显函数关系的两个变量,举出生活中的例子,并对身高与体重的数据进行分析,以帮助学生理解;进而,提出两个变量之间散点图及相关性的概念.【例】P54给出生活中一个常见的现象――身高越高的人,他的右手一长就越长,但是这两者之间又不是函数关系,而是一个相关关系,从以后的学习中,我们还会知道,这两者之间的相关程度是很大的.基于这个现象,教科书提供了一组真实的数据,让学生来分析这组数据,主要考虑三个方面的问题――其一,制成散点图,从散点图上判断这两者之间是否存在相关关系;其二,近似地描述这种线性关系,画出直线;其三,利用它们之间的近似关系作一个估计.这三个问题是讨论线性相关性时很重要的问题.教科书将重点放在第二个问题的讨论上,旨在提倡学生采用自己的解决方法,因为拟合本身没有最好的方法,只有更好的方法,目的是要让学生进行探究,在探究的过程中寻求较好的拟合方法.这将有助于发散学生的思维,培养学生的创新意识与创新能力.相关性2005-09-30 11:13:42________________________________________【分析理解】P57同学甲和同学乙的思考方法是比较形象的,同学甲最直观,但比较粗略,同学乙“使得在直线两侧的点数尽可能一样多”是理性和精细的.同学丙和同学丁的思考方法是比较理性的,也是相对粗略的,但对于学生来说,比较直观,也便于理解和操作.这两种方法比较程序化,同学丁的方法更精细一点.同学丙和同学丁的思考方法本身是值得研究和探讨的,教学时,教师可以指导有兴趣的学生将这种问题进行更深入的探讨,可以给学生提出这样的问题――如果按照同学丙和同学丁的方法,那么你是否能将他们的思考方法更精细化.比如,我们可以将所有的点分成四个部分,每个部分取一个平均点,这样就得出了四个点的坐标,然后,再分别求出这四个点中的前三个点和后三个点的平均点,最后将这两个点连成一条直线.这条直线在一定程度上要比同学丙和同学丁的方法精细一些.如此做下去,一定会得到越来越精细的拟合.【练习】P59练习中的问题与例题是相似的,处理方法上也是一样的,第(3)个问题的解决方法可由学生自己选择,教师不要强求一致.第(4)个问题是根据第(3)个问题而得出的,所以前一个问题的解决方法不同,可能导致着结果的不同.解题的主要步骤如下.(1)根据表中提供的数据,可以画出如下的散点图.(2)从散点图上可以看出,气温与卖出的热茶杯数近似地成线性关系,并且当气温越高时,所卖出热茶的杯数就越少.(3)同学甲和同学乙的方法略去.按照同学丙的方法,我们可以将数据分成两类:一类是气温高于10℃的,另一类是气温不高于10 ℃的,求出它们的平均点的坐标分别为133,1523,(19,26).设这条近似的直线方程为:y=kx+b,由两个平均点可以求出斜率k=(26-152/3)/(19-13/3)=(-74/3)/(44/3)=-3722≈-1.682,代入一点坐标即可求出b=1.27522≈57.955,进而所求的直线方程为:y=-1.682x+57.955.当x=-5时,y=-1.682×(-5)+57.955≈66.因此,当气温是-5 ℃时,大约能卖出热茶66杯.按照同学丁的方法,我们可以将数据分成三类:平均每类有两个点,第一类是(-1,64),(4,50),第二类是(10,38),(13,34),第三类是(18,24),(26,20).这三类的平均点的坐标依次为(1.5,57),(11.5,36),(22,22),这三个点的“平均点”为(11.7,38.3).设这条近似的直线方程为:y=kx+b,进而由点(1.5,57)和(22,22),求出斜率k=(57-22)/(1.5-22)=35/(-20.5)=-70/41≈-1.707,代入点(11.7,38.3)坐标即可求出b≈58.272,进而所求的直线方程为:y=-1.707x+58.272.当x=-5时,y=-1.707×(-5)+58.272≈67.因此,当气温是-5 ℃时,大约能卖出热茶67杯.【习题1-8】P591.本题主要目的是与抽样方法联系起来,让学生经历一个完整的统计过程,要设计调查方案与分析报告.调查方案与分析报告的书写格式不做硬性要求,但是基本的要求要达到.比如,采用什么的抽样方法,如何组织调查,数据如何进行收集与整理,对数据的分析主要侧重于哪些方面,期望能得到什么样的结论等.这两个问题都可以采用简单随机抽样或系统抽样.对数据的分析可以作出散点图,选用适当的方法画出近似直线.2.本题是与例题类似的问题,也是对本节开始提出的体重与身高问题的一个回答.散点图如下页所示.从散点图上可以看出,这些人的身高与体重近似成一条直线.同学甲和同学乙的方法略去.按照同学丙的方法,我们可以将这10个点分成两组:一组是身高在188 cm以上的,其他的为另一组.可以求得这两组数据的平均点分别为(182.8,74.4),(194.2,88.8).设这条近似的直线方程为:y=kx+b,由两个平均点可以求出斜率k=(88.8-74.4)/(194.2-182.8)=14.4/11.4=24/19≈1.263,代入一点坐标即可求出b=-2 973.6/19≈-156.505,相关性2005-09-30 11:13:42________________________________________进而所求的直线方程为:y=1.263x-156.505.当x=172时,y=1.263×172-156.505≈61,因此,身高是172 cm的运动员的体重大约是61 kg.按照同学丁的方法,我们按照身高状况将数据分成三类:第一类是(175, 63),(180, 75),(185, 79);第二类是(186, 80),(188, 75),(190, 82),(193, 86);第三类是(194, 92),(196, 88),(198, 96).这三类的平均点的坐标依次为180, 2173,(189.25, 80.75),(196, 92),这三个点的“平均点”为(188.4,81.7).设这条近似的直线方程为:y=kx+b,进而由点(180, 2173)和(196, 92),求出斜率k=(92-217/3)/(196-180)=(59/3)/16=59/48≈1.229,代入点(188.4, 81.7)坐标即可求出b≈-149.844,进而所求的直线方程为:y=1.229x-149.844.当x=172时,y=1.229×172-149.844≈62,因此,身高是172 cm的运动员的体重大约是62 kg.3.与第2题类似.根据表中的数据,制成散点图如下.从散点图上可以看出,人的年龄与最大可识别距离近似成一条直线.相关性2005-09-30 11:13:42________________________________________按照同学丙的方法,我们可以将这30个点分成两组:一组是年龄大于54岁的,其他的为另一组.可以求得这两组数据的平均点分别为(31.53, 482),(70.47, 364.67).设这条近似的直线方程为:y=kx+b,由两个平均点可以求出斜率k=(364.67-482)/(70.47-31.53)=-117.33/38.94≈-3,代入一点坐标即可求出b=576.59,进而所求的直线方程为:y=-3x+576.59.当x=50时,y=426.59.因此,一位年龄为50岁的驾驶员的最大可识别距离大约为426.59英尺.按照同学丁的方法,我们按照身高状况将数据分成三组:按照年龄从小到大顺序平均分成三组.这三组平均点的坐标依次为(24.7, 506),(54.2, 407),(74.1, 357),这三个点的“平均点”为(51,423.3).设这条近似的直线方程为:y=kx+b,进而由点(24.7, 506)和(74.1, 357),求出斜率k=(506-357)/(24.7-74.1)=149/-49.4≈-3,代入点(51,423.3)坐标即可求出b=576.3,进而所求的直线方程为:y=-3x+576.3.当x=50时,y=426.3.因此,一位年龄为50岁的驾驶员的最大可识别距离大约为426.3英尺.根据以上的数据与分析结果可以知道,随着年龄的增大,最大可识别距离在减小,因此,建议年龄较大的驾驶员在驾驶时车速不宜太快,否则对交通标志的识别与交通意外的判断都会大大降低,也就是更容易遇到危险.4.本题可以做出几个散点图,从不同的散点图上可以分析不同的相关性,可以求出它们之间关系的拟合直线方程.下面提供了5个散点图,求方程的过程同前几题.(略去)相关性2005-09-30 11:13:42。
高一数学相关性北师大版【本讲教育信息】一. 教学内容:相关性二. 学习目标1. 通过收集现实问题中两个变量的数据作出散点图,利用散点图直观认识变量间的相关关系.2. 经历用不同的估算方法来描述两个变量线性相关的过程.三、知识要点1、变量的相关性变量与变量之间的关系常见的有两类,一类是变量与变量之间存在着确定性的关系,如函数关系,当自变量给出以后,就有唯一的函数值与之对应;一类是变量与变量之间存在着非确定性的依赖关系,如人的身高与体重;2、相关关系当一个变量确定时,另一个变量的取值带有一定的随机性,我们把这两个变量之间的关系称为相关关系。
说明:相关关系与函数关系的异同点①相同点:均指两个变量的关系;②不同点:函数关系是一种确定的关系,描述了自变量与因变量之间的关系,是两个非随机变量之间的关系;相关关系是一种非确定性关系,是非随机变量与随机变量之间的关系。
3、相关关系的分类①正相关:存在相关关系的两个变量,如果一个变量随着另一个变量的增加而增加,则称这两个变量正相关;②负相关:存在相关关系的两个变量,如果一个变量随着另一个变量的增加而减小,则称这两个变量负相关。
4、散点图在研究两个变量的关系时,为了对变量之间的关系有一个大致的认识,把变量对应的点在坐标系中绘出所得到的图称为变量之间的散点图。
5、曲线拟合观察散点图,如果变量之间存在着某种关系,这些点会有一个大致集中的趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这种近似的过程称为曲线拟合。
6、线性相关若两个变量x,y的散点图中,所有点看上去都在一条直线附近波动,则称这两个变量是线性相关的,此时我们可以用一条直线来近似表示。
7、非线性相关若两个变量x,y的散点图中,所有点看上去都在某条曲线(非直线)附近波动,则称此相关为非线性相关,此时我们可以用一条曲线(非直线)来拟合。
8、不相关若所有点在散点图中没有显示任何关系,则称变量间是不相关的。
9、正确认识数据相关与事件因果关系之间的联系①统计数据相关并不意味着两个事件必然具有因果关系(如公鸡打鸣的时间与太阳升起的时间,在统计数据上是相关的);具有因果关系的两件事,从统计数据上看有时也并不相关(如铀矿工人的寿命并不比其他人群短,表面上看在不在铀矿工作与寿命长短并无相关性)。
相关性-备课资料学习导航学习提示1.能根据数据,利用计算机制出反映两个变量间关系的散点图.2.能根据散点图判断变量间是否为线性相关.3.若两个变量为线性相关,告诉一个变量的值,能估计出其对应另一变量的值. 本节重点是能根据散点图,判断两个变量是否为线性相关;难点是根据一个变量的值估计出另一个变量的值. 教材习题探讨 方法点拨练习(第59页) 解:(1)散点图如图1-8-13.杯数气温/ oC (2)从散点图1-8-13中可以看出气温越低,销售热茶的杯数越多,近似地成一条直线,成线性相关. (3)画一条直线近似地表示这种线性关系(如图1-8-13). (4)如果某天的气温为-5℃,则这天的热茶卖出的杯数大约为67杯. 习题1—8 1.解:(1)第一步,先抽取样本.为使抽取的样本具有广泛的代表性,我们可采取分层抽样,按身高分层.. 第三步,根据得到的数据画出散点图.第四步,根据散点图,写出分析报告.(2)利用前面抽取的样本,测量每个个体的左、右手的一拃长,其余同(1).2.解:(1)散点图如图1-8-14.利用计算机电子表格软件作散点图,由散点图推断它们之间是否线性相关.本解答只提供步骤方法,具体由学生根据学过的方法知识、实际数据完成答案,然后互相交流比较.我们用计算机电子表格软件作散点图,由散点图推断身高与体重之间成线性相关,画出近似直线.由直线再估算身高为172 cm 的体重.12108642体重/k g 身高/c m图(2)从散点图1-8-14中可以看出,总体上体重随身高增大而增大,近似地成一条直线,成线性相关. (3)所画直线如图1-8-14.(4)身高为172 cm 的运动员,他的体重大约为61 kg. 3.解:(1)散点图如图1-8-15.7654321最大可识别距离/英尺 年龄/岁图我们从散点图1-8-15中可以发现,年龄与最大可识别距离总体趋势成一条直线,它们之间是线性相关的. (2)所画直线如图1-8-15.(3)如果一个美国司机年龄是50岁,估计他最大可识别距离为440英尺左右.(4)一般情况,年龄越大,可识别最大距离越小.老年司机开车时车速应比年青人要小一些. 4.解:肝功能原始值年龄76050 100图1-8-16 图1-8-16为年龄与肝功能原始值的散点图,由散点图可以看出年龄与肝功能原始值之间成线性相关.同样,年龄与肝功能对数变换值之间也成线性相关.同学们一定要熟练应用计算机电子表格软件作散点图.本题散点较多,如果用手工描图工作量非常大,故熟练应用现代计算机信息技术,利用计算机电子表格软件作散点图效率很高且比较准确.生存天数原始值10008006040200年龄50 100图1-8-17 图1-8-17是年龄与生存天数原始值的散点图.由散点图可以看出年龄与生存天数原始值之间成线性相关.同样年龄与生存天数对数变换值之间也成线性相关.108642-2图图1-8-18为肝功能原始值与生存天数原始值之间的散点图.由散点图可以看出它们之间成线性相关.同样,肝功能对数变换值与生存天数对数变换值之间也成线性相关. 互动学习知识链接1.在现实生活中,请你举出几个两个量之间存在明确函数关系的例子.2.请在现实生活中举出两个变量不满足函数关系,但二者确实有关系的例子.解:1.圆的半径r 和面积S ,有着S=πr2的关系.工作效率a和工作量W ,有着W=at 的关系.物体的质量m 和体积V ,满足m=ρV 的关系.2.(1)商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关. (2)粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素,因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.(3)人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等因素有关,可能还与个人的先天体质有关.在现实生活中,有些量之间存在着函数关系,还有很多量之间不满足函数关系,但二者之间确实有关系,这种关系正是本节所要研究的问题.知识总结两个变量间的关系有两种:一种是函数关系;另一种是相关关系.理解两种关系的定义及两者之间的联系.另外散点图非常重要,要会画散点图,并会根据散点图判断两个变量间是何种关系.。