第8.1节两个变量的相关关系
- 格式:ppt
- 大小:216.00 KB
- 文档页数:11
第八章成对数据的统计分析 8.1 成对数据的相关关系一、选择题(共40小题;共200分)1. 下列图形中具有相关关系的两个变量是( )A. B.C. D.2. 有关线性回归的说法,不正确的是( )A. 具有相关关系的两个变量不具有因果关系B. 散点图能直观地反映数据的相关程度C. 回归直线最能代表线性相关的两个变量之间关系D. 任一组数据都有回归直线3. 下列两个变量之间的关系,不是函数关系的是( )A. 角度与它的正弦值B. 圆的半径与它的面积C. 正n边形的边数和正n边形的内角和D. 人的年龄与身高4. 下列两个变量之间的关系,不是函数关系的是( )A. 角度与它的余弦值B. 正方形的边长与面积C. 正n边形的边数与各内角的角度之和D. 人的年龄与身高5. 已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程必过( )A. 点(2,2)B. 点(1.5,0)C. 点(1,2)D. 点(1.5,4)6. 一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( )A. 确定性关系B. 相关关系C. 函数关系D. 无任何关系7. 下列关系属负相关的是( )A. 父母的身高与子女身高的关系B. 农作物产量与施肥的关系C. 吸烟与健康的关系D. 数学成绩与物理成绩的关系8. 如图所示,每个图的两个变量具有相关关系的是( )A. (1)(2)B. (1)(3)C. (2)(4)D. (2)(3)9. 下列两个变量之间是相关关系的是( )A. 圆的面积与半径之间的关系B. 球的体积与半径之间的关系C. 角度与它的正弦值之间的关系D. 降雪量与交通事故的发生率之间的关系10. 对变量x,y有观测数据(x i,y i)(i=1,2,⋯,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,⋯,10),得散点图(2),由这两个散点图可以判断( )A. 变量x与y正相关,u与v正相关B. 变量x与y正相关,u与v负相关C. 变量x与y负相关,u与v正相关D. 变量x与y负相关,u与v负相关11. 已知变量x和y满足关系y=−0.1x+1,变量y与z正相关.下列结论中正确的是( )A. x与y正相关,x与z负相关B. x与y正相关,x与z正相关C. x与y负相关,x与z负相关D. x与y负相关,x与z正相关12. 下列关系中,是相关关系的有( )①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.A. ①②B. ①③C. ②③D. ②④13. 假设有两个分类变量X和Y的2×2列联表:YX y1y2总计x1a10a+10x2c30c+30总计6040100对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为( )A. a=45,c=15B. a=40,c=20C. a=35,c=25D. a=30,c=3014. 对于给定的两个变量的统计数据,下列说法中正确的是( )A. 都可以分析出两个变量的关系B. 都可以用一条直线近似地表示两者的关系C. 都可以作出散点图D. 都可以用确定的表达式表示两者的关系15. 以下四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件进行某项指标检测,这种抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程y^=0.2x+12中,当解释变量x每增加1个单位时,预报变量y^平均增加0.2个单位;④对分类变量X与Y,它们的随机变量K2的观测值k越小," X与Y有关系"的把握程度越大,其中正确的命题是( )A. ①④B. ②③C. ①③D. ②④16. 对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( )A. 频率分布直方图与总体密度曲线无关B. 频率分布直方图就是总体密度曲线C. 样本容量很大的频率分布直方图就是总体密度曲线D. 如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线17. 试从下面四个图中的点在散点图上的分布状态,直观上初步判断两个变量之间有线性相关关系的是( )A. B.C. D.18. 列两个变量之间的关系,不是函数关系的是( )A. 角度与它的余弦值B. 正方形的边长与面积C. 正n边形的边数与内角度数之D. 人的年龄与身高19. 单位产品成本与其产量的相关关系,单位产品成本与单位产品原材料消耗量相关关系中( )A. 前者是正相关,后者是负相关B. 前者是负相关,后者是正相关C. 两者都是正相关D. 两者都是负相关20. 在下列各图中,图中的两个变量间具有相关关系的是( )A. (1)(2)B. (1)(3)C. (2)(4)D. (2)(3)21. 下列变量之间的关系是函数关系的是( )A. 已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量为这个函数对应方程的判别式B. 光照时间和果树亩产量C. 降雪量和交通事故的发生率D. 每亩施用肥料量和粮食亩产量22. 下列有关样本相关系数的说法不正确的是( )A. 相关系数用来衡量x与y之间的线性相关程度B. ∣r∣≤1,且∣r∣越接近0,相关程度越小C. ∣r∣≤1,且∣r∣越接近1,相关程度越大D. ∣r∣≥1,且∣r∣越接近1,相关程度越大23. 观察下列各图:其中两个变量x,y具有线性相关关系的图是( )A. ①②B. ①④C. ③④D. ②③24. 如图是根据变量x,y的观测数据(x i,y i,i=1,2,⋯,10)(得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是( )A. ①②B. ①④C. ②③D. ③④25. 如图是根据x,y的观测数据(x i,y i)(i=1,2,⋯,10)得到的散点图,由这些散点图可以判断变量x,y具有线性相关关系的图是( )A. ①②B. ①④C. ②③D. ③④26. 下列语句所表示的事件不具有相关关系的是( )A. 瑞雪兆丰年B. 名师出高徒C. 吸烟有害健康D. 喜鹊叫喜27. 已知变量x和y满足关系y=−0.1x+1,变量y与z正相关.下列结论中正确的是( )A. x与y正相关,x与z负相关B. x与y正相关,x与z正相关C. x与y负相关,x与z负相关D. x与y负相关,x与z正相关28. 观察下列散点图,其中两个变量的相关关系判断正确的是( )A. a为正相关,b为负相关,c为不相关B. a为负相关,b为不相关,c为正相关C. a为负相关,b为正相关,c为不相关D. a为正相关,b为不相关,c为负相关29. 在一组样本数据(x1,y1),(x2,y2),⋯,(x n,y n)(n≥2,x1,x2,⋯,x n不全相等)的散点图中,若所x+1上,则这组样本数据的样本相关系数为有样本点(x i,y i)(i=1,2,⋯,n)都在直线y=12( )D. 1A. −1B. 0C. 1230. 在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A. 100个吸烟者中至少有99人患有肺癌B. 1个人吸烟,那么这人有99%的概率患有肺癌C. 在100个吸烟者中一定有患肺癌的人D. 在100个吸烟者中可能一个患肺癌的人也没有31. 在研究打酣与患心脏病之间的关系中,通过收集数据、整理分析数据得"打酣与患心脏病有关"的结论,并且有99%以上的把握认为这个结论是成立的.下列说法中正确的是( )A. 100个心脏病患者中至少有99人打酣B. 1个人患心脏病,则这个人有99%的概率打酣C. 100个心脏病患者中一定有打酣的人D. 100个心脏病患者中可能一个打酣的人都没有32. 有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的重量和每千米耗油量.其中两个变量成正相关的是( )A. ①③B. ②④C. ②⑤D. ④⑤33. 对于回归分析,下列说法错误的是( )A. 在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B. 线性相关系数可以为正或负C. 回归分析中,如果r2=1或r±1,说明x与y之间完全线性相关D. 样本相关系数r∈(−1,1)34. 下图中的两个变量具有相关关系的是( )A. B.C. D.35. 下面两个变量之间是相关关系的是( )A. 出租车车费与行驶的里程B. 房屋面积与房屋价格C. 身高与体重D. 铁的大小与质量36. 对于给定的两个变量的统计数据,下列说法正确的是( )A. 都可以分析出两个变量的关系B. 都可以用一条直线近似地表示两者的关系C. 都可以作出散点图D. 都可以用确定的表达式表示两者的关系37. 对变量x,y有观测数据(x i,y i)(i=1,2,⋯,10),得散点图1;对变量u,v有观测数据(u i,v i)(i=1,2,⋯,10),得散点图2.由这两个散点图可以判断( ).A. 变量x与y正相关,u与v正相关B. 变量x与y正相关,u与v负相关C. 变量x与y负相关,u与v正相关D. 变量x与y负相关,u与v负相关38. 下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:气温∘C1813104−1杯数2434395163若热茶杯数y与气温x近似地满足线性关系,则其关系式最接近的是( )A. y=x+6B. y=x+42C. y=−2x+60D. y=−3x+7839. 观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是( )A. B.C. D.40. 变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )A. r2<r1<0B. 0<r2<r1C. r2<0<r1D. r2=r1二、填空题(共30小题;共150分)41. 下列关系中带有随机性相关关系的有.①光照时间与果树的亩产量的关系;②圆柱体积与其底面直径的关系;③自由落体的物体的质量与落地时间的关系;④球的表面积与球半径之间的关系.42. 下列关系中,属于相关关系的是.①正方形的边长和面积之间的关系;②水稻产量与施肥量之间的关系;③人的身高与学习成绩之间的关系;④降雪量与交通事故的发生率之间的关系.43. 下列变量间的关系是相关关系的有,是函数关系的有.①球的表面积与体积;②光照时间和果树亩产量;③降雪量和交通事故发生率;④出租车费与行驶的里程;⑤人的身高与视力;⑥家庭的支出与收入;⑦收入水平与纳税水平.44. 在研究两个变量的关系时,可以通过残差e^1,e^2,⋯,e^n来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为分析.45. 相应于显著性水平0.05,观测值为10组的相关数临界值为.46. 自变量取值一定时,因变量的取值两个变量之间的关系叫做相关关系.与函数关系,相关关系是一种.47. 对具有的两个变量进行统计分析的方法叫回归分析.48. 现有一个由身高预测体重的回归方程:体重预测值=4(磅/英寸)×身高−130磅.其中体重与身高分别以磅和英寸为单位.如果换算为公制(1英寸≈2.5cm,1磅≈0.45kg),回归方程应该为.49. 从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为.50. 在分析两个分类变量之间是否有关系时,常用到的图表有.51. 据两个变量x,y之间的关系,观察数据画成散点图如图,这两个变量是否具有线性相关关系(答是与否).52. 为了判断两个变量x,y之间是否具有相关关系,描出每一组观测值(x,y)表示的点,得到的图形称为.53. 表示具有相关关系的两个变量的一组数据的图形叫做.54. 现实世界中存在许多情况是两个变量间有密切联系,但这种关系无法用确定的函数关系式表达出来,这种变量之间的关系称.55. 在两个变量的回归分析中,作散点图的目的是.56. 判断下列结论的正误(正确的打“√”错误的打“×”)(1)相关关系与函数关系都是一种确定性的关系.( )(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示.( ) 57. 已知一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1、2.…n),若e i恒为0,则R2为.58. 若有一组数据的总偏差平方和为100,相关指数为0.5,则其残差平方和为,回归平方和为.59. 许多因素都会影响贫穷,教育也是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的线性回归方程为y^=0.8x+4.6,斜率的估计值等于0.8说明,成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)之间的相关系数.(填“大于0”或“小于0”)60. 有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系.其中有相关关系的是.61. 下列四个关系中为相关关系的是.①正方形的边长与其面积的关系;②圆的面积与半径的关系;③圆柱体积与其底面半径的关系;④Rt△ABC中,锐角A的大小与斜边长度的关系.62. 某市居民2010∼2014年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:年份20102011201220132014收入x11.512.11313.315支出y 6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是,家庭年平均收入与年平均支出有相关关系.(填“正”或“负”)63. 有下列关系:①名师出高徒;②球的体积与该球的半径之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系;⑥乌鸦叫,没好兆.其中,具有相关关系的是.64. 根据你的生活经验及掌握的知识,将下列所有你认为正确的结论填入题后空中.①一般地,学生的数学成绩与物理成绩之间是正相关的;②一般地,学生的数学成绩与英语成绩是负相关的;③一块农田的水稻产量与施肥量之间是相关关系;④对于在校儿童,年龄的大小与阅读能力有很强的相关关系.以上正确的结论是.65. 有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系,其中有相关关系的是66. 已知施化肥量x与水稻产量y的试验数据如下表,则变量x与变量y是相关(填“正”或“负”)施化肥量x15202530354045水稻产量y33034536540544545045567. 下列命题中:①命题p:“∃x0∈R,x02−x0−1>0”的否定¬p“∀x∈R,x2−x−1≤0”;②汽车的重量和汽车每消耗1升汽油所行驶的平均路程成正相关关系;③命题“若a>b,则2a>2b−1”的否命题为“若a≤b,则2a≤2b−1”;④概率是随机的,在试验前不能确定.正确的有.68. 有同学在用电子邮件时发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少,为了研究国籍与邮箱名称是否与含有数字有关,于是我们共收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.那么认为"国籍和邮箱名称里是否含有数字有关"的把握性为.(用百分数表示)69. 某炼钢厂废品率x(%)与成本y(元/t)的线性回归方程为y^=105.492+42.569x.当成本控制在176.5元/t时,可以预计生产1000t钢中,约有t钢是废品.70. 以下四个命题,其中正确的序号是.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程y^=0.2x+12中,当解释变量x每增加一个单位时,预报变量y^平均增加0.2个单位;④对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.三、解答题(共30小题;共390分)71. 如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?72. 某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据:x24568y3040605070判断这两者是否具有相关关系,如果具有的话,进一步判断是正相关还是负相关.73. 从高一(1)班中随机选出10名同学,将他们的身高、数学成绩和物理成绩列表如下:身高(m) 1.50 1.60 1.55 1.65 1.45 1.60 1.52 1.66 1.70 1.40数学成绩(分)90857888877695756870物理成绩(分)88848083787090807468试判断数学成绩与身高和物理成绩是否成线性相关关系.74. “明师出高徒”可以解释为教师的水平越高,学生的水平也越高.那么,教师的水平与学生的水平是否成相关关系?如成相关关系,是正相关,还是负相关?你能举出更多描述生活中两个变量或相关关系的成语吗?75. 5个学生的数学和物理成绩如下表(单位:分)画出散点图,并判断它们是否有相关关系.76. 在班级随机地抽取8名学生,得到一组数学成绩与物理成绩的数据:数学成绩6090115809513580145物理成绩4060754070856090(1)计算出数学成绩与物理成绩的平均分及方差;(2)求相关系数r的值,并判断相关性的强弱;(r≥0.75为强)(3)求出数学成绩x与物理成绩y的线性回归直线方程,并预测数学成绩为110的同学的物理成绩.77. 下图甲、乙分别是对应于(a),(b)两组数据的散点图:表(a)A261813104−1B202434385064表(b)C05101520253035D541.67602.66672.09704.99806.71908.59975.421034.75根据数据的散点图判断两图中变量是否具有相关关系;如果具有相关关系,请说出是哪种相关关系.78. 抽测10名15岁的男生的身高x(单位:cm)和体重y(单位:kg),得到如下数据:x157153151158155156159160158163y45.544424644.54546.5474549(1)作出散点图;(2)从散点图中观察身高与体重成什么关系?(3)如果近似成线性关系,试画出一条直线来近似地表示这种关系.79. 某校为调查学生喜欢数学是否与性别有关,对50名学生进行了问卷调查得到了如下的列联表:喜欢数学不喜欢数学合计男生5女生10合计50已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3.5临界值参考:P(k2≥k)0.100.050.250.0100.0050.001k 2.706 3.841 5.024 6.6357.87910.828,其中n=a+b+c+d)(参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)(1)请将上面的列联表补充完整(不用写计算过程);(2)是否有99.5%的把握认为喜欢数学与性别有关?说明你的理由.80. 有一台机床可以按各种不同的速度运转,其加工的零件中有二级品,并且每小时生产的二级品零件的数量随机床运转的速度而变化,下面是记录的数据:机床运转的速度(转/秒)每小时生产二级品的数量/个851281491611(1)作出散点图,并说明上述两个变量之间是否具有线性相关关系;(2)求出机床运转的速度x与每小时生产二级品数量y的回归直线方程;(3)若实际生产中每小时所允许的二级品数量不超过10个,那么机床运转速度不得超过多少转/秒?(保留两位小数)81. 给出施化肥量对水稻产量影响的试验数据如下表:施化肥量x15202530354045水稻产量y330345365405445450455(1)画出散点图,并判断这两者之间是否具有线性相关关系;(2)如果具有线性相关关系,请求出回归直线并且画出图形.82. 在某小区随机抽取16名成年男子测量他们的体重,x表示第一年的体重,y表示第二年的体重,数据如下(单位:kg):x77599098668569847276887595847965y68668199759175808069726391849273(1)对变量y与x进行相关性检验;(2)如果y与x具有线性相关关系,求回归直线方程.83. 下表是某地一年中10天测量的白昼时间统计表(时间近似到0.1小时,一年按365天计算):日期日期位置序号x白昼时间y(小时)日期日期位置序号x白昼时间y(小时)1月1日1 5.66月21日17219.42月28日5910.28月13日22516.43月21日8012.49月20日26312.44月27日11716.410月25日2988.55月6日12617.312月21日3555.4(1)以日期在 365 天中的位置序号 x 为横坐标,白昼时间 y 为纵坐标,在给定的坐标系中画出这些数据的散点图;(2)试选用一个函数近似描述一年中白昼时间 y 与日期位置 x 之间的函数关系; (3)用 (2) 中的函数模型估计该地一年中大约有多少天白昼时间大于 15.9 个小时.84. 某公司的广告费支出 x 与销售额 y (单位:万元)之间有下列对应数据x 24568y 3040605070参考公式:回归方程为 y ^=bx +a ,其中 b =∑x i y i −nxyn i=1∑x i 2−nx2n i=1,a =y −bx .(1)画出散点图,并判断广告费与销售额是否具有相关关系;(2)根据表中提供的数据,用最小二乘法求出 y 与 x 的回归方程 y ^=bx +a ; (3)预测销售额为 115 万元时,大约需要多少万元广告费.85. 在研究色盲与性别的关系调查中,调查了男性 480 人,其中有 38 人患色盲,调查的 520 个女性中 6 人患色盲,根据以上的数据得到一个 2×2 的列联表如下患色盲不换色盲总计男480女520总计1000(1)请根据以上的数据完成这个 2×2 的列联表;(2)若认为“性别与患色盲有关系”,则出错的概率会是多少? 参考数据:(38×514−442×6)2480×520×44×956=0.02714;(38×6−442×514)2480×520×44×956=4.90618;(38×442−6×514)2480×520×44×956=0.01791;86. 菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水 x (单位:千克)清洗该蔬菜 1 千克后,蔬菜上残留的农药 y (单位:微克)的统计表:x 12345y 5854392910(1)在下面的坐标系中,描出散点图,并判断变量 x 与 y 的相关性;(2)若用解析式 y ^=cx 2+d 作为蔬菜农药残量 y ^ 与用水量 x 的回归方程,令 ω=x 2,计算平均值 ω 和 y ,完成以下表格(填在答题卡中),求出 y ^ 与 x 的回归方程;(c ,d 精确到 0.1)ω1491625y 5854392910ωi −ωy i −y(3)对于某种残留在蔬菜上的农药,当它的残留量低于 20 微克时对人体无害,为了放心食用该蔬菜,请估计需要用多少千克的清水清洗一千克蔬菜?(精确到 0.1,参考数据 √5≈2.236)(附:线性回归方程 y ^=b ^x +a ^ 中系数计算公式分别为: b^=i −x )(i −y )n i=1(x −x )2,a ^=y −b^x .)87. 某地区 2007 年至 2013 年农村居民家庭纯收入 y (单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t 1234567人均纯收入y2.93.33.64.44.85.25.9(1)求 y 关于 t 的线性回归方程;(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入.88. 在块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg )施化肥量x/kg 15202530354045水稻产量y/kg 330345365405445450455 (1)作出这些数据的散点图; (2)由(1)分析两变量之间的关系: (3)求回归线性方程; (4)当所施化肥量为 50kg 时,求水稻的产量.89. 假设某关于设备的使用年限 x (年)和所支出的维修费用 y (万元)有如下的统计资料.x 23456y 2.2 3.8 5.5 6.57.0(1)画出散点图并判断是否线性相关; (2)如果线性相关,求回归直线方程; (3)估计使用 10 年时的维修费用.90. 已知一个样本数据的对应值如下表:x 1825303941424952y 356788910判断 x ,y 之间是否有线性相关关系,若有,求其线性回归方程.91. 在电视的收视率调查中,得到性别与收视习惯的列联表如下表所示.试用独立性检验的方法分析性别与收视习惯是否有关?若有关系,则说出可在多大程度上认为有关系?92. 如图是某企业 2010 年至 2016 年污水净化量(单位:吨)的折线图.注:年份代码 1∼7 分别对应年份 2010∼2016.附注:参考数据:y =54,∑(t i −t)7i=1(y i −y )=21,√14≈3.74,∑(y i −yi ^)27i=1=94.参考公式:相关系数 r =i −t)n i=1i −y )√∑(t i −t)ni=1∑(y i −y )2ni=1 y ^=a ^+b^t 中斜率和截距的最小二乘估计公式分别为 b^=i −t)n i=1i −y )∑(t −t)2n i=1,a ^=y −b^t . 反映回归效果的公式为 R 2=1i i 2n i=1∑(y −y)2n ,其中 R 2越接近于 1,表示回归的效果越好. (1)由折线图看出,可用线性回归模型拟合 y 和 t 的关系,请用相关系数加以说明; (2)建立 y 关于 t 的回归方程,预测 2017 年该企业污水净化量; (3)请用数据说明回归方程预报的效果.93. 2015 男篮亚锦赛决赛阶段,中国男篮以 9 连胜的不败战绩赢得第 28 届亚锦赛冠军,同时拿到亚洲唯一 1 张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛 MVP (最有价值球员),如表是易建联在这 9 场比赛中投篮的统计数据.注:(1)表中 a/b 表示出售 b 次命中 a 次;(2)TS%(真实得分率)是横梁球员进攻的效率,其计算公式为:TS%=全场得分2×(投篮出手次数+0.44×罚球出手次数);(1)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%超过50%的概率;(2)从上述9场比赛中随机选择两场,求易建联在这两场比赛中TS%至少有一场超过60%的概率;(3)用x来表示易建联某场的得分,用y来表示中国队该场的总分,画出散点图如图所示,请根据散点图判断y与x之间是否具有线性相关关系?结合实际简单说明理由.94. 2015男篮亚锦赛决赛阶段,中国男篮以9连胜的不败战绩赢得第28届亚锦赛冠军,同时拿到亚洲唯一1张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛MVP最有价值球员),如表是易建联这9场比赛中投篮的统计数据.注:(1)表中a/b表示出手b次命中a次;(2)TS%(真实得分率)是衡量球员进攻的效率,其计算公式为:TS%=全场得分2×(投篮出手次数+0.44×罚球出手次数)(1)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%过50%的概率;。
8.1 成对数据的相关关系-人教A版高中数学选择性必修第三册(2019版)教案一、教学目标1.理解成对数据相关关系的概念。
2.能够用散点图表示成对数据的相关关系。
3.掌握用皮尔逊积矩相关系数度量成对数据的相关关系的强度和方向。
4.能够根据相关系数的大小和符号判断成对数据的相关关系的强度和方向,并进行解释。
5.能够利用样本数据计算相关系数,并进行正确的解读。
二、教学重难点1.重点:皮尔逊积矩相关系数的计算方法和相关系数的解释。
2.难点:相关系数的判断及其解释。
三、教学内容和过程1. 概念引入老师先给出几组数据,例如二元组(4,10),(5,20),(6,30),(7,40),让学生们对这些数据进行观察和思考,看看是否存在某种关系。
然后再引出成对数据的相关关系的概念,并解释相关关系的强度和方向。
2. 散点图的表示为了更形象地表示成对数据的相关关系,老师可以让同学们将数据转化为散点图。
然后以散点图为基础,引导学生们讨论成对数据的相关关系的强度和方向。
3. 相关系数的计算老师向同学们介绍皮尔逊积矩相关系数的定义和计算方法,然后进行示范。
在计算的过程中,老师需要提醒同学们要注意计算过程中的准确性和细节。
4. 相关关系的解释为了更好地让同学们理解相关系数的含义,老师可以对几组数据进行计算,然后让同学们根据相关系数的大小和符号判断成对数据的相关关系的强度和方向,并进行解释。
5. 相关系数的应用老师可以利用选修三中的案例,引导学生们运用相关系数的知识解决实际问题,如“影响两块地板之间热量传递的因素有哪些?”,以及“研究肺癌与吸烟的相关关系时,如何计算相关系数并解释其含义?”等。
四、教学方法1.演示法:老师先以实例为基础进行讲解,然后项目让同学们自己完成相关关系的计算和判断。
2.讨论法:老师可以利用成对数据的案例,进行一些讨论和知识点的引导。
五、教学评估1.完成课堂演示的学生自我评估和相互评估。
2.设计作业,让学生们自己计算相关系数,并根据结果解释成对数据的相关关系的强度和方向。
温馨提示:此套题为Word 版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。
关闭Word 文档返回原板块。
第八章 成对数据的统计分析8.1 成对数据的统计相关性必备知识·素养奠基1.变量的相关关系(1)两个变量的关系(2)散点图:将样本中的每一个序号下的成对数据用直角坐标系中的点表示出来得到的统计图.(3)正相关与负相关加时,另一个变量的相应值也呈现增加的趋势加时,另一个变量的相应值呈现减少的趋势(4)线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.正相关与负相关是对所有具有相关关系的两个变量而言的,对吗?提示:不对,正相关与负相关是针对线性相关关系而言的.2.样本的相关系数(1)相关系数:统计学里一般用r=错误!未找到引用源。
=错误!未找到引用源。
来衡量y与x的线性相关性的强弱,这里的r称为样本相关系数(简称相关系数).(2)相关系数的性质1r>0时,成对数据正相关;r<0时,成对数据负相关,-1≤r≤1.2 |r|越小,两个变量之间的线性相关程度越弱,|r|越大,两个变量之间的线性相关程度越强.3|r|=1时,成对数据构成的点都在一条确定的直线上.|r|的大小有何实际意义?提示:|r|越小,两个变量之间的线性相关性越弱;|r|越大,两个变量之间的线性相关性越强.1.思维辨析(对的打“√”,错的打“×”)(1)两个变量的相关关系是一种确定的关系.( )(2)两个变量的相关系数越大,它们的相关程度越强.( )(3)当一个变量的值增加时,另一个变量的值随之减少,则称这两个变量负相关.( )(4)一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.( )提示:(1)×.两个变量的相关关系不是一种确定的关系,是一种随机关系. (2)×.相关系数|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.(3)×.存在相关关系的两个变量,当一个变量增加时,另一个变量的相应值呈减少的趋势,则称这两个变量负相关.(4)√.2.根据一组数据判断两个变量是否线性相关时,应选( )A.茎叶图B.频率分布直方图C.散点图D.频率分布折线图【解析】选C.判断两个变量是否有线性相关关系时,应先画出散点图.若这些点大体分布在一条直线附近则具有线性相关关系.3.已知两个变量负相关,且相关程度很强,则它们的相关系数的大小可能是( )A.-0.95B.-0.13C.0.15D.0.96【解析】选A.相关系数r<0时,成对数据负相关,且|r|越大,两个变量之间的线性相关程度越强.关键能力·素养形成类型一相关关系与线性相关关系角度1 相关关系【典例】(多选题)下列关系中,属于相关关系的是( )A.正方形的边长与面积之间的关系B.农作物的产量与施肥量之间的关系C.人的身高与年龄之间的关系D.降雪量与交通事故的发生率之间的关系【思维·引】紧扣相关关系的概念加以判断.【解析】选BD.在A中正方形的边长与面积之间的关系是函数关系;在B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在C中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在D中,降雪量与交通事故的发生率之间具有相关关系.角度2 线性相关关系的判断【典例】5名学生的数学和物理成绩(单位:分)如下:物理70 66 68 64 62成绩判断数学成绩与物理成绩是否具有线性相关关系.【思维·引】根据散点图判断.【解析】以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.【素养·探】本例考查利用散点图判断两个变量是否线性相关,同时考查了数据分析与数学抽象的核心素养.本例条件若改为:某公司2014~2019年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:年份2014 2015 2016 2017 2018 2019利润x 12.2 14.6 16 18 20.4 22.3支出y 0.62 0.74 0.81 0.89 1 1.11判断x与y是否线性相关,是正相关还是负相关?【解析】作出散点图(图略),由散点图可知,各点分布在一条直线附近,故x与y 之间线性相关,且y随x的增大而增大,是正相关.【类题·通】1.函数关系与相关关系函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.两个变量是否相关的两种判断方法(1)实际经验法:借助积累的经验进行分析判断;(2)散点图法:绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.【习练·破】1.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【解析】选C.由题图象知,变量x与y呈负相关关系;u与v呈正相关关系.2.下列两个变量间的关系不是函数关系的是( )A.圆的半径与周长B.角的度数与它的正切值C.单产为常数时,土地面积与粮食总产量D.日照时间与水稻的单位产量【解析】选D.函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项C=2πr,B项y=tan α,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系.【加练·固】某个男孩的年龄与身高的统计数据如表所示.年龄x(岁) 1 2 3 4 5 6身高y(cm) 78 87 98 108 115 120(1)画出散点图;(2)判断y与x是否具有线性相关关系.【解析】(1)散点图如图所示.(2)由散点图知,所有数据点分布在一条直线附近,因此,认为y与x具有线性相关关系.类型二相关系数与相关程度的判断角度1 相关系数的概念【典例】下面的各图中,散点图与相关系数r不符合的是( )【思维·引】根据相关系数与散点图的关系解答.【解析】选B.A、B选项中散点全部集中在一条直线上,且分别呈负、正相关,故相关系数r的值应分别为-1,1;C选项变量呈负相关,故-1<r<0,D选项变量没有相关性,相关系数近似看为0.角度2 相关程度的判断【典例】一般来说,一个人的身高越高,他的手就越大,为调查这一问题,对某校10名高一男生的身高与右手长度进行测量得到如下数据(单位:cm):身高168 170 171 172 174 176 178 178 180 181 右手长度19.20.21.21.521.22.24.23.22.523.(1)判断两者有无线性相关关系;(2)如果具有线性相关关系,判断相关性的强弱.【思维·引】画散点图判断是否线性相关,求相关系数刻画相关程度. 【解析】(1)散点图如图所示.可见,身高与右手长度之间的总体趋势为一条直线,即它们线性相关.(2)根据以上数据可由计算器计算得错误!未找到引用源。
8.1.2 样本相关系数新知探究散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢?问题 若样本系数r =0.97,则成对样本数据的相关程度如何? 提示 r =0.97,表明成对样本数据正线性相关程度很强.1.相关系数r 的计算注意:相关系数是研究变量之间线性相关程度的量假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),对数据作进一步的“标准化处理”处理,用s x =1n ∑ni =1 (x i -x -)2,s y =1n ∑ni =1(y i -y -)2分别除x i -x -和y i -y -(i =1,2,…,n ,x -和y -分别为x 1,x 2,…,x n 和y 1,y 2,…,y n 的均值),得⎝ ⎛⎭⎪⎫x 1-x -s x ,y 1-y -s y ,⎝ ⎛⎭⎪⎫x 2-x -s x ,y 2-y -s y ,…,⎝ ⎛⎭⎪⎫x n -x -s x ,y n -y -s y ,为简单起见,把上述“标准化”处理后的成对数据分别记为(x 1′,y 1′),(x 2′,y 2′),…,(x n ′,y n ′),则变量x 和变量y 的样本相关系数r 的计算公式如下: r =1n (x 1′y 1′+x 2′y 2′+…+x n ′y n ′)=∑n i =1 (x i -x -)(y i -y -)∑n i =1(x i -x -)2∑n i =1(y i -y -)2.2.相关系数r 的性质(1)当r >0时,称成对样本数据正相关;当r <0时,成对样本数据负相关;当r =0时,成对样本数据间没有线性相关关系. (2)样本相关系数r 的取值范围为[-1,1].当|r |越接近1时,成对样本数据的线性相关程度越强; 当|r |越接近0时,成对样本数据的线性相关程度越弱. 3.样本相关系数与标准化数据向量夹角的关系r =1n x ′·y ′=1n |x ′||y ′|cos θ=cos θ(其中x ′=(x 1′,x 2′,…,x n ′),y ′=(y 1′,y 2′,…,y n ′),|x ′|=|y ′|=n ,θ为向量x ′和向量y ′的夹角).拓展深化[微判断]1.回归分析中,若r =±1说明x ,y 之间具有完全的线性关系.(√) 2.若r =0,则说明成对样本数据间是函数关系.(×) 提示 若r =0,则说明成对样本数据间没有线性相关关系. 3.样本相关系数r 的范围是r ∈(-∞,+∞).(×) 提示 样本相关系数的范围是[-1,1]. [微训练]1.下面对相关系数r 描述正确的是( ) A .r >0表明两个变量负相关 B .r >1表明两个变量正相关 C .r 只能大于零D.||r 越接近于0,两个变量相关关系越弱解析 因r >0表明两个变量正相关,故A 错误;又因 r ∈[-1,1],故B ,C 错误;两个变量之间的相关系数r 的绝对值越接近于1,表明两个变量的线性相关性越强, r 的绝对值越接近于0,表示两个变量之间几乎不存在线性相关,故D 正确. 答案 D2.(多选题)下面的各图中,散点图与相关系数r 符合的是 ( )解析 因为相关系数r 的绝对值越接近1,线性相关程度越高,且r >0时正相关,r <0时负相关,故观察各选项,易知B 不符合,A ,C ,D 均符合.故选ACD. 答案 ACD [微思考]当r =1或-1时,两个变量的相关性如何?提示 当r =1时,两个变量完全正相关;当r =-1时,两个变量完全负相关.题型一 线性相关性的检验【例1】 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x (分)与入学后第一次考试的数学成绩y (分)如下:请问:这10名学生的两次数学成绩是否具有线性相关关系? 解 x -=110(120+108+…+99+108)=107.8,y -=110(84+64+…+57+71)=68,∑10i =1x 2i=1202+1082+…+992+1082=116 584, ∑10i =1y 2i =842+642+…+572+712=47 384, ∑10i =1x i y i=120×84+108×64+…+99×57+108×71=73 796.所以相关系数为r =73 796-10×107.8×68(116 584-10×107.82)(47 384-10×682) ≈0.750 6.由此可看出这10名学生的两次数学成绩具有线性相关关系.规律方法 利用相关系数r 判断线性相关关系,需要应用公式计算出r 的值,由于数据较大,需要借助计算器.【训练1】 假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元)有如下统计资料:已知∑5i =1x 2i =90,∑5i =1y 2i =140.78,∑5i =1x i y i=112.3. (1)求x -,y -;(2)对x ,y 进行线性相关性检验. 解 (1)x -=2+3+4+5+65=4.y -=2.2+3.8+5.5+6.5+7.05=5.(2) ∑5i =1x i y i -5x - y -=112.3-5×4×5=12.3, ∑5i =1x 2i-5x -2=90-5×42=10, ∑5i =1y 2i -5y -2=140.78-125=15.78, 所以r =12.310×15.78≈0.979.所以x 与y 之间具有很强的线性相关关系. 题型二 判断线性相关的强弱【例2】 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.求样本相关系数r 并判断它们的相关程度. 解 列表如下x -=1687=24,y -=7,r =∑7i =1x i y i -7x - y - ∑7i =1x 2i -7x -2∑7i =1y 2i -7y -2=4 900.16-7×24×202.9474 144-7×2425 892.013 6-7×⎝ ⎛⎭⎪⎫202.9472≈0.96.由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.规律方法 当相关系数|r |越接近1时,两个变量的相关关系越强,当相关系数|r |越接近0时,两个变量的相关关系越弱.【训练2】 以下是收集到的新房屋的销售价格y (万元)和房屋的大小x (m 2)的数据.(1)画出数据的散点图; (2)求相关系数r ,并作出评价. 解 (1)图略. (2)列表如下:x -=5455=109,y -=1165=23.2,r =∑5i =1x i y i -5x - y -∑5i =1x 2i -5x -2∑5i =1y 2i -5y -2=12 952-5×109×23.260 975-5×1092 2 756.8-5×23.22=3081 570×65.6≈0.96,由此可知,新房屋的销售价格和房屋的大小之间有很强的正线性相关关系.一、素养落地1.通过本节课的学习,进一步提升数学抽象及数据分析素养.2.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就可利用线性相关系数来判断.3.|r|越接近1,它们的散点图越接近一条直线,两个变量之间的相关关系越强.二、素养训练1.两个变量之间的相关程度越低,则其线性相关系数的数值()A.越小B.越接近1C.越接近0 D.越接近-1解析由相关系数的性质知选C.答案C2.给定y与x的一组样本数据,求得相关系数r=-0.690,则()A.y与x线性不相关B.y与x正线性相关C.y与x负线性相关D.以上都不对解析因为r=-0.690<0,所以y与x负线性相关.答案C3.(多选题)下列说法正确的是()A.变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B.线性相关系数可以是正的或负的C.如果r=±1,说明x与y之间完全线性相关D.线性相关系数r∈(-1,1)解析∵相关系数|r|≤1,∴D错误.答案ABC4.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:已知记忆力x和判断力y是线性相关的,求相关系数r.解列表如下x -=364=9,y -=164=4,∴r =∑4i =1x i y i -4x - y - ∑4i =1x 2i -4x -2∑4i =1y 2i -4y -2=158-4×9×4344-4×8174-4×16≈0.99.。
8.1 成对数据的相关关系(精讲)两个变量有关系但又没有确切到可由其中的一个去精确地决定另一个的程度正相关;一个变量的值增加时,另一个变量的相应值也呈现增加的趋势负相关;一个变量的值增加时,另一个变量的相应值也呈现减少的趋势思维导图成对数据的统计相关性非线性相关或曲线相关线性I 相望&一股地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近3一般地,如果两个变量具有相关性,但不是线性相关H越接近1时,成对数据的线性相关程度越强H越接近0时,成对数据的线性相关程度越弱r》0时,称成对数据正相关。
NO时,称成对数据负相关.相关关系考法一 相关关系【例1】(1) (2020 •全国高二单元测试)对于变量x 与y,当x 取值一定时,y 的取值带有一定的随机性,x, y 之间的这种非确定性关系叫做( )A.函数关系B.线性关系C.相关关系D.回归关系(2) (2020 •全国高二单元测试)对变量x, y 有观测数据(x i , y i )(i = 1,2, 3,・,10),得散点图1;对 变量u, v 有观测数据(u i , v i )(i = 1, 2, 3,…,10),得散点图2,由这两个散点图可以断定()0 ] 234567rfI 2 3 4 5 6 7 u图1图2A. x 与y 正相关,u 与v 正相关B. x 与y 正相关,u 与v 负相关C. x 与y 负相关,u 与v 正相关D. x 与y 负相关,u 与v 负相关 【一隅三反】1. (2020 •武威第八中学)下列两变量具有相关关系的是( )成对数据的统计相关性考法二样本的相关系数)考法一相关关QA.正方体的体积与边长B.人的身高与体重C.匀速行驶车辆的行驶距离与时间D.球的半径与体积2.(2020 •银川市•宁夏大学附属中学)给出下列关系:其中具有相关关系的是()①考试号与考生考试成绩;②勤能补拙;③水稻产量与气候;④正方形的边长与正方形的面积.A.①②③B.①③④C.②③D.①③考点二样本的相关系数【例2-1】(2020 •吴起高级中学)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数尸如下表:甲乙丙丁r-0.82-0.78 -0.69-0.85则哪位同学的试验结果体现A, B两变量有更强的线性相关性()A.甲B.乙C.丙D.T【例2-2】(2020 •重庆九龙坡区•渝西中学)2018年反映社会现实的电影《我不是药神》引起了很大的轰动,治疗特种病的创新药研发成了当务之急.为此,某药企加大了研发投入,市场上治疗一类慢性病的特3 / 8效药品的研发费用 (百万元)和销量 (万盒)的统计数据如下: (1)求y 与1的相关系数r (精确到0.01),并判断y 与1的关系是否可用线性回归方程模型拟合?(规定: | r | 0.75时,可用线性回归方程模型拟合); (2)该药企准备生产药品A 的三类不同的剂型A ,A 2,A3,并对其进行两次检测,当第一次检测合格后,才能进行第二次检测.第一次检测时,三类剂型A, A , A合格的概率分别为1, 4 ,3,第二次检测 123255时,三类剂型A , A , A 合格的概率分别为4 ,1,2.两次检测过程相互独立,设经过两次检测后A , 1235231A , A 三类剂型合格的种类数为X ,求X 的数学期望.23>—4 1 y - nxyii二(Z i 2 -nx 2)(Z y 2 -ny 2)i =1i =1【一隅三反】1.(2021 •湖南长沙市•长沙一中高三月考)两个具有线性相关关系的变量的一组数据(i j y 1),(12,y 2),…G , y ),下列说法错误的是()nnA .相关系数M 越接近i,变量羽y 相关性越强B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好C.相关指数R 2越小,残差平方和越大,即模型的拟合效果越差D.若1表示女大学生的身高,y 表示体重则R 2 x 0.64表示女大学生的身高解释了 64%的体重变化2. (2020 •广西钦州市)在线性回归模型中,分别选择了甲,乙,丙,丁四个不同的模型,它们的相关指 数R 2分别为0.46,0.85,0.72,0.93,其中回归效果最好的模型是( )A.甲B.乙C.丙D.T附:(1)相关系数r =(2)Z 8 1 y = 347, iii =1Z 8 12 =1308, ii =1Zy 2 : 93, "785 = 42.25 .i =13.(2020 •黑山县黑山中学)在我国,大学生就业压力日益严峻,伴随着政府政策引导与社会观念的转变,大学生创业意识,就业方向也悄然发生转变某大学生在国家提供的税收,担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数y.(单位:万元)与时间t(单位:年)的数据,列表如下:ii(I )依据表中给出的数据,是否可用线性回归模型拟合y与t的关系,请计算相关系数厂并加以说明(计算结果精确到0.01).(若H > 0.75,则线性相关程度很高,可用线性回归模型拟合):(II)该专营店为吸引顾客,特推出两种促销方案.方案一:每满500元可减50元;2方案二:每满500元可抽奖一次,每次中奖的概率都为5,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.①某位顾客购买了 1050元的产品,该顾客选择参加两次抽奖,求该顾客获得100元现金奖励的概率.②某位顾客购买了1500元的产品,作为专营店老板,是希望该顾客直接选择返回150元现金,还是选择参加三次抽奖?说明理由参考数据:<56.95工7.547.4. (2020 •湖南高二期中)湖南省从2021年开始将全面推行“ 3 +1 + 2 ”的新高考模式,新高考对化学、生物、地理和政治等四门选考科目,制定了计算转换T 分(即记入高考总分的分数)的“等级转换赋分规 则”(详见附1和附2),具体的转换步骤为:①原始分Y 等级转换;②原始分等级内等比例转换赋分.某校附:相关系数公式r =£ (t -1)(yE,ty —£(一T \ 2G —y\(t —广) E G —y )2ii=1ii=1ii =1ii=1的一次年级统考中,政治、生物两选考科目的原始分分布如下表:现从政治、生物两学科中分别随机抽取了20个原始分成绩数据,作出茎叶图:(1)根据茎叶图,分别求出政治成绩的中位数和生物成绩的众数;(2)该校的甲同学选考政治学科,其原始分为82分,乙同学选考生物学科,其原始分为91分,根据赋分转换公式,分别求出这两位同学的转化分;(3)根据生物成绩在等级B的6个原始分和对应的6个转化分,得到样本数据(Y,T),请计算生物原始分iiY与生物转换分T之间的相关系数,并根据这两个变量的相关系数谈谈你对新高考这种“等级转换赋分法”i i的看法.附1:等级转换的等级人数占比与各等级的转换分赋分区间.Y—Y T—T附2:计算转换分T的等比例转换赋分公式:声一7 二声〒.(其中:Y,Y,分别表示原始分Y对应等Y—Y T —T 1211级的原始分区间下限和上限;T1,T2分别表示原始分对应等级的转换分赋分区间下限和上限.T的计算结果 按四舍五入取整数)附 3:£(Y — Y )T — T )= 74 , 2(y -Y ).(T - T ) =<5494 氏 74.12 ,i i \ i ii =11 i =1i =1£ G -Y )T -T)iir = i =1一。
变量的相关关系样本相关系数导学案【学习目标】1.了解变量间的相关关系,会画散点图2.会用散点图判断两个变量之间是否具有相关关系【自主学习】知识点一变量间的相关关系(1)相关关系的定义变量之间有一定的联系,但不能完全用函数来表达.如人的体重y与身高x.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.相关关系是非确定性关系,因变量的取值具有一定的_随机性__.,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.(2)散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.(3)正相关与负相关①正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.②负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.知识点二相关系数(1)样本相关系数r的计算公式我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为()()niix x y y r --=∑.(2)样本相关系数r 的性质 ①||1r ≤;②当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关; ③|r |越接近于1,表明两个变量的线性相关性越强; ④|r |越接近于0,表明两个变量的线性相关性越弱.【合作探究】探究一相关关系及判断【例1】某个男孩的年龄与身高的统计数据如下表所示.(1)(2)判断y与x是否具有线性相关关系.[解](1)散点图如图所示.(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.归纳总结:(1)两个变量x和y具有相关关系的判断方法①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;②表格、关系式法:结合表格或关系式进行判断;③经验法:借助积累的经验进行分析判断.(2)判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.【练习1】下列关系中,属于相关关系的是________(填序号).①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系. 【答案】②②[在②中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;②为确定的函数关系;在②中,降雪量与交通事故的发生率之间具有相关关系.]探究二 正负相关关系的判断【例2】有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是( ) A .①③ B .②③ C .② D .③【答案】C[②是负相关;②是正相关;②不是相关关系.] 归纳总结:【练习2】对两个变量x 、y 进行线性相关检验,得线性相关系数10.7859r =,对两个变量u 、v 进行线性相关检验,得线性相关系数20.9568r =-,则下列判断正确的是( )A .变量x 与y 正相关,变量u 与v 负相关,变量x 与y 的线性相关性较强B .变量x 与y 负相关,变量u 与v 正相关,变量x 与y 的线性相关性较强C .变量x 与y 正相关,变量u 与v 负相关,变量u 与v 的线性相关性较强D .变量x 与y 负相关,变量u 与v 正相关,变量u 与v 的线性相关性较强【答案】C 【分析】根据相关系数的符号决定两个变量的正相关、负相关,以及相关系数绝对值越大,两个变量的线性相关性越强,进而可得出结论. 【详解】由线性相关系数10.78590r =>知x 与y 正相关, 由线性相关系数20.95680r =-<知u 与v 负相关,又12r r <,所以,变量u 与v 的线性相关性比x 与y 的线性相关性强, 故选:C.探究三 样本相关系数的应用【例3】两个变量x 与y 的回归模型中,分别选择了四个不同的模型来拟合y 与x 之间的关系,它们的相关系数r 如下,其中拟合效果最好的模型是( )A .模型1B .模型2C .模型3D .模型4【答案】A 【分析】根据相关系数||r越接近于1,模型的拟合效果越好,结合表格中的数据,即可求解.【详解】两个变量x与y的回归模型中,它们的相关系数||r越接近于1,这个模型的拟合效果越好,在所给的四个相关系数中0.98的绝对值最接近1,所以拟合效果最好的模型是模型1.故选:A.归纳总结:【练习3】对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()A.2431r r r r<<<<B.4213r r r r<<<<C.4231r r r r<<<<D.2413r r r r<<<<【答案】A【分析】由给出的四组数据的散点图,结合相关系数的概念,逐图判定,即可求解.【详解】由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0,题图2和题图4是负相关,相关系数小于0,题图1和题图2的点相对更加集中,所以相关性更强,所以1r 接近于1,2r 接近于1-, 由此可得24310r r r r <<<<. 故选:A .课后作业A 组 基础题一、选择题1.下列语句所表示的事件中的因素不具有相关关系的是( ) A .瑞雪兆丰年 B .读书破万卷,下笔如有神 C .吸烟有害健康 D .喜鹊叫喜,乌鸦叫丧【答案】: D解析: “瑞雪兆丰年”和“读书破万卷,下笔如有神”是根据多年经验总结归纳出来的,吸烟有害健康具有科学根据,所以它们都是相关关系,所以A 、B 、C 三项具有相关关系;结合生活经验知喜鹊和乌鸦发出叫声是它们自身的生理反应,与人无任何关系,故D 项不具有相关关系.2.在一组样本数据112212()()()(2n n n x y x y x y n x x x ≥,,,,,,,,,,不全相等)的散点图中,若所有样本点()(,1,2,,)i i x y i n =都在直线112y x =+上,则这组样本数据的样本相关系数为 A .-1 B .0C .12D .1【答案】D【解析】所有样本点均在直线上,则样本相关系数最大,即为1. 二、填空题3.如图,有5组(x ,y )数据,去掉________点对应的数据后,剩下的4组数据的线性相关程度最大.【答案】D[去掉D点对应的数据后,其余四点大致在一条直线附近,相关性最强.]4.以下是收集到的某物品的销售价格y和物品的大小x的数据:【答案】:有解析:物品大小的值由小变大时,销售价格也由小变大,因此,两个变量有相关关系.5.甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:则________同学的试验结果体现A,B两变量有更强的线性相关性.【答案】丁【分析】根据数据直接判断即可.【详解】解:r越大,m越小,线性相关性越强,易知丁同学的试验结果体现A,B两变量的线性相关性较强.故【答案】为:丁.三、解答题6.下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:(1)[解](1)散点图如图:7.两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,分别判断它们是否具有相关关系;若具有相关关系,说出它们相关关系的区别.表1[解]从图中可以看出两图中的点各自分布在一条曲线附近,因此两对变量都具有相关关系.图(1)中,当A的值由小变大时,B的值却是由大变小,故A和B成负相关;图(2)中,当C的值由小变大时,D的值也是由小变大,故C和D成正相关.8.有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出热饮杯数与当天气温的对比表:(1)(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗?解析:(1)以x轴表示温度,以y轴表示热饮杯数,可作散点图如图.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间是具有相关关系,即气温越高,卖出去的热饮杯数越少.B组能力提升一、选择题1.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4)(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则A.r2<r1<0B.0<r2<r1C.r2<0<r1D.r2=r1【答案】C【解析】根据题中提供的数据,变量Y随X的增大而增大,故Y与X正相关,即r1>0;变量V随U的增大而减小,故V与U负相关,即r2<0,故r2<0<r1.二、解答题2.互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲,乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:(1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况;(2)据统计表明,y与x之间具有线性相关关系.r ,则可认为y与x有较请用相关系数r对y与x之间的相关性强弱进行判断;(若||0.75强的线性相关关系,r值精确到0.001)参考数据:()()5166iii x x y y =--=∑77≈.【答案】(1)外卖甲比外卖乙经营状况更好;(2)【答案】见解析; 【分析】(1)由表格中的数据,求得22,x y s s =<甲乙,即可得结论;(2)根据公式,求得相关系数r 的值,结合||0.75r >,即可得到结论;【详解】(1)由表格中的数据,可得52981175x ++++==,231051575y ++++==,外卖甲的日接单量的方差222222(57)(27)(97)(87)(117)105s -+-+-+-+-==甲,外卖乙的日接单量的方差222222(27)(37)(107)(57)(157)23.65s -+-+-+-+-==乙,因为22,x y s s =<甲乙,即外卖甲平均日接单量与外卖乙平均日接单量相同,但外卖甲日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.(2)①因为()()niix x y y r --=∑又()()5166iii x x y y =--=∑77≈,所以代入计算可得,相关系数660.8570.7577r ≈≈>, 所以可认为y 与x 之间有较强的线性相关关系.3.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x (千克)之间的对应数据的散点图,如图所示.依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若0.75r>,则线性相关程度很高,可用线性回归模型拟合);附:相关系数公式()()n ni i i ix x y y x y nx y r---==∑∑.0.55≈0.95≈.【答案】0.95;【答案】见解析;【分析】根据散点图中的数据分别求得可得x,y,()()51i iixx y y=--∑,进而求得相关系数r,再与0.75比较下结论.【详解】由已知数据可得2456855x++++==,3444545y++++==,所以()()()()()5131100010316i iix x y y=--=-⨯-+-⨯+⨯+⨯+⨯=∑,====所以相关系数()()50.95iix x y y r --===≈∑.因为0.75r >,所以可用线性回归模型拟合y 与x 的关系.4.某湿地公园经过近十年的规划和治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的300个地块,并设计两种抽样方案,方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区;依据抽样数据计算得到相应的相关系数0.81r =;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据(),i i x y (1i =,2,…,30),其中i x 和i y 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得30160ii x==∑,3011200i i y ==∑,()302190ii x x =-=∑,()30218000i i y y=-=∑,()()301800i ii x xy y =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求方案二抽取的样本(),i i x y (1i =,2,…,30)的相关系数(精确到0.01);并判定哪种抽样方法更能准确的估计.附:相关系数()()niix x y y r--=∑ 1.414≈;相关系数[]0.75,1r ∈,则相关性很强,r 的值越大,相关性越强.答案:(1)12000;(2)0.94r =,方案二的分层抽样方法更能准确的估计.【分析】(1)先由题中条件,得到样区野生动物平均数,进而可得出结果;(2)根据题中数据,直接计算相关系数;根据两种方案对应的相关系数的值,即可得出结果.【详解】(1)由题意可得,样区野生动物平均数为301111200403030i i y ==⨯=∑, 又地块数为300,所以该地区这种野生动物的估计值为3004012000⨯=; (2)由题中数据可得,样本(),i i x y (1i =,2,…,30)的相关系数为()()300.94iix x y y r --===≈∑.因为方案一的相关系数为0.81r =明显小于方案二的相关系数为0.94r =, 所以方案二的分层抽样方法更能准确的估计.。