《变量间的相关关系》习题.doc.docx
- 格式:docx
- 大小:51.68 KB
- 文档页数:7
第四章 《变量之间的关系》复习题(B 卷)1、某产品生产流水线每小时生产100件产品,生产前无产品积压,生产3小时后,安排工人装箱,若每小时装150件,则未装箱产品数量y 与时间t 关系图为( )A .B .C .D .2、小明一出校门先加速行驶,然后匀速行驶一段后,在距家门不远的地方开始减速,最后停止,下面的图( )可以近似地刻画出他在这一过程中的时间与速度的变化情况.(A ) (B ) (C ) (D ) 3、“健康重庆”就是要让孩子长得壮,老人寿命更长,全民生活得更健康.为了响应“健康重庆”的号召,小明的爷爷经常坚持饭后走一走.某天晚饭后他慢步到附近的融侨公园,在湖边亭子里休息了一会后,因家中有事,快步赶回家.下面能反映当天小明的爷爷所走的路程y 与时间x 的关系的大致图象是( )4、柿子熟了从树上自然掉落下来,下面哪一幅图可以大致刻画出柿子下落过程中(即落地前)的速度变化情况( ).时间时间速度时间时间速度速度速度(C ) O(D )O时间速度(B )O时间速度O时间(A )5、如图,一只蚂蚁以均匀的速度沿台阶12345A A A A A →→→→爬行,那么蚂蚁爬行的高度..h 随时间t 变化的图象大致是( )5、百舸竞渡,激情飞扬. 为纪念爱国诗人屈原,长寿区在长寿湖举行了龙舟赛. 如图是甲、乙两支龙舟队在比赛时的路程s (米)与时间t (分钟)之间关系的图象,请你根据图象回答下列问题:(1)1.8分钟时,哪支龙舟队处于领先地位? (2)在这次龙舟比赛中,哪支龙舟队先到达终点?(3)比赛开始多少时间后,先到达终点的龙舟队就开始领先?6.为了鼓励小强勤做家务,培养劳动意识,小强每月的总费用等于基本生活费加上奖 励(奖励由上个月他的家务劳动时间确定).已知小强4月份的家务劳动时间为20小时, 他5月份获得了400元的总费用.小强每月可获得的总费用与他上月的家务劳动时间之 间的关系如图所示,请根据图象回答下列问题.(1)上述变化过程中,自变量是_______, 因变量是_______;(2)小强每月的基本生活费为________元. (3)若小强6月份获得了450元的总费用, 则他5月份做了_______小时的家务. (4)若小强希望下个月能得到120元奖励, 则他这个月需做家务________小时.3.41A 2A 3A4A 5AOh tA .Oh tB .Oh tC .OhtD .7、小颖和小亮上山游玩,小颖乘坐缆车,小亮步行,两人相约在山顶的缆车终点会合.已知小亮行走到缆车终点的路程是缆车到山顶的线路长的2倍,小颖在小亮出发后50 分才乘上缆车,缆车的平均速度为180 米/分.设小亮出发x 分后行走的路程为y 米.图中的折线表示小亮在整个行走过程中y 随x 的变化关系. (1)小亮行走的总路程是________米,他途中休息了________分. (2)分别求出小亮在休息前和休息后所走的路程段上的步行速度。
精品文档变量间的相关关系练习、在一组样本数据1的上,则这组样本若所有样本点都在直线散点图中,_______. 数据的样本相关系数为两变量的线性相关试验,并用回归B2、甲,乙,丙,丁四位同学各自对A,如表:分析方法分别求得相关系数r丁甲乙丙0.82 0.78 r0.69 0.85则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是() A.甲 B.乙 C.丙 D.丁3、某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某111115日的白月月日至种饮料销量之间的关系进行分析研究,他分别记录了C°(天2126233025销量(杯)222天数据若先从这五组数据中抽出组数据恰好是相邻组,求抽出的(Ⅰ)的概率;yx的线性回归方程;关于(Ⅱ)请根据所给五组数据,求出116日的白天平均月(Ⅲ)根据(Ⅱ)中所得的线性回归方程,若天气预报C7°(),请预测该奶茶店这种饮料的销量.气温精品文档.精品文档.)(参考公式:u11,2…10)xy(xy)(i,4、对变量,,,得散点图有观测数据,,;对变量=ii)((u2.1,2v)(i…10)v=,,得散点图,,由这两个散点图可以判断有观测数据iivyuByuvxAx负相正相关,与正相关与.变量.变量与与正相关,关vyuvDxxCyu 负相正相关负相关,.变量与.变量负相关,与与与关)(14 5、下表是某厂单位:百吨~的一组数据:月份用水量x4312月份xy由散点图可知,用水量之间有较好的线性相关关系,其回归方程是与月份)(0.7xaa+,则等于=-5.25D B5.15 C5.2 10.5 A ....将其整理后得到如、某研究小组在一项实验中获得一组关于之间的数据,7、) ty图所示的散点图,下列函数中,最能近似刻画与之间关系的是(精品文档.精品文档8、以下四个命题中:分钟从中抽取一件产品质检员每10 ①从匀速传递的产品生产流水线上,进行某项指标检测,这样的抽样是分层抽样; 1;②若两个随机变量的线性相关性越强,则相关系数的绝对值越接近于③根据散点图求得的回归直线方程可能是没有意义的;,.9=04P),且(④若某项测量结果服从正态分布N(1≤,) 1-2≤)=0.P则.(其中真命题的个数为4 .1 A. B2 . C 3 D(单(单位:百万元)与年广告支出xy年的年利润~、某公司1020052010 位:百万元)的统计资料如表所示:20102008 2005 20092007年份2006精品文档.精品文档22.320.4 14.6 16 x 利润1812.21.111 0.74 0.81 0.89 支出 y 0.62)根据统计资料,则(有正线性相关关系x与y A.利润中位数是16,有负线性相关关系与y 利润中位数是18,x B.有正线性相关关系与yC.利润中位数是17,xy与有负线性相关关系利润中位数是17,x D.) 11、在下列各组图中,每个图的两个变量具有相关关系的图是()2)(3)(4) D. ( 2) B. (1)(3) C. (2)(A.(1、以下三个命题中:12分钟从中抽取一件产品进行某10①从匀速传递的产品生产流水线上,质检员每项指标检测,这样的抽样是分分层抽样;;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于12,在(0>0).若(服从正态分布N1,σξ)(σ③在某项测量中,测量结果ξ.2)内取值的概率为0.80.4)内取值的概率为,则ξ在(0,1 )其中真命题的个数为( 3. C1.B .0A . 2D、对四组数据进行统计,获得以下散点图,关于其相关系数的比较,13 ). ( 正确的是精品文档.精品文档<r<r0<rr<r B.r<<A.r<r0<33412214 r<r<< D.r<r0 0C.r<r<<r<r 32114324之间关系最强的是、观察下面频率等高条形图,其中两个分类变量14(). C A. B.. D、下列五个命题16 ②圆的周长与该圆的半径具有相关关系①任何两个变量都具有相关关系③某商品的需求量与该商品的价格是一种非确定性关系④根据散点图求得的回归直线方程可能是没有意义的把非确定性问题转化为确定性问题⑤两个变量间的相关关系可以通过回归直线,进行研究.正确命题的序号为____________的三个散点图,它们从左到右的对应关和、观察下列关于两个变量17)系依次为(精品文档.精品文档A.正相关、负相关、不相关 B.负相关、不相关、正相关C.负相关、正相关、不相关 D.正相关、不相关、负相关xy之间的相关关系,并求得回归,19、四名同学根据各自的样本数据研究变量直线方程,分别得到以下四个结论:①y与x负相关且=2 347x-6 423;②y与x负相关且=-3 476x+5 648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.其中一定不正确的结论的序号是( )A.①② B.②③ C.③④ D.①④20、为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点图(两轴单位长度相同),用回归直线近似的刻画其相关关系,根据图形,以下结论最有可能成立的是的值为 B.线性相关关系较强,线性相关关系较强,A.的值为线性相关关系太弱,无研究价值的值为线性相关关系较强,C. D.精品文档.。
10.3 变量间的相关关系、统计案例基础篇 固本夯基考点一 变量间的相关关系1.(2022届陕西宝鸡期末,4)下列两个变量具有相关关系的是( ) A.正方体的体积与棱长 B.汽车匀速行驶时的路程与时间 C.人的体重与饭量 D.人的身高与视力 答案 C2.(2021西南名校联盟联考,3)已知甲、乙、丙、丁四组数据变量间对应的线性相关系数分别为0.46,0.79, -0.92,0.85,则( )A.甲组数据变量间的线性相关程度最强B.乙组数据变量间的线性相关程度最弱C.丙组数据变量间的线性相关程度最强D.丁组数据变量间的线性相关程度最强 答案 C3.(2020陕西铜川二模,5)四名同学根据各自的样本数据研究变量x,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x-6.423; ②y 与x 负相关且y ^=-3.476x+5.648; ③y 与x 正相关且y ^=5.437x+8.493; ④y 与x 正相关且y ^=-4.326x-4.578. 其中不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 答案 D4.(2020陕西榆林三模,3)如图所示,给出了样本容量均为7的A,B 两组样本数据的散点图,已知A 组样本数据的相关系数为r 1,B 组样本数据的相关系数为r 2,则( )A.r 1=r 2B.r 1<r 2C.r 1>r 2D.无法判定 答案 C5.(2022届四川资阳一诊,4)我国在2020年如期完成了新时代脱贫攻坚目标任务,脱贫攻坚战取得全面胜利,历史性地解决了绝对贫困问题,并全面建成了小康社会.现就2013—2019 年年末全国农村贫困人口数进行了统计,制成如下散点图:据此散点图,下面 4个回归方程类型中最适宜作为年末贫困人口数y 和年份代码x 的回归方程类型的是( )A.y=a+bxB.y=a+bx C.y=a+be x D.y=a+bln x 答案 A6.(2022届四川绵阳阶段测试,3)某市物价部门对5家商场的某商品一天的销售量及其价格进行了调查,5家商场的价格x(元)和销售量y(件)之间的一组数据如表所示:价格x(元) 9 9.5 10 10.5 11 销售量y(件)1110865按公式计算,y 与x 的回归直线方程是y ^=-3.2x+a ^,相关系数|r|=0.992,则下列说法错误的是( ) A.变量x,y 线性负相关且相关性较强 B.a ^=40C.当x=8.5时,y 的估计值为12.8D.相应于点(10.5,6)的残差为0.4 答案 D7.(2020兰州一诊,7)近五年来某草场羊只数与草场植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示.年份 1 2 3 4 5 羊只数(万只) 1.4 0.9 0.750.60.3 草场植被指数1.14.315.6 31.349.7根据表及图得到以下判断:①羊只数与草场植被指数成减函数关系;②若利用这五组数据得到的两变量间的相关系数为r 1,去掉第一年数据后得到的相关系数为r 2,则|r 1|<|r 2|; ③可以利用回归直线方程,准确地得到当羊只数为2万只时的草场植被指数. 以上判断中正确的个数是( )A.0B.1C.2D.3 答案 B8.(2020课标Ⅱ,18,12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i=1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑i=120x i =60,∑i=120y i =1 200,∑i=120(x i -x )2=80,∑i=120(y i -y )2=9 000,∑i=120(x i -x)(y i -y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数);(2)求样本(x i ,y i )(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由. 附:相关系数 r=∑i=1n(x i -x)(y -y)√∑i=1(x i -x)2∑i=1(y i -y)2,√2≈1.414.解析(1)由已知得样本平均数y =120∑i=120y i =60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i ,y i )(i=1,2,…,20)的相关系数 r=∑i=120(x i -x)(y -y)√∑i=1(x i -x)2∑i=1(y i-y)2=√80×9 000=2√23≈0.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.考点二 独立性检验1.(2022届黑龙江月考,8)某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有99%的把握但没有99.9%的把握认为偏爱蔬菜还是肉类与性别有关,则K 2的观测值可能为( )P(K 2≥k 0) 0.10 0.05 0.025 0.010 0.0050.001k0 2.706 3.841 5.024 6.6357.87910.828A.K2=3.206B.K2=6.625C.K2=7.869D.K2=11.208答案C2.(2022届山西运城期中,7)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验.根据四个实验室得到的列联表画出如下四个等高堆积条形图,最能体现该药物对预防禽流感有显著效果的图形是()答案D3.(2020宁夏石嘴山二模,4)通过随机询问200名性别不同的大学生是否爱好踢毽子运动,计算得到K2的观测值k≈4.892,参照下表,得到的正确结论是()P(K2≥k0)0.100.050.025k0 2.706 3.841 5.024A.有97.5%以上的把握认为“爱好该项运动与性别有关”B.有97.5%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”答案C4.(2021四川南充阆中中学4月质检,6)若由一个2×2列联表中的数据计算得K2=4.013,那么有的把握认为两个变量有关系.()P(K2≥k0)0.150.100.050.0250.0100.0050.001k0 2.0722.7063.8415.0246.6357.87910.828A.95%B.97.5%C.99%D.99.9%答案A5.(2021安徽黄山二模,7)给出下列命题:①在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于0,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1; ③两个模型中残差平方和越小的模型拟合的效果越好;④对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大. 其中正确命题的个数是( )A.1B.2C.3D.4 答案 C6.(2022届河南焦作模拟,17)第32届夏季奥运会于2021年7月23日至8月8日在日本举行,为了解某校学生对奥运会是否关注,随机调查了该校200名学生,统计结果如表:关注 不关注 合计 女生 34 51 85 男生 66 49 115 合计100100200(1)分别估计该校女生和男生关注奥运会的概率;(2)能否有99%的把握认为该校女生和男生对奥运会的关注度有差异? 参考公式及数据: K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.050 0.010 0.001k3.8416.635 10.828解析 (1)估计该校女生关注奥运会的概率约为3485=25;男生关注奥运会的概率约为66115. (2)由题表中数据可知K2=200×(34×49-66×51)2100×100×85×115=13623≈5.913. 因为5.913<6.635,故没有99%的把握认为该校女生和男生对奥运会的关注度有差异.7.(2022届昆明质检,17)“微信运动”是手机APP 推出的多款健康运动软件中的一款,某学校140名教师均在微信好友群中参与了“微信运动”,对运动10 000步或以上的教师授予“运动达人”称号,低于10 000步称为“参与者”.为了解教师们的运动情况,选取了教师们在某日的运动数据进行分析,统计结果如下:运动达人 参与者 合计 男教师 60 20 80 女教师 40 20 60 合计10040140(1)根据上表说明,能否在犯错误概率不超过0.05的前提下认为获得“运动达人”称号与性别有关; (2)从获得“运动达人”称号的教师中采用按性别分层抽样的方法选取5人参加全国第四届“万步有约”全国健走激励大赛某赛区的活动,若从选取的5人中随机抽取2人作为代表参加开幕式,求抽取的2人都为女教师的概率. 参考公式:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:P(K 2≥k 0) 0.050 0.0100.001k 03.8416.635 10.828解析 (1)∵K2=140×(60×20-40×20)280×60×100×40≈1.167<3.841,∴不能在犯错误的概率不超过0.05的前提下认为获得“运动达人”称号与性别有关.(2)根据分层抽样方法得:参赛的男教师有60100×5=3人,参赛的女教师有40100×5=2人,抽取的男教师记为A,B,C;女教师记为a,b.从抽取的这五名教师中随机选取2名,有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,ab 共10种选法,其中2人都是女教师的选法有ab 一种,故抽取的2人都为女教师的概率P=110.8.(2019课标Ⅰ,17,12分)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d).P(K 2≥k)0.050 0.010 0.001 k3.8416.63510.828.解析 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)K2=100×(40×20-10×30)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.综合篇 知能转换考法一 线性回归方程的求解与应用1.(2022届四川模拟,8)已知回归直线的斜率的估计值为1.23,样本点的中心为(5,6),则回归直线方程为( ) A.y ^=-0.15x+1.23 B.y ^=-2.38x+1.23C.y ^=1.23x-2.38 D.y ^=1.23x-0.15 答案 D2.(2022届哈尔滨模拟,10)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间具有线性相关关系,利用下表中的五组数据求得回归直线方程为y ^=b ^x+a ^,根据该回归方程,预测当x=8时,y ^=84.8,则b ^=( )x23456y 25 37 50 56 64A.9.4B.9.5C.9.6D.9.8 答案 C3.(2021甘肃二模,7)某地以“绿水青山就是金山银山”理念为引导,推进绿色发展,现要订购一批苗木,苗木长度与售价如下表:苗木长度x(厘米) 38 485868 7888 售价y(元)16.8 18.8 20.8 22.8 2425.8由表可知,苗木长度x(厘米)与售价y(元)之间存在线性相关关系,回归方程为y ^=0.2x+a ^,则当苗木长度为150厘米时,售价大约为( ) A.33.3元 B.35.5元 C.38.9元 D.41.5元 答案 C4.(2021西安中学二模,4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n),用最小二乘法建立的回归方程为y ^=0.85x-85.71. ①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x ,y );③若该大学某女生身高增加1 cm,则其体重约增加0.85 kg; ④若该大学某女生身高为170 cm,则其体重必为58.79 kg. 则上述判断不正确的个数是( ) A.1 B.2 C.3 D.4 答案 A5.(2020中原名校质量考评,7)根据最小二乘法,由一组样本数据(x i ,y i )(其中i=1,2,…,300)求得的回归方程是y ^=b ^x+a ^,则下列说法正确的是( )A.至少有一个样本点落在回归直线y ^=b ^x+a ^上B.若所有样本点都在回归直线y ^=b ^x+a ^上,则变量间的相关系数为1 C.对所有的解释变量x i (i=1,2,…,300),b ^x i +a ^的值一定与y i 有误差 D.若回归直线y ^=b ^x+a ^的斜率b ^>0,则变量x 与y 正相关 答案 D6.(2021江西八校4月联考,14)如图,根据已知的散点图得到y 关于x 的线性回归方程为y ^=b ^x+0.2,则b ^= .答案 1.67.(2022届江西顶级名校调研,18)根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作.某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用.自宣传开始后村干部统计了本村200名居民(未接种)5天内每天新接种新冠疫苗的情况如下表:第x 天 1 2 3 4 5 新接种人数y1015192328(1)建立y 关于x 的线性回归方程;(2)假设全村共计2 000名居民(均未接种过新冠疫苗),用样本估计总体来预测该村80%居民接种新冠疫苗需要几天.参考公式:回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计公式分别为b ^=∑i=1nx i y i -nxy ∑i=1nx i 2-nx2,a ^=y -b ^x .解析 (1)x =1+2+3+4+55=3,y =10+15+19+23+285=19,则b ^=10+30+57+92+140-5×3×1912+22+32+42+52-5×32=225,a ^=19-225×3=295,故y 关于x 的线性回归方程为y ^=225x+295.(2)设a n =225n+295,数列{a n }的前n 项和为S n ,易知数列{a n }是等差数列, 则S n =n(a 1+a n )2=n (225+295+225n+295)2=115n 2+8n,因为S 6=127.2,S 7=163.8,所以10S 6=1 272,10S 7=1 638,又2 000×80%=1 600(人),所以预测该村80%居民接种新冠疫苗需要7天.8.(2021广西贵港港北模拟,17)某个体服装店经营各种服装,在某周内获纯利润y(元)与该周每天销售这种服装件数x 之间的一组数据关系如下表:x 3456789y66 69 73 81 89 90 91(1)求x ,y ;(2)若y 与x 线性相关,请求纯利润y(元)与每天销售件数x 的回归直线方程. 参考数据及公式:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y ∑i=1nx i2-nx 2,a ^=y -b ^x ,∑i=17x i 2=280,∑i=17x i y i =3 487. 解析 (1)x =17×(3+4+5+6+7+8+9)=6,y =17×(66+69+73+81+89+90+91)=5597. (2)设回归直线方程为y ^=b ^x+a ^.∵∑i=17x i 2=280,∑i=17x i y i =3 487,∴b ^=3 487-7×6×5597280-7×36=13328=4.75,a ^=5597-6×4.75≈51.36.∴回归直线方程为y ^=4.75x+51.36.9.(2021成都郫都模拟,18)某人统计了近5年某网站“双11”当天的交易额,统计结果如下表:年份 2015 2016 2017 2018 2019 年份代码x 1 2 3 4 5 交易额y/百亿元912172126(1)请根据上表提供的数据,用相关系数r 说明y 与x 的线性关系的强弱(线性相关系数保留三位小数);(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值x i ,变量y 的观测值为y i (1≤i ≤n),则两个变量的相关系数的计算公式为r=∑i=1n(x i -x)(y -y)√∑i=1(x i -x)2∑i=1(y i -y)2.统计学认为,对于变量x,y,如果r ∈[-1,-0.75],那么负相关很强;如果r ∈[0.75,1],那么正相关很强;如果r ∈(-0.75,-0.30]或r ∈[0.30,0.75),那么相关性一般;如果r ∈[-0.25,0.25],那么相关性较弱)(2)求出y 关于x 的线性回归方程,并预测2020年该网站“双11”当天的交易额. 参考公式:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y -b ^x ,参考数据:√1 860≈43.1.解析 (1)根据题表中的数据,可得x =15×(1+2+3+4+5)=3,y =15×(9+12+17+21+26)=17, 则∑i=15(x i -x )(y i -y )=(1-3)×(9-17)+…+(5-3)×(26-17)=43;√∑i=15(x i -x)2∑i=15(y i -y)2=√10×186≈43.1,所以r=∑i=15(x i -x)(y -y)√∑i=15(x i -x)2∑i=15(y i-y)2=4343.1≈0.998,所以变量y 与x 的线性相关性很强. (2)由(1)可得x =3,y =17,∑i=15(x i -x )(y i -y )=43,∑i=15(x i -x )2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,所以b ^=∑i=15(x i -x)(y i -y)∑i=15(x i -x)2=4310=4.3,则a ^=y -b ^x =17-4.3×3=4.1.所以y 关于x 的线性回归方程为y ^=4.3x+4.1.令x=6,可得y ^=4.3×6+4.1=29.9,故预测2020年该网站“双11”当天的交易额为29.9百亿元.思路分析 (1)利用已知条件求解相关系数,判断即可;(2)根据公式求出回归直线方程的系数,得回归直线方程,然后把x=6代入,求出结果进行预测即可.考法二 独立性检验的应用1.(2022届河南月考,9)某外语学校要学生从德语和日语中选择一种作为“第二外语”进行学习,为了解选择第二外语的倾向与性别的关系,随机抽取100名学生,得到下面的数据表:选择德语 选择日语 男生 15 35 女生3020根据表中提供的数据可知( ) 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.100 0.050 0.010 0.005 0.001 k2.7063.841 6.635 7.87910.828A.在犯错误的概率不超过0.1%的前提下,认为选择第二外语的倾向与性别无关B.在犯错误的概率不超过0.1%的前提下,认为选择第二外语的倾向与性别有关C.有99.5%的把握认为选择第二外语的倾向与性别无关D.有99.5%的把握认为选择第二外语的倾向与性别有关答案D2.(2020江西吉安、抚州、赣州一模,5)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A 的100天日落和夜晚天气,得到如下2×2列联表:夜晚天气下雨未下雨日落云里走出现255未出现2545临界值表P(K2≥k0)0.100.050.0100.001k0 2.706 3.841 6.63510.828并计算得到K2≈19.05,下列小波对地区A天气的判断不正确的是()A.夜晚下雨的概率约为12B.未出现“日落云里走”,夜晚下雨的概率约为514C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨答案D3.(2020湖南衡阳八中月考,5)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:喜欢应用统计课程不喜欢应用统计课程男生205女生1020附表:P(K2≥k)0.100.050.0250.0100.0050.001k 2.706 3.841 5.024 6.6357.87910.828参考公式:K2=n(ad-bc)2,其中n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为喜欢“应用统计”课程与性别有关B.在犯错误的概率不超过0.1%的前提下,认为喜欢“应用统计”课程与性别无关C.有99.99%以上的把握认为喜欢“应用统计”课程与性别有关D.有99.99%以上的把握认为喜欢“应用统计”课程与性别无关答案A4.(2020安徽蚌埠三模,15)某企业为了调查其产品在国内和国际市场的发展情况,随机抽取国内、国外各100名客户代表,了解他们对该企业产品的发展前景所持的态度,得到如图所示的等高条形图,则有99%以上的把握认为是否持乐观态度与国内外差异有关(填“能”或“不能”).P(K2≥k)0.0500.0100.0050.001k 3.841 6.6357.87910.828附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).答案能5.(2021山东青岛一模,15)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2≥k)0.050.0250.0100.001k 3.841 5.024 6.63510.828答案0.0256.(2022届吉林重点高中月考,19)新能源汽车是指除汽油、柴油发动机之外所有的其他能源汽车,被认为能减少空气污染和缓解能源短缺.在当今提倡全球环保的前提下,新能源汽车产业必将成为未来汽车产业发展的导向与目标.新能源汽车也越来越受到消费者的青睐.某机构调查了某地区近期购车的200位车主的性别与购车种类情况,得到数据如下:购置新能源汽车购置传统燃油汽车合计男性10020120女性503080合计15050200 (1)根据表中数据,判断是否有99.9%的把握认为购置新能源汽车与性别有关;(2)用分层抽样的方法按性别从被调查的购置新能源汽车的车主中选出6位,参加关于“新能源汽车驾驶体验”的问卷调查,并从这6位车主中随机抽取2位车主赠送一份小礼物,求这2位获赠礼品的车主中至少有1位女性车主的概率. 参考公式:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:P(K 2≥k 0) 0.10 0.05 0.010 0.001 k 02.7063.8416.63510.828解析 (1)由题表得K2=200×(100×30-20×50)2120×80×150×50=1009≈11.111>10.828.所以有99.9%的把握认为购置新能源汽车与性别有关.(2)用分层抽样的方法按性别从被调查的购置新能源汽车的车主中选出6位,其中男性车主有100150×6=4人,记为a,b,c,d;女性车主有50150×6=2人,记为E,F.从这6位车主中随机抽取2位车主包含的基本事件有:ab,ac,ad,aE,aF,bc,bd,bE,bF,cd,cE,cF,dE,dF,EF,共15种. 至少有1位女性车主包含的基本事件有:aE,aF,bE,bF,cE,cF,dE,dF,EF,共9种.故所求概率P=915=35. 7.(2022届山西长治质检,17)为了了解某种新型药物对治疗某种疾病的疗效,某机构日前联合医院进行了小规模的调查.结果显示,相当多的受访者担心使用新药后会有副作用.为了了解使用该种新型药品后是否会引起疲乏症状,该机构随机抽取了某地患有这种疾病的275人进行调查,得到统计数据如下表:无疲乏症状有疲乏症状总计 未使用新药 150 25 t 使用新药 x y 100 总计225m275(1)求2×2列联表中的数据x,y,m,t 的值,并确定能否有95%的把握认为有疲乏症状与使用该新药有关; (2)从使用该新药的100人中按是否有疲乏症状,采用分层抽样的方法抽出4人,再从这4人中随机抽取2人作进一步调查,求这2人中恰有1人有疲乏症状的概率. 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.150 0.100 0.050 0.025 0.010 k2.072 2.7063.841 5.0246.635解析 (1)t=150+25=175,x=225-150=75,y=100-75=25,m=25+25=50,所以K 2的观测值k=275×(150×25-75×25)2225×50×100×175≈4.910 7>3.841,故有95%的把握认为有疲乏症状与使用新药有关.(2)从使用该新药的100人中按是否有疲乏症状,采用分层抽样的方法抽出4人,其中无疲乏症状的有75100×4=3人,记为a,b,c;有疲乏症状的有25100×4=1人,记为D,则从这4人中随机抽取2人的情况有ab,ac,aD,bc,bD,cD,共6种,这2人中恰有1人有疲乏症状的情况有aD,bD,cD,共3种.故所求概率P=36=12. 8.(2021安徽五校联盟联考(二),18)网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表:年龄段(岁) (0,20) [20,40) [40,60) [60,100) 网购人数 26 32 34 8 男性人数1510105(1)若把年龄在[20,60)的人称为“网购迷”,否则称为“非网购迷”,请完成下面的2×2列联表,并判断能否有99%的把握认为网购与性别有关;网购迷非网购迷总计男性 女性 总计(2)若从年龄小于40岁的网购男性中用分层抽样的方法抽取5人,再从中抽取两人,求两人年龄都小于20岁的概率. 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K 2≥k) 0.10 0.05 0.01 0.001k2.7063.841 6.635 10.828解析 (1)由题中信息完善2×2列联表如下表所示:网购迷 非网购迷 总计 男性 20 20 40 女性 46 14 60 总计6634100∴K2=100×(20×14-46×20)266×34×40×60≈7.605>6.635,故有99%的把握认为网购与性别有关.(2)年龄在(0,20)、[20,40)的网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,从年龄段(0,20)内抽取3人,分别记为1、2、3;从年龄段[20,40)内抽取2人,分别记为a 、b,从中随机抽取2人的可能结果有(1,2)、(1,3)、(1,a)、(1,b)、(2,3)、(2,a)、(2,b)、(3,a)、(3,b)、(a,b),共10个.用A表示“两人年龄都小于20岁”这一事件,则事件A包含的结果为(1,2)、(1,3)、(2,3),共3个.故事件A发生的概率P(A)=310.9.(2021安徽黄山二模,17)2021年3月5日,人社部和全国两会政府工作报告中针对延迟退休给出了最新消息,人社部表示正在研究延迟退休改革方案,两会上指出十四五期间要逐步延迟法定退休年龄.现对某市工薪阶层关于延迟退休政策的态度进行调查,随机调查了50人,他们月收入的频数分布及对延迟退休政策赞成的人数如下表.月收入(单位:百元)[15,25)[25,35)[35,45)[45,55)[55,65)[65,75]频数510151055赞成人数123534(1)根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有99%的把握认为“月收入以55百元为分界点”对延迟退休政策的态度有差异;月收入不低于55百元月收入低于55百元合计赞成不赞成合计(2)若采用分层抽样法从月收入在[25,35)和[65,75]的被调查人中选取6人进行跟踪调查,并随机给其中3人发放奖励,求获得奖励的3人中至少有1人月收入在[65,75]的概率.参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k)0.0500.0100.001k 3.841 6.63510.828解析(1)2×2列联表如下:月收入不低于55百元月收入低于55百元合计赞成71118不赞成32932合计104050则K2=50×(7×29-3×11)210×40×32×18≈6.27<6.635,所以没有99%的把握认为“月收入以55百元为分界点”对延迟退休政策的态度有差异.(2)按照分层抽样的方法可知,月收入在[25,35)的抽取4人,记为a,b,c,d,月收入在[65,75]的抽取2人,记为A,B,则从6人中任取3人的所有情况为{A,B,a}、{A,B,b}、{A,B,c}、{A,B,d}、{A,a,b}、{A,a,c}、{A,a,d}、{A,b,c}、{A,b,d}、{A,c,d}、{B,a,b}、{B,a,c}、{B,a,d}、{B,b,c}、{B,b,d}、{B,c,d}、{a,b,c}、{a,b,d}、{a,c,d}、{b,c,d},共20种, 其中至少有1人月收入在[65,75]的情况有16种, 所以3人中至少有1人月收入在[65,75]的概率为1620=45.应用篇 知行合一应用 回归模型的应用1.(2020课标Ⅰ,5,5分探索创新情境)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( )A.y=a+bxB.y=a+bx 2C.y=a+be xD.y=a+bln x 答案 D2.(2022届宁夏顶级名校月考,20实际生活)“金山银山不如绿水青山;绿水青山就是金山银山.”复兴村借力“乡村振兴”国策,依托得天独厚的自然资源开展乡村旅游,乡村旅游事业蓬勃发展.复兴村旅游协会记录了近八年的游客人数,见下表.年份2013 年 2014 年 2015 年 2016 年 2017 年 2018 年 2019 年2020 年 年份代码x 1 2 345678 游客人数y (百人)4816 32 51 71 97122为了分析复兴村未来的游客人数变化趋势,公司总监分别用两种模型对变量y 和x 进行拟合,得到了相应的回归方程,绘制了残差图.残差图如下(注:残差e ^i =y i -y ^i ):模型①y ^=bx 2+a;模型②y ^=dx+c.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由; (2)根据(1)中选定的模型求出相应的回归方程(系数均保留两位小数); (3)根据(2)中求出的回归方程来预测2021年的游客人数(结果保留整数). 其中,z=x2,z =18∑i=18z i .参考数据:∑i=18(x i -x )·(y i -y )=728∑i=18(x i -x )2=42∑i=18(z i -z )·(y i -y )=6 868∑i=18(z i -z )2=3 570∑i=18z i =204∑i=18y i =400附:回归直线的斜率和截距的最小二乘估计公式分别为b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y -b ^x .解析 (1)选择模型①.理由:根据残差图可以看出, 模型①的估计值和真实值相对比较接近;模型②的残差相对比较大,所以模型①的拟合效果相对较好.(2)由(1)可知y 关于x 的回归方程为y ^=bx 2+a.令z=x 2,则y ^=bz+a,由题中所给数据得b ^=6 8683 570≈1.92,又z =18∑i=18z i =2048=25.5,y =4008=50,所以a ^=50-1.92×25.5=1.04,所以y 关于x 的回归方程为y ^=1.92x 2+1.04. (3)将x=9代入回归方程,可得y ^=1.92×92+1.04≈157, 则2021年游客人数大约为157百人. 3.(2021哈尔滨三中一模,19实际生活)宁夏西海固地区,在1972年被联合国粮食开发署确定为最不适宜人类生存的地区之一.为改善这一地区人民生活的贫困状态,20世纪90年代,党中央和自治区政府决定开始吊庄移民,将西海固地区的人口成批地迁移到更加适合生活的地区.为了帮助移民人口尽快脱贫,党中央作出推进东西部对口协作的战略部署,其中确定福建对口帮扶宁夏,在福建人民的帮助下,原西海固人民实现了快速脱贫,下表是对2016年以来近5年某移民村庄100位移民的年人均收入的统计:年份 2016 2017 2018 2019 2020 年份代码x12 3 4 5 人均年收入y(千元) 1.32.85.78.913.8现要建立y 关于x 的回归方程,有两个不同回归模型可供选择,模型一y^(1)=b ^x+a ^;模型二y ^(2)=c ^x 2+d ^,即使画出y 关于x 的散点图,也无法确定哪个模型拟合效果更好,现用最小二乘法原理,已经求得模型一的方程为y ^=3.1x-2.8.(1)请你用最小二乘法原理,结合下面的参考数据及参考公式求出模型二的方程(计算结果保留到小数点后一位);(2)用计算残差平方和的方法比较哪个模型拟合效果更好(已经计算出模型一的残差平方和为∑i=15(y i -y ^i )2=3.7).参考数据:∑i=15t i y i -5ty ∑i=15t i2-5t 2≈0.52,其中t i =x i 2,i=1,2,3,4,5.参考公式:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计公式分别为β^=∑i=1nu i v i -nuv ∑i=1nu i 2-nu 2,α^=v -β^u .解析 (1)令t=x 2,则模型二可化为y 关于t 的线性回归问题, t =1+4+9+16+255=11,y =1.3+2.8+5.7+8.9+13.85=6.5, 则由参考数据可得c ^=∑i=15t i y i -5ty ∑i=15t i2-5t 2≈0.52≈0.5,d ^=y -c ^t =6.5-0.52×11≈0.8, 则模型二的方程为y ^(2)=0.5x 2+0.8. (2)由模型二的回归方程可得,y ^1(2)=0.5×1+0.8=1.3,y ^2(2)=0.5×4+0.8=2.8,y ^3(2)=0.5×9+0.8=5.3,y ^4(2)=0.5×16+0.8=8.8,y ^5(2)=0.5×25+0.8=13.3,∴∑i=15(y i -y ^i (2))2=02+02+0.42+0.12+0.52=0.42<3.7,故模型二的拟合效果更好.创新篇 守正出奇创新 统计与统计案例的综合应用。
变量间的相关关系(二)班级:____________ 姓名:__________________一、选择题1.下列语句所表示的事件中的因素不具有相关关系的是( ) A .瑞雪兆丰年 B .上梁不正下梁歪 C .吸烟有害健康D .喜鹊叫喜,乌鸦叫丧解析:选D 选项A ,B ,C 中描述的变量间都具有相关关系,而选项D 是迷信说法,没有科学依据. 2.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .不能小于0 B .不能大于0 C .不能等于0D .只能小于0【解析】 当b ^=0时,r =0,这时不具有线性相关关系,但b ^能大于0,也能小于0. 【答案】 C3.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -4.423;②y 与x 负相关且y ^=-1.476x +3.648;③y 与x 正相关且y ^=3.437x +6.493;④y 与x 正相关且y ^=-2.326x -2.576.其中一定不正确...的结论的序号是( ) A .①② B .②③ C.③④D .①④【解析】 由正负相关性的定义知①④一定不正确. 【答案】 D4.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为7.4,据此模型预报广告费用为6万元时,销售额为( ) A .61.6万元 B .63.5万元 C .65.7万元D .72.0万元【解析】 x -=14(4+2+3+5)=1.5,-y =14(49+26+39+54)=42, 所以a ^=-y -b ^x -=42-7.4×1.5=7.1, 所以回归方程为y ^=7.4x +7.1,令x =6,得y ^=7.4×6+7.1=63.5(万元).故选B. 【答案】 B5.设某大学的女生体重y (单位:kg)与身高x (单位: cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:选D 由于回归直线的斜率为正值,故y 与x 具有正的线性相关关系,选项A 中的结论正确;回归直线过样本点的中心,选项B 中的结论正确;根据回归直线斜率的意义易知选项C 中的结论正确;由于回归分析得出的是估计值,故选项D 中的结论不正确.6.已知数列{}n a 的首项110,1n n a a a +==+,则20a =( ) A .99 B .101 C .399 D .401解析:C 【详解】由11n n a a +=+,可得)21111n a ++==,是以1为公差,以1为首项的等差数列.2,1n n a n ==-,即220201399a =-=.故选C.7.在ABC ∆中,角,,A B C 的对边分别是,,a b c , 2cos 22A b c c+=,则ABC ∆的形状为 A .直角三角形 B .等腰三角形或直角三角形 C .等腰直角三角形 D .正三角形解析:A 【解析】 因为2cos22A b c c +=,所以1cosA 22b cc++=,() ccosA b,sinCcosA sinB sin A C ,sinAcosC 0===+=,因此cosC 0C 2π==,,选A.二、填空题8.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差________分.【解析】 令两人的总成绩分别为x 1,x 2. 则对应的数学成绩估计为 y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20. 【答案】 209.假设学生在初中的英语成绩和高一英语成绩是线性相关的.现有10名学生的初中英语成绩(x )和高一英语成绩(y )如下:x 74 71 72 68 76 73 67 70 65 74 y76757170767965776272解析:将x =71,y =72.3,b ^=1.22,代入y =b ^x +a ^,得a ^=72.3-1.22×71=-14.32. 答案:y ^=1.22x -14.32 10.过点()2,0引直线l 与曲线21y x =-相交于A 、B 两点,O 为坐标原点,当ABO ∆的面积取最大值时,直线l 的斜率为_________. 【答案】3-【解析】曲线21y x =-的图象如图所示:若直线l 与曲线相交于A,B 两点,则直线l 的斜率k 0<,设l :(2)y k x =-,则点O 到直线的距离221k d k=+,则ABO ∆的面积222221111=||2(1)(1)2222d d S AB d d d d d -+⋅=⨯-⋅=-≤=,当且仅当221d d -=,即 222=21k d k =+时,S 有最大值,此时33k =-,故填33-. 三、解答题11.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1 x i =80, ∑10i =1 y i =20, ∑10i =1x i y i =184, ∑10i =1x 2i =720. (1)求家庭的月储蓄y 对月收入x 的线性回归方程y=bx+a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储是多少?蓄.【解】 (1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2, ,由此得b =l xy l xx =2480=0.3,a =-y -b x -=2-0.3×8=-0.2.故所求线性回归方程为y =0.3x -0.2.(2)由于变量y 的值随x 值的增加而增加(b =0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).12.已知等差数列{}n a 的前n 项和为n S ,且1250,15a a S +==,数列{}n b 满足:12b a =,且131(2).n n n n n nb a b a b ++++=(1)求数列{}n a 和{}n b 的通项公式;(2)若211(5)log n n n c a b +=+⋅,求数列{}n c 的 前n 项和.n T答案:(1)23n a n =-,14n n b -=;(2)4(1)nnT n =+【解析】(1)设等差数列{}n a 的公差为d ,所以11120,1,2,23545152n a d a d a n a d +=⎧⎪∴=-==-⎨⨯+=⎪⎩; 由1311(2),(6n 12n 1)b 4nb n n n n n n n n nb a b a b nb +++++=⇒=--+=,14n nb b +∴=,所以数列{}n b 是以4为公比,首项121b a ==的等比数列,14.n n b -∴= (2)因为2111111(),(5)log (22)(2)41n n n c a b n n n n +===-+⋅++1211111111b b b (1).42233414(n 1)n n nT n n ∴=+++=-+-+-++-=++。
变量间的相关关系1、下列说法中正确的是( )A .任何两个变量都具有相关关系B .人的知识与其年龄具有相关关系C .散点图中的各点是分散的没有规律D .根据散点图求得的回归直线方程都是有意义的2、变量y 与x 之间的回归方程( )A .表示y 与x 之间的函数关系B .表示y 和x 之间的不确定关系C .反映y 和x 之间真实关系的形式D .反映y 与x 之间的真实关系达到最大限度的吻合3、线性回归方程ˆˆˆybx a =+必过( ) A 、(0,0)点 B 、(x ,0)点 C 、(0,y )点 D 、(x ,y )点4、设一个回归方程为ˆy=3—1.2x ,则变量x 增加一个单位时( ) A 、y 平均增加1.2个单位 B 、y 平均增加3个单位C 、y 平均减少1.2个单位D 、y 平均减少3个单位5、对于回归方程ˆy=2.75x +9,当x =4时,y 的估计值是 , 6、某种产品的广告费支出x 与销售额(单位:万元)之间有如下对应数据:(1)画出散点图;(2)求回归直线方程;(3)预测广告费支出为10万元时的销售额。
解:7、(2007广东高考)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程ˆy=ˆˆ+;bx a(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:⨯+⨯+⨯+⨯=)3 2.543546 4.566.5解:8、教材P94习题A组:3 .解:。
变量之间的关系一、选择题1、表格列出了一项实验的统计数据,表示皮球从高度d落下时弹跳高度力与下落高d的关系,试问下列说法不正确的是()A. x与y都是变量,且x是自变量,y是因变量B.弹簧不挂重物时的长度为OcmC.物体质量每增加1kg,弹簧长度y增加0.5cmD.所挂物体质量为7kg时,弹簧长度为13.5cm3、在关系式y=3x+5中,下列说法:①x是自变量,y是因变量;②x的数值可以任意选择;③y是变量,它的值与x无关;④用关系式表示的不能用图象表示;⑤y与x的关系还可以用列表法和图象法表示,其中说法正确的是()A、①②⑤B、①②④C、①③⑤D、①④⑤4、张大伯出去散步,从家走了 20min ,至U了一个离家900m的阅报亭,看了 10min报纸后,用了15 min返回到家,如图1图象中能表示张大伯离家时间与距离之间关系的是()C图1 D二、填空题1、表示函数之间的关系常常用__________________________ 三种方法.AB2、重庆市家庭电话月租费为25元,市内通话费平均每次为0.2元.若莹莹家上个月共打出市内电话a 次,那么上个月莹莹家应付费y与。
之间的关系为,若你家上个月共打出市内电话100次,那么你家应付费元.例如第(1)个图形的表面积为6个平方单位,第(2)个图形的表面积为18个平方单位,第(3) 个图形的表面积是36个平方单位,。
依此规律。
则第(5)个图形的表面积 个平方单位.5. 下面是用棋子摆成的“上”字型图案:第一个“上”字 第二个“上”字 第三个“上”字第5题图按照以上规律继续摆下去,通过观察,可以发现:(1)第五个“上”字需用 枚棋子;(2)第刀个"上"字需用 枚棋子.三、简答题1、下面的统计图反映了某中国移动用户5月份手机的使用情况,该用户的通话对象分为三 类:市内电话,本地中国移动用户,本地中国联通用户.(1) 该用户5月份通话的总次数为 次.(2) 已知该用户手机的通话均按0.6元/分钟计费,求该用户5月份的话费(通话时间不 满1分钟按1分钟计算。
一、选择题1、对于线性相关系数r,下列说法正确的是()A、)r,||r越大,相关程度越大;反之,相关程度越∈|+∞|,0(小B、)-∞r,r越大,相关程度越大;反之,相关程度越小∈,(+∞C、||r≤1,且||r越接近于1,相关程度越大;||r越接近于0,相关程度越小D、以上说法都不正确2、下列两变量具有相关关系的是()A 正方体的体积与边长B人的身高与体重C匀速行驶车辆的行驶距离与时间D球的半径与体积3、下列说法中不正确的是()A回归分析中,变量x和y都是普通变量B变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定C回归系数可能是正的也可能是负的D如果回归系数是负的,y的值随x的增大而减小4、线性回归方程ˆy =bx +a 必过( )A 、(0,0)点B 、(x ,0)点C 、(0,y )点D 、(x ,y)点5、若变量y 与x 之间的相关系数r=-0.9362,查表得到相关系数临界值r 0.05=0.8013,则变量y 与x 之间( )A 、不具有线性相关关系B 、具有线性相关关系C 、它们的线性关系还要进一步确定D 、不确定二、填空题6、有下列关系:① 人的年龄与他(她)拥有的财富之间的关系;② 曲线上的点与该点的坐标之间的关系;③ 苹果的产量与气候之间的关系;④ 森林中的同一种树木,其断面直径与高度之间的关系;⑤ 学生与他(她)的学号之间的关系、其中有相关关系的是 。
7、回归直线方式:a bx y+=ˆ∑==ni ix nx 11相应的直线叫回归直线,对两个变量所进行的上述统计分析叫线性回归分析。
8、 叫做变量y 与x 之间的相关系数。
9、相应于显著性水平0、05,观测值为10组的相关系数临界值为 。
10、对于回归方程25775.4ˆ+=x y,当x=28时,y 的估计值是 。
三、解答题11、某种合金的抗拉强度y(kg/m 2m )与其中的含碳量x(%)有关,今测得12对数据如下表所示:利用上述资料:作出抗拉强度y 关于含碳量x 的散点图; 建立y 关于x 的一元线性回归方程。
变量间的相关关系练习题一、选择题1、下列两个变量具有相关关系的是( B )。
A. 正方体的体积与边长B. 人的身高与体重C. 匀速行驶车辆的行驶距离与时间D. 球的半径与体积2、 (2010凌海高一检测)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩; ③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量;其中两个变量成正相关的是( )。
A .①③ B.②④ C .②⑤ D.④⑤ 【解析】选C 。
3、两个变量成负相关关系时,散点图的特征是( D )。
A. 点散布在从左下角到右上角的区域内B. 点散布在某带形区域内C. 点散布在某圆形区域内D. 点散布在从左上角到右下角的区域内 4、(2010天津高一检测)对变量x, y 有观测数据(1x ,1y )(i=1,2,…,10),得散点图1;对变量u ,v 有观测数据(1u ,1v )(i=1,2,…,10),得散点图2. 由这两个散点图可以判断( )。
A 、变量x 与y 正相关,u 与v 正相关B 、变量x 与y 正相关,u 与v 负相关C 、变量x 与y 负相关,u 与v 正相关D 、变量x 与y 负相关,u 与v 负相关 【解析】选C 。
图1中x 变大时,y 随之变小故x 与y 负相关;图2中u 变大时,v 也随之变大,故u 与v 正相关。
5、(2010白城高一检测)在下列各图中,每个图的两个变量具有相关关系的图是( )。
(1) (2) (3) (4) A .(1)(2) B .(1)(3) C .(2)(4) D .(2)(3)【解析】选D 。
选项A 为函数关系,选项D 不具有相关关系。
6、(2010个旧高一检测)某设备使用年限x 和所支出维修费用y (万元)之间呈线性相关,现取五对观察值,计算得:∑∑∑∑========515125151120,90,25,20i i i i i i i i iy x x y x,则x y 与的回归方程是( )。
《变量间的相关关系》习题1.下列两个变量之间的关系,哪个不是函数关系() A.匀速行驶车辆的行驶距离与时间B.角度和它的正弦值C.等腰直角三角形的腰长与面积D.在一定年龄段内,人的年龄与身高2.下列有关线性回归的说法,不正确的是() A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C.回归方程最能代表观测值x、y 之间的线性关系D.任何一组观测值都能得到具有代表意义的回归方程^3.工人月工资 (元 )依劳动生产率 (千元 )变化的回归方程为y = 60+ 90x,下列判断正确的是()A .劳动生产率为 1 千元时,工资为50 元B.劳动生产率提高 1 千元时,工资提高 150 元C.劳动生产率提高 1 千元时,工资约提高90 元D.劳动生产率为 1 千元时,工资为90 元4.已知 x 与 y 之间的几组数据如下表:x123456y021334^^^假设根据上表数据所得线性回归直线方程y = b x+a,若某同学根据上表中的前两组数据 (1,0)和 (2,2)求得的直线方程为y= b′x+ a′,则以下结论正确的是()^^^^A. b >b′, a >a′B.b >b′, a <a′^^^^C.b <b′, a >a′D.b <b′, a <a′5.若对某个地区人均工资x 与该地区人均消费y 进行调查统计得 y 与 x 具有相关关系,且^回归方程为 y = 0.7x+ 2.1(单位:千元 ),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为________.6.期中考试后,某校高三(9)班对全班65 名学生的成绩进行分析,得到数学成绩y 对总成^绩 x 的回归方程为 y分,则他们= 6+0.4x.由此可以估计:若两个同学的总成绩相差50的数学成 大 相差 ________分.7.从某居民区随机抽取10 个家庭, 得第i 个家庭的月收入x i ( 位:千元 )与月 蓄 y i (10101010位:千元 )的数据 料,算得x i = 80,y i = 20,x i y i = 184, 2x i = 720.i =1i =1i =1i =1^^^(1)求家庭的月 蓄 y 月收入 x 的 性回 方程 y =b x + a ;(2)判断 量 x 与 y 之 是正相关 是 相关;(3)若 居民区某家庭月收入7 千元, 家庭的月 蓄.nx i y i - n xy^^^^i =1^^附: 性回 方程 y =b x + a中,b =,a = y - bx ,其中 x , yn22x i -n xi =1本平均 .8.(x 1, y 1), (x 2, y 2), ⋯ ,(x n , y n )是 量 x 和 y 的 n 个 本点,直 l 是由 些 本点通 最小二乘法得到的回 直 (如 ),以下 中正确的是 ()A . x 和 y 的相关系数 直l 的斜率B .x 和 y 的相关系数在0 到 1 之C .当 n 偶数 ,分布在 l 两 的 本点的个数一定相同D .直 l 点 ( x , y )9.若 量y 与 x 之 的相关系数r =- 0.936 2, 量 y 与 x 之 ( )A .不具有 性相关关系B .具有 性相关关系C.它们的线性相关关系还要进一步确定D.不确定10.某工厂生产某种产品的产量x(吨 )与相应的生产能耗y(吨标准煤 )有如下几组样本数据:x3456y 2.534 4.5据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得其回归直线的斜率为 0.7,则这组样本数据的回归直线方程是________.11.某数学老师身高 176 cm,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和 182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm.12.以下是某地搜集到的新房屋的销售价格y 和房屋的面积 x 的数据:房屋面积 x(m2)11511080135105销售价格 y(万元 )24.821.618.429.222(1)画出数据对应的散点图;(2)求回归方程,并在散点图中加上回归直线.(3)据 (2) 的结果估计当房屋面积为150 m2时的销售价格.13.一台机器由于使用时间较长,生产的零件有一些会缺损,按不同转速生产出来的零件有缺损的统计数据如下表:转速 x(转 /秒 )1614128每小时生产缺损零件数y(件 )11985(1)作出散点图;(2)如果 y 与 x 线性相关,求出回归直线方程;(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10 个,那么,机器的运转速度应控制在什么范围?1.答案 D解析 在一定年龄段内,人的年龄与身高具有相关关系. 2.答案 D解析 只有数据点整体上分布在一条直线附近时,才能得到具有代表意义的回归直线. 3.答案C^解析 因工人月工资与劳动生产率变化的回归方程为y =60+ 90x ,当 x 由 a 提高到 a^^+ 1 时, y 2- y 1= 60+ 90(a + 1)- 60- 90a = 90. 4.答案 C6x i - xy i - y^i =1解析b ′=2, a ′=- 2,由公式 b =求得.6x i - x2i =1^5^^x =13 5 7 1 b = , a = y - b6-×=- ,77 23^^∴ b <b ′, a >a ′选.C. 5.答案 87.5%解析设该地区人均工资收入为 y ,则 y = 0.7 x + 2.1,当 y = 10.5 时, x =10.5- 2.1=12.0.710.5 12×100%= 87.5%.6.答案 20解析令两人的总成绩分别为x , x .则对应的数学成绩估计为^^y 1= 6+ 0.4x 1,y 2 =6+ 0.4x 2,^^所以 |y 1- y 2|= |0.4(x 1- x 2)|= 0.4 ×50= 20.1 n807.解(1)由题意知 n = 10, x = n =x i = 10= 8,i11 n20y =y i == 2,n222又 l xx = x i - n x= 720- 10×8= 80,i =1 nl xy =x i y i - n xy =184- 10×8×2= 24,i =1^由此得 b = l xy =24= 0.3,l xx 80^^x = 2- 0.3 ×8=- 0.4,a = y -b^故所求线性回归方程为 y =0.3x - 0.4.^^(2)由于变量 y 的值随 x 值的增加而增加 (b = 0.3>0),故 x 与 y 之间是正相关.(3)将 x = 7 代入回归方程可以预测该家庭的月储蓄为 y = 0.3 ×7-0.4= 1.7(千元 ).8.答案 D解析相关系数 r 的计算公式与 l 斜率的计算公式不一样,故A 错;由 |r |< 1 知B 错;分布在 l 两侧的点的个数没有什么规律,故 C 错;(x , y )为样本点的中心,回归直线过样本的中心,故 D 正确.9.答案B解析 由于 r ∈ [ -1,- 0.75] 时,变量 y 与 x 负相关很强, r =- 0.936 2∈ [- 1,- 0.75] ,所以选 B.^10.答案 y = 0.7x + 0.35解析∵ x = 3+ 4+5+ 6= 4.5, y = 2.5+ 3+ 4+ 4.5= 3.5,4 4^^∴ a = y -b x = 3.5- 0.7 ×4.5= 0.35.^∴回归直线方程为 y = 0.7x +0.35.11.答案185解析 根据题中所提供的信息,可知父亲与儿子的对应数据可列表如下:父亲的身高 (x) 173 170 176 儿子的身高 (y)1701761823x i - xy i - y^i =13×6^^x = 173, y = 176,∴ b ==2 =1,a = y - b x =- 3 232+ 3i - xxi =1176- 173= 3,^182+ 3= 185(cm) .∴回归方程为 y =x + 3,从而可预测他孙子的身高为12.解 (1) 数据对应的散点图如图所示:1 5(2) x = 5i =x i = 109, y = 23.2,1552= 60 975,x i y i = 12 952.x ii =1i =1^^^设所求回归方程为 y = bx + a ,5i i - 5 x yx y^ i =1≈ 0.196 2, 则 b =522x i - 5 xi =1^^a = y -b x =23.2- 109 × 0.196 2≈ 1.814, 2^故所求回归方程为 y = 0.196 2x + 1.814 2.(3)据 (2) ,当 x = 150 m 2 时,销售价格的估计值为^y =0.196 2 ×150+ 1.814 2= 31.244 2(万元 ).13.解 (1) 根据表中的数据画出散点图如图:^ ^ ^(2)设回归直线方程为 y = bx + a ,并列表如下:i 1 2 3 4 x i 16 14 12 8 y i 11 9 8 5 x i y i176126964044x = 12.5, y = 8.25,2x y = 438,x= 660,ii ii =1i =1^438- 4×12.5 ×8.25∴ b = 660- 4×12.5 2 ≈ 0.73,^a = 8.25- 0.73 ×12.5=- 0.875,^∴ y = 0.73x - 0.875.(3)令 0.73x - 0.875 ≤ ,10解得 x ≤ 14.9 ≈ 15.故机器的运转速度应控制在15 转 /秒内.。