高中数学选修2-3 北师大版 第3章 §1.1回归分析 作业(含答案)
- 格式:doc
- 大小:108.00 KB
- 文档页数:4
高中数学学习材料马鸣风萧萧*整理制作回归分析同步练习【选择题】1、下列两个变量之间的关系哪个不是函数关系?()A、角度和它的余弦值B、正方形边长和面积C、正n边形的边数和顶点角度之和D、人的年龄和身高2、变量y与x之间的回归直线方程()A.表示y与x之间的函数关系B.表示y和x之间的不确定关系C.反映y和x之间真实关系的形式D.反映y与x之间的真实关系达到最大限度的吻合3、若用水量x(吨)与某种产品的产量y的回归直线方程是ˆy=2x+1250,若用水量为50kg时,预计的某种产品的产量是()A.1350 kg B.大于 1350 kg C.小于1350kg D.以上都不对【填空题】4、对具有______________的两个变量进行统计分析的方法叫回归分析。
5、现有一个由身高预测体重的回归方程:体重预测值=4(磅/英寸)×身高-130磅.其中体重与身高分别以磅和英寸为单位.如果换算为公制(1英寸≈2.5cm,1磅≈0.45kg),回归方程应该为_____________________6、回归直线方式:a bx y+=ˆ中b =_____________________,a =____________________(其中:∑==ni ix n x 11)【解答题】7、为考虑广告费用x 与销售额y 之间的关系,抽取了5家餐厅,得到如下数据:广告费用(千元) 1.0 4.0 6.0 10.0 14.0 销售额(千元)19.044.040.052.053.0(1)在同一张图上画散点图,直线ˆy(1)=24+2.5x ,曲线ˆy (2)=602xx +;(2)比较所画直线与曲线,哪一条更能表现这组数据之间的关系?(3)分别计算用直线方程与曲线方程得到在5个x 点处的销售额预测值与实际值之间的误差,最后比较两个误差绝对值之和的大小。
8、下面是两个变量的一组数据: x 1 2 3 4 5 6 7 8 y1491625364964请用最小二乘法求出这两个变量之间的线性回归方程。
新课程标准数学选修2—3第三章课后习题解答第三章统计案例3.1回归分析的基本思想及其初步应用练习(P89)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:①寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.②分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,=+,没所以每个样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.有随机误差项,是严格的一次函数关系. 通过计算可得21习题3.1 (P89)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,(2)用t得ˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729yt =-. 残差计算结果见下表.GDP 值与年份线性拟合残差表2003年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系. 2、说明:本题的结果与具体的数据有关,所以答案不唯一. 3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =, 得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化. 因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 3.2独立性检验的基本思想及其初步应用练习(P97)(1)画等高条形图. 由图及表直观判断好像“成绩与班级有关系”.(2)因为2K 的观测值0.6536.63k ≈<,由教科书中表3—11知2( 6.635)0.01P K ≥≈,所以在犯错误的概率不超过0.01的前提下不能认为“成绩与班级有关系”. 说明:(1)教师在布置该题目时,应该明确要求学生们制作等高条形图,并从图形上判断两个分类变量之间是否有关系.(2)通过图形的直观感觉的结果可能会出现错误. (3)本题与例题不同,本题计算得到的2K 的观测值比6.635小,所以没有理由说明“成绩与班级有关系”. 独立性检验与反证法有类似的地方,在使用反证法证明结论时,在假设结论不成立的条件下,如果没有推出矛盾,并不能说明结论成立,也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾. 习题3.2 (P97)1、如果“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的观测值很大,则说明很可能“服药与患病之间有关系”. 由题目中所给数据计算得 6.109k ≈,而由表3-11,得2( 5.024)0.025P K ≥≈,而6.1090.025>,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 再由服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,则2K 的观测值应比较小. 如果2K 的观测值很大,则说明“性别与读营养说明之间有关系”. 按题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表3-11知2(7.879)0.005P K ≥≈,8.4167.879>,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”. 说明:如果问题为“性别与读营养说明之间有没有关系?”则下面表述同样正确:虽然2K 的观测值8.4167.879k ≈>,而2( 6.635)0.010P K ≥≈,所以在犯错误的概率不超过0.01的前提下认为“性别与读营养说明之间有关系”. 3、需要收集数据,所有没有统一答案.说明:第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同.说明:第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为-770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为-1120万人. 2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5y x =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系.说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、总偏差平方和21()ni i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()nii yy =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式222111ˆˆ()()()nn niii i i y y y yy y ===-=-+-∑∑∑表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和. 3、本题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。
第三章统计案例§1回归分析1.1回归分析课后作业提升1.散点图在回归分析过程中的作用是()A.查找个体数B.比较个体数据大小关系C.探究个体分类D.粗略推断变量是否具有相关关系答案:D2.已知x,y之间的数据如下表所示,则y与x之间的线性回归方程过点()A.(0,0)B.(1.1675,0)C.(0,2.3925)D.(1.1675,2.3925)解析:由a=y-b x,知y=a+b x,回归直线y=a+bx肯定过点(x,y),即经过点(1.1675,2.3925).答案:D3.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),其线性回归直线在y轴上的截距为()A.y-bxB.y-b xC.x-b yD.y+b x答案:B4.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程y=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估量该城市人均消费额占人均工资收入的百分比约为()A.83%B.72%C.67%D.66%答案:A5.在争辩硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:解度y6.7 6.0 5.0 12.3 28.0由此得到回归直线的斜率是.解析:由表中的数据,得b=∑i=1nx i y i-nx y∑i=1nx i2-nx2≈0.8809.答案:0.88096.若施化肥量x与小麦产量y之间的回归直线方程为y=250+4x,当施化肥量为50kg时,估计小麦产量为kg.答案:4507.某设备的使用年限x(年)和所支出的修理费用y(万元)有如下的统计数据,由资料显示y与x呈线性相关关系.(1)请依据上表供应的数据,求出y关于x的线性回归方程;(2)试依据(1)求出的线性回归方程,猜测使用年限为10年时,修理费用是多少?解:(1)∑i=14x i y i=3×2.5+4×3+5×4+6×4.5=66.5,x=3+4+5+64=4.5,y=2.5+3+4+4.54=3.5,∑i=14x i2=32+42+52+62=86,b=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a=y-b x=3.5-0.7×4.5=0.35,故线性回归方程为y=0.7x+0.35.(2)当x=10时,y=0.7×10+0.35=7.35,所以依据回归方程的猜测,使用年限为10年时,修理费用是7.35万元.8.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数.现观测得到(x,y)的4组值为(8,5),(12,8),(14,9),(16,11).(1)假设y与x之间存在线性相关关系,求y与x之间的线性回归方程;(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1)解:(1)设回归方程为y=a+bx,则x=8+12+14+164=12.5,。
[A 基础达标]1.下列两个变量之间呈相关关系的是( ) A .角度与它的正弦值B .一个考生的数学成绩与物理成绩C .单产为常数时,土地面积与粮食总产量D .面积为定值的长方形的长与宽解析:选B.选项A 、C 和D 均为函数关系,只有选项B 为相关关系.2.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel 软件计算得y =0.577x -0.448(x 为人的年龄,y 为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )A .年龄为37岁的人体内脂肪含量都为20.90%B .年龄为37岁的人体内脂肪含量约为21.01%C .年龄为37岁的人群中的大部分人的体内脂肪含量约为20.90%D .年龄为37岁的人群中的大部分人的体内脂肪含量约为31.5%解析:选C.当x =37时,y =0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量约为20.90%.3.某单位为了制定节能减排的目标,先调查了用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温/℃ 18 13 10 -1 用电量/度24343864A .20B .40C .60D .80解析:选C. x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,因为(x ,y )在线性回归方程y =-2x +a 上, 所以40=-2×10+a , 即a =60.4.工人月工资y (单位:元)关于劳动生产率x (单位:千元)的回归方程为y =650+80x ,下列说法中正确的个数是( )①劳动生产率为1 000元时,工资为730元;②劳动生产率提高1 000元,则工资提高80元;③劳动生产率提高1 000元,则工资提高730元;④当月工资为810元时,劳动生产率约为2 000元.A.1 B.2C.3 D.4解析:选C.代入方程计算可判断①②④正确.5.为研究变量x和y的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线l1和l2,两人计算知x相同,y也相同,下列正确的是()A.l1与l2一定重合B.l1与l2一定平行C.l1与l2相交于点(x,y)D.无法判断l1和l2是否相交解析:选C.因为两个人在试验中发现对变量x的观测数据的平均值都是x,对变量y的观测数据的平均值都是y,所以两组数据的样本中心点是(x,y),因为回归直线经过样本的中心点,所以l1和l2都过(x,y).6.一般来说,一个人的脚长与身高有相关关系,现对10名成年男性的脚长x(cm)与身高y(cm)进行测量,从而得出它们具有很强的线性相关性且线性回归方程为y=7x,某刑侦人员在某案现场发现一对裸脚印,量得每个脚印长26.5 cm,请你估计案发嫌疑人的身高为________cm.解析:由题意知,当x=26.5 cm时,y=185.5 cm.答案:185.57.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得则y与x的线性回归方程是________.解析:由题中数据得x=6.5,y=28.5.所以b=≈2.62,a=y-b x=28.5-2.62×6.5=11.47,所以y与x的线性回归方程是y=2.62x+11.47.答案:y=2.62x+11.478.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消化系数的数据如下表所示:尿汞含量x 246810消化系数 64 138 205 285 260若y 与x 具有线性相关关系,则线性回归方程是________.解析:b =a =y -b x =28.7,所以y =28.7+26.95x . 答案:y =28.7+26.95x9.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据.x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 对x 的线性回归方程y =bx +a ;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程, 预测技改后生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤? 解:(1)散点图如图所示,显然y 与x 之间具有线性相关关系.(2) x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,a =y -b x =3.5-0.7×4.5=0.35. 所以线性回归方程是y =0.7x +0.35.(3)技改后生产100吨甲产品的生产能耗为y =0.7×100+0.35=70.35吨标准煤,比技改前降低生产能耗90-70.35=19.65吨标准煤.10.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得解:(1)由题意知n =10,x -=110∑i =110x i =8010=8,y -=110∑i =110y i =2010=2,由此得b =l xy l xx =2480=0.3,a =y --b x -=2-0.3×8=-0.4.故所求线性回归方程为y =0.3x -0.4.(2)将x =7代入线性回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).[B 能力提升]11.已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) A .b >b ′,a >a ′ B .b >b ′,a <a ′ C .b <b ′,a >a ′D .b <b ′,a <a ′解析:选C.由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2,a ′=0-2×1=-2.求b ,a 时,∑i =16x i y i =0+4+3+12+15+24=58,x -=3.5,y -=136,i =16x 2i =1+4+9+16+25+36=91,所以b =58-6×3.5×13691-6×3.52=57,a =136-57×3.5=136-52=-13,所以b <b ′,a >a ′.12.对20艘轮船的研究中,船的吨位区间从192 t 到3 246 t ,船员的数目从5人到32人,对船员人数关于船的吨位进行回归分析得到如下结果: 船员人数=9.5+0.006 2×吨位.(1)假定两艘船吨位相差1 000 t ,则船员平均人数相差________;(2)对于最小的船估计的船员人数是________,对于最大的船估计的船员人数是________. 解析:设船员人数分别为y 1,y 2,吨位分别为x 1,x 2,则y 1-y 2=(9.5+0.006 2x 1)-(9.5+0.006 2x 2)=0.006 2·(x 1-x 2)=0.006 2×1 000=6.2,所以船员平均人数相差6.最小的船所载船员人数为9.5+0.006 2×192≈10,最大的船所载船员人数为9.5+0.006 2×3 246≈29.答案:(1)6 (2)10 2913.某地最近几年粮食需求量逐年上升,下表是部分统计数据:(1)(2)利用(1)中所求出的线性回归方程预测该地2020年的粮食需求量.解:(1)由所给数据看出,年需求量与年份之间近似直线.为此对数据预处理如下:x -=0,y -=3.2,b =(-4)×(-21)+(-2)×(-11)+2×19+4×2942+22+22+42=26040=6.5. a =y --b x -=3.2.由上述计算结果,知所求回归直线方程为y -257=b (x -2 012)+a =6.5(x -2 012)+3.2. 即y =6.5(x -2 012)+260.2.①(2)利用直线方程①,可预测2020年的粮食需求量为6.5×(2 020-2 012)+260.2 =6.5×8+260.2 =312.2(万吨) ≈312(万吨).14.(选做题)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求线性回归方程y =bx +a ,其中b =-20,a =y --b x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x -=8.5,y -=80,所以a =y --b x -=80+20×8.5=250,从而线性回归方程为y =-20x +250.(2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20⎝⎛⎭⎫x -3342+361.25. 当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.由Ruize收集整理。
1.设有一个回归直线方程y=2-2.5x,则变量x增加一个单位时().A.y平均增加2.5个单位B.y平均增加2个单位C.y平均减少2.5个单位D.y平均减少2个单位2.y与x之间的线性回归方程y=bx+a必定过().A.(0,0)B.(,0)C.(0,y)D.(,y)3.工人月工资y(单位:元)关于劳动生产率x(单位:千元)的回归方程为y=650+80x,下列说法中正确的个数是().①劳动生产率为1000元时,工资为730元;②劳动生产率提高1000元,则工资提高80元;③劳动生产率提高1000元,则工资提高730元;④当月工资为810元时,劳动生产率约为2000元.A.1B.2C.3D.44.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为y=0.01x+0.5,则加工600个零件大约需要().A.6.5hB.5.5hC.3.5hD.0.5h5.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有().A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反6.已知一个回归直线方程为y=1.5x+45,x∈{1,7,5,13,19},则y=______.7.对于n个复数z1,z2,…,z n,如果存在n个不全为零的实数k1,k2,…,k n,使得k1z1+k2z2+…+k z n=0,就称z1,z2,…,z n线性相关.若要说明z1=1+2i,z2=1-i,z3=-2线性相关,那么可取{k1,k2 n,k3}=______.(只要写出一组即可)8.已知x与y之间的一组数据:x 012 3y 1357则y与x的线性回归方程为y=bx+a必过点__________.9.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下.零件数x(个)102030405060708090100加工时间y(分)626875818995102108115122(1)求y对x的回归直线方程.(2)据此估计加工200个零件所用的时间是多少?10.某农场对单位面积化肥用量x(kg)和水稻相应产量y(kg)的关系作了统计,得到数据如下:如果x 与y之间具有线性相关关系,求出回归直线方程,并预测当单位面积化肥用量为32kg时水稻的产量大约是多少?(精确到0.01kg)x 15202530354045y 330345365405445450455参考答案1.答案:C解析:∵y =2-2.5x ,a =2,b =-2.5,∴变量x 增加一个单位时,y 平均减少2.5个单位. 2.答案:D解析:线性回归方程一定过样本中心(,y ). 3.答案:C解析:代入方程计算可判断①②④正确. 4.答案:A解析:当x =600,y =600×0.01+0.5=6.5(h). 5.答案:A解析:因为b >0时,两变量正相关,此时,r >0;b <0时,两变量负相关,此时r <0. 6.答案:58.5 解析:因为=15×(1+7+5+13+19)=9,且y =1.5+45,所以y =1.5×9+45=58.5. 7.答案:{2,4,3}解析:由k 1(1+2i)+k 2(1-i)-2k 3=0, 即(k 1+k 2-2k 3)+(2k 1-k 2)i =0, ∴1231220,20,k k k k k +-=⎧⎨-=⎩即k 1∶k 2∶k 3=1∶2∶32.8.答案:(1.5,4)解析:回归直线方程必过点(,y ),又=01234+++=1.5,13574y +++==4,故y 与x 的线性回归方程必过点(1.5,4).9.解:(1)列出下表,并用科学计算器进行计算.i 1 2 3 4 5 6 7 8 9 10 x i 10 20 30 40 50 60 70 80 90 100 y i 62 68 75 81 89 95 102 108 115122x i y i 62013602250324044505700 7140864010350 12200=55,y =91.7,1021ii x=∑=38500,101i ii x y =∑=55950设所求的回归直线方程为y =bx +A .同时,利用上表可得b =10110222110 y55 950-105591.738 500-105510i ii ii x y x xx ==-⨯⨯=⨯-∑∑≈0.668, a =y -b =91.7-0.668×55=54.96,即所求的回归直线方程为y =0.668x +54.96.(2)这个回归直线方程的意义是当x 增大1时,y 的值约增加0.668,而54.96是y 不随x 增大而变化的部分.因此当x =200时,y 的估计值为 y =54.96+0.668×200=188.56≈189. 故加工200个零件时所用的时间约为189分. 10.解:列表如下:序号 x y x 2 xy 1 15 330 225 4950 2 20 345 400 6900 3 25 365 625 9125 4 30 405 900 12150 5 35 445 1225 15575 6 40 450 1600 18000 7 45 455 2025 20475 合计2102795700087175=17×210=30,17y =×2795≈399.3, b =287 175-730399.37 000-730⨯⨯⨯≈4.746, a =399.3-4.746×30=256.92,∴y 对x 的回归直线方程为y =256.92+4.746x . ∴当x =32时,y =256.92+4.746×32≈408.79(kg).答:回归直线方程为y =256.92+4.746x ,当单位面积化肥用量为32kg 时,水稻的产量约为408.79kg.。
高中数学第三章统计案例1.1 回归分析同步测控北师大版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第三章统计案例1.1 回归分析同步测控北师大版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第三章统计案例1.1 回归分析同步测控北师大版选修2-3的全部内容。
高中数学第三章统计案例 1.1 回归分析同步测控北师大版选修2—3我夯基,我达标1。
对有线性相关关系的两个变量建立的回归直线方程y=a+bx中,回归系数b()A。
可以小于0 B.大于0C。
能等于0 D。
只能小于0解析:b可能大于0,也可能小于0,但当b=0时,x、y不具有线性相关关系.答案:A2.设有一个回归方程为y=2—2。
5x,则变量x增加一个单位时,则()A。
y平均增加2.5个单位 B.y平均增加2个单位C。
y平均减少2.5个单位 D。
y平均减少2个单位解析:斜率的估计值为—2。
5,即x每增加1个单位时,y平均减少2。
5个单位.答案:C3。
工人月工资y(元)依劳动生产率x(千元)变化的回归方程y=50+80x,下列判断不正确的是( )①当劳动生产率为1 000元时,工资为130元②劳动生产率提高1 000元,则工资提高80元③劳动生产率提高1 000元,则工资提高130元④当月工资为210元时,劳动生产率为2 000元A.①B.② C。
③ D.④答案:C4.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为( )A.y=x+1B.y=x+2 C。
y=2x+1 D.y=x-1解析:A、B、C、D四点共线,都在直线y=x+1上.答案:A5。
1 回归分析[A组基础巩固]1.设有一个线性回归方程y=2-2.5x,则变量x增加1个单位时()A.y平均增加2.5个单位B.y平均增加2个单位C.y平均减少2.5个单位D.y平均减少2个单位解析:在线性回归方程y=bx+a中,①当b>0时,说明变量y与x正相关;②当b<0时,说明变量y与x负相关;③x每增加1个单位,y就增加或减少|b|个单位.因为回归直线的斜率为-2.5,即变量x增加1个单位,y平均减少2.5个单位.答案:C2.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()A.变量x与y正相关,u和v正相关B.变量x与y正相关,u和v负相关C.变量x与y负相关,u和v正相关D.变量x与y负相关,u和v负相关解析:由这两个散点图可以判断,变量x与y负相关,u与v正相关.答案:C3.观察两个变量的如下数据:x -1-2-3-4-55432 1y -0.9-2-3.1-3.9-5.15 4.1 2.9 2.10.9若x与y具有线性相关关系,则两个变量间的线性回归方程为()A.y=0.5x-1 B.y=xC.y=2x+0.3 D.y=x+1解析:∵x =0,y =0,∴回归直线必定经过点(0,0),经检验知B 正确. 答案:B4.已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归方程y =bx +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A .b >b ′,a >a ′B .b >b ′,a <a ′C .b <b ′,a >a ′D .b <b ′,a <a ′ 解析:b ′=2,a ′=-2,由公式b =6i =1(x i -x )(y i -y )6i =1(x i -x )2求得. b =57,a =y -b x =136-57×72 =-13,∴b <b ′,a >a ′.选C. 答案:C5.对于指数曲线y =a e bx ,令u =ln y ,c =ln a ,经过非线性化回归分析之后,可以转化成的形式为( )A .u =c +bxB .u =b +cxC .y =b +cxD .y =c +bx解析:对方程y =a e bx 两边同时取对数,然后将u =ln y ,c =ln a 代入,不难得出u =c +bx .答案:A6.已知x 与y 之间的一组数据如下表:x 0 1 2 3 y2468则可求得y 与x 的线性回归方程y =bx +a 必过点________.解析:x =0+1+2+34=32,y =2+4+6+84=5.所以过点(32,5).答案:(32,5)7.若施化肥量x (kg)与小麦产量y (kg)之间的线性回归方程为y =250+4x ,当施化肥量为50 kg 时,预计小麦产量为________.解析:把x =50代入y =250+4x ,可求得y =450. 答案:450 kg8.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的线性回归方程为y =0.254x +0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由题意知[0.254(x +1)+0.321]-(0.254x +0.321)=0.254. 答案:0.2549.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:若加工时间y 与零件个数x 之间有较好的线性相关关系. (1)求加工时间与零件个数的线性回归方程; (2)求加工10个零件需要的时间.解析:(1)由表中数据及计算公式得b =0.7,a =y -b x =1.05,因此,所求的线性回归方程为y =0.7x +1.05.(2)将x =10代入线性回归方程,得y =0.7×10+1.05=8.05(小时),即加工10个零件需要的时间为8.05小时.10.某工厂1~8月份某种产品的产量x (t)与成本y (万元)的统计数据见下表:(1)画出散点图;(2)y 与x 是否具有线性相关关系?若有,求出回归方程. 解析:(1)由表画出散点图如图所示:(2)由(1)中图可看出,这些点基本散布在一条直线附近,可以认为x 和y 线性相关,下面求回归方程:x =6.85,y =157.25,∴b =∑8i =1x i y i -8x ·y ∑8i =1x 2i -8x 2=8 764.5-8×6.85×157.25382.02-8×6.852≈22.17,a =y -b x ≈157.25-22.17×6.85≈5.39. ∴回归方程为y =22.17x +5.39.[B 组 能力提升]1.以下是福建某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:房屋面积(m 2) 115 110 80 135 105 销售价格(万元)24.821.618.429.222则两个变量间的线性回归方程为( ) A .y =0.5x -1B .y =0.196 2x +1.816 6C .y =2x +1.816 6D .y =0.196 2x +18.016 6解析:因为x =15(115+110+80+135+105)=109,y =15(24.8+21.6+18.4+29.2+22)=23.2,所以两个变量间的回归直线必过点(109,23.2).代入验证知应选B. 答案:B2.一唱片公司欲知打歌费用x (十万元)与唱片销售量y (千张)之间的关系,乃从其所发行的唱片中随机抽取了10张,得如下的资料,∑10i =1x i =28,∑10i =1x 2i =303.4,∑10i =1y i =75,∑10i =1y 2i =598.5,∑10i =1x i y i =237,则y 与x 的相关系数r 的绝对值为________. 解析:由公式r =∑ni =1x i y i -n x y(∑ni =1x 2i -n x 2)(∑ni =1y 2i -n y 2),得r =237-10×2.8×7.5(303.4-10×2.82)×(598.5-10×7.52)=0.3,即|r |=0.3. 答案:0.33.对20艘轮船的研究中,船的吨位区间从192 t 到3 246 t ,船员的数目从5人到32人,对船员人数关于船的吨位进行回归分析得到如下结果:船员人数=9.5+0.006 2×吨位.(1)假定两艘船吨位相差1 000 t ,则船员平均人数相差________;(2)对于最小的船估计的船员人数是________,对于最大的船估计的船员人数是________. 解析:设船员人数分别为y 1,y 2,吨位分别为x 1,x 2则y 1-y 2=(9.5+0.006 2x 1)-(9.5+0.006 2x 2)=0.006 2(x 1-x 2)=0.006 2×1 000=6.2,所以船员平均人数相差6.最小的船所载船员人数为9.5+0.006 2×192≈10,最大的船所载船员人数为9.5+0.006 2×3 246≈29.答案:(1)6 (2)10 294.某地今年上半年患某种传染病人数y 与月份x 之间满足的函数关系模型为y =a e bx ,试确定这个函数解析式.解析:设u =ln y ,c =ln a ,则u =c +bx . 由已知得下表:∑6i =1x i =21,∑6i =1u i =25.359 5,∑6i =1x 2i =91,∑6i =1u 2i ≈107.334, ∑6i =1x i u i =90.342 3,x =3.5,u ≈4.226 58, b =∑6i =1x i u i -6x u ∑6i =1x 2i -6x2≈90.342 3-6×3.5×4.226 5891-6×3.52=1.584 1217.5≈0.09, c =u -b x =4.226 58-0.09×3.5=3.911 58, ∴u =3.911 58+0.09x . ∴y =e 3.911 58·e 0.09x . =e 0.09x +3.91158。
1.散点图在回归分析过程中的作用是( )A.查找个体数B.比较个体数据大小关系C.探究个体分类D.粗略判断变量是否相关答案:D2.设产品产量与产品质量之间的线性相关系数为-0.87,这说明二者之间( ) A.负相关B.正相关C.不相关D.相关关系不能确定解析:因为|-0.87|=0.87,与1接近,二者存在相关关系,且为负相关.答案:A3.(2012·湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确...的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:由于回归直线的斜率为正值,故y与x具有正的线性相关关系,选项A中的结论正确;回归直线过样本点的中心,选项B中的结论正确;根据回归直线斜率的意义易知选项C中的结论正确;由于回归分析得出的是估计值,故选项D中的结论不正确.答案:D4.(2011·山东高考)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)423 5销售额y(万元)492639546万元时销售额为( )A.63.6万元B.65.5万元C.67.7万元D.72.0万元解析:样本中心点是(3.5,42),则a=y-b x=42-9.4×3.5=9.1,所以回归直线方程是y=9.4x+9.1,把x=6代入,得y=65.5.答案:B5.由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到的线性回归方程为y=a+bx,那么下面说法中错误的是________.(1)a =y --b x -;(2)直线y =a +bx 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;(3)直线y =a +bx 的斜率为b =∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2.答案:(2)6.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:月平均气温x (℃) 17 13 8 2 月销售量y (件)24334055由表中数据算出线性回归方程y =a +bx 中的b ≈-2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月羽绒服的销售量的件数约为________件.解析:x -=14(17+13+8+2)=10,y -=14(24+33+40+55)=38.由线性回归方程过(x -,y -)知, 38=a +-2×10,∴a =58.∴y =58+-2x ,∴当x =6时,y =46. 答案:467.某种产品的广告费用支出x 与销售额y 之间有如下的对应数据(单位:万元).x (万元) 2 4 5 6 8 y (万元)3040605070(1)画出散点图 (2)求回归方程;(3)据此估计广告费用支出为10万元时,销售额y 的值. 解:(1)作出散点图如下图.(2)由散点图可知,样本点近似地分布在一条直线附近,因此,x ,y 之间具有线性相关关系.由表中的数据可知,x -=15×(2+4+5+6+8)=5,y -=15×(30+40+60+50+70)=50.所以b =∑i =15x i -x-y i -y-∑i =15x i -x-2=6.5,a =y --b x -=50-6.5×5=17.5,因此线性回归方程为y =17.5+6.5x .(3)x =10时,y =17.5+10×6.5=82.5(万元). 即当支出广告费用10万元时,销售额为82.5万元. 8.在钢铁碳含量对于电阻的效应研究中,得到如下数据表:碳含量x (%)0.100.300.400.550.700.800.9520℃时 电阻(Ω)15 18 19 21 22.6 23.6 26求解:由已知数据得x -=17×∑i =17x i ≈0.543,y -=17×145.2≈20.74,∑i =17x 2i =2.595,∑i =17y 2i =3 094.72,∑i =17x i y i =85.45.∴b ≈85.45-7×0.543×20.742.595-7×0.5432≈12.46, a =20.74-12.46×0.543≈13.97.线性回归方程为y =13.97+12.46x . 下面利用相关系数检验是否显著.∑i =17x i y i -7x - y -=85.45-7×0.543×20.74≈6.62,∑i =17x 2i -7x -2=2.595-7×(0.543)2≈0.531, ∑i =17y 2i -7y -2=3 094.72-7×(20.74)2=83.687. ∴r =6.620.531×83.687≈0.993.由于r 接近于1,故钢铁碳含量对电阻的效应线性相关关系显著.。
1.1 回归分析 1.2 相关系数学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.掌握建立线性回归模型的步骤.知识点一 线性回归方程 思考 (1)什么叫回归分析?(2)回归分析中,利用线性回归方程求出的函数值一定是真实值吗?梳理 (1)平均值的符号表示假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),在统计上,用x 表示一组数据x 1,x 2,…,x n 的平均值,即x =______=________;用y 表示一组数据y 1,y 2,…,y n 的平均值,即y =______________=______________. (2)参数a ,b 的求法b =l xyl xx =____________=____________,a =________. 知识点二 相关系数思考1 给出n 对数据,按照公式求出的线性回归方程,是否一定能反映这n 对数据的变化规律?思考2怎样通过相关系数刻画变量之间的线性相关关系?梳理(1)相关系数r的计算公式r=∑ni=1x i y i-n x y∑ni=1x2i-n x2∑ni=1y2i-n y2.(2)相关系数r的取值范围是________,|r|值越大,变量之间的线性相关程度越高;|r|值越接近0,变量之间的线性相关程度越低.(3)当r>0时,b________0,称两个变量正相关;当r<0时,b________0,称两个变量负相关;当r=0时,称两个变量线性不相关.类型一概念的理解和判断例1有下列说法:①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程y=bx+a可以估计观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是()A.1 B.2 C.3 D.4跟踪训练1下列关系中,是相关关系的是________.(填序号)①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.类型二回归分析命题角度1求线性回归方程例2某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.跟踪训练2某个服装店经营某种服装,在某周内纯获利y(元)与该周每天销售这种服装件数x之间的一组数据如下表:(1)求样本点的中心;(2)画出散点图;(3)求纯获利y与每天销售件数x之间的回归方程.命题角度2线性回归分析与回归模型构建例3某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x 取整数)(元)与日销售量y(台)之间有如下关系:(1)画出散点图,并判断y与x是否具有线性相关关系;(2)求日销售量y对销售单价x的线性回归方程;(3)设经营此商品的日销售利润为P元,根据(2)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.跟踪训练3某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:(1)求年推销金额y对工作年限x的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.类型三相关系数的计算与应用例4现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x)与入学后第一次考试的数学成绩(y)如下:请问:这10名学生的两次数学成绩是否具有线性相关关系?跟踪训练4 下面的数据是从年龄在40岁到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平y (满分100),以及每天花在看电视上的平均时间x (小时).(1)求心脏功能水平y 与每天花在看电视上的平均时间x 之间的样本相关系数r ;(2)求心脏功能水平y 与每天花在看电视上的平均时间x 的线性回归方程,并讨论方程是否有意义;(3)估计平均每天看电视3小时的男子的心脏功能水平.1.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (t)与相应的生产能耗y (t)的几组对应数据:根据上表提供的数据,求出y 关于x 的线性回归方程为y =0.7x +0.35,那么表中t 的值为( )A .3B .3.15C .3.5D .4.52.下表是x 和y 之间的一组数据,则y 关于x 的回归直线必过点( )A.(2,3) B .(1.5,4) C .(2.5,4) D .(2.5,5)3.一唱片公司欲知打歌费用x (十万元)与唱片销售量y (千张)之间的关系,从其所发行的唱片中随机抽取了10张,得如下的资料:∑i =110x i =28,∑i =110x 2i =303.4,∑i =110y i =75,∑i =110y 2i =598.5,∑i =110xiy i=237,则y与x的相关系数r的绝对值为________.4.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x(单位:千箱)与单位成本y(单位:元)的资料进行线性回归分析,结果如下:x=72,y=71,∑i=16x2i=79,∑i=16x i y i=1 481.则销量每增加1 000箱,单位成本下降________元.5.已知x、y之间的一组数据如下表:(1)分别计算:x、y、x1y1+x2y2+x3y3+x4y4、x21+x22+x23+x24;(2)已知变量x与y线性相关,求出回归方程.回归分析的步骤(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量.(2)画出确定好的自变量和因变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程y=bx+a).(4)按一定规则估计回归方程中的参数.答案精析问题导学 知识点一思考 (1)回归分析是对具有相关关系的两个变量进行统计分析的一种方法.(2)不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.梳理 (1)x 1+x 2+…+x n n 1n ∑i =1n x i y 1+y 2+…+y nn1n ∑i =1ny i (2)∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1nx i y i -n x y∑i =1nx 2i -n x2y -b x知识点二思考1 如果数据散点图中的点都大致分布在一条直线附近,这条直线就能反映这n 对数据的变化规律,否则求出的方程没有实际意义.思考2 |r |值越接近1,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低;当r =0时,两个变量线性不相关. 梳理 (2)[-1,1] (3)> < 题型探究 例1 C跟踪训练1 ②④例2 解 (1)散点图如图.(2)因为∑i =14x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =14x 2i =62+82+102+122=344,所以b =158-4×9×4344-4×92=1420=0.7,a =y -b x =4-0.7×9=-2.3, 故线性回归方程为y =0.7x -2.3.(3)由(2)中线性回归方程可知,当x =9时,y =0.7×9-2.3=4,所以预测记忆力为9的同学的判断力约为4.跟踪训练2 解 (1)x =6,y ≈79.86,样本点的中心为 (6,79.86). (2)散点图如下:(3)因为∑i =17x i y i =3 487,∑i =17x 2i =280,所以b =∑i =17x i y i -7x y ∑i =17x 2i -7x2=3 487-7×6×79.86280-7×62≈4.75.a =y -b x ≈51.36, 所以y =4.75x +51.36.例3 解 (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.(2)因为x =14×(35+40+45+50)=42.5,y =14×(56+41+28+11)=34.∑i =1nx i y i =35×56+40×41+45×28+50×11=5 410.∑i =14x 2i =352+402+452+502=7 350.所以b =∑i =14x i y i -4x y∑i =14x 2i -4x 2=5 410-4×42.5×347 350-4×42.52=-370125≈-3. a =y -b x =34-(-3)×42.5=161.5. 所以线性回归方程为y =161.5-3x . (3)依题意,有P =(161.5-3x )(x -30) =-3x 2+251.5x -4 845=-3(x -251.56)2+251.5212-4 845.所以当x =251.56≈42时,P 有最大值,约为426元.即预测当销售单价为42元时,能获得最大日销售利润.跟踪训练3 解 (1)设所求的线性回归方程为y =a +bx ,则b =∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1020=0.5,a =y -b x =0.4. ∴年推销金额y 对工作年限x 的线性回归方程为 y =0.4+0.5x .(2)当x =11时,y =0.4+0.5×11=5.9(万元), ∴可以估计第6名推销员的年推销金额为5.9万元. 例4 解 x =110(120+108+…+99+108)=107.8,y =110(84+64+…+57+71)=68,∑i =110x 2i =1202+1082+…+992+1082=116 584,∑i =110y 2i =842+642+…+572+712=47 384,∑i =110x i y i =120×84+108×64+…+99×57+108×71=73 796.所以相关系数 r =73 796-10×107.8×68(116 584-10×107.82)(47 384-10×682)≈0.750 6.由此可看出这10名学生的两次数学成绩具有线性相关关系. 跟踪训练4 解 n =6,x =16(4.4+4.6+…+4.6)≈3.716 7,y =16(52+53+…+65)≈64.166 7,∑i =16x 2i -6x 2=(4.42+4.62+…+4.62)-6×3.716 72≈19.766 8, ∑i =16y 2i -6y 2=(522+532+…+652)-6×64.166 72≈964.807 7,∑i =16x i y i -6x y =(4.4×52+4.6×53+…+4.6×65)-6×3.716 7×64.166 7≈-124.630 2.(1)心脏功能水平y 与每天花在看电视上的平均时间x 之间的相关系数: r =-124.630 219.766 8×964.807 7≈-0.902 5.(2)b =-124.630 219.766 8≈-6.305 0,a =y -b x ≈87.600 5,心脏功能水平y 与每天花在看电视上的平均时间x 的线性回归方程为y =87.600 5-6.305 0x .由(1)知y 与x 之间有较强的线性关系,所以这个方程是有意义的.(3)将x =3代入线性回归方程y =87.600 5-6.305 0x ,可得y ≈68.7,即平均每天看电视3小时,心脏功能水平约为68.7. 当堂训练 1.A 2.C 3.0.3 4.1.818 2 5.解 (1)x =0+1+2+34=1.5,y =1+3+5+74=4, x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,x 21+x 22+x 23+x 24=02+12+22+32=14. (2)b =34-4×1.5×414-4×1.52=2, a =y -b x =4-2×1.5=1, 故线性回归方程为y =2x +1.。
第三章§1
一、选择题
1.下列变量是线性相关的是()
A.人的身高与视力
B.在同一个圆内,圆心角的大小与其所对的圆弧长
C.收入水平与纳税水平
D.人的年龄与身高
解析:其中B具有确定关系,A,D不具有线性关系,故选C.
答案: C
2.对于线性相关系数r,叙述正确的是()
A.|r|∈(0,+∞),|r|越大,相关程度越高,反之,相关程度越低
B.r∈(-∞,+∞),r越大,相关程度越高,反之,相关程度越低
C.|r|≤1且|r|越接近于1,相关程度越高;|r|越接近于0,相关程度越低
D.以上说法都不对
解析:由相关系数的性质知r∈[-1,1],排除A,B;又|r|越接近于1,相关程度越高,|r|越接近于0,相关程度越低,故选C.
答案: C
3.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是()
A.①②B.①③
C.②③D.③④
解析:图①是正相关线性最强,图③是负相关线性最强,②④散点图的点较分散.答案: B
4.设有一个回归方程为y=2-2.5x,则变量x增加一个单位时,则()
A.y平均增加2.5个单位B.y平均增加2个单位
C.y平均减少2.5个单位D.y平均减少2个单位
解析:斜率的估计值为-2.5,即x每增加1个单位时,y平均减少2.5个单位.
答案: C
二、填空题
5.下列五个命题,正确命题的序号为____________. ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线把非确定性问题转化为确定性问题进行研究.
解析: 变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效的方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的.
答案: ③④⑤
6.已知x 与y 之间的一组数据如下,则y 与x 的线性回归方程为y ∧
=bx +a 必过点____________.
解析: x =14(1+2+3)=32
y =1
4(1+3+5+7)=4,
∴样本中心为⎝⎛⎭⎫
32,4 ∴回归直线必过⎝⎛⎭⎫32,4点. 答案: ⎝⎛⎭⎫32,4 三、解答题
7.高三·一班学生每周用于数学学习的时间x (单位:h)与数学平均成绩y (单位:分)之间有如下数据:
根据这些数据判断x 与y 之间是否具有相关关系. 解析: 由表中数据可得x =17.4,y =74.9,
∴相关系数r =
∑i =1
10
x i y i -10x ·y
(∑i =1
10x 2i -10x 2)(∑i =1
10
y 2i -10y 2
)
≈0.92>0.75.
∴x 与y 具有线性相关关系.
8.研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下:
(1)求y 对x 的回归直线方程;
(2)预测水深为1.95 m 时,水的流速是多少?
解析: (1)由表中的数据,得x =1.75,y =1.977 5,
8
i =1x 2
i =24.92, 8
i =1
x i y i =27.993, ∴b =
8
i =1
x i y i -8x
y
8
i =1
x 2
i -8x 2
=27.993-8×1.75×1.997 524.92-8×1.752
=11
15≈0.733,
a =y -
b x =1.977 5-11
15×1.75≈0.694,
∴y 对x 的回归直线方程为 y =a +bx =0.694+0.733
x .
(2)当x =1.95时,y =0.694+0.733×1.95≈2.12(m/s). 即当水深为1.95 m 时,渠道水的流速约为2.12 m/s. 尖子生题库 ☆☆☆
9.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:
(1)作散点图;
(2)如果y 与x 之间具有线性相关关系,求线性回归方程. 解析: (1)散点图如图.。