高中数学-第三章《统计案例》综合测试题-新人教B版选修2-3
- 格式:doc
- 大小:152.50 KB
- 文档页数:6
高中数学学习材料马鸣风萧萧*整理制作高中数学选修2-3第三章《统计案例》测试题B 卷考试时间:100分钟,满分:150分一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的,请把正确答案的代号填在题后的括号内(每小题5分,共50分)1.已知一个线性回归方程为ˆy=1.5x +45(x i ∈{1,7,5,13,19}),则y =( ) A .58.5 B .58.6 C .58 D .57.52.对有线性相关关系的两个变量建立的回归直线方程 ˆˆˆya bx =+中,回归系数ˆb ( ) A .能等于0 B .小于0 C .可以小于0D .只能等于03.能表示n 个点与相应直线在整体上的接近程度的是( )A.1()ni i y i =-∑ B 1()ni i i y =-∑ C.21()nii y i =-∑ D.21()nii yy =-∑4.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由K 2=2()()()()()n ad bc a b c d a c b d -++++算得K 2=2110(40302030)7.860506050⨯⨯-⨯≈⨯⨯⨯附表:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是( )A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”5..已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+bx ,若∑i =110x i =17,∑i =110y i =4,则b 的值为( )A .2B .1C .-2D .-16.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58 总计8880168则认为多看电视与人冷漠有关系的把握大约为 ( ) A .90%B .97.5%C .95%D .99.9%7.在一次试验中,测得(x ,y )的四组值分别是A (1,2),B (2,3),C (3,4),D (4,5),则y 与x 间的线性回归方程为( )A. y ^=x +1B. y ^=x +2 C. y ^=2x +1 D . y ^=x-18.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀 非优秀 总计 甲班 10 b 乙班 c 30 总计105已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 9.有下列数据x123y 3 5.99 12.01下列四个函数中,模拟效果最好的为( ) A .y =3×12x - B .y =log 2x C .y =3xD .y =x 210.已知数组(x 1,y 1),(x 2,y 2),…,(x 10,y 10)满足线性回归方程y ^=bx +a ,则“(x 0,y 0)满足线性回归方程y ^=bx +a ”是“x 0=x 1+x 2+…+x 1010,y 0=y 1+y 2+…+y 1010”的( ).A .充分不必要条件B .必要不充分条件C .充要条件D .既不充分也不必要条件二、填空题(每小题6分, 共24分) 11.关于x 与y ,有如下数据 x 2 4 5 6 8 y3040605070有如下的两个模型:5.175.6ˆ)1(+=x y,ˆ(2)717y x =+。
一、选择题1.设(1+x)n =a 0+a 1x+…+a n x n ,若a 1+a 2+…+a n =63,则展开式中系数最大的项是( ) A .15x 2B .20x 3C .21x 3D .35x 32.已知x 与y 之间的几组数据如下表:参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()niix x y y r --=∑上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >3.为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的1000人,其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示.若将直方图中分组区间的中点值设为解释变量x (分钟),这个区间上的人数为y (人),易见两变量x ,y 线性相关,那么一定在其线性回归直线上的点为( )A .()1.5,0.10B .()2.5,0.25C .()2.5,250D .()3,3004.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由 列联表算得7.8k ≈参照附表,得到的正确结论是( ).A .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”6.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关7.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015由此表得到的正确结论是()A.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”8.某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大合计男生18927女生81523合计262450()附:()()()()()22n ad bcKa b c d a c b d-=++++P(K2>k0)0.150.100.050.0250.010.001k 0 2.072 2.706 3.841 5.024 6.635 10.828A .0.01B .0.025C .0.10D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)2433 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5811.下列说法中正确的是①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度;④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好.( ) A .①②B .③④C .①④D .②③12.对两个变量x 和y 进行回归分析,得到一组样本数据: ()()1122,,,x y x y ,…(),n n x y ,则下列说法中不正确的是( )A .由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB .残差平方和越小的模型,拟合的效果越好C .若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D .用相关指数2R 来刻画回归效果, 2R 越小,说明模型的拟合效果越好二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.16.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表. 气温x (度) 18 13 10 -1 用电量y (度)24343864由表中数据,得回归直线方程ˆˆˆybx a =+,若ˆ2b =-,则ˆa =________. 17.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)18.用线性回归模型求得甲、乙、丙3组不同的数据对应的2R 的值分别为0.81,0.98,0.63,其中__________(填甲、乙、丙中的一个)组数据的线性回归的效果最好.19.以下说法正确的是_____________ . ①类比推理属于演绎推理.②设有一个回归方程ˆ23yx =- ,当变量每增加1个单位,y 平均增加3个单位. ③样本相关系数r 满足以下性质:1r ≤,并且r 越接近1,线性相关程度越强;r 越接近0,线性相关程度越弱.④对复数12,z z 和自然数n 有()1212nn n z z z z ⋅=⋅.20.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________.三、解答题21.新型冠状病毒属于β属的冠状病毒,人群普遍易感,病毒感染者一般有发热咳嗽等临床表现.基于目前的流行病学调查和研究结果,病毒潜伏期一般为1-14天,大多数为3-7天.为及时有效遏制病毒扩散和蔓延,减少新型冠状病毒感染对公众健康造成的危害,需要对与确诊新冠肺炎病人接触过的人员进行检查.某地区对与确诊患者有接触史的1000名人员进行检查,结果统计如下表:(Ⅰ)填写下面列联表,并通过计算判断能否在犯错误的概率不超过0.001的前提下,以为新冠肺炎密切接触者有发热症状与最终确诊患病有关?(Ⅱ)在全国人民的共同努力下,尤其是全体医护人员的辛勤付出下,我国的疫情得到较好控制,现阶段防控重难点主要在境外输入病例和无症状感染者(即无相关临床表现但核酸检测或血清特异性免疫球蛋白M 抗体检测阳性者).根据防控要求,无症状感染者虽然还没有最终确诊患新冠肺炎,但与其密切接触者仍然应当采取居家隔离医学观察14天.已知某人曾与无症状感染者密切接触,而且在家已经居家隔离11天未有临床症状,若该人员居家隔离第k 天出现临床症状的概率为()11112,13,142k k -⎛⎫= ⎪⎝⎭,两天之间是否出现临床症状互不影响,而且一旦出现临床症状立刻送往医院核酸检查并采取必要治疗,若14天内未出现临床症状则可以解除居家隔离,求该人员在家隔离的天数(含有临床症状表现的当天)ξ的分布列以及数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命. 为了研究司机开车时使用手机的情况,交警部门调查了100名机动车司机,得到以下统计:在55名男性司机中,开车时使用手机的有40人,开车时不使用手机的有15人;在45名女性司机中,开车时使用手机的有20人,开车时不使用手机的有25人.(1)完成下面的22⨯列联表,并判断是否有99.5%的把握认为开车时使用手机与司机的性别有关;(2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X ,若每次抽检的结果都相互独立,求X 的分布列和数学期望()E X . 参考公式与数据: 参考数据:()20P k χ>0.15 0.100.050.025 0.010 0.005 0.001 0k 2.0722.7063.8415.0246.6357.87910.828参考公式()()()()()22n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.23.在中国,不仅是购物,而且从共享单车到医院挂号再到公共缴费,日常生活中几乎全部领域都支持手机支付,出门不带现金的人数正在迅速增加.某机构随机抽取了一组市民,并统计他们各自出门随身携带现金(单位:元)的情况,制作出如图所示的茎叶图.规定:随身携带的现金在100元以下(不含100元)的为“手机支付族”,其他为“非手机支付族”.(1)根据茎叶图的数据,完成答题卡上的22⨯列联表;男生 女生 合计手机支付族 非手机支付族合计45(2)根据(1)中的列联表,判断是否有99%的把握认为“手机支付族”与“性别”有关. 附:22()()()()()()n ad bc K n a b c d a b c d a c b d -==+++++++24.为了了解某校高中生的身体质量情况,某调查机构进行了一次高一学生体重和身高的抽样调查,从中抽取了8名学生(编号为18)的身高(cm)x 和体重(kg)y 数据.如下表,某调查机构分析发现学生的身高和体重之间有较强的线性相关关系,在编号为6的体检数据丢失之前,调查员甲已进行相关的数据分析并计算出该组数据的线性回归方程为ˆˆ0.5ya x =+,且根据回归方程预估一名身高为180cm 的学生体重为71kg ,计算得到的其他数据如下:81170,89920i ii x x y===∑.(1)求a 的值及表格中8名学生体重的平均值y ;(2)在数据处理时,调查员乙发现编号为8的学生体重数据有误,应为63kg ,身高数据无误.请你根据调查员乙更正的数据重新计算线性回归方程,并据此预估一名身高为180cm 的学生的体重.附:回归直线方程ˆˆˆy a bx=+的斜率和截距的最小二乘法估计分别为:1221ˆni ii n i i x ynx ybx nx==-=-∑∑,ˆˆa y bx=-. 25.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:2SOPM2.5[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO浓度不超过150”的概率;(2)根据所给数据,完成下面的22⨯列联表:2SOPM2.5[0,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO浓度有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,2()P K k≥0.050 0.010 0.001k 3.841 6.63510.82826.某企业组织应聘该企业的100名应届毕业生参加专业能力测试(满分100分),这100名毕业生的成绩的频率分布直方图如图所示.(Ⅰ)该企业拟以成绩的中位数作为分数线来确定进入面试阶段的毕业生名单,根据频率分布直方图求进入该企业面试的分数线;(Ⅱ)若被测试的毕业生中有40名女生,进入面试的有15名女生,35名男生,填写下面列联表,并根据列联表判断是否有95%的把握认为成绩与性别有关.成绩<分数线成绩≥分数线 总计男生 女生 总计附:()()()()()22n ad bc K a b c d a c b d -=++++()2P K k0.050 0.010 0.001 k3.8416.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】 令x=1,则(1+1)n =++…+=64.∴n=6.故(1+x)6的展开式中系数最大的项为T 4=x 3=20x 3.2.D解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =.()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()4222221 1.50.50.5 1.55i i x x =-=-+-++=∑ , ()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215i i x x=-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.3.C解析:C 【分析】写出四个区间中点的横纵坐标,从而可求出 2.5x =,250y =,进而可选出正确答案. 【详解】解:由频率分布直方图可知, 第一个区间中点坐标,111.0,0.101000100x y ==⨯=, 第二个区间中点坐标,222.0,0.211000210x y ==⨯=, 第三个区间中点坐标,333.0,0.301000300x y ==⨯=,第四个区间中点坐标,444.0,0.391000390x y ==⨯=, 则()12341 2.54x x x x x =+++=,()123412504y y y y y =+++=, 则一定在其线性回归直线上的点为(),x y ()2.5,250=. 故选:C. 【点睛】本题考查了频率分布直方图,考查了线性回归直线方程的性质.本题的关键是利用线性回归直线方程的性质,即点(),x y 一定在方程上.4.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.5.A解析:A 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】由独立性检验的结论,观测值7.8k ≈,结合临界值表:7.8 6.635>,据此可给出结论:在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”. 本题选择A 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.6.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.7.C解析:C【解析】由2×2列联表得到a=45,b=10,c=30,d=15.则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100.所以K2的观测值k=2100675-30055457525⨯⨯⨯()≈3.030.因为2.706<3.030<3.841.选C.点睛:根据卡方公式求K2,再与参考数据比较,最后作出判断.8.B解析:B【解析】K2=≈5.059>5.024,因为P(K2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B9.C解析:C【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.11.D解析:D 【解析】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,则相关性越强,所以错误;②回归直线y bx a =+一定经过样本点的中心(),x y ,正确; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度,正确;④相关指数2R 用来刻画回归的效果,2R 越小,说明模型的拟合效果越不好,所以错误. 所以正确的有②③.故选D .12.D解析:D 【解析】逐一分析所给的各个选项:A. 由样本数据得到的回归方程ˆˆˆy bx a =+必过样本中心(),x yB. 残差平方和越小的模型,拟合的效果越好C. 若变量y 和x 之间的相关系数为0.9362r =-,则变量y 和x 之间具有线性相关关系D. 用相关指数2R 来刻画回归效果,2R 越大,说明模型的拟合效果越好,该说法错误. 本题选择D 选项.二、填空题13.①③【分析】①在回归分析中根据相关指数越大模型的拟合效果越好即可判断;②根据离散型随机变量的概念即可判断;③根据样本的标准差是样本数据到平均数的一种平均距离样本的方差是标准差的平方即可判断;④根据相解析:①③ 【分析】①在回归分析中,根据相关指数2R 越大,模型的拟合效果越好即可判断;②根据离散型随机变量的概念即可判断;③根据样本的标准差是样本数据到平均数的一种平均距离,样本的方差是标准差的平方即可判断;④根据相互独立事件的定义即可判断. 【详解】解:①用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好,故①正确;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是不确定,无法一一列举出来,不是离散型随机变量,故②错误;③样本的标准差是样本数据到平均数的一种平均距离,样本的方差是标准差的平方,反映了样本数据的分散程度的大小它们越小,则随机变量偏离均值的平均程度越小,故③正确;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是对立事件,但不是相互独立事件,因为事件A对事件B发生有影响.故答案为:①③.【点睛】本题考查了相关系数的意义、离散型随机变量的概念、样本的标准差与方差的概念与应用、对立事件与相互独立事件的区别,是基础题.14.3【解析】【分析】逐一分析各个说法即可得到结论【详解】由方差的性质知:方差反映一组数据的波动大小将一组数据中的每个数据都加上或者减去同一个常数后方差恒不变①正确;一个回归方程=3-5x变量x增加一个解析:3【解析】【分析】逐一分析各个说法即可得到结论【详解】由方差的性质知:方差反映一组数据的波动大小,将一组数据中的每个数据都加上或者减去同一个常数后,方差恒不变,①正确;一个回归方程ˆy=3-5x,变量x增加一个单位时,y平均减少5个单位,②错误线性回归方程必过样本中心点,③正确;曲线上的点与该点的坐标之间具有一一对应关系④错误.在一个2×2列联表中,由计算得K2=13.079,则其两个变量之间有关系的可能性是99.90%,故⑤错误综上所述,其中错误的个数是3个故答案为3【点睛】本题主要考查了线性回归方程,考查了独立性检验,考查了方差的变化特点,考查了相关关系,是一道考查的知识点比较多的题目,综合性较强,注意分析,本题不需要计算,只要理解概念即可得到结论15.2【解析】试题分析:从匀速传递的产品生产流水线上质检员每10分钟从中抽取一件产品进行某项指标检测这样的抽样是系统抽样①错;两个随机变量的线性相关性越强相关系数的绝对值越接近于1②正确;某项测量结果服解析:2【解析】试题分析:从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样,①错;两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,②正确;某项测量结果服从正太态布,则,③正确;对于两个分类变量和的随机变量的观测值来说,越大,判断“与有关系”的把握程度越大,④错.故只有2个正确.考点:抽样方法(系统抽样),线性相关关系,正态分布,独立性检验.16.【解析】试题分析:由回归方程过样本平均数点则:由代入可得:考点:回归方程的性质及应用解析:【解析】试题分析:由回归方程过样本平均数点(,)x y ,则:10,40x y ==,由2ˆ-=b代入 x b a yˆˆˆ+=可得:ˆ60a =。
高中新课标选修(2-3)第三章统计案例综合测试题一、选择题1. 下列变量之间:①人的身高与年龄、产甜的成本与生产数量;②商品的销售额与广告费;③家庭的支出与收入.其中不是函数关系的有()A . 0个B . 1个 C. 2个 D. 3个答案:D2. 当>3.841时,认为事件4与事件3 ()A. 有95%的把握有关B. 有99%的把握有关C. 没有理由说它们有关D. 不确定答案:A3. 已知回归直线方程y = bx + a,其中f/ = 3且样本点中心为(1,2),则回归直线方程为()A. y = x + 3 B . y = -2x + 3 C. y = -jr + 3 D . y = x-3答案:C4. 为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表:喜欢数学不喜欢数学计E378512235143178计72228■00D. 0.95答案:B你认为性别与是否喜欢数学课程之间有关系的把握冇()A. 0B. 95%C. 99%D. 100%则广告费与销售额间的相关系数为()A.. 0.819B. 0.919C. 0. 9236.在回归直线方程y = a + bx中,回归系数b表示()A. 当兀=0时,y的平均值B. /变动一个单位时,y的实际变动量C. y变动一个单位时,/的平均变动量D. /变动一个单位时,y的平均变动量答案:D7.对于回归分析,下列说法错课的是()A. 在回归分析中,变量间的关系若是非确定关系,那么因变量不能由口变量唯一确定B. 线性相关系数可以是正的,也可以是负的C. 回归分析中,如果r2=l,说明『与y之间•完全相关D. 样本相关系数re (-1,1)答案:D8.部分国家13岁学生数学测验平均分数为:对于授课天数与分数是否存在冋归直线,下列说法止确的是()A. —定存在B. 可能存在也可能不存在C . 一定不存在D.以上都不止确答案:A9.下列关于残差图的描述错误的是()A. 残差图的横坐标可以是编号B. 残差图的横坐标可以是解释变量和预报变量C. 残差点分布的带状区域的宽度越窄相关指数越小D. 残差点分布的带状区域的宽度越窄残差平方和越小答案:C10.某化工厂为预测某产品的回收率y,需要研究它和原料有效成份含量之间的相关关系,现取了88对观测值,计算得:£兀=8= 52, £川88= 228, Yx; =478, yx/y/ = 1849 ,则y 与兀的冋归直i=l<=1r=l Z=1线方程是()A. y = 11.47 + 2.62兀 B . y =:—11.47 + 2.62尢C. y = 2.62x4-11.47x D . y =:11.47-2.62兀答案:A 二、填空题11. 直线回归方程y = a + bx恒过定点___________ .答案:(xy)12.下表给出了某些地区的鸟的种类与这些地区的海拔高度5):种类数6qQ7123718295海拔高度1250115810675701311067014936249分析这些数据,可得鸟的种类与海拔高度间的相关系数为 ________ 答案:0. 78213•设对变量x,卩有如下观察数据:答案:y = 0.4463% - 27.292014.某高校大一12名学生的体重/与肺活量F的数据如下:4 2424646465c00cJ22— cJ8582 .552.202.75rz.402.802.81rV.41n■・102・85Q o.50 3.00预测体重是55kg的同学的肺活约量为_________答案:3. 24三、解答题15. 某市统计1994〜2004一年在校屮学生每年高考考入人学的百分比,把农村、县镇、城币分开统计,为了便于计算,把1994年编号为0, 1995年编号为1,…,2004年编号为10,如果把每年考入大学的百分比作为统计变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线:城市:9 = 9.50 + 2.54%;县镇:9 = 6.76 + 2.32x;农村:$ = 1.80 + 0.42x.(1)在同一坐标系中作出.三条回归直线;(2)对于农村学生来讲,系数等于0.42意味着什么?(3)在这一阶段,哪里的大学入学率增长最快?解:(1)散点图略;(2)对于农村学生来讲,系数等于0.42总味着1994^2004年在校中学生每年高考考入大学的百分比逐年增加0. 42;(3)在这一阶段,城市的大学入学率增长最快.16. 调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:4 船不晕船计L 人12257* 人124nJ4计224971根据此资料,你是否认为在2飞级风的海上航行屮男人比女人更容易晕船?解:心響需泸皿因为0.08 < 2.706 ,所以我们没冇理由说晕船与男女性别冇关.17. 对某校小学牛•进行心理障碍测试得如下列联表:(其屮焦虑、说谎、懒惰都是心理障碍)4 虑1谎* 惰计—生115■牛‘21KV(计2526511.0试说明在这三种心理障碍屮哪一种与性别关系最大?解:对于上述三种心理障碍分别构造三个随机变量K;, K;, 由表中数据可得110x(5x60 - 25x20)230x80x25x85110x(10x70-20x10)230x80x20x90110x(15x30 - 15x50)230x80x65x45因为K;的值最大,所以说谎与性別关系最大.=1.410・18. 一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多 少随机器运转速度而变化,用/表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件个 数,现观测得到(兀,刃的4组观测值为(8, 5) , (12, 8) , (14, 9) , (16, 11).(1) 假定y 与xZ 间有线性相关关系,求y 对x 的冋归直线方程;(2) 若实际生产中所容许的每小时最人冇缺点物件数为10,则机器的速度不得超过多少转/ 秒.(精确到1转/秒)4 4工#=660,工兀’=438・/=!<=1八 51 6•••所求的冋归直线方程为y = —x--; 70 7 (2)由 y =—兀一°W10,得70751即机器速度不得超过15转/秒.解:(1)设冋归直线方程为y = bx-^a7 = 12.5, y = 8.25 438-4x12.5x8.25 660-4X12.52- 25.53551 70« = ^-^ = 8.25-—xl2.5 = —•70 451 25 6------ x —=— 70 2 7。
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( )A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关 2.以下四个命题:①从匀速传递的产品生产流水线上,每30分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②某市进行了一次全市高中男生身高统计调查,数据显示某市30000高中男生的身高ξ(单位:cm )服从正态分布()2172,N σ,且(172180)0.4P ξ<≤=,那么该市身高高于180cm 的高中男生人数大约为3000;③随机交量X 服从二项分布(100,0.4)B ,若随机变量21Y X =+,则Y 的数学期望为()81E Y =,方差为()48D Y =;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系的把握程度越大其中正确的个数是( ) A .1B .2C .3D .43.已知x 与y 之间的几组数据如下表: 参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()niix x y y r --=∑上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >4.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为( ) 患心脏病情况秃发情况 患心脏病 无心脏病 秃发 20 300 不秃发5450A .0.1B .0.05C .0.01D .0.995.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 6.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系:y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .107.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 总计201030计算得K 2=10,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响C .在犯错误的概率不超过0.1%的前提下,认为使用智能手机对学习有影响D .在犯错误的概率不超过1%的前提下,认为使用智能手机对学习无影响8.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k 2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是( ) P (K 2≥k ) … 0.250.150.100.025 0.010 0.005 …k…1.323 2.072 2.706 5.024 6.635 7.879 …A .90%B .95%C .97.5%D .99.5%9.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关 10.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .411.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________.15. 2.5PM 是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据某地某日早7点至晚8点甲、乙两个 2.5PM 监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_________.16.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.17.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温. 气温(℃)14 12 86用电量(度) 22 26 34 38由表中数据得线性方程x b a yˆˆˆ+=中2ˆ-=b ,据此预测当气温为5℃时,用电量的度数约为 .18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.已知的取值如表所示:若与呈线性相关,且回归方程为,则等于 .23454620.4月16日摩拜单车进驻大连市旅顺口区,绿色出行引领时尚,旅顺口区进行了“经常使用共享单车与年龄关系”的调查,得下列22⨯列联表:则得到的2χ=__________.(小数点后保留一位)(附:()()()()()22χ-=++++n ad bca b c d a c b d)三、解答题21.国家逐步推行全新的高考制度.未来新高考不再分文、理科,采用33+模式,其中语文、数学、外语三科为必考科目,满分各150分,另外考生还要依据想考取的高校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化学、生物6门科目中自选3门参加考试(6选3),每科目满分100分.为了应对新高考,某高中从高一年级1000名学生(其中男生550人,女生450人)中,采用分层随机抽样的方法从中抽取n名学生进行调查.(1)已知抽取的n名学生中女生有45人,求n的值;(2)学校计划在高一上学期开设选修中的物理和地理两个科目,为了了解学生对这两个科目的选课情况,对在(1)的条件下抽取到的n名学生进行问卷调查(假设每名学生在这两个科目中必须选择一个科目且只能选择一个科目),下表是根据调查结果得到的22⨯列联表.请将列联表补充完整,并判断是否有99%的把握认为选择科目与性别有关,说明理由;(3)在抽取的选择地理的学生中用分层抽样的方法再抽取6名学生,然后从这6名学生中抽取2名学生了解学生对地理的选课意向情况,求这2名学生中至少有1名男生的概率.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 22.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付支付宝支付总计20.0500.0100.001()P K kk 3.841 6.63510.828()()()()()22n ad bc K a b c d a c b d -=++++. 24.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关? (2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X ,若用样本的频率作为概率,求随机变量X 的分布列和期望.附:K 2=2()()()()()n ad bc a b c d a c b d -++++,其中n =a +b +c +d .25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.20()P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.某公司(人数众多)为鼓励员工利用网络进行营销,准备为员工办理手机流量套餐.为了解员工手机流量使用情况,按照男员工和女员工1:3的比例分层抽样,得到200名员工的月使用流量L (单位:M )的数据,其频率分布直方图如图所示.求a 的值,并估计这200名员工月使用流量的平均值x (同一组中的数据用中点值代表);(2)若将月使用流量在800M 以上(含800M )的员工称为“手机营销达人”,填写下面的22⨯列联表,能否有超过0095的把握认为“成为手机营销达人与员工的性别有关”;男员工 女员工 合计手机营销达人 5非手机营销达人合计200(3)若这200名员工中有2名男员工每月使用流量在[]900,1000,从每月使用流量在[]900,1000的员工中随机抽取名3进行问卷调查,记女员工的人数为X ,求X 的分布列和数学期望. 参考公式及数据:()()()()()22n ab bc K a b c d a c b d -=++++,其中n a b c d =+++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.A解析:A 【分析】根据抽样方式的特征,可判断①;根据正态分布的性质,可判断②;根据二项分布的期望与方差特点,可判断③;根据独立性检验的方法和步骤,可判断④. 【详解】解:①根据抽样是间隔相同,且样本间无明显差异,故①应是系统抽样,即①为假命题;②某市进行了一次全市高中男生身高统计调查,数据显示某市30000高中男生的身高ξ(单位:cm )服从正态分布()2172,N σ,且(172180)0.4P ξ<≤=,所以()1(180)1721800.12P P ξξ>=-<≤=,所以该市身高高于180cm 的高中男生人数大约为300000.13000⨯=人,故②为真命题;③随机交量X 服从二项分布(100,0.4)B ,则()1000.440E X =⨯=,()()1000.410.424D X =⨯⨯-=,若随机变量21Y X =+,则Y 的数学期望为()()2181E Y E X =+=,方差为()()2296D Y D X ==;故③为假命题;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越小,故④为假命题. 故选:A . 【点睛】本题以命题的真假判断为载体考查了抽样方法,正态分布,二项分布及独立性检验等知识点,属于中档题.3.D解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()4222221 1.50.50.5 1.55i i x x =-=-+-++=∑ , ()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215i i x x=-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误.故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.4.C解析:C 【分析】首先列出22⨯联表,通过计算出2K 的值,然后作统计推断,得出正确的结论. 【详解】列出22⨯联表如下图所示:()277520450530015.96825750455320K ⨯⨯-⨯=≈⨯⨯⨯ 6.635>,故判断错误的概率不超过0.01,故选C .【点睛】本小题主要考查补全22⨯联表,考查2K 的计算以及独立性检验的概念,属于基础题. 独立性检验的步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22n ad bc K a b c d a c b d -=++++()()()()(),计算2K 的观测值;(3)比较2K 与临界值的大小关系作统计推断. 5.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 6.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.yx =+当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .7.A解析:A 【解析】因为7.879<K 2<10.828,所以有99.5%的把握认为使用智能手机对学习有影响. 故选A.8.C解析:C 【详解】∵2 6.023 5.024K =>∴可断言市民收入增减与旅游欲望有关的把握为97.5%. 故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
第三章统计案例同步练测(人教实验B版选修2-3)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.观察图中各图形:①②③④其中两个变量x,y具有相关关系的图是()A.①②B.①④C.③④D.②③2.为了了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得出2χ≈9.643.根据临界值表,以下说法正确的是()A.有99%的把握认为课外阅读量大与作文成绩无关B.有99.9%的把握认为课外阅读量大与作文成绩有关C.有99.5%的把握认为课外阅读量大与作文成绩无关D.有99.5%的把握认为课外阅读量大与作文成绩有关3.下列关系中,是相关关系的为( )①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.A.①②B.①③C.②③D.②④4.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是( )A.直线l1,l2有交点(s,t)B.直线l1,l2相交,但是交点未必是(s,t)C.直线l1,l2由于斜率相等,所以必定平行D.直线l1,l2必定重合5.对于散点图,下列说法中正确的是()A.通过散点图一定可以看出变量之间的变化规律B.通过散点图一定不可以看出变量之间的变化规律C.通过散点图可以看出正相关与负相关有明显区别D.通过散点图看不出正相关与负相关有什么区别6.若回归直线方程为ˆ2 3.5y x=-,则变量x增加一个单位,变量y 平均()A.减少3.5个单位B.增加2个单位C.增加3.5个单位D.减少2个单位7.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归直线方程ˆ35y x=-,变量x增加一个单位时,y平均增加5个单位;③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2的列联表中,由计算得2χ=13.079,则其两个变量间有关系的可能性是90%.其中错误的个数是( )A.1B.2C.3D.48.若两个分类变量x和y的列联表为:建议用时实际用时满分实际得分120分钟150分作文成绩优秀作文成绩一般合计课外阅读量较大22 10 32 课外阅读量一般8 20 28 合计30 30 60y 1y 2x 1 5 15 x 24010则x 与y 之间有关系的可能性为 ( ) A.0.1% B.99.9% C.97.5% D.0.25% 9.若对于变量y 与x 的10组统计数据的回归模型中,相关指数95.02=R ,又知残差平方和为53.120,那么∑=-1012)(i i y y 的值为( )A.06.241B.6.2410C.08.253D.8.253010.下表是对于喜欢足球与否的统计列联表,依据表中的数据,得到( )A. 2χ≈9.564 B. 2χ≈3.564C. 2χ706.22<KD. 2χ841.32>K11.统计假设H 0:P (AB )=P (A )·P (B )成立时,有以下判断:①P (A B )=P (A )P (B ); ②P (A B )=P (A )P (B ); ③P (A B )=P (A )P (B ). 其中正确的个数是( ) A.1 B.2 C.3D.012.在对吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若随机变量2χ>6.635,我们有99%的把握说明吸烟与患肺病有关,即若某人吸烟,那么他有99%的可能患有肺病B.若由随机变量求出有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99个人患有肺病C.若由随机变量求出有95%的把握说吸烟与患肺病有关,那么有5%的可能性使得推断错误D.以上说法均不正确二、填空题(本大题共4小题,每小题4分,共16分.将答案填写在题中的横线上)13.面对竞争日益激烈的消费市场,众多商家不断扩大自已的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x (千箱)与单位成本y (元)的资料进行线性回归分析,结果如下:()6621127717914812714816712ˆ 1.8182779627ˆ71 1.818277.362i i i i i x y x x y b a======-⨯⨯=≈-⎛⎫-⨯ ⎪⎝⎭≈--⨯≈∑∑,,,,,, 则销量每增加1 000箱,单位成本下降________元. 14.下表是关于出生男婴与女婴调查的列联表:晚上 白天 合计 男婴 45 A B 女婴 E 35 C 合计98D180那么,A = ,B = ,C = ,D = ,E = .15.如下表中给出的五组数据),(y x ,从中选出四组使其线性相关性最强,且保留第一组)3,5(--,那么,应去掉第 组.i1234 5x i −5 −4 −3 −2 4 y i −3 −2 4 −1 616.某学校对课程《人与自然》的选修情况进行了统计,得到如下数据:那么,选修《人与自然》与性别有关的把握是 .三、解答题(本大题共6小题,共74分.解答应写出文字说明、证明过程或演算步骤)17.(本小题满分12分)为研究是否喜欢饮酒与性别之间的关系,在某地区随机抽取290人,得到如下列联表:为饮酒与性别有关系?18.(本小题满分12分)有甲、乙两个班,进行数学考试,按学生考试及格与不及格统计成绩后,得到如下的列联表.根据表中数据,你有多大把握认为成绩及格与班级有关?19.(本小题满分12分)一机器可以按不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件的个数,现观测得到),(y x 的四组观测值为)11,16(),9,14(),8,12(),5,8(.若实际生产中所允许的每小时有缺点物件数不超过10,则机器的速度每秒不得超过多少转?20.(本小题满分12分)在大街上,随机调查339名成人,有关吸烟、不吸烟、患肺炎、不患肺炎的数据如下表:(1)判断:吸烟与患肺炎是否有关? (2)用假设检验的思想予以证明.21.(本小题满分13分)假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元)有如下统计资料:已知∑i =15x 2i =90,∑i =15y 2i =140.8,∑i =15x i y i =112.3.(1)求x ,y ;(2)如果x 与y 具有线性相关关系,求出线性回归 方程;(3)估计使用年限为10年时,维修费用约是多少? 22.(本小题满分13分)在综合素质评价的某个维度的测评中,依据评分细则,学生之间相互打分,最终将所有的数据合成一个分数.满分100分,按照大于等于80分为优秀,小于80分为合格.为了解学生在该维度的测评结果,从毕业班中随机抽出一个班的数据.该班共有60名学生,得到如下的列联表.已知在该班随机抽取1人,测评结果为优秀的概率为13.(1)请完成上面的列联表;(2)是否有90%的把握认为性别与测评结果有关系?(3)现在如果想了解全校学生在该维度的表现情况,采取简单随机抽样的方式在全校学生中抽取少数一部分人来分析,请你选择一个合适的抽样方法,并解释理由.第三章 统计案例 同步练测(人教实验B 版选修2-3)答题纸得分:一、选择题二、填空题13. 14. 15. 16.三、解答题17.18.19.20..21.22.第三章 统计案例 同步练测(数学人教实验B 版选修2-3)答案一、选择题1.C 解析:由相关关系的定义,当散点图中的点集中在一条直线或曲线附近时就称两变量具有相关关系.2.D 解析:根据独立性检验的基本思想和临界值表可以知道,只有D 对.3.A 解析:学生的学习成绩与学生的学习态度和教师的执教水平是相关的,与学生的身高和家庭经济条件不相关.4.A 解析:由ˆˆˆˆˆ,y bx a a y bx =+=-可知,当x x =时,y y =,故回归直线过定点()x y ,.所以回归直线1l 过点()s t ,,回归直线2l 也过点()s t ,,所以1l 与2l 有交点()s t ,. 5.C6.A 解析:由回归直线方程可得ˆ 3.5,b=-则变量x 增加一个单位,变量y 平均减少3.5个单位. 7.C 解析:根据方差的计算公式,可知①正确,②③④不正确.8.B 解析:()()225154010510401518.822>6.635(515)(4010)(540)(1510)χ+++⨯-⨯≈++++=,∴ 有99%以上的把握认为x 与y 之间有关系. 9.B10.D 解析:通过2χ的计算公式计算得 2χ≈4.722>3.841. 11.C12. C 解析:2χ的意义与概率不能混淆.二、填空题13.1.818 2 解析:由分析可得,y =−1.818 2x +77.36,销量每增加1千箱,则单位成本约下降1.818 2元. 14.47 92 88 82 53 15.3 解析:画散点图可以发现.16.99% 解析:由2χ的计算公式计算2χ≈163.8>6.635,即有99%的把握,认为选修《人与自然》与性别有关. 三、解答题17.解:由列联表中的数据得2χ=290×(101×20-124×45)2146×144×225×65≈11.953.∵ 11.953>6.635,∴ 有99%的把握认为“是否喜欢饮酒与性别有关”. 18.解:由列联表中的数据,得2χ≈0.652 7<3.841,所以没有理由认为“成绩及格或不及格与班级有关”.19.解:由于5.12)1614128(41=+++=x , 25.8)11985(41=+++=y , 5.25))((41=--∑=i i iy y x x,35)(412=-∑=i ix x,75.18)(412=-∑=i i y y ,那么75.0995.075.18355.25>=⨯=r ,因此,y 与x 之间具有很强的线性相关关系.于是由公式,得b ̂≈0.729,a ̂≈−0.863 ,那么y 与x 之间的回归直线方程为程y ̂=0.729x −0.863, 由0.729x −0.863≤10,得14.9015x ≤≈,即每小时有缺点的物件数不超过10时,机器的速度每秒不得超过15转. 20.解:(1)由列联表中的数据,得2χ≈7.469>6.635,所以有0099的把握认为吸烟与患肺炎有关.(2)假设吸烟与患肺炎无关,由于2( 6.635)0.01A P χ=>≈,即A 为小概率事件,而小概率事件发生了,进而得出假设错误,得到吸烟与患肺炎有关.21. 解:(1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5.(2)51522215112.3545ˆˆˆ1.23,5 1.2340.08.90545i ii ii x y x yba y bx xx ==--⨯⨯====-=-⨯=-⨯-∑∑ 于是所以y 对x 的回归直线方程为ˆˆˆ 1.230.08.ybx a x =+=+ (3)当x =10时,38.1208.01023.1ˆ=+⨯=y (万元),即估计使用10年时维修费用是12.38万元. 22.解:(1)(2)提出统计假设:性别与测评结果没有关系,则2=60×(6×18−22×14)240×20×32×28≈3.348>2.706,因此,有90%的把握认为性别与测评结果有关系.(3)由(2)可知性别很有可能对是否优秀有影响,所以采用分层抽样按男、女生比例抽取一定的学生,这样 得到的结果对学生在该维度测评中的总体表现情况会比较符合实际情况.。
一、选择题1.下列四个命题中,正确的有( )①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”; ③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .32.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==3.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .44.下列命题正确的个数是:( )①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为23;④“0,0a b >>”是“2b aa b+≥”的充分不必要条件 A .1B .2C .3D .45.近年来,由于大学生不理智消费导致财务方面的新闻层出不穷,无力偿还校园贷,跳楼自杀也偶有发生,一时间人们对大学生的消费观充满了质疑.为进一步了解大学生的消费情况,对S 城某大学的10000名(其中男生6000名,女生4000名)在校本科生,按性别采用分层抽样的方式抽取了1000名学生进行了问卷调查,其中有一项是针对大学生每月的消费金额进行调查统计,通过整理得如图所示的频率分布直方图.已知在抽取的学生中,月消费金额超过2000元的女生有150人.根据上述数据和频率分布直方图,判断下列说法正确的是( )参考数据与参考公式:003 1.732,sin150.258,sin7.50.1305=≈≈.A .月消费金额超过2000元的女生人数少于男生人数B .所调查的同学中月消费金额不超过500元的共有4人C .样本数据的中位数约为1750元D .在犯错的概率不超过0.1%的情况下认为月消费金额在2000元以上的大学生与性别有关 6.对于相关指数R2,下列说法正确的是 A .R2的取值越小,模型拟合效果越好B .R2的取值可以任意大,且R2取值越大,拟合效果越好C .R2的取值越接近于1,模型拟合效果越好D .以上答案都不对7.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k 2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是( ) P (K 2≥k )…0.250.150.100.025 0.010 0.005 …k … 1.323 2.072 2.706 5.024 6.635 7.879 …A .90%B .95%C .97.5%D .99.5%8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.某家具厂的原材料费支出x 与销售量y (单位:万元)之间有如下数据,根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为ˆ8ˆy x b =+,则^b为( ) x 2 4 5 6 8 y2535605575A .5B .15C .10D .20 11.已知样本789x y 、、、、的平均数是82xy 值为 A .8B .32C .60D .8012.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.如图所示是世界20个地区受教育程度的人口百分比与人均收入的散点图,样本点基本集中在一个条型区域,因此两个变量呈线性相关关系.利用散点图中的数据建立的回归方程为ˆ 3.19388.193yx =+,若受教育的人口百分比相差10%,则其人均收入相差_________.14.x ,y 的取值如下表: x-2-1.5-1-0.5 00.51y 0.26 0.35 0.51 0.711.1 1.412.05则x ,y 之间的关系可选用函数___进行拟合.15.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计26 24 50由表中数据计算得到K 2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关. 16.某单位为了了解用电量度与气温之间的关系,随机统计了某天的用电量与当天气温.由表中数据得回归直线方程中,据此预测当气温为5℃时,用电量的度数约为____.17.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.18.给出下列四个结论:(1)如图Rt ABC ∆中,2,90,30.AC B C =∠=︒∠=︒是斜边上的点,.以为起点任作一条射线交于点,则点落在线段上的概率是32;(2)设某大学的女生体重与身高具有线性相关关系,根据一组样本数据,用最小二乘法建立的线性回归方程为,则若该大学某女生身高增加,则其体重约增加;(3)若()f x 是定义在上的奇函数,且满足,则函数()f x 的图像关于对称;(4)已知随机变量ξ服从正态分布()()21,,40.79,N P σξ≤=则.其中正确结论的序号为________________19.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.20.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:则认为“是否同意限定区域停产与家长的性别有关”的把握约为__________.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.2020年江西省旅游产业发展大会于6月12日至6月13日在赣州顺利召开.为让广学生子解赣州旅游文化,赣州市旅游局在赣州市各中小学校开展“赣州市旅游知识网络竞赛”活动.为了更好地分析中学生和小学生对赣州市旅游知识掌握情况,将中学组和小学组的所有参赛选手按成绩分为优秀、良好、一般三个等级,随机从中抽取了100名选手进行调查,下面是根据调查结果绘制的选手等级人数的条形图.(1)若将一般和良好等级合称为合格等级,根据已知条件完成下面的22⨯列联表,并据此资料你是否有95%的把握认为选手成绩“优秀”与文化程度有关?优秀 合格 合计中学组 小学组 合计(2)若某县参赛选手共80人,用频率估计概率,试估计该县参赛选手中优秀等级的人数;(3)如果在优秀等级的选手中取3名,在良好等级的选手中取2名,再从这5人中任选3人组成一个比赛团队,求所选团队中恰有2名选手的等级为优秀的概率.注:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.P (20K k ≥)0.10 0.05 0.00523.为了解某企业生产的某产品的年利润与年广告投入的关系,该企业对最近一些相关数据进行了调查统计,得出相关数据见下表:根据以上数据,研究人员分别借助甲、乙两种不同的回归模型,得到两个回归方程:方程甲,2(1)(1) 2.75yb x =-+^^;方程乙,(2)1.6yc x =-^^.(1)求b ^(结果精确到0.01)与c ^的值.(2)为了评价两种模型的拟合效果,完成以下任务.①完成下表(备注:i i ie y y =-^^,i e ^称为相应于点(x i ,y i )的残差);②分别计算模型甲与模型乙的残差平方和Q 1及Q 2,并通过比较Q 1,Q 2的大小,判断哪个模型拟合效果更好.24.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付支付宝支付总计20.0500.0100.001()P K kk 3.841 6.63510.828()()()()()22n ad bc K a b c d a c b d -=++++. 25.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下列联表,并判断能否在犯错误率不超过0.05的前提下认为“体育迷”与性别有关?非体育迷 体育迷 合计男 女 合计(2)将日均收看该体育项目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.()2P K k ≥0.050.01k 3.8416.63526.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下: 研发费用x (百万元)236101314(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-= 解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。
第三章知能基础测试时间120分钟,满分150分。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的.)1.下列说法正确的是( )A .相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义B .独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义C .相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的D .独立性检验如果得出的结论有99%的可信度就意味着这个结论一定是正确的 [答案] C[解析] 相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义.故选C.2.设有一个回归方程为y ^=2-2.8x ^,则变量x 增加一个单位时( ) A .y 平均增加2.8个单位 B .y 平均增加2个单位 C .y 平均减少2.8个单位 D .y 平均减少2个单位 [答案] C[解析] 根据回归方程可知y 是关于x 的单调递减函数,并且由系数知,x 增加一个单位,相应的y 值平均减少2.8个单位.故选C.3.下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是y ^=-0.7x +a ,则a 等于( )A .10.5B .5.15C .5.2D .5.25[答案] D[解析] x =2.5,y =3.5, ∵回归直线方程过定点(x ,y ),∴3.5=-0.7×2.5+a ,∴a =5.25.故选D.4.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,由高尔顿提出的,他的研究结果是子代的平均高身向中心回归.根据他的结论,在儿子的身高y 与父亲的身高x 的回归直线方程y ^=a ^+b ^x 中,b ^( )A .在(-1,0)内B .等于0C .在(0,1)内D .在[1,+∞)内[答案] C[解析] 子代平均身高向中心回归,b ^应为正的真分数.故选C.5.(2014·济南市模拟)为了解疾病A 是否与性别有关,在一医院随机地对入院50人进行了问卷调查得到了如下的列联表:请计算出统计量K 2下面的临界值表供参考:A.95% C .99.5% D .99.9%[答案] C[解析] 由公式得K 2=50×(20×15-5×10)225×25×30×20≈8.333>7.879,故有1-0.005=99.5%的把握认为疾病A 与性别有关.6.如下表给出5组数据(x ,y ),为选出4组数据使其线性相关程度最大,且保留第1组数据(-5,-3),则应去掉( )A.第2组 C .第3组 D .第5组[答案] C[解析] 通过散点图选择,画出散点图如图.应除去第3组,对应点是(-3,4).故选C.7.根据下面的列联表判断患肝病与嗜酒有关系的把握有( )A.90% C .97.5% D .99.9%[答案] D[解析] 由χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得其观测值χ=9965×(7775×49-2099×42)27817×2148×9874×91≈56.6>10.828.故有99.9%的把握认为患肝病与嗜酒有关系,答案选D.8.若A 与B 相互独立,且P (A )=0.8,P (B )=0.9,则P (A B +A B )=________. A .0.72 B .0.92 C .0.82 D .0.26[答案] D[解析] ∵A 与B 相互独立,∵A 与B 、A 与B 相互独立,A B 与A B 互斥. ∴P (A B +A B )=P (A )P (B )+P (A )P (B )=(1-0.8)×0.9+0.8×(1-0.9)=0.26.故选D.9.由一组样本数据(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )得到的回归直线方程y ^=bx +a ,那么下面说法不正确的是( )A .直线y ^=bx +a 必经过点(x ,y )B .直线y ^=bx +a 至少经过点(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )中的一个点C .直线y ^=bx +a 的斜率为b =∑i =1nx i y i -n x y ∑i =1nx 2i -n x2D .直线y ^=bx +a 和各点(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )的偏差∑i =1n[y i -(bx i +a )]2是该坐标平面上所有直线中与这些点的偏差中最小的直线[答案] B10.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%[答案] A[解析] 将y =7.675代入回归方程,可计算得x ≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.故选A.11.(2014·江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表3A .成绩B .视力C .智商D .阅读量[答案] D[解析] A 中,χ2=52×(6×22-10×14)220×32×16×36=131440;B 中,χ2=52×(4×20-12×16)220×32×16×36=637360;C 中,χ2=52×(8×24-8×12)220×32×16×36=1310;D 中,χ2=52×(14×30-2×6)220×32×16×36=3757160.因此阅读量与性别相关的可能性最大,所以选D.12.2003年春季,我国部分地区SARS 流行,党和政府采取果断措施,防治结合,很快使病情得到控制.下表是某同学记载的5月1日至5月12日每天某市SARS 病患者治愈者数据,及根据这些数据绘制出的散点图.下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系; ②根据此散点图,可以判断日期与人数具有一次函数关系; ③根据此散点图,可以判断日期与人数具有非线性相关关系. 其中正确的个数为( ) A .0个 B .1个 C .2个 D .3个[答案] B[解析] 只有①正确.故选B.二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上) 13.对于一条线性回归直线y ^=a +bx ,如果x =3时,对应的y 的估计值是17,当x =8时,对应的y 的估计值是22,那么,可以估计出回归直线方程是____________,根据回归直线方程判断当x =____________时,y 的估计值是38.[答案] y ^=x +14 24[解析] 首先把两组值代入回归直线方程得⎩⎪⎨⎪⎧ 3b +a =178b +a =22⇒⎩⎪⎨⎪⎧b =1,a =14.所以回归直线方程是 y ^=x +14.令x +14=38,可得x =24.14.对有关数据的分析可知,每一立方米混凝土的水泥用量x (单位:kg)与28天后混凝土的抗压度Y (单位:kg/cm 2)之间具有线性相关关系,其线性回归方程为y =0.30x +99.9.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7kg/cm 2,每立方米混凝土的水泥用量最少应为________kg.(精确到0.1kg)[答案] 265.7 [解析] ∵y ≥89.7, ∴0.30x +9.99≥89.7 ∴x ≥265.7故水泥用量最少应为265.7kg.15.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和及格统计人数后,得到如下列联表:班级与成绩列联表则χ2=________.(精确到[答案] 0.600 [解析] 由列联表得则χ2=90×(11×37-34×8)245×45×19×71≈0.600.16.在对两个变量x 、y 进行线性回归分析时有下列步骤: ①对所求出的回归方程作出解释; ②收集数据(x i ,y i ),i =1,2,…,n ; ③求线性回归方程; ④求相关系数;⑤根据所搜集的数据绘制散点图;如果根据可靠性要求能够作出变量x 、y 具有线性相关结论,则正确的操作顺序是____________. [答案] ②⑤④③①三、解答题(本大题共6个小题,共74分,解答应写出文字说明、证明过程或演算步骤) 17.(本题满分12分)高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据,试判断文科学生总成绩不好与数学成绩不好是否有关.[解析] 根据题意计算得 χ2=913(478×30-12×393)2490×423×871×42≈11.153>6.635.因此有99%的把握认为“文科学生总成绩不好与数学成绩不好有关系”.18.(本题满分12分)以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150m 2时的销售价格. [解析] (1)数据对应的散点图如下图所示:(2)x =15∑i =15x i =109,l xx =∑i =15 (x i -x )2=1 570,y =23.2,l xy =∑i =15(x i -x )(y i -y )=308.设所求回归直线方程为y ^=b ^x +a ^,则b ^=l xx l xy =3081 570≈0.196 2,a ^=y -b ^x =1.816 6.故所求回归直线方程为y ^=0.196 2x +1.816 6. (3)据(2),当x =150 m 2时,销售价格的估计值为 y ^=0.196 2×150+1.816 6=31.246 6(万元).19.(本题满分12分)在研究一种新药对小白鼠的防治效果时,得到如下数据.[解析] 由公式χ2=339×(43×121-162×13)2205×134×56×283≈7.469.由于7.469>6.635,所以我们有99%的把握认为这种新药对小白鼠防治效果是有效的. 20.(本题满分12分)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件各中抽出了500件,量其内径尺寸,得结果如下表:甲厂(1)(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?附:χ2=n (n 11n 22-n 12n 21n 1+n 2+n +1n +2,[解析] (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)χ2=1000×(360×180-320×140)500×500×680×320≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.21.(本题满分12分)(2014·新课标Ⅱ理,19)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(1)(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:b ^=ni =1 (t i -t )(y i -y )ni =1(t i -t )2,a ^=y -b ^t [解析] (1)∵t =1+2+…+77=4,y =2.9+3.3+3.6+4.4+4.8+5.2+5.97=4.3设回归方程为y =bt +a ,代入公式,经计算得 b =3×14+2+0.7+0+0.5+1.8+4.8(9+4+1)×2=1414×2=12.a =y -b t =4.3-12×2=2.3所以,y 关于t 的回归方程为y =0.5t +2.3.(2)∵b =12>0,∴2007年至2013年该区人均纯收入稳步增长,预计到2015年,该区人均纯收入y=0.5·9+2.3=6.8(千元)所以,预计到2015年,该区人均纯收入约6千8百元左右.22.(本题满分14分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出Y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(参考公式:b ^=∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2)=∑ni =1 (x i -x )(y i -y )∑n i =1(x i -x )2, a ^=y ^-b ^x )[解析] (1)设抽到相邻两个月的数据为事件A .因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的.其中,抽到相邻两个月的数据的情况有5种.所以P (A )=515=13. (2)由数据求得x =11,y =24,由公式求得b ^=187,再由a ^=y ^-b ^x =-307,所以Y 关于x 的线性回归方程为 y ^=187x -307. (3)当x =10时,y ^=1507,|1507-22|<2; 同样当x =6时,y ^=787,|787-12|<2, ∴该小组所得线性回归方程是理想的.。
(完整版)高中数学选修2-3第三章统计案例章末检测题编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整版)高中数学选修2-3第三章统计案例章末检测题)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(完整版)高中数学选修2-3第三章统计案例章末检测题的全部内容。
(完整版)高中数学选修2-3第三章统计案例章末检测题编辑整理:张嬗雒老师尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布到文库,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是我们任然希望(完整版)高中数学选修2—3第三章统计案例章末检测题这篇文档能够给您的工作和学习带来便利。
同时我们也真诚的希望收到您的建议和反馈到下面的留言区,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请下载收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为〈(完整版)高中数学选修2-3第三章统计案例章末检测题〉这篇文档的全部内容.高中数学选修2—3第三章统计案例章末检测题(满分150分,时间120分钟)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.分析人的身高与体重的关系,可以用( )A.残差分析B.回归分析C.等高条形图D.独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决.【答案】B2.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K2≈0。
99,根据这一数据分析,下列说法正确的是()A.有99%的人认为栏目优秀B.有99%的人认为栏目是否优秀与改革有关系C.有99%的把握认为电视栏目是否优秀与改革有关系D.没有理由认为电视栏目是否优秀与改革有关系【解析】由于K2=0.99<3。
高中新课标第三章统计案例综合测试题选修2-3
一、选择题
1.下列属于相关现象的是()
A.利息与利率
B.居民收入与储蓄存款
C.电视机产量与苹果产量
D.某种商品的销售额与销售价格
答案:B
2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()A.2 3.841
K>B.2 3.841
K<
C.2 6.635
K>D.2 6.635
K<
答案:A
3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4
组数据的线性相关性最大()
A.EB.CC.DD.A
答案:A
4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,
不患肺病
患
肺病
合
计
不吸烟7775 42
7
817
吸烟2099 49
2
148
合计9874 91
9
965
A.90%B.95%C.99%D.100%
答案:C
5.调查某医院某段时间婴儿出生的时间与性别的关系,得到下面的数据表:
晚上
白
天
合
计
男婴
2
4
3
1
5
5
女8 23
你认为婴儿的性别与出生时间有关系的把握为( )
A.80% B.90% C.95% D.99%
答案:B
6.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( )
A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0
答案:A
7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说确的是( )
A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元
答案:C
8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( )
A.①② B.②③ C.①③ D.①②③
答案:C
9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一
35A.100 B.143 C.200 D.243
答案:B
10.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下
列联表:
利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于()A.0.3~0.4 B.0.4~0.5 C.0.5~0.6 D.0.6~0.7
答案:B
二、填空题
11
则Y对的回归系数.
答案:0.1229
-
12.对于回归直线方程 4.75257
=+,当28
y x
x=时,y的估计值为.
答案:390
13.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则2
K=.
答案:16.373
14.某工厂在2005年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组
则月总成本y对月产量x的回归直线方程为.
答案: 1.2150.975
y x
=+
三、解答题
15.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的
对于教育机构的研究项目,根据上述数据能得出什么结论.
解:
2
2
392(3916715729)
1.78
19619668324
K
⨯⨯-⨯
=≈
⨯⨯⨯
.
因为1.78 2.706
<,所以我们没有理由说人具有大学专科以上学历(包括大学专科)和对待教育改革态度有关.
16.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.
(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?
(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?
解:由题意知:(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6,
∴船员平均相差6人;
(2)最小的船估计的船员数为:9.1+0.006×192=9.1+1.152=10.252≈10(人).
最大的船估计的船员数为:9.1+0.006×3246=9.1+19.476=28.576≈28(人).
17.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录:
周岁0 1 2 3 4 5 6
身高/
cm
1
34.2
1
40.8
1
47.6
1
54.2
1
60.9
1
67.6
1
73.0
(1)作出这些数据的散点图;
(2)求出这些数据的回归方程;
(3)对于这个例子,你如何解释回归系数的含义?
(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.
(5)解释一下回归系数与每年平均增长的身高之间的联系.
解:(1)数据的散点图如下:
(2)用y表示身高,x表示年龄,则数据的回归方程为y=6.317x+71.984;
(3)在该例中,回归系数6.317表示该人在一年中增加的高度;
(4)每年身高的增长数略.3~16岁身高的年均增长数约为6.323cm;
(5)回归系数与每年平均增长的身高之间近似相等.
18.某个服装店经营某种服装,在某周获纯利y(元),与该周每天销售这种服装件数x之间的一组数据关系见表:
3 4 5 6 78 9
6
6
6
9
7
3
8
1
8
9
9
9
1
已知
7
2
1
280
i
i
x
=
=
∑,72
1
45309
i
i
y
=
=
∑,
1
3487
i i
i
x y
=
=
∑.
(1)求x y,;
(2)画出散点图;
(3)判断纯利y与每天销售件数x之间是否线性相关,如果线性相关,求出回归方程.解:(1)
3456789
6
7
x
++++++
==,
66697381899091
79.86
7
y
++++++
=≈;
(2)略;
(3)由散点图知,y与x有线性相关关系,
设回归直线方程:y bx a
=+,
559
3487761337 4.7528073628
b -⨯⨯=
==-⨯,
79.866 4.7551.36a =-⨯=.
∴回归直线方程 4.7551.36y x =+.。