统计案例练习习题(答案已做)
- 格式:docx
- 大小:34.87 KB
- 文档页数:6
第一章统计案例 测试题一、选择题1.下列属于相关现象的是( ) A.利息与利率B.居民收入与储蓄存款 C.电视机产量与苹果产量D.某种商品的销售额与销售价格2.已知盒中装有3只螺口与7只卡口灯泡,这些灯泡的外形与功率都相同且灯口向下放着,现需要一只卡口灯泡,电工师傅每次从中任取一只并不放回,则在他第1次抽到的是螺口灯泡的条件下,第2次抽到的是卡口灯泡的概率为 ( )3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( )<A.E B.C C.D D.A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人) 》 根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A.90% B.95% C.99% D.100%5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:你认为婴儿的性别与出生时间有关系的把握为( )A.80% B.90% C.95% D.99%6.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( ) ]A.可以小于0 B.只能大于0 C.可以为0 D.只能小于07.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与*摄氏 温度5-0 4 7 12 15 19 23 .2731 36 热饮 杯数156 150 132 128 130~116104 89 93 76 54A.100 B.143 C.200 D.243不患肺病 患肺病 合计 不吸烟 7775 42 7817@ 吸烟 2099 49 2148合计 9874 91 9965 晚上 白天 合计 `男婴24 31 55 女婴 8 26 34合计 32 -5789!10.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:【A.~ B.~ C.~ D.~ 二、填空题11.某矿山采煤的单位成本Y 与采煤量x 有关,其数据如下: 则Y 对x 的回归系数 .的估计值为 .13.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不=是因为患心脏病而住院的男性病人中有175人秃顶,则2χ .14.设A 、B 为两个事件,若事件A 和B 同时发生的概率为310,在事件A 发生的条件下,事件B 发生的概率为12,则事件A 发生的概率为________________.15.由一个 2*2 列联表中数据计算得 2χ = ,有__________ 把握认为两个变量有关系.?三、解答题 16.国庆节放假,甲去北京旅游的概率为13,乙、丙去北京旅游的概率分别为14,15.假定三人的行动相互之间没有影响,求这段时间内至少有1人去北京旅游的概率 ^17.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:】对于教育机构的研究项目,根据上述数据能得出什么结论.18.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少(2)对于最小的船估计的船员数为多少对于最大的船估计的船员数是多少;!19.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线(1)作出这些数据的散点图; (2)求出这些数据的回归方程;(3)对于这个例子,你如何解释回归系数的含义 !(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数. (5)解释一下回归系数与每年平均增长的身高之间的联系.?20.某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表: 已知721280i i x ==∑,2145309i i y ==∑,13487i i i x y ==∑.(1)求x y ,; (2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程.》|21.甲、乙两人各射击一次,击中目标的概率分别是23和34.假设两人射击是否击中目标相互之间没有影响;每人各次射击是否击中目标,相互之间也没有影响. 《(1)求甲射击4次,至少有1次未击中目标的概率;(2)假设某人连续2次未击中目标,则中止其射击.问:乙恰好射击5次后,被中止射击的概率是多少、&第一章 统计案例检测题答案一、选择题1-5 BDACB 6-10 ACCBB 二、填空题11.0.1229- 12. 390 13. 15. 95% 四、解答题16.解:因甲、乙、丙去北京旅游的概率分别为13,14,15.因此,他们不去北京旅游的概率分别为23,34,45,所以,至少有1人去北京旅游的概率为P =1-23×34×45=35.17.解:22392(3916715729) 1.7819619668324K ⨯⨯-⨯=≈⨯⨯⨯.因为1.78 2.706<,所以我们没有理由说人具有大学专科以上学历(包括大学专科)和对待教育改革态度有关.18. 解:由题意知:(1)船员平均人数之差=×吨位之差=×1000=6, ∴船员平均相差6人;(2)最小的船估计的船员数为:+×192=+=≈10(人). 最大的船估计的船员数为:+×3246=+=≈28(人). 19.解:(1)数据的散点图如下:(2)用y 表示身高,x 表示年龄,则数据的回归方程为y =6.317x +71.984;(3)在该例中,回归系数6.317表示该人在一年中增加的高度;(4)每年身高的增长数略.3~16岁身高的年均增长数约为6.323cm ;(5)回归系数与每年平均增长的身高之间近似相等. 20. 解:(1)345678967x ++++++==,6669738189909179.867y ++++++=≈;(2)略;(3)由散点图知,y 与x 有线性相关关系, 设回归直线方程:y bx a =+,5593487761337 4.7528073628b -⨯⨯===-⨯,79.866 4.7551.36a =-⨯=.∴回归直线方程 4.7551.36y x =+.21.解:(1)记“甲连续射击4次至少有1次未击中目标”为事件A 1.由题意,射击4次,相当于作4次独立重复试验.故P (A 1)=1-P (A 1)=1-(23)4=6581,所以甲连续射击4次至少有一次未击中目标的概率为6581.(2)记“乙恰好射击5次后被中止射击”为事件A 3,“乙第i 次射击未击中”为事件D i (i =1,2,3,4,5),则 A 3=D 5D 4·D 3·(D 2D 1),且P (D i )=14. 由于各事件相互独立,故 P (A 3)=P (D 5)·P (D 4)·P (D 3)·P (D 2D 1) =14×14×34×(1-14×14)=451 024.所以乙恰好射击5次后被中止射击的概率为451 024.。
2015年高三复习高中数学统计案例习题(有详细答案)一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.363.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,324.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.80005.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.2006.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.287.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.6710.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.12011.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.4512.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.6013.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.1815.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.19.下表是某单位在2013年1﹣5月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 5用水量y 4.5 4 3 2.5 1.8(Ⅰ)若由线性回归方程得到的预测数据与实际检验数据的误差不超过0.05,视为“预测可靠”,通过公式得,那么由该单位前4个月的数据中所得到的线性回归方程预测5月份的用水量是否可靠?说明理由;(Ⅱ)从这5个月中任取2个月的用水量,求所取2个月的用水量之和小于7(单位:百吨)的概率.参考公式:回归直线方程是:,.20.某校高三数学竞赛初赛考试后,对考生的成绩进行统计(考生成绩均不低于90分,满分为150分),将成绩按如下方式分成六组,第一组[90,100)、第二组[100,110)…,第六组[140,150],如图为其频率分布直方图的一部分,若第四、五、六组的人数依次成等差数列,且第六组有4人.(Ⅰ)求第四和第五组频率,并补全频率分布直方图;(Ⅱ)若不低于120分的同学进入决赛,不低于140分的同学为种子选手,完成下面2×2列联表(即填写空格处的数据),并判断是否有99%的把握认为“进入决赛的同学成为种子选手与专家培训有关”.[120,140)[140,150]合计参加培训8 8未参加培训合计 4附:K2=P(K2≥k0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001K0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82821.为了了解某中学高二女生的身高情况,该校对高二女生的身高进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:(单位:cm)(1)表中m、n、M、N所表示的数分别是多少?(2)绘制频率分布直方图;(3)估计该校女生身高小于162.5cm的百分比.22.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求x值;(2)(理科)从成绩不低于80分的学生中随机的选取2人,该2人中成绩在90以上(含90分)的人数记为ξ,求ξ的概率分布列及数学期望Eξ.(文)从从成绩不低于80分的学生中随机的选取3人,该3人中至少有2人成绩在90以上(含90分)的概率.23.某网站针对2014年中国好声音歌手A,B,C三人进行网上投票,结果如下观众年龄支持A 支持B 支持C20岁以下200 400 80020岁以上(含20岁)100 100 400(1)在所有参与该活动的人中,用分层抽样的方法抽取n人,其中有6人支持A,求n的值.(2)在支持C的人中,用分层抽样的方法抽取6人作为一个总体,从这6人中任意选取2人,求恰有1人在20岁以下的概率.24.某校100名学生期中考试数学成绩的频率分布直方图如图,其中成绩分组区间如下:组号第一组第二组第三组第四组第五组分组[50,60)[60,70)[70,80)[80,90)[90,100](Ⅰ)求图中a的值;(Ⅱ)根据频率分布直方图,估计这100名学生期中考试数学成绩的平均分;(Ⅲ)现用分层抽样的方法从第3、4、5组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率?25.从某实验中,得到一组样本容量为60的数据,分组情况如下:(Ⅰ)求出表中m,a的值;分组5~15 15~25 25~35 35~45频数 6 2l m频率 a 0.05(Ⅱ)估计这组数据的平均数.26.某校高三文科分为四个班.高三数学调研测试后,随机地在各班抽取部分学生进行测试成绩统计,各班被抽取的学生人数恰好成等差数列,人数最少的班被抽取了22人.抽取出来的所有学生的测试成绩统计结果的频率分布条形图如图所示,其中120~130(包括120分但不包括130分)的频率为0.05,此分数段的人数为5人.(1)问各班被抽取的学生人数各为多少人?(2)求平均成绩;(3)在抽取的所有学生中,任取一名学生,求分数不小于90分的概率.27.在参加世界杯足球赛的32支球队中,随机抽取20名队员,调查其年龄为25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28.(1)填写下面的频率分布表(2)并画出频率分布直方图.(3)据此估计全体队员在哪个年龄段的人数最多?占总数的百分之几?分组频数频率20.5~22.522.5~24.524.5~26.526.5~28.528.5~30.5合计28.如图是调查某地某公司1000名员工的月收入后制作的直方图.(1)求该公司员工的月平均收入及员工月收入的中位数;(2)在收入为1000至1500元和收入为3500至4000元的员工中用分层抽样的方法抽取一个容量15的样本,员工甲、乙的月收入分别为1200元、3800元,求甲乙同时被抽到的概率.29.某市为了解全市居民日常用水量的分布情况,现采用抽样调查的方式,获得了n位居民某年的月均用水量(单位:t),样本统计结果如图表:(Ⅰ)分别求出x,n,y的值;(Ⅱ)若从样本中月均用水量在[5,6]内的5位居民a,b,c,d,e中任选2人作进一步的调查研究,求居民a被选中的概率.分组频数频率[0,1)25 y[1,2)0.19[2,3)50 x[3,4)0.23[4,5)0.18[5,6] 530.为了分析某次考试数学成绩情况,用简单随机抽样从某班中抽取25名学生的成绩(百分制)作为样本,得到频率分布表如下:分数[50,60)[60,70)[70,80)[80,90)[90,100]频数2 3 9 a 1频率0.08 0.12 0.36 b 0.04(Ⅰ)求样本频率分布表中a,b的值,并根据上述频率分布表,在下表中作出样本频率分布直方图;(Ⅱ)计算这25名学生的平均数及方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从成绩在[50,70)的学生中任选2人,求至少有1人的成绩在[60,70)中的概率.参考答案与试题解析一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样考点:分层抽样方法.专题:阅读型.分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.故选C.点评:本小题考查抽样方法,主要考查抽样方法,属基本题.2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.36考点:分层抽样方法.专题:计算题.分析:根据社区里的高收入家庭户和高收入家庭户要抽取的户数,得到每个个体被抽到的概率,用求到的概率乘以低收入家庭户的户数,得到结果.解答:解:∵区现有480个住户,高收入家庭120户,抽取了6户∴每个个体被抽到的概率是∴该社区本次被抽取的总户数为=24,故选B.点评:本题考查分层抽样方法,这种题目类型是高考题目中一定会出现的题目,运算量不大,是一个必得分题目.3.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32考点:系统抽样方法.专题:计算题.分析:由系统抽样的特点知,将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,这时间隔一般为总体的个数除以样本容量.从所给的四个选项中可以看出间隔相等且组距为10的一组数据是由系统抽样得到的.解答:解:从50枚某型导弹中随机抽取5枚,采用系统抽样间隔应为=10,只有B答案中导弹的编号间隔为10,故选B.点评:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本.4.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.8000考点:频率分布直方图.专题:概率与统计.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的面积等于这一组的频率.底部周长小于100cm的矩形的面积求和乘以样本容量即可.解答:解:由图可知:底部周长小于100cm段的频率为(0.01+0.02)×10=0.3,则底部周长大于100cm的段的频率为1﹣0.3=0.7那么在这片树木中底部周长大于100cm的株树大约10000×0.7=7000人.故选C.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.5.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.200考点:频率分布直方图.专题:概率与统计.分析:根据直方图中的各个矩形的面积代表了频率,各个矩形面积之和为1,求出小长方形面积最大的一组的频率,再根据频数=频率×样本容量,求出频数即可.解答:解:∵直方图中的各个矩形的面积代表了频率,这5个小方形的面积由小到大构成等差数列{a n},a2=2a1,∴d=a1,a3=3a1,a4=4a1,a5=5a1根据各个矩形面积之和为1,则a1+a2+a3+a4+a5=15a1=1∴a1=,小长方形面积最大的一组的频率为a5=5×=根据频率=可求出频数=300×=100故选:A.点评:本题考查了频率、频数的应用问题,各小组频数之和等于样本容量,各小组频率之和等于1.6.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.28考点:众数、中位数、平均数.专题:概率与统计.分析:利用中位数的定义即可得出.解答:解:这组数据为16,17,19,22,25,27,28,30,30,32,36,40的中位数是=27.5.故选:A.点评:本题考查了中位数的定义及其计算方法,属于基础题.7.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B考点:众数、中位数、平均数.专题:概率与统计.分析:本题可以由折线图上的数据做出两个城市的平均气温和方差,也可以根据两个折线图的高低和变化的趋势即波动的大小,得到结果.解答:解:由折线图可知A市的平均气温是,B市的平均气温是=11.7,由折线图也可以看出B市的气温较高,可以看出B市的气温的变化不大,方差较小;故选D.点评:本题考查了折线图以及平均数和方差的求法;求两组数据的平均值和方差是研究数据常做的两件事,平均值反映数据的平均水平,而方差反映数据的波动大小,从两个方面可以准确的把握数据的情况.8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④考点:散点图.专题:计算题.分析:通过观察散点图可以知道,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.解答:解:由题图③可知,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,由题图④可知,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.故选D.点评:本题考查散点图,是通过读图来解决问题,考查读图能力,粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关.9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.67考点:线性回归方程.专题:计算题;概率与统计.分析:由题意,将20代入可得68.2,故可能值为68.解答:解:由题意,y=0.68×20+54.6=68.2,又由表可知加工时间y(min)都是以整数记,故a可能为68,故选B.点评:本题考查了线性回归方程的应用及数学问题与实际问题的转化,属于基础题.10.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120考点:频率分布直方图.专题:图表型.分析:根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.解答:解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选B.点评:本小题主要考查频率、频数、统计和概率等知识,考查数形结合、化归与转化的数学思想方法,以及运算求解能力.11.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45考点:频率分布直方图.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,小矩形的面积等于这一组的频率,则所以面积和为1,建立等量关系即可求得长度在[25,30)内的频率即得.解答:解:设长度在[25,30)内的频率为a,根据频率分布直方图得:a+5×0.02+5×0.06+5×0.03=1⇒a=0.45.则根据频率分布直方图估计从该批产品中随机抽取一件,则其为二等品的概率为0.45.故选D.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.12.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.60考点:频率分布直方图.专题:概率与统计.分析:由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.解答:解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选B.点评:本题考查的知识点是频率分布直方图,结合已知中的频率分布直方图,结合频率=矩形的高×组距,求出满足条件的事件发生的频率是解答本题的关键.13.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户考点:分层抽样方法.专题:概率与统计.分析:由分层抽样的计算方法:中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得出答案.解答:解:由已知可得中等收入家庭中应抽选出的户数==56.故选C.点评:本题考查了分层抽样,掌握分层抽样的计算方法是解决问题的关键.14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.18考点:分层抽样方法.专题:计算题.分析:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,由此解得x 的值.解答:解:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,解得x=18,故选D.点评:本题主要考查分层抽样的定义和方法,利用了总体中各层的个体数之比等于样本中对应各层的样本数之比,属于基础题.15.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人考点:分层抽样方法.专题:计算题.分析:先求出每个个体被抽到的概率,用该层的个体数乘以每个个体被抽到的概率,就等于该层应抽取的个体数.解答:解:每个个体被抽到的概率等于=,老年人中被抽取到参加健康检查的人数是40×=4,故选C.点评:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?考点:频率分布直方图;频率分布表.专题:概率与统计.分析:(1)根据上表求出身高不低于1.65m且不高于1.71m的频率与不低于1.63m的频率;(2)将测量数据分组,求频数与频率,列出频率分布表,画出频率分布直方图;(3)根据图形得出正确的结论以及估计结果.解答:解:(1)根据上表得,身高不低于1.65m且不高于1.71m的频率是=≈0.567,∴约占总体的56.7%;不低于1.63m的频率是1﹣=1﹣0.15=0.85,约占总体的85%;(2)将测量数据分布6组,∴=0.033,∴组距是0.04,计算频数与频率,列出频率分布表,如下;分组频数频率156.5﹣160.5 7 0.11160.5﹣164.5 9 0.15164.5﹣168.5 15 0.25168.5﹣172.5 22 0.37172.5﹣176.5 6 0.10176.5﹣180.5 1 0.02合计60 1.00画出样本频率分布直方图,如图所示;(3)根据图形知,该校年满16周岁的男生在168.5﹣172.5内的人数所占的比例最大,如果年满16周岁的男生有360人,那么在这个范围的人数估计约为360×0.37=133人.点评:本题考查了频率分布直方图的应用问题,也考查了列表和画图的能力,解题时应根据图中数据进行有关的计算,是基础题.17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.考点:回归分析的初步应用.专题:计算题;概率与统计.分析:求平均值,回归直线必过样本点的中心.解答:解:==3,==8,故回归方程=x+所表示的直线必经过点(3,8).点评:本题考查了回归分析,回归直线必过样本点的中心,同时考查了平均数的求法,属于基础题.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.考点:茎叶图;众数、中位数、平均数;极差、方差与标准差.专题:概率与统计.分析:(I)由茎叶图知甲乙两同学的成绩分别为:甲:82 81 79 88 乙:85 77 83 85.利用“列举法”及其古典概型的概率计算公式即可得出.(II)分别计算出甲乙的平均成绩及其方差即可得出.。
2015年高三复习高中数学统计案例(有答案)一.选择题(共18小题)1.(2014•四川)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读2.(2014•重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性.=0.4x+2.3 =2x﹣2.4 C=﹣2x+9.5D.=﹣0.3x+4.4得到回归方程为=bx+a,则()4.(2014•唐山二模)用简单随机抽样的方法从含有100个个体的总体中依次抽取一个容量为5的样本,则个体m .C D.5.(2014•揭阳三模)某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人6.(2014•黄冈模拟)2014年3月,为了调查教师对第十二届全国人民代表大会二次会议的了解程度,安庆市拟采用分层抽样的方法从A,B,C三所不同的中学抽取60名教师进行调查.已知A,B,C学校中分别有180,270,7.(2014•湖北模拟)某学校用分层抽样的方法从三个年级抽取若干学生,调查“马年春节”学生参加社会实践活动情)8.(2014•闸北区三模)某初级中学领导采用系统抽样方法,从该校预备年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k==16,即每16人抽取一个人.在1~16中随机9.(2014•大连一模)某小礼堂有25排座位,每排有20个座位.一次心理讲座时礼堂中坐满了学生,讲座后为了10.(2014•江西模拟)月底,某商场想通过抽取发票的10%估计该月的销售总额.先将该月的全部销售发票存根进行了编号:1,2,3,…,然后拟采用系统抽样的方法获取一个样本.若从编号为1,2,…,10的前10张发票存根中随机抽取一张,然后再按系统抽样的方法依编号顺序逐次产生第二张、第三张、第四张、…,则抽样中产生的第11.(2014•福建模拟)为调查某校学生喜欢数学课的人数比例,采用如下调查方法:(1)在该校中随机抽取100名学生,并编号为1,2,3, (100)(2)在箱内放置两个白球和三个红球,让抽取的100名学生分别从箱中随机摸出一球,记住其颜色并放回;(3)请下列两类学生举手:(ⅰ)摸到白球且号数为偶数的学生;(ⅱ)摸到红球且不喜欢数学课的学生.13.(2014•安徽模拟)在样本的频率分布直方图中,共有11个小长方形,若中间一个长方形的面积等于其他十个小长方形面积的和的,且样本容量是160,则中间一组的频数为()14.(2014•江西模拟)在样本的频率分布直方图中,一共有m(m≥3)个小矩形,第3个小矩形的面积等于其余m﹣1个小矩形面积之和的,且样本容量为100,则第3组的频数是()15.(2014•许昌二模)在抽查产品尺寸的过程中,将尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组C D16.(2014•锦州二模)学校为了解学生在课外读物方面的支出情况,抽取了n个同学进行调查,结果显示这些同学的支出都在[10,50)(单位:元),其中支出在[30,50)(单位:元)的同学有67人,其频率分布直方图如图所示,则n的值为()17.(2014•浙江二模)如图是某班50位学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90)[90,100),则图中x的值等于()0.048C18.(2013•临汾模拟)某一个班全体学生参加物理测试,成绩的频率分布直方图如图,则该班的平均分估计是()二.解答题(共12小题)19.(2014•广东)随机观测生产某种零件的某工作厂25名工人的日加工零件个数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据1212(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.20.(2014•凉州区二模)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:(Ⅰ)分别估计用A配方,B配方生产的产品的优质品率;(Ⅱ)已知用B配方生成的一件产品的利润y(单位:元)与其质量指标值t的关系式为y=从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)21.(2014•安徽)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联附:K2=.22.(2014•辽宁)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表”;(Ⅱ)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:X2=23.(2014•烟台三模)某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果从中任取2人,求至少有1人的学历为研究生的概率;(Ⅱ)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值.24.(2014•肇庆二模)为考察高中生的性别与是否喜欢数学课程之间的关系,在我市某普通中学高中生中随机抽取”?(2)若采用分层抽样的方法从不喜欢数学课的学生中随机抽取5人,则男生和女生抽取的人数分别是多少?(3)从(2)随机抽取的5人中再随机抽取3人,该3人中女生的人数记为ξ,求ξ的数学期望.25.(2014•仙游县模拟)如图所示是预测到的某地5月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择5月1日至5月13日中的某一天到达该市,并停留2天.(Ⅰ)求此人到达当日空气重度污染的概率;(Ⅱ)求此人在该市停留期间只有1天空气质量优良的概率;(Ⅲ)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)26.(2014•唐山二模)某种水果的单个质量在500g以上视为特等品随机抽取1000个水果.结果有50个特等品.将这50个水果的质量数据分组,得到所示的频率分布表.(Ⅰ)估计该水果的质量不少于560g的概率;27.(2014•遵义二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为酒后驾车;当Q>80时,为醉酒驾车.济南市公安局交通管理部门于2011年2月的某天晚上8点至11点在市区设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图,为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(1)求此次拦查中醉酒驾车的人数;(2)从违法驾车的60人中按酒后驾车和醉酒驾车利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取3人,求3人中含有醉酒驾车人数x的分布列和期望.28.(2014•河南一模)某企业员工500人参加“学雷锋”志愿活动,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.6人,年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(Ⅱ)的前提下,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.29.(2014•大港区二模)某市为增强市民的环境保护意识,面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示.(1)若从第3,4,5组中用分层抽样的方法抽取6名志愿者参广场的宣传活动,应从第3,4,5组各抽取多少名志愿者?(2)在(1)的条件下,该县决定在这6名志愿者中随机抽取2名志愿者介绍宣传经验,求第4组至少有一名志愿者被抽中的概率.30.(2014•太原二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为“酒后驾车”;当Q>80时,为“醉酒驾车”某市公安局交通管理部门于2013年11月的某天晚上8点至11点在该市区解放路某处设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(Ⅰ)求此次拦查中“醉酒驾车”的人数;(Ⅱ)从违法驾车的60人中按“酒后驾车”和“醉酒驾车”利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取2人,求2人中其中1人为“酒后驾车”另1人为“醉酒驾车”的概率.参考答案与试题解析一.选择题(共18小题)1.(2014•四川)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读2.(2014•重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性.=0.4x+2.3 =2x﹣2.4 C=﹣2x+9.5D.=﹣0.3x+4.4样本平均数=3.5得到回归方程为=bx+a,则()=5.5,∴=4.(2014•唐山二模)用简单随机抽样的方法从含有100个个体的总体中依次抽取一个容量为5的样本,则个体m .C D.个个体,某个个体被抽到的概率为×.5.(2014•揭阳三模)某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人=×=9×6.(2014•黄冈模拟)2014年3月,为了调查教师对第十二届全国人民代表大会二次会议的了解程度,安庆市拟采用分层抽样的方法从A,B,C三所不同的中学抽取60名教师进行调查.已知A,B,C学校中分别有180,270,7.(2014•湖北模拟)某学校用分层抽样的方法从三个年级抽取若干学生,调查“马年春节”学生参加社会实践活动情)故有=,,解得8.(2014•闸北区三模)某初级中学领导采用系统抽样方法,从该校预备年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k==16,即每16人抽取一个人.在1~16中随机9.(2014•大连一模)某小礼堂有25排座位,每排有20个座位.一次心理讲座时礼堂中坐满了学生,讲座后为了10.(2014•江西模拟)月底,某商场想通过抽取发票的10%估计该月的销售总额.先将该月的全部销售发票存根进行了编号:1,2,3,…,然后拟采用系统抽样的方法获取一个样本.若从编号为1,2,…,10的前10张发票存根中随机抽取一张,然后再按系统抽样的方法依编号顺序逐次产生第二张、第三张、第四张、…,则抽样中产生的第11.(2014•福建模拟)为调查某校学生喜欢数学课的人数比例,采用如下调查方法:(1)在该校中随机抽取100名学生,并编号为1,2,3, (100)(2)在箱内放置两个白球和三个红球,让抽取的100名学生分别从箱中随机摸出一球,记住其颜色并放回;(3)请下列两类学生举手:(ⅰ)摸到白球且号数为偶数的学生;(ⅱ)摸到红球且不喜欢数学课的学生.,摸到白球的概率为=0.4×0.4=2013.(2014•安徽模拟)在样本的频率分布直方图中,共有11个小长方形,若中间一个长方形的面积等于其他十个小长方形面积的和的,且样本容量是160,则中间一组的频数为()14.(2014•江西模拟)在样本的频率分布直方图中,一共有m(m≥3)个小矩形,第3个小矩形的面积等于其余m ﹣1个小矩形面积之和的,且样本容量为100,则第3组的频数是()15.(2014•许昌二模)在抽查产品尺寸的过程中,将尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组C D,列出方程求出∴∴=16.(2014•锦州二模)学校为了解学生在课外读物方面的支出情况,抽取了n个同学进行调查,结果显示这些同学的支出都在[10,50)(单位:元),其中支出在[30,50)(单位:元)的同学有67人,其频率分布直方图如图所示,则n的值为()根据频率计算公式,可得=0.6717.(2014•浙江二模)如图是某班50位学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90)[90,100),则图中x的值等于()0.048C18.(2013•临汾模拟)某一个班全体学生参加物理测试,成绩的频率分布直方图如图,则该班的平均分估计是()二.解答题(共12小题)19.(2014•广东)随机观测生产某种零件的某工作厂25名工人的日加工零件个数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.为事件,的概率为=,),的概率为.20.(2014•凉州区二模)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:(Ⅱ)已知用B配方生成的一件产品的利润y(单位:元)与其质量指标值t的关系式为y=从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)配方生产的产品中优质的频率为配方生产的产品中优质品的频率为21.(2014•安徽)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联附:K2=.×=90≈22.(2014•辽宁)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表”;(Ⅱ)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:X2=人,共有名喜欢甜品,有=3人喜欢甜品的概率23.(2014•烟台三模)某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果从中任取2人,求至少有1人的学历为研究生的概率;(Ⅱ)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值.∴人的教育程度为研究生的概率为)解:依题意得:∴24.(2014•肇庆二模)为考察高中生的性别与是否喜欢数学课程之间的关系,在我市某普通中学高中生中随机抽取”?(2)若采用分层抽样的方法从不喜欢数学课的学生中随机抽取5人,则男生和女生抽取的人数分别是多少?(3)从(2)随机抽取的5人中再随机抽取3人,该3人中女生的人数记为ξ,求ξ的数学期望.)∵)男生抽取的人数有:(人)∵,,1 2 3的数学期望为25.(2014•仙游县模拟)如图所示是预测到的某地5月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择5月1日至5月13日中的某一天到达该市,并停留2天.(Ⅰ)求此人到达当日空气重度污染的概率;(Ⅱ)求此人在该市停留期间只有1天空气质量优良的概率;(Ⅲ)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)…=26.(2014•唐山二模)某种水果的单个质量在500g以上视为特等品随机抽取1000个水果.结果有50个特等品.将这50个水果的质量数据分组,得到所示的频率分布表.(Ⅰ)估计该水果的质量不少于560g的概率;,结合表格易得所要求的数据;=,解出+=0.16+0.04=0.2,解得27.(2014•遵义二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为酒后驾车;当Q>80时,为醉酒驾车.济南市公安局交通管理部门于2011年2月的某天晚上8点至11点在市区设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图,为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(1)求此次拦查中醉酒驾车的人数;(2)从违法驾车的60人中按酒后驾车和醉酒驾车利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取3人,求3人中含有醉酒驾车人数x的分布列和期望.===28.(2014•河南一模)某企业员工500人参加“学雷锋”志愿活动,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(Ⅱ)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(Ⅱ)的前提下,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.29.(2014•大港区二模)某市为增强市民的环境保护意识,面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示.(1)若从第3,4,5组中用分层抽样的方法抽取6名志愿者参广场的宣传活动,应从第3,4,5组各抽取多少名志愿者?(2)在(1)的条件下,该县决定在这6名志愿者中随机抽取2名志愿者介绍宣传经验,求第4组至少有一名志愿者被抽中的概率.,=.30.(2014•太原二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为“酒后驾车”;当Q>80时,为“醉酒驾车”某市公安局交通管理部门于2013年11月的某天晚上8点至11点在该市区解放路某处设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(Ⅰ)求此次拦查中“醉酒驾车”的人数;(Ⅱ)从违法驾车的60人中按“酒后驾车”和“醉酒驾车”利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取2人,求2人中其中1人为“酒后驾车”另1人为“醉酒驾车”的概率.种,。
一、选择题1.某人射击一次命中目标的概率为12,且每次射击相互独立,则此人射击 7次,有4次命中且恰有3次连续命中的概率为( ) A .3761()2CB .2741()2AC .2741()2CD .1741()2C2.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22⨯列联表,则至少有( )的把握认为喜爱打篮球与性别有关.附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.A .99.9%B .99.5%C .99%D .97.5%3.某市通过随机询问100名不同年级的学生是否能做到“扶跌倒老人”,得到如下列联表:则下列结论正确的是( ) 附参照表:参考公式:22()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++A .在犯错误的概率不超过90%的前提下,认为“学生能否做到‘扶跌倒老人’与年级高低有关”B .在犯错误的概率不超过1%的前提下,“学生能否做到‘扶跌倒老人’与年级高低无关”C .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低有关”D .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低无关”4.甲、乙两名同学参加2018年高考,根据高三年级一年来的各种大、中、小型数学模拟考试总结出来的数据显示,甲、乙两人能考140分以上的概率分别为12和45,甲、乙两人是否考140分以上相互独立,则预估这两个人在2018年高考中恰有一人数学考140 分以上的概率为( ) A .12B .23C .34D .135.已知12P(B|A)=,P(A)=35,则()P AB 等于( ) A .56B .910 C .215D .1156.甲罐中有5个红球,2个白球和3个黑球,乙罐中有6个红球,2个白球和2个黑球,先从甲罐中随机取出一个球放入乙罐,分别以1A ,2A ,3A 表示由甲罐取出的球是红球、白球和黑球的事件,再从乙罐中随机取出一个球,以B 表示由乙罐取出的球是红球的事件,下列结论中不正确...的是( ) A .事件B 与事件1A 不相互独立 B .1A 、2A 、3A 是两两互斥的事件 C .17(|)11P B A =D .3()5P B =7.甲、乙两人抢答竞赛题,甲答对的概率为15,乙答对的概率为14,则两人中恰有一人答对的概率为 A .720B .12 20C .120D .2208.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由22()()()()()n ad bc K a b c d a c b d -=++++并参照附表,得到的正确结论是( )A .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C .有99.9%的把握认为“爱好游泳运动与性别有关”D .有99.9%的把握认为“爱好游泳运动与性别无关”9.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如右表,则下列说法正确的是( )使用智能手机 不使用智能手机 总计 学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 总计201030参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:20()P K k ≥0.10 0.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828A .有99.9%的把握认为使用智能手机对学习有影响.B .有99.9%的把握认为使用智能手机对学习无影响.C .在犯错误的概率不超过0.005的前提下认为使用智能手机对学习有影响.D .在犯错误的概率不超过0.005的前提下认为使用智能手机对学习无影响. 10.下面是22⨯列联表:则表中a b,的值分别为()A.84,60 B.42,64 C.42, 74 D.74, 4211.下列结论中正确的是()A.若两个变量的线性关系性越强,则相关系数的绝对值越接近于0B.回归直线至少经过样本数据中的一个点C.独立性检验得到的结论一定正确D.利用随机变量2x来判断“两个独立事件,X Y的关系”时,算出的2x值越大,判断“,X Y 有关”的把握越大12.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()参考公式附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:A.130 B.190 C.240 D.250二、填空题13.有甲、乙两台机床生产某种零件,甲获得正品乙不是正品的概率为14,乙获得正品甲不是正品的概率为16,且每台获得正品的概率均大于12,则甲乙同时生产这种零件,至少一台获得正品的概率是___________.14.从包括甲乙两人的6名学生中选出3人作为代表,记事件A:甲被选为代表,事件B:乙没有被选为代表,则()P B A │等于_________. 15.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.16.在10个形状大小均相同的球中有4个红球和6个白球,不放回地依次摸出2个球,在第1次摸出红球的条件下,第2次也摸出红球的概率为_________. 17.已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.18.某团队派遣甲、乙、丙、丁四人分别完成一项任务,已知甲完成任务的概率为14,乙完成任务的概率为12,丙、丁完成任务的概率均为23,若四人完成任务与否相互独立,则至少2人完成任务的概率为____.19.现有A ,B 两队参加关于“十九大”知识问答竞赛,每队3人,每人回答一个问题,答对者为本队赢1分,答错得0分;A 队中每人答对的概率均为23,B 队中3人答对的概率分别为23,23,13,且各答题人答题正确与否之间互不影响,若事件M 表示“A 队得2分”,事件N 表示“B 队得1分”,则()P MN =______.20.某校为了解家长对学校食堂的满意情况,分别从高一、高二年级随机抽取了20位家长的满意度评分,其频数分布表如下:假设两个年级家长的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率.现从高一、高二年级各随机抽取1名家长,记事件A:“高一家长的满意度等级高于高二家长的满意度等级”,则事件A发生的概率为__________.三、解答题21.随着生活质量的提升,家庭轿车保有量逐年递增.方便之余却加剧了交通拥堵和环保问题.绿色出行引领时尚,共享单车进驻城市黄泽市有统计数据显示.2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年齡分为“年轻人”(20岁~391岁)和“非年轻人”( 19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的经常使用共享单车的称为“单车族”.使用次数为5次或不足5次的称为“非单车族”.已知在“单车族”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为400的样本,请你根据图表中的数据,补全下列22列联表,并判断是否有95%的把握认为经常使用共享单车与年龄有关?使用共享单车情况与年龄列联表是“非年轻人”的人数为随机变量,X 求X 的分布列与期望. 参考数据:独立性检验界值表其中,()()()()()2,n ad bc n a b c d K a b c d a c b d -=+++=++++(注:保留三位小数). 22.奶茶是年轻人非常喜欢的饮品.某机构对于奶茶的消费情况在一商圈附近做了一些调查,发现女性喜欢奶茶的人数明显高于男性,每月喝奶茶的次数也比男性高,但单次奶茶消费金额男性似乎明显高于女性.针对每月奶茶消费是否超过百元进行调查,已知在调查的200人中女性人数是男性人数的4倍,统计如下:22⨯关?(2)在月消费超百元的调查者中,同时进行对于品牌喜好的调查.发现喜欢A 品牌的男女均为3人,现从喜欢A 品牌的这6人中抽取2人送纪念品,求这两人恰好都是女性的概率. 附:()()()()()22n ad bc K a b c d a c b d -=++++. 23.某工厂A ,B 两条相互独立的生产线生产同款产品,在产量一样的情况下,通过日常监控得知,A ,B 生产线生产的产品为合格品的概率分别为p 和21(0.51)p p -.(1)从A ,B 生产线上各抽检一件产品,若使得产品至少有一件合格的概率不低于99.5%,求p 的最小值0p ;(2)假设不合格的产品均可进行返工修复为合格品,以(1)中确定的0p 作为p 的值. ①已知A ,B 生产线的不合格品返工后每件产品可分别挽回损失5元和3元,若从两条生产线上各随机抽检1000件产品,以挽回损失的平均数为判断依据,估计哪条生产线的挽回损失较多?②若最终的合格品(包括返工修复后的合格品)按照一、二、三等级分类后,每件可分别获利10元、8元、6元,现从A ,B 生产线的最终合格品中各随机抽取100件进行分级检测,结果统计如图所示,用样本的频率分布估计总体分布,记该工厂生产一件产品的利润为X ,求X 的分布列并估计该厂产量2000件时利润的期望值.24.某小区停车场的收费标准为:每车每次停车时间不超过2小时免费,超过2小时的部分每小时收费1元(不足1小时的部分按1小时计算).现有甲乙两人独立来停车场停车(各停车一次),且两人停车时间均不超过5小时,设甲、乙两人停车时间(小时)与取车概率如表所示: 停车时间 取车概率 停车人员 (0,2](2,3](3,4](4,5]甲12xxx乙1613y(1)求甲、乙两人所付车费相同的概率;(2)设甲、乙两人所付停车费之和为随机变量ξ,求ξ的分布列和数学期望()E ξ. 25.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量()g y 与尺寸(mm)x 之间近似满足关系式b y c x =⋅(b ,c 为大于0的常数).按照某指标测定,当产品质量与尺寸的比在区间(0.302,0.388)内时为优等品.现随机抽取6件合格产品,测得数据如下:(1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率; (2)根据测得数据作了初步处理,得相关统计量的值如下表:根据所给统计量,求y 关于x 的回归方程. 附:对于样本(),(1,2,,6)i i v u i =,其回归直线u b v a =⋅+的斜率和截距的最小二乘法估计公式分别为:()()()1122211ˆnniii i i i nniii i v v u u v u nvubv v vnv ====---==--∑∑∑∑,ˆˆa u bv=-, 2.7183e ≈. 26.贝诺酯为对乙酰氨基酚与阿司匹林的酯化产物,是一种新型的抗炎、抗风湿、解热镇痛药,主要用于类风湿关节炎、急慢性风湿性关节炎、神经痛及术后疼痛.药监部门要利用小白鼠扭体实验,对某厂生产的该药品的镇痛效果进行检测,若用药后的小白鼠扭体次数没有减少,扭体时间间隔没有变长,则认定镇痛效果不明显. (1)若该药品对雌性小白鼠镇痛效果明显的概率为23,对雄性小白鼠镇痛效果明显的概率为45,药监部门要利用两只雌性和两只雄性小白鼠检测该药药效,对4只小白鼠逐一检测.若在检测过程中,一只小白鼠用药后镇痛效果明显,记录积分为1,镇痛效果不明显,则记录积分为1-.用随机变量X 表示检测4只小白鼠后的总积分,求随机变量X 的分布列和数学期望()E X ;(2)若该药品对每只雌性小白鼠镇痛效果明显的概率均为p ,现对6只雌性小白鼠逐一进行检测,当检测到镇痛效果不明显的小白鼠时,停止检测.设至少检测5只雌性小白鼠才能发现镇痛效果不明显的概率为()f p ,求()f p 最大时p 的值.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】由于射击一次命中目标的概率为12,所以关键先求出射击7次有4次命中且恰有3次连续命中的所有可能数,即根据独立事件概率公式得结果. 【详解】因为射击7次有4次命中且恰有3次连续命中有24A 种情况,所以所求概率为7241A 2⎛⎫⋅ ⎪⎝⎭.选B. 【点睛】本题考查排列组合以及独立事件概率公式,考查基本分析求解能力,属中档题.2.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.3.C解析:C 【解析】分析:根据列联表中数据,利用公式求得2 3.03K ≈,参照临界值表即可得到正确结论. 详解:由公式()()()()()22n d bc k a b c d a c b d -=++++可得2 3.03K ≈,参照临界值表,2.7063.030 3.841<<,∴0090以上的把握认为,“学生能否做到‘扶跌倒老人’与年级高低有关”,故选C.点睛:本题考查了独立性检验的应用,属于基础题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.4.A解析:A 【解析】分析:根据互斥事件概率加法公式以及独立事件概率乘积公式求概率.详解:因为这两个人在2018年高考中恰有一人数学考140 分以上的概率为甲考140 分以上乙未考到140 分以上事件概率与乙考140 分以上甲未考到140 分以上事件概率的和,而 甲考140 分以上乙未考到140 分以上事件概率为14(1)25⨯-,乙考140 分以上甲未考到140 分以上事件概率为14(1)25-⨯,因此,所求概率为14(1)25⨯-1451(1)25102+-⨯==, 选A.点睛:本题考查互斥事件概率加法公式以及独立事件概率乘积公式,考查基本求解能力.5.C解析:C 【解析】分析:根据条件概率的计算公式,即可求解答案. 详解:由题意,根据条件概率的计算公式()()|()P AB P B A P A =, 则()()()122|3515P AB P B A P A =⋅=⨯=,故选C. 点睛:本题主要考查了条件概率的计算公式的应用,其中熟记条件概率的计算公式是解答的关键,着重考查了推理与运算能力.6.D解析:D 【解析】分析:由题意1A ,2A ,3A是两两互斥事件,条件概率公式求出1(|)P B A ,()()()()123P B P A B P A B P A B =++,对照选项即可求出答案.详解:由题意1A ,2A ,3A是两两互斥事件, ()()()12351213,,10210510P A P A P A =====, ()()()111177211|1112P BA P B A P A ⨯===,()23|11P B A =,()33|11P B A =,而()()()()123P B P A B P A B P A B =++()()()()()()112233|||P A P B A P A P B A P A P B A =++1713332115111011=⨯+⨯+⨯ 511=. 所以D 不正确. 故选:D.点睛:本题考查相互独立事件,解题的关键是理解题设中的各个事件,且熟练掌握相互独立事件的概率简洁公式,条件概率的求法,本题较复杂,正确理解事件的内蕴是解题的关键.7.A解析:A 【解析】第一种:甲答对,乙答错,此时概率为11315420⎛⎫⨯-=⎪⎝⎭;第二种:甲答错,乙答对,此时的概率为11415420⎛⎫-⨯= ⎪⎝⎭. 综上,两人中恰有一人答对的概率为347202020+=. 故选A.8.A解析:A 【解析】()()()()()22n ad bc K a b c d a c b d -=++++2110(1200400)7.82 6.63560506050-=≈>⨯⨯⨯所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”,选A.9.C解析:C 【解析】 经计算,()2230421681020101218K ⨯-⨯==⨯⨯⨯,27.87910.828K <<,对照数表知,在犯错误的概率不超过0.005的前提下认为使用智能手机对学习有影响,故选C .点睛:本题考查了独立性检验的应用问题,是基础题;其解题步骤为:(1)认真读题,取出相关数据,作出22⨯列联表;(2)根据22⨯列联表中的数据,计算2K 的观测值k ;(3)通过观测值k 与临界值0k 比较,得出事件有关的可能性大小.10.B解析:B 【解析】因2163a +=,故42a =,又22a b +=,则64b = ,应选答案B 。
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
一、选择题1.如图是九江市2019年4月至2020年3月每月最低气温与最高气温(℃)的折线统计图:已知每月最低气温与最高气温的线性相关系数r =0.83,则下列结论错误的是( )A .每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关B .月温差(月最高气温﹣月最低气温)的最大值出现在10月C .9﹣12月的月温差相对于5﹣8月,波动性更大D .每月最高气温与最低气温的平均值在前6个月逐月增加2.甲、乙两人进行乒乓球比赛,假设每局比赛甲胜的概率是0.6,乙胜的概率是0.4.那么采用5局3胜制还是7局4胜制对乙更有利?( ) A .5局3胜制B .7局4胜制C .都一样D .说不清楚3.变量X 与Y 相对应的一组数据为(10 , 1),(11.3 , 2),(11.8 , 3),(12.5 , 4),(13 , 5);变量U 与V 相对应的一组数据为(10 , 5),(11.3 , 4),(11.8 , 3),(12.5 , 2),(13 , 1).1r 表示变量Y X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则( )A .120r r <<B .210r r <<C .210r r <<D .21r r =4.某射手射击一次命中的概率为0.8,连续两次射击均命中的概率是0.6,已知该射击手某次射中,则随后一次射中的概率是( ) A .34B .45C .35D .7105.从混有4张假钞的10张一百元纸币中任意抽取3张,若其中一张是假币的条件下,另外两张都是真币的概率为( ) A .512B .58C .35 D .126.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样 7.根据如下样本数据:得到回归方程 1.412.ˆ4yx =-+,则 A .5a =B .变量x 与y 线性正相关C .当x =11时,可以确定y =3D .变量x 与y 之间是函数关系 8.下面是22⨯列联表:则表中a b ,的值分别为( ) A .84,60B .42,64C .42, 74D .74, 429.下列结论中正确的是( )A .若两个变量的线性关系性越强,则相关系数的绝对值越接近于0B .回归直线至少经过样本数据中的一个点C .独立性检验得到的结论一定正确D .利用随机变量2x 来判断“两个独立事件,X Y 的关系”时,算出的2x 值越大,判断“,X Y 有关”的把握越大 10.已知()112P A =,()136P AB =,()512P B =,则()P B A 为( ) A .12 B .13C .115D .1511.把一枚硬币任意掷两次,事件A=“第一次出现正面”,事件B=“第二次出现正面”,则P (B/A )=( ) A .14B .13C .12D .2312.甲、乙两人同时报考某一所大学,甲被录取的概率为0.6,乙被录取的概率为0.7,两人是否被录取互不影响,则其中至少有一人被录取的概率为( )A.0.12 B.0.42 C.0.46 D.0.88二、填空题13.国产杀毒软件进行比赛,每个软件进行四轮考核,每轮考核中能够准确对病毒进行查杀的进入下一轮考核,否则被淘汰.已知某个软件在四轮考核中能够准确杀毒的概率依次是5 6,35,34,13,且各轮考核能否通过互不影响.则该软件至多进入第三轮考核的概率为______.14.某人抛掷一枚均匀骰子,构造数列{}n a,使1,()1,()nnan⎧=⎨-⎩当第次掷出偶数当第次掷出奇数,记12n nS a a a=+++,则2S≠且82S=的概率为_____.15.甲、乙两人参加一次英语口语考试,已知在备选的10道试题中,甲能答对其中的6道,乙能答对其中的8道,规定每次考试都从备选题中随机抽出3道题进行测试,至少答对2道题才算合格,则甲、乙两人至少有一人考试合格的概率为________.16.有如下四个命题:①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44.②相关系数0.83r=-,表明两个变量的相关性较弱.③若由一个2⨯2列联表中的数据计算得2K的观测值 4.103k≈,那么有95%的把握认为两个变量有关.④用最小二乘法求出一组数据(,),(1,,)i ix y i n=的回归直线方程ˆˆˆy bx a=+后要进行残差分析,相应于数据(,),(1,,)i ix y i n=的残差是指()ˆˆˆi i ie y bx a=-+.以上命题“错误”的序号是_________________17.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56y x=-,数据列表是:则其中的数据a=__________.18.体育课上定点投篮项目测试规则:每位同学有3次投篮机会,一旦投中,则停止投篮,视为合格,否则一直投3次为止.每次投中与否相互独立,某同学一次投篮投中的概率为p,若该同学本次测试合格的概率为0.784,则p=_____.19.以下说法正确的是_____________ .①类比推理属于演绎推理.②设有一个回归方程ˆ23y x=-,当变量每增加1个单位,y平均增加3个单位.③样本相关系数r 满足以下性质:1r ≤,并且r 越接近1,线性相关程度越强;r 越接近0,线性相关程度越弱.④对复数12,z z 和自然数n 有()1212nn n z z z z ⋅=⋅.20.如图所示,在边长为1的正方形OABC 内任取一点P ,用A 表示事件“点P 恰好取自由曲线y x =与直线1x =及x 轴所围成的曲边梯形内”, B 表示事件“点P 恰好取自阴影部分内”,则(|)P B A =_________.三、解答题21.中国探月工程自2004年立项以来,聚焦“自主创新、重点跨越、支撑发展、引领未来”的目标,创造了许多项中国首次.2020年12月17日凌晨,嫦娥五号返回器携带“月壤”着陆地球,又首次实现了我国地外天体无人采样返回.为了了解某中学高三学生对此新闻事件的关注程度,从该校高三学生中随机抽取了100名学生进行调查,调查结果如下面22⨯列联表.关注 没关注 合计男 30女 3040合计22⨯与性别有关”?(2)现在从这100名学生中按性别采取分层抽样的方法抽取5名学生,如果再从中随机选取2人进行有关“嫦娥五号”情况的宣讲,求选取的2名学生中恰有1名女生的概率.若将频率视为概率. 附:()20P K k ≥0.150 0.100 0.050 0.010 0.0050k 2.0722.7063.841 6.635 7.879()()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++22.2020年10月份黄山市某开发区一企业顺利开工复产,该企业生产不同规格的一种产品,根据检测标准,其合格产品的质量y (单位:g )与尺寸x (单位:mm )之间近似满足关系式b y c x =⋅(b 、c 为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间,97e e ⎛⎫⎪⎝⎭内时为优等品.现随机抽取6件合格产品,测得数据如下:(1)现从抽取的6件合格产品中再任选3件,记为取到优等品的件数试求随机变量的分布列和期望;(2)根据测得数据作了初步处理,得相关统计量的值如下表:②已知优等品的收益z (单位:千元)与x ,y 的关系为20.32z y x =-,则当优等品的尺寸x 为何值时,收益z 的预报值最大?(精确到0.1) 附:对于样本(),(1,2,,)i i v u i n =,其回归直线u b v a =⋅+的斜率和截距的最小二乘估计公式分别为:()()()1122211ˆnniii i i i nni ii i v v u u v u nvubv v vnv====---==--∑∑∑∑,ˆˆa u bv=-, 2.7182e ≈. 23.2020年11月某市进行了高中各年级学生的“国家体质健康测试”.现有1500名(男生1200名,女生300名)学生的测试成绩,根据性别按分层抽样的方法抽取100名学生进行分析,得到如下统计图表: 男生测试情况:(1)现从抽取的100名且测试成绩为优秀的学生中随机挑选两名学生,求选出的这两名学生恰好是一男一女的概率;(2)若测试成绩为良好或优秀的学生为“体育达人”,其他成绩的学生(含病残等免试学生)为“非体育达人”.根据以上统计数据填写下面的列联表,并回答能否在犯错误的概率不超过0.01的前提下认为“是否为体育达人与性别有关?”男性 女性 总计体育达人 非体育达人 总计()20P K k ≥0.10 0.05 0.025 0.010 0.0050k2.7063.841 5.024 6.635 7.879附:22(),()()()()n ad bc K n a b c d a b c d a c b d ⎛⎫-==+++ ⎪++++⎝⎭24.在一次抽样调查中测得5个样本点,得到下表及散点图.x0.250.51 2 4 y1612521(1)根据散点图判断y a bx =+与1y c k x -=+⋅哪一个适宜作为y 关于x 的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果试建立y 与x 的回归方程;(计算结果保留整数) (3)在(2)的条件下,设=+z y x 且[)4,x ∈+∞,试求z 的最小值.参考公式:回归方程ˆˆˆy bx a =+中,()()()1122211ˆn niii ii i nniii i x x y y x y nx ybx x xnx====---==--∑∑∑∑,a y bx =-.25.某小区停车场的收费标准为:每车每次停车时间不超过2小时免费,超过2小时的部分每小时收费1元(不足1小时的部分按1小时计算).现有甲乙两人独立来停车场停车(各停车一次),且两人停车时间均不超过5小时,设甲、乙两人停车时间(小时)与取车概率如表所示:(1)求甲、乙两人所付车费相同的概率;(2)设甲、乙两人所付停车费之和为随机变量ξ,求ξ的分布列和数学期望()E ξ. 26.自然资源部门对某市饮用水厂中的地下水质量进行监测,随机抽查了100眼水井进行监测,得到溶解性总固体浓度(单位:mg L )和硫酸盐浓度(单位:mg L )的分布如下表:(1)估计事件“该市某一水井中溶解性总固体浓度不超过500,且硫酸盐浓度不超过150”的概率;(2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市水井中溶解性总固体浓度与硫酸盐浓度有关?附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D【分析】根据相关系数的性质判断A;根据所给折线图,对B,C,D逐项进行判断.【详解】每月最低气温与最高气温的线性相关系数r=0.83,比较接近于1,则每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关,则A正确;由所给的折线图可以看出月温差(月最高气温﹣月最低气温)的最大值出现在10月,则B 正确;5﹣8月的月温差分别为18,17,16,16,9﹣12月的月温差分别为20,31,24,21,则9﹣12月的月温差相对于5﹣8月,波动性更大,C正确;每月的最高气温与最低气温的平均值在前5个月逐月增加,第六个月开始减少,所以A正确,则D错误;故选:D【点睛】本题主要考查了根据折线图解决实际问题以及相关系数的性质的应用,对于相关系数r ,r 越接近于1,两个变量的线性相关程度越强,属于中档题. 2.A解析:A 【分析】分别计算出乙在5局3胜制和7局4胜制情形下对应的概率,然后进行比较即可得出答案. 【详解】当采用5局3胜制时,乙可以3:0,3:1,3:2战胜甲,故乙获胜的概率为:322222340.4+0.40.60.40.40.60.40.3174C C ⨯⨯+⨯⨯≈;当采用7局4胜制时,乙可以4:0,4:1,4:2,4:3战胜甲,故乙获胜的概率为:4333323334560.4+0.40.60.40.40.60.4+0.40.60.40.2898C C C ⨯⨯+⨯⨯⨯⨯≈,显然采用5局3胜制对乙更有利,故选A. 【点睛】本题主要考查相互独立事件同时发生的概率,意在考查学生的计算能力和分析能力,难度中等.3.C解析:C 【分析】求出1r ,2r ,进行比较即可得到结果 【详解】变量X 与Y 相对应的一组数据为()()()()()10111.3211.8312.54135,,,,,,,,,()1011.311.812.513511.72X ∴=++++÷=()1234553Y =++++÷=即17.20.375519.172r ==变量U 与V 相对应的一组数据为()()()()()10511.3411.8312.52131,,,,,,,,,1234535U ++++==∴这一组数据的相关系数20.3755r =-则第一组数据的相关系数大于0,第二组数据的相关系数小于0 则210r r << 故选C 【点睛】本题主要考查的是变量的相关性,属于基础题.4.A解析:A 【解析】分析:某次射中,设随后一次射中的概率为p ,利用相互独立事件概率乘法公式能求出p 的值.详解:某次射中,设随后一次射中的概率为p ,∵某射击手射击一次命中的概率为0.8,连续两次均射中的概率是0.5,0.80.6p ,∴= 解得34p =.故选:A .点睛:本题考查概率的求法,涉及到相互独立事件概率乘法公式的合理运用,考查推理论证能力、运算求解能力、数据处理能力,考查化归与转化思想,是基础题.5.A解析:A 【解析】分析:直接利用条件概率公式求解.详解:由条件概率公式得26291553612C P C ===.故答案为A 点睛:(1)本题主要考查条件概率,意在考查学生对条件概率的掌握水平.(2) 条件概率一般有“在A 已发生的条件下”这样的关键词,表明这个条件已经发生, 发生了才能称为条件概率.但是有时也没有,要靠自己利用条件概率的定义识别.6.A解析:A 【解析】在A 中,设随机变量X 服从正态分布N (10,0.01),则由正态分布性质得1(10)2P X >=,故A 正确; 在B 中,线性回归直线一定过样本中心点(),x y ,故B 错误;在C 中,若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故C 错误;在D 中,先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是系统抽样法,故D 错误. 故选:A7.A解析:A 【解析】 由题意可得:357964x +++==,6321144a ay ++++==,回归方程过样本中心点,则:11 1.4612.44a+=-⨯+, 求解关于实数a 的方程可得:5a =,由 1.40ˆb=-<可知变量x 与y 线性负相关; 当x =11时,无法确定y 的值;变量x 与y 之间是相关关系,不是函数关系. 本题选择A 选项.点睛:一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.8.B解析:B 【解析】因2163a +=,故42a =,又22a b +=,则64b = ,应选答案B 。
高中统计案例试题及答案一、选择题1. 以下哪个选项是描述数据集中趋势的统计量?A. 方差B. 标准差C. 平均数D. 极差答案:C2. 一组数据的中位数是所有数据排序后位于中间位置的数值,如果数据个数为奇数,则中位数是:A. 第一个数据B. 最后一个数据C. 位于中间位置的数值D. 无法确定答案:C3. 以下哪个统计图适合展示时间序列数据的变化趋势?A. 条形图B. 饼图C. 折线图D. 散点图答案:C二、填空题4. 某班级有30名学生,他们的数学成绩分别为:70, 85, 90, 75, 95, 80, 85, 70, 80, 90, 85, 95, 75, 70, 80, 90, 85, 95, 75, 70, 80, 85, 90, 95, 75。
这组数据的平均数是____。
答案:825. 如果一组数据的方差是25,那么它的标准差是____。
答案:5三、简答题6. 描述统计学中的“样本”和“总体”的概念,并举例说明。
答案:在统计学中,“总体”指的是研究对象的全体,而“样本”是从总体中随机抽取的一部分个体。
例如,如果我们想要了解全国高中生的数学成绩水平,全国所有高中生的数学成绩就是总体,而如果我们随机抽取了1000名高中生的数学成绩进行研究,这1000名高中生的数学成绩就是我们的样本。
四、计算题7. 某工厂生产了一批零件,其长度的测量数据如下:20, 22, 21, 23, 20, 21, 22, 21, 22, 23。
请计算这组数据的平均数、中位数、方差和标准差。
答案:平均数 = (20+22+21+23+20+21+22+21+22+23) / 10 = 21.5中位数 = (21+22) / 2 = 21.5方差 = [(20-21.5)² + (22-21.5)² + ... + (23-21.5)²] / 10 = 1.65标准差= √1.65 ≈ 1.29结束语:通过上述试题及答案,我们可以看出,统计学是一门应用广泛的学科,它可以帮助我们更好地理解和分析数据。
一、选择题1.已知x 与y 之间的几组数据如下表:参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()niix x y y r --=∑上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.下列说法错误..的是( ) A .10xy ≠是5x ≠或2y ≠的充分不必要条件B .若命题p :x R ∀∈,210x x ++≠,则p ⌝:x R ∃∈,210x x ++=C .已知随机变量()2~2,X N σ,且()40.84P X ≤=,则()00.16P X ≤=D .相关系数r 越接近1,表示线性相关程度越弱. 3.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值4.对于独立性检验,下列说法正确的是( ) A .2 3.841K >时,有95%的把握说事件A 与B 无关 B .2 6.635K >时,有99%的把握说事件A 与B 有关 C .2 3.841K ≤时,有95%的把握说事件A 与B 有关 D .2 6.635K >时,有99%的把握说事件A 与B 无关 5.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .16.对四对变量Y 和x 进行线性相关性检验,已知n 是观测值组数,r 是相关系数,且已知: ①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.995 0,则变量Y 和x 具有线性相关关系的是( ) A .①和② B .①和③ C .②和④D .③和④7.给出下列说法:①用()()221211ˆni i i n i i i y y R y y ==-=--∑∑刻画回归效果,当2R 越大时,模型的拟合效果越差,反之则越好;②归纳推理是由特殊到一般的推理,而演绎推移则是由一般到特殊的推理;③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”;④设有一个回归方程ˆ35yx =+,变量x 增加1个单位时,y 平均增加5个单位;⑤线性回归方程ˆˆˆy bx a =+必过点(),x y .其中错误的个数有( )A .0个B .1个C .2个D .3个8.为了普及环保知识,增强环保意识,某大学从理工类专业的A 班和文史类专业的B 班各抽取20名同学参加环保知识测试,统计得到成绩与专业的列联表:( )附:参考公式及数据:(1)统计量:()()()()()22n ad bcKa b c d a c b d-=++++,(n a b c d=+++).(2)独立性检验的临界值表:则下列说法正确的是A.有95%的把握认为环保知识测试成绩与专业有关B.有95%的把握认为环保知识测试成绩与专业无关C.有99%的把握认为环保知识测试成绩与专业有关D.有99%的把握认为环保知识测试成绩与专业无关9.通过随机询问250名不同性别的高中生在购买食物时是否看营养说明书,得到如下列联表:从调查的结果分析,认为性别和读营养说明书的关系为()附:()()()()()22n ad bc K a b c d a c b d -=++++ . A .95%以上认为无关 B .90%~95%认为有关 C .95%~99.9%认为有关D .99.9%以上认为有关10.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系: x 2 4 5 6 8 y3040605070y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .1011.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关 12.有下列数据: x123y35.9912.01下列四个函数中,模拟效果最好的为( ) A .B .C .D .二、填空题13.对相关系数r ,①r 越大,线性相关程度越大; ②r 越小,线性相关程度越大;③|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大; ④|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小 以上说法中,正确说法的序号是__________.14. 2.5PM 是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据某地某日早7点至晚8点甲、乙两个 2.5PM 监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_________.15.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表由表中数据,得回归直线方程ˆˆˆy bx a =+,若ˆ2b=-,则ˆa =________. 16.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过______(填百分比)的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.17.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 18.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上)19.给出下列四个结论:(1)相关系数r的取值范围是1r<;(2)用相关系数r来刻画回归效果,r的值越大,说明模型的拟合效果越差;(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;(4) 一个篮球运动员投篮一次得3分的概率为a,得2分的概率为b,不得分的概率为c,且(),,0,1a b c∈,已知他投篮一次得分的数学期望为2,则213a b+的最小值为163.其中正确结论的序号为______________.20.为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:礼让斑马线行人不礼让斑马线行人男性司机人数4015女性司机人数2025若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()11221221 21212n n n n nn n n nχ++++-=三、解答题21.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值;(2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bcKa b c d a c b d-=++++.(其中n a b c d=+++为样本容量)22.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg合计旧养殖法新养殖法合计(2)在新养殖法养殖的网箱中,按照分层抽样的方法从箱产量少于50kg和不少于50kg的网箱中随机抽取5箱,再从中抽取3箱进行研究,这3箱中产量不少于50kg的网箱数为X,求X的分布列和数学期望.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++ ()2P K k ≥ 0.1000.050 0.010 0.005 0.001 k 2.706 3.8416.6357.87910.82823.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A 表示事件“微信支付人数低于50千人”,估计A 的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;()()()()()2n ad bc K a b c d a c b d -=++++.24.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关? (2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X ,若用样本的频率作为概率,求随机变量X 的分布列和期望.附:K 2=2()()()()()n ad bc a b c d a c b d -++++,其中n =a +b +c +d .25.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下列联表,并判断能否在犯错误率不超过0.05的前提下认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育项目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.()2P K k≥0.050.01k 3.841 6.63526.为迎接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]得到如图所示的频率分布直方图.(Ⅰ)求a 的值;(Ⅱ)记A 表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A 的概率;(Ⅲ)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成绩低于80分为“非优秀”.请在答题卡上将22⨯列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()4222221 1.50.50.5 1.55i i x x =-=-+-++=∑ , ()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.D解析:D 【分析】A 选项,由“若10xy ≠,则5x ≠或2y ≠”的逆否命题判断充分性,由其否命题判断必要性;由全称命题的否定的概念判断选项B ;由正态分布的性质判断选项C ;由相关系数的概念判断选项D. 【详解】对于选项A,命题“若10xy ≠,则5x ≠或2y ≠”的逆否命题为“若5x =且2x =,则10xy =”,为真命题,而命题“若10xy =,则5x =且2x =”为假命题,所以10xy ≠是5x ≠或2y ≠的充分不必要条件,故A 正确;对于选项B,由全称命题的否定可得p ⌝:x R ∃∈,210x x ++=,故B 正确;对于选项C,由随机变量()2~2,X N σ,且()40.84P X ≤=,则()()()041410.840.16P X P X P X ≤=≥=-≤=-=,故C 正确;对于选项D,相关系数r 越接近1,表示线性相关程度越强,故D 错误, 故选:D 【点睛】本题考查充分不必要条件的判断,考查全称命题的否定,考查正态分布的概率,考查相关系数的概念,熟练掌握各知识点是解题关键.3.B解析:B 【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案. 【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验, 回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析, 综上可知①是独立性检验,②是回归分析,故选B . 【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.4.B解析:B 【分析】根据独立性检验中卡方的概念知,选B. 【详解】根据独立性检验中卡方的概念知,2 6.635K >时,有99%的把握说事件A 与B 有关选B. 【点睛】本题主要考查了独立性检验中卡方的概念,属于中档题.5.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4). 【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.6.B解析:B 【解析】分析:先查相关系数检验的临界值表,再判断变量Y 和x 具有线性相关关系的选项. 详解: 查相关系数检验的临界值表 ①r 0.05=0.754,r >r 0.05; ②r 0.05=0.514,r <r 0.05; ③r 0.05=0.482,r >r 0.05; ④r 0.05=0.997,r 0.05>r.∴y 和x 具有线性相关关系的是①③.故答案为B.点睛:本题主要考查相关系数,意在考查学生对这些知识的掌握水平.7.B解析:B 【解析】分析:①可由相关指数的概念判断;②③由推理,综合法和反证法的概念判断;④和⑤由线性回归分析判断即可.详解:①相关指数2R 越大,则相关性越强,模型的拟合效果越好.错误;② 归纳推理是由特殊到一般的推理,而演绎推理是由一般到特殊的推理,由归纳推理与演绎推理的概念可知正确.③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”,由概念可知正确. ④由回归方程的系数意义知,当变量x 增加1个单位时,y 平均增加5个单位,正确;⑤线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,正确.故选B.点睛:本题是一道综合性考题,即考查了推理与证明的原理,又考查了利用2R 判断模型拟合程度,同时还考查了线性回归分析的相关概念,属于中档题.8.A【解析】分析:首先计算观测值k 0的值,然后给出结论即可. 详解:由列联表计算观测值:()2401413672804.912 3.8412119202057k ⨯⨯-⨯==≈>⨯⨯⨯, 则有95%的把握认为环保知识测试成绩与专业有关. 本题选择A 选项.点睛:本题主要考查独立性检验及其应用等知识,意在考查学生的转化能力和计算求解能力.9.D解析:D 【解析】分析:由列联表中的数据,利用公式()()()()()22n ad bc K a b c d a c b d -=++++求得2K ,与邻界值比较,即可得到结论. 详解:()222509070603021.6310.828120130150100K ⨯⨯-⨯=≈>⨯⨯⨯,∴有0099.9的把握认为性别和读营养说明书的有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)10.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .11.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .12.A【解析】当x=1,2,3时,分别代入求y值,离y最近的值模拟效果最好,可知A模拟效果最好.故选A.考点:非线性回归方程的选择.二、填空题13.④【解析】两个变量之间的相关系数r的绝对值越接近于1表示两个变量的线性相关性越强r的绝对值非常接近于0时表示两个变量之间几乎不存在线性相关故答案为④解析:④【解析】两个变量之间的相关系数,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值非常接近于0时,表示两个变量之间几乎不存在线性相关.故答案为④.14.甲【解析】根据茎叶图中的数据可知甲地的数据都集中在006和007之间数据分布比较稳定而乙地的数据分布比较分散不如甲地数据集中故甲地的方差小故答案为甲解析:甲【解析】根据茎叶图中的数据可知,甲地的数据都集中在0.06和0.07之间,数据分布比较稳定,而乙地的数据分布比较分散,不如甲地数据集中,故甲地的方差小,故答案为甲. 15.【解析】试题分析:由题意得即样本中心点代入回归直线方程得考点:回归直线方程的应用解析:60【解析】试题分析:由题意得18131011542x++-==,24343864404y+++==,即样本中心点15(,40)2,代入回归直线方程,得15402602ˆˆa a=-⨯+⇒=.考点:回归直线方程的应用.16.%【解析】试题分析:所以在犯错误不超过%的前提下认为小动物是否被感染与有没有服用疫苗有关考点:1卡方统计量2统计;【易错点晴】本题主要考查的是统计中的卡方统计量属于容易题解题时一定要注意计算问题很多解析:%【解析】试题分析:,所以在犯错误不超过%的前提下,认为“小动物是否被感染与有没有服用疫苗有关” . 考点:1.卡方统计量,2.统计;【易错点晴】本题主要考查的是统计中的卡方统计量,属于容易题.解题时一定要注意计算问题,很多同学列式正确计算错误,从而不能正确得到结果.另外,学生容易把答案写为%,所以一定要注意本题中的问题是什么,否则很容易出现错误.17.【解析】将代入得所以残差 解析:0.29-【解析】将160x =代入0.85 2.1ˆ87yx =-,得0.8516082.71ˆ53.29y =⨯-=,所以残差5353.ˆ290ˆ.29ey y =-=-=-. 18.(1)(3)(4)【分析】根据相关指数离散型随机变量随机变量的方差和标准差绝对值不等式和相互独立事件相关的知识对五个结论逐一分析由此得出正确结论的序号【详解】对于(1)R2越大模型的拟合效果越好结论解析:(1),(3),(4) 【分析】根据相关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,对五个结论逐一分析,由此得出正确结论的序号. 【详解】对于(1),R 2越大,模型的拟合效果越好,结论正确.对于(2),内径与规定的内径尺寸之差是连续型随机变量,结论错误.对于(3),根据随机变量的方差和标准差的知识可判断出结论正确.对于(4),根据绝对值不等式有22x x a a a -+-≥-≥,所以2a a -≤-或2a a -≥,前者解得1a ≤,后者无解,故a 的最大值为1,结论正确.对于(5),事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是对立事件,不是相互独立事件,结论错误.综上所述,正确结论为(1),(3),(4). 【点睛】本小题主要考查关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,考查分析与解决问题的能力,属于基础题.19.(3)(4)【解析】分析:(1)相关系数的范围;(2)由相关指数r 的含有知|r|的值越大说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2进而利用均值不等式求最解析:(3)(4) 【解析】分析:(1)相关系数的范围;(2)由相关指数r 的含有知,|r|的值越大,说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2,进而利用均值不等式求最值.详解:(1)相关系数r 的取值范围是1r ≤,故(1)错误;(2)用相关指数r 来刻画回归效果,|r|的值越大,说明模型的拟合效果越好,故(2)错误;(3)含零个白球的概率为5210,含一个白球的概率为50210,含二个白球的概率为100210,含三个白球的概率为50210,含四个白球的概率为5210, 白球个数的期望为:550100505012342210210210210210⨯+⨯+⨯+⨯+⨯=,故(3)正确; (4)∵3a+2b+0•c=2,a ,b ,c ∈(0,1), ∴213a b +=(213a b +)•12(3a+2b )=12(6+4b a +a b +23)≥12(203+24b aa b ⋅) =12(203+4)=163(当且仅当a=2b ,即a=12,b=14时取“=”),故(4)正确. 其中正确结论的序号为:(3)(4). 故答案为(3)(4).点睛:本题考查相关系数的有关概念,考查离散型随机变量的期望及概率统计与基本不等式的综合应用,属于中档题.20.【解析】分析:根据题意填写2×2列联表计算观测值对照临界值得出结论详解:填写2×2列联表如下:根据数表计算=≈825>7879所以有995的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的 解析:8.25【解析】分析:根据题意填写2×2列联表,计算观测值,对照临界值得出结论. 详解:填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的一般步骤:(I )根据样本数据制成22⨯列联表;(II )根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(III ) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)三、解答题21.(1)直方图见解析,3360元;(2)列联表见解析,没有95%的把握认为网购金额与网购人年龄有关. 【分析】(1)由频数分布表计算出各组数据的纵坐标(频率除以组距),再做出频率分布直方图, 由频率分布直方图估计平均值的定义可得本市居民此期间网络购物的消费平均值; (2) 根据频数分布表中的数据可知网购金额不超过4000元的有700人,超过4000元的有300人,根据分层抽样可得网购金额不超过4000元需要抽取140人,超过4000元的需要抽取60人,再根据列联表的性质即可完成表格,再根据列联表的数据计算出2K 并与给定的参考表对照得到结论. 【详解】(1)由题可知随机对1000人做问卷调查,消费数据的组距为2000, 可求得频率分布直方图纵轴上每组的数据(频率除以组距), 即3000.0001510002000=⨯,4000.000210002000=⨯,1800.0000910002000=⨯,600.0000310002000=⨯,则[]0,2000,(]2000,4000,(]4000,6000,(]6000,8000,(]8000,10000, 对应的的数据(频率除以组距)分别是0.00015,0.0002,0.00009,0.00003,0.00003, 从而得出频率分布直方图,由频率分布直方图估计平均值的定义,可得10000.330000.450000.1870000.0690000.0630012009004205403360x =⨯+⨯+⨯+⨯+⨯=++++=(元),故本市居民此期间网络购物的消费平均值为3360元; (2)由数据可知以网购金额不超过4000元的有2007001401000⨯=(人), 超过4000元的有200300601000⨯=(人),可得列联表.由()()()()220075356525502.3813.8411406010010021n ad bc K a b c d a c b d -⨯⨯-⨯===≈<++++⨯⨯⨯. 故在此期间没有95%的把握认为网购金额与网购人年龄有关. 【点睛】本题第一问考查了平均数的计算、画出频率分布直方图,其中主要是计算出纵坐标的值(频率除以组距)属于常见题型,第二问主要考查完善列联表,2K 的计算,属于中档题目,解题中对计算能力要求较高.22.(1)列联表见解析,有把握;(2)分布列见解析,1.8. 【分析】(1)完成列联表求出2K ,从而有99%的把握认为箱产量与养殖方法有关.(2)推导出X 的可能取值为1,2,3,分别求出相应的概率,由此能求出X 的分布列和数学期望. 【详解】解:(1)依题意,得下表:2200(62603840)9.68 6.63510298100100K ⨯-⨯∴=≈>⨯⨯⨯,即2( 6.635)0.010P K ∴>=所以,有99%的把握认为箱产量与养殖方法有关;(2)按照分层抽样的方法从箱产量少于50kg 和不少于50kg 的网箱中随机抽取5箱,分别为2箱和3箱,从中再抽3箱,则1,2,3X =则2123353(1)10C C P X C ===,1223356(2)10C C P X C ===,0323351(3)10C C P X C ===,X 的分布列为所以,1123 1.8101010EX=⨯+⨯+⨯=【点睛】本题考查独立检验的应用,考查离散型随机变量的分布列、数学期望的求法,考查运算求解能力,属于中档题.23.(1)0.62;(2)列联表见解析,有99%的把握认为支付人数与支付方式有关.【分析】(1)由频率分布直方图可得微信支付人数低于50千人的频率;(2)根据频率分布直方图得出<50千人和≥50千人的人数,得列联表,计算出2K,比较后可得结论.【详解】(1)根据题意,由微信支付人数的频率分布直方图可得:()()0.0120.0140.0240.0340.04050.62P A=++++⨯=(2)根据题意,补全列联表可得:则有()22006266383415.705 6.63510010096104K⋅⨯-⨯=≈>⨯⨯⨯,故有99%的把握认为支付人数与支付方式有关.【点睛】本题考查频率分布直方图,考查列联表,独立性检验,计算出2K即得,本题属于基础题.24.(1)见解析;(2)分布列见解析,期望是10 3.【分析】(1)先根据题中数据完成列联表,再进行计算,判断;(2)根据题意得X服从二项分布,进而求解.【详解】(1)由题意得,。
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.2019年10月18日-27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为12;②在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”;则正确命题的个数为( )附:22()()()()()n ad bc K a b c d a c b d -=++++A .0B .1C .2D .33.下列关于回归分析与独立性检验的说法正确的是() A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;4.已知x 与y 之间的几组数据如下表:x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a'D .b<b',a>a'5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k ,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响6.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示: 序号 12345678910 11 12 13 14 15 16 17 18 19 20数学成绩 95 75 80 94 92 65 67 84 987167 93 64 787790 57 83 72 83物理成绩90 63 72 87 917158 82 93 817782 48 85 69 91 61 84 78 86若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( )A .95%B .97.5%C .99.5%D .99.9%7.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;8.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bc K a c b d a d b c -++++,其中n a b c d =+++.20()P K k ≥0.100.050.01 0.0050k 2.7063.8416.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们( )A .没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”9.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表女 男 合计读营养说明 16 28 44 不读营养说明 20 8 28 总计363672请问性别和读营养说明之间在多大程度上有关系 ( ) A .99%的可能性 B .99.75%的可能性 C .99.5%的可能性 D .97.5%的可能性10.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1 B .2C .3D .411.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 14.若两个分类变量X 与Y 的列联表为:则“X 与Y 之间有关系”这个结论出错的可能性为________.15.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”. 参考附表:(参考公式:K 2=()()()()()2n ad bc a b c d a c b d -++++,其中n=a+b+c+d)16.如表是降耗技术改造后生产某产品过程中记录产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆˆ0.70.3yx =+,那么表中m 的值为__________.17.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 18.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c互不相同,则这个三位数为”有缘数”的概率是__________. 19.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上)20.在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示: 价格x 9 9.5 10 10.5 11 销售量y1110865由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,其线性回归方程是:3.2y x a =-+,则a =__________.三、解答题21.某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据绘制成散点图.光照时长为x (单位:小时),大棚蔬菜产量为y (单位:千斤每亩),记ln w x =.(1)根据散点图判断,y a bx =+与ln y c d x =+⋅,哪一个适宜作为大棚蔬菜产量y 关于光照时长x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(结果保留小数点后两位)(3)根据实际种植情况,发现上述回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求方程估计当光照时长为2e 小时(自然对数的底 2.71828e ≈),大棚蔬菜亩产约为多少. 参数数据:参考公式:β关于α的线性回归方程m n βα=⋅+中,1221i ii nii n m n αβαβαα==-⋅=-∑∑,n m βα=-⋅22.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期.一研究团队统计了某地区200名患者的相关信息,得到如下表格:(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据将如下列联表补充完整,并根据列联表判断是否有99%的把握认为该传染病的潜伏期与患者年龄有关.(2)将200名患者的潜伏期超过6天的频率视为该地区每名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该团队随机调查了该地区20名患者,其中潜伏期超过6天的人数为X ,求随机变量X 的期望和方差. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 23.新冠肺炎疫情防控时期,各级各类学校纷纷组织师生开展了“停课不停学”活动,为了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表:参考公式:在线性回归方程y bx a =+,()()()()1122211n niii ii i nniii i x x y y x y nx yb x x xn x====---==--∑∑∑∑,a y bx =-(2)针对全班45名同学(25名女生,20名男生)的线上学习满意度调查中,女姓满意率为80%,男生满意率为75%,填写下面列联表,判断能否在犯错误概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?参考公式和数据:()()()()()2n ad bc x a b c d a c b d -=++++,()20.0500.0100.0013.8416.63510.828P x k k ≥24.为了了解某校高中生的身体质量情况,某调查机构进行了一次高一学生体重和身高的抽样调查,从中抽取了8名学生(编号为18)的身高(cm)x 和体重(kg)y 数据.如下表,某调查机构分析发现学生的身高和体重之间有较强的线性相关关系,在编号为6的体检数据丢失之前,调查员甲已进行相关的数据分析并计算出该组数据的线性回归方程为ˆˆ0.5ya x =+,且根据回归方程预估一名身高为180cm 的学生体重为71kg ,计算得到的其他数据如下:81170,89920i ii x x y===∑.(1)求a 的值及表格中8名学生体重的平均值y ;(2)在数据处理时,调查员乙发现编号为8的学生体重数据有误,应为63kg ,身高数据无误.请你根据调查员乙更正的数据重新计算线性回归方程,并据此预估一名身高为180cm 的学生的体重.附:回归直线方程ˆˆˆy a bx=+的斜率和截距的最小二乘法估计分别为:1221ˆni ii ni i x ynx ybx nx==-=-∑∑,ˆˆa y bx=-. 25.冠状病毒是一个大型病毒家族,今年出现的新型冠状病毒(nCoV )是以前从未在人体中发现的冠状病毒新毒株.(1)某科研团队为研究潜伏期与新冠肺炎患者年龄的关系,组织专家统计了该地区新冠肺炎患者新冠病毒潜伏期的相关信息,其中被统计的患者中60岁以下的人数与60岁以上的人数相同,60岁以下且潜伏期在7天以下的人数约占15,60岁以上且潜伏期在7天以下的人数约占35,若研究得到在犯错误概率不超过0.010的前提下,认为潜伏期与新冠肺炎患者年龄有关,现设被统计的60岁以上的人员人数为5x ,请完成下面2×2列联表并计算被统计的60岁以上的人员至少多少人?附1:()()()()()22n ad bc X a b c d a c b d -=++++,其中n a b c d =+++()20P X k ≥0.100 0.050 0.010 0.005 0.001 0k 2.7063.8416.6357.87910.828(2)某地区的新冠肺炎治愈人数y (人)与3月份的时间x (日)满足回归直线方程ˆˆˆybx a =+,统计数据如下: 3月日期(日) 2 3 4 5 6治愈人数(人)25304045t已知5=11405i i y y ==∑,52=190i i x =∑,5=1885i i i x y =∑,请利用所给数据求t 和回归直线方程ˆˆˆy bx a =+;附2:()1221ˆni ii ni i x y nx ybx n x ==-⋅=-∑∑,ˆˆa y bx=-. 26.某企业组织应聘该企业的100名应届毕业生参加专业能力测试(满分100分),这100名毕业生的成绩的频率分布直方图如图所示.(Ⅰ)该企业拟以成绩的中位数作为分数线来确定进入面试阶段的毕业生名单,根据频率分布直方图求进入该企业面试的分数线;(Ⅱ)若被测试的毕业生中有40名女生,进入面试的有15名女生,35名男生,填写下面列联表,并根据列联表判断是否有95%的把握认为成绩与性别有关.成绩<分数线成绩≥分数线 总计附:()()()()()22n ad bc K a b c d a c b d -=++++)2k【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B 【分析】依次判断每个选项:计算概率为25得到①错误;计算2 5.952K ≈得到②错,③对得到答案. 【详解】任取1名参赛人员,抽到对主办方表示满意的男性运动员的概率为20025005=,故①错误;22(2003050220)5005.95225025042080K ⨯-⨯⨯=≈⨯⨯⨯,故②错,③对故选:B . 【点睛】本题考查了概率的计算和独立性检验,意在考查学生的综合应用能力.3.D解析:D 【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案. 【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A 、B 、C 均错误,故答案选D . 【点睛】本题主要考查了回归分析与独立性检验的定义的区别.4.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.7.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.8.B解析:B 【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K 的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人, 又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人, 又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530) 4.762 3.8412109075225K ⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”, 故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.9.C解析:C 【详解】由题意可知16,28,20,8a b c d ====,44,28,36,36a b c d a c c d +=+=+=+=,72n a b c d =+++=,代入公式()()()()()22n ad bc K a b c d a c b d -=++++得()227216828208.4244283636K ⨯⨯-⨯=≈⨯⨯⨯,由于28.427.879K ≈>,我们就有0099.5的把握认为性别和读营养说明之间有关系,即性别和读营养说明之间有0099.5的可能是有关系的,故选C .10.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.11.D解析:D 【解析】 试题由题根据二列联表得出;2K=()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,对应参考值得 2 5.024K >,则有10.0250.975-=,即有97.5%的把握认为文化程度与月收入有关系。
一、选择题1.甲、乙两人进行乒乓球比赛,比赛规则为“3局2胜”,即以先赢2局者为胜,根据经验,每局比赛中甲获胜的概率为0.4,则本次比赛甲获胜的概率是( ) A .0.216B .0.36C .0.352D .0.6482.某学校10位同学组成的志愿者组织分别由李老师和张老师负责,每次献爱心活动均需该组织4位同学参加.假设李老师和张老师分别将各自活动通知的信息独立,随机地发给4位同学,且所发信息都能收到.则甲同学收到李老师或张老师所发活动通知的信息的概率为( ) A .25B .1225C .1625D .453.一个盒子里有7个红球,3个白球,从盒子里先取一个小球,然后不放回的再从盒子里取出一个小球,若已知第1个是红球的前提下,则第2个是白球的概率是( )A .310 B .13C .710D .23 4.从345678910,1112,,,,,,,,中不放回地依次取2个数,事件A = “第一次取到的数可以被3整除”,B = “第二次取到的数可以被3整除”,则()P B|?A =( ) A .59B .23C .13D .295.在“新零售”模式的背景下,自由职业越来越流行,诸如:淘宝网店主、微商等等,现调研某自由职业者的工资收入情况,记x 表示该自由职业者的平均水平每天工作的小时数,y 表示平均每天工作x 个小时的月收入.假设y 与x 具有线性相关关系,则y 关与x 的线性回归方程ˆˆˆybx a =+必经过点( ) A .()33, B .()34, C .()44, D .()45,6.甲罐中有5个红球,2个白球和3个黑球,乙罐中有6个红球,2个白球和2个黑球,先从甲罐中随机取出一个球放入乙罐,分别以1A ,2A ,3A 表示由甲罐取出的球是红球、白球和黑球的事件,再从乙罐中随机取出一个球,以B 表示由乙罐取出的球是红球的事件,下列结论中不正确...的是( ) A .事件B 与事件1A 不相互独立 B .1A 、2A 、3A 是两两互斥的事件 C .17(|)11P B A =D .3()5P B =7.甲、乙两人抢答竞赛题,甲答对的概率为15,乙答对的概率为14,则两人中恰有一人答对的概率为 A .720B .12 20C .1 20D .2208.将一个半径适当的小球放入如图所示的容器最上方的入口处,小球将自由落下,小球在下落的过程中,将3次遇到黑色障碍物,最后落入A 袋或B 袋中,已知小球每次遇到黑色障碍物时,向左、右两边下落的概率分别为2133、,则小球落入A 袋中的概率为 ( )A .34B .14C .13D .239.抛掷红、黄两颗骰子,当红色骰子的点数为4或6时,两颗骰子的点数之积大于20的概率是( ) A .35B .14C .12D .1310.下列有关结论正确的个数为( )①小赵、小钱、小孙、小李到4个景点旅游,每人只去一个景点,设事件A =“4个人去的景点不相同”,事件B =“小赵独自去一个景点”,则()2|9P A B =; ②设,a b ∈R ,则“22log log a b >”是“21a b ->的充分不必要条件;③设随机变量ξ服从正态分布(),7N μ,若()()24P P ξξ<=>,则μ与D ξ的值分别为3,7D μξ==. A .0B .1C .2D .311.袋中有6个黄色、4个白色的乒乓球,做不放回抽样,每次任取1个球,取2次,则关于事件“直到第二次才取到黄色球”与事件“第一次取到白球的情况下,第二次恰好取得黄球”的概率说法正确的是( )A .事件“直到第二次才取到黄色球”与事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率都等于23 B .事件“直到第二次才取到黄色球”与事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率都等于415C.事件“直到第二次才取到黄色球”的概率等于23,事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率等于4 15D.事件“直到第二次才取到黄色球”的概率等于415,事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率等于2 312.甲、乙两人同时报考某一所大学,甲被录取的概率为0.6,乙被录取的概率为0.7,两人是否被录取互不影响,则其中至少有一人被录取的概率为( )A.0.12 B.0.42 C.0.46 D.0.88二、填空题13.甲、乙两人参加一次英语口语考试,已知在备选的10道试题中,甲能答对其中的6道,乙能答对其中的8道,规定每次考试都从备选题中随机抽出3道题进行测试,至少答对2道题才算合格,则甲、乙两人至少有一人考试合格的概率为________.14.为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()11221221 21212n n n n nn n n nχ++++-=15.已知x、y之间的一组数据如下:则线性回归方程ˆy a bx=+所表示的直线必经过点________.16.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cossinxyθθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y+=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误.17.已知一组数据的回归直线方程为 1.51y x =-+,且4y =,发现有两组数据( 1.7,2.9)-,( 2.3,5.1)-的误差较大,去掉这两组数据后,重新求得回归直线方程为y x a '''=-+,则当3x '=-时,y '=_____.18.某质检员检验一件产品时,把正品误判为次品的概率是0.1,把次品误判为正品的概率是0.05.如果一箱产品中含有8件正品,2件次品,现从中任取1件让该质检员检验,那么出现误判的概率为___________.19.某校为了解家长对学校食堂的满意情况,分别从高一、高二年级随机抽取了20位家长的满意度评分,其频数分布表如下:假设两个年级家长的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率.现从高一、高二年级各随机抽取1名家长,记事件A :“高一家长的满意度等级高于高二家长的满意度等级”,则事件A 发生的概率为__________.20.某人在公园进行射击气球游戏,排除其它因素的影响,各次射击相互独立,每次击中气球的概率均为0.8,若连续射击10次,记击中气球的次数为ξ,则D (ξ)=______.三、解答题21.一个口袋中有4个红球和3个黑球.(1)从口袋中随机地连续取出三个球,取出后不放回,求: (i )三个球中有两个红球一个黑球的概率;(ii )第二次取出的是红球且第三次取出的也是红球的概率.(2)从口袋中随机地连续取出三个球,取出后放回,求至少有两个是红球且第三个是红球的概率22.面对环境污染,党和政府高度重视,各级环保部门制定了严格措施治理污染,同时宣传部门加大保护环境的宣传力度,因此绿色低碳出行越来越成为市民的共识,为此吉安市在吉州区建立了公共自行车服务系统,市民凭本人二代身份证到公共自行车服务中心办理诚信借车卡,初次办卡时卡内预先赠送20分,当诚信积分为0时,借车卡自动锁定,限制借车,用户应持卡到公共自行车服务中心以1元购1个积分的形式再次激活该卡,为了鼓励市民租用公共自行车出行,同时督促市民尽快还车,方便更多的市民使用,公共自行车按每车每次的租用时间进行扣分缴费,具体扣分标准如下:①租用时间不超过1小时,免费;②租用时间为1小时以上且不超过2小时,扣1分;③租用时间为2小时以上且不超过3小时,扣2分;④租用时间为3小时以上且不超过4小时,扣3分;⑤租车时间超过4小时除扣3分外,超出时间按每小时扣2分收费(不足1小时的部分按1小时计算).甲、乙两人独立出行,各租用公共自行车一次,且两人租车时间都不会超过4小时,设甲、乙租用时间不超过一小时的概率分别是0.4,0.3;租用时间为1小时以上且不超过2小时的概率分别是0.4,0.5;租用时间为2小时以上且不超过3小时的概率分别是0.1,0.1.(1)求甲比乙所扣积分多的概率;(2)设甲、乙两人所扣积分之和为随机变量ξ,求ξ的分布列和数学期望.23.2020年11月某市进行了高中各年级学生的“国家体质健康测试”.现有1500名(男生1200名,女生300名)学生的测试成绩,根据性别按分层抽样的方法抽取100名学生进行分析,得到如下统计图表:男生测试情况:生恰好是一男一女的概率;(2)若测试成绩为良好或优秀的学生为“体育达人”,其他成绩的学生(含病残等免试学生)为“非体育达人”.根据以上统计数据填写下面的列联表,并回答能否在犯错误的概率不超过0.01的前提下认为“是否为体育达人与性别有关?”附:22(),()()()()n ad bc K n a b c d a b c d a c b d ⎛⎫-==+++ ⎪++++⎝⎭24.消费者信心指数是反映消费者信心强弱的指标;它是预测经济走势和消费趋向的一个先行指标,是监测经济周期变化的重要依据.消费者信心指数值介于0和200之间.指数超过100时,表明消费者信心处于强信心区;指数等于100时,表示消费者信心处于强弱临界点;指数小于100时,表示消费者信心处于弱信心区.我国某城市从2016年到2019年各季度的消费者信心指数如下表1:记2016年至2019年年份序号为,该城市各年消费者信心指数的年均值(四舍五入取整)为y ,x 与y 的关系如下表2:的消费者信心指数不小于2017年的消费者信心指数的概率;(2)根据表2得到线性回归方程为:ˆˆ4.4yx a =+,求ˆa 的值,并预报该城市2020年消费者信心指数的年平均值.(3)根据表2计算(,)x y 的相关系数r (保留两位小数),并判断是否正相关很强.参考数据和公式:ˆˆay bx =-;12342.54x +++==;105112114119112.54y +++==23.45≈22.47≈;()()niix x y y r --=∑0.751r ≤≤时,y 与x 正相关很强.25.随着运动App 和手环的普及和应用,在朋友圈、运动圈中出现了每天1万步的健身打卡现象,“日行一万步,健康一辈子”的观念广泛流传.“健康达人”小王某天统计了他朋友圈中所有好友(共400人)的走路步数,并整理成下表:间中点值作代表);(2)若用A 表示事件“走路步数低于平均步数”,试估计事件A 发生的概率;(3)若称每天走路不少于8千步的人为“健步达人”,小王朋友圈中岁数在40岁以上的中老年人有200人,其中健步达人恰有150人,请填写下面22⨯列联表.根据列联表判断有多大把握认为,健步达人与年龄有关?附:()()()()()22n ad bc K a b c d a c b d -=++++26.某种疾病可分为Ⅰ、Ⅱ两种类型.为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中女性是男性的2倍,男性患Ⅰ型病的人数占男性病人的56,女性患Ⅰ型病的人数占女性病人的13. (1)若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物.两个团队各至多安排2个接种周期进行试验.甲团队研发的药物每次接种后产生抗体的概率为p ,每人每次接种花费()0m m >元,每个周期至多接种3次,第一个周期连续2次出现抗体则终止本接种周期进入第二个接种周期,否则需依次接种至第一周期结束,再进入第二周期;第二接种周期连续2次出现抗体则终止试验,否则需依次接种至至试验结束;乙团队研发的药物每次接种后产生抗体的概率为q ,每人每次花费()0n n >元,每个周期接种3次,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.①若甲团队的试验平均花费大于乙团队的试验平均花费,求p 、q 、m 、n 满足的关系式;②若m n =,2p q =,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:()()()()()22n ad bc K a b c d a c b d -=++++,()20P K k ≥ 0.10 0.05 0.01 0.005 0.001 0k2.7063.8416.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】 【分析】先列举出甲获胜的情况,再利用独立事件的概率乘法公式可计算出所求事件的概率。
欢迎阅读③线性回归方程: y bx a (最小二乘法)nx i y i nxyi1b nx i 2 nx 2i1a y bx注意:线性回归直线经过定点 (x,y ) 。
2. 相关系数(判定两个变量线性相关性): rn(x i x)(y i y)i1 nn(x i x)2 (y i y) 2 i 1 i 1注: ⑴r >0时,变量 x, y 正相关; r <0 时,变量 x, y 负相关;2)|r | 越接近于 1,两个变量的线性相关性越强; |r| 接近于 0时,两个变量之间几乎不存在线性相关关系。
3.回归分析中归效果的判定:n1)回归平方和:(y i y )2i1nn (y i y i )(yi yi)2 相关指数 R 2 1 i n 1i 1(y i y i )i1注: ① R 2得知越大,说明残差平方和越小,则模型拟合效果越好;② R 2 越接近于 1,,则回归效果越好。
、选择题统计案例专题练习(高二文)、知识点归纳 1.线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系4.独立性检验(分类变量关系): 随机变量 K 2 越大,说明两个分类变量,关系越强,反之, 越弱。
K=欢迎阅读1.下列属于相关现象的是()A.利息与利率B.居民收入与储蓄存款C.电视机产量与苹果产量D.某种商品的销售额与销售价格2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()2 2 2 2A.K2 3.841 B.K2 3.841 C.K2 6.635 D.K2 6.635 3.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费;③家庭的支出与收入.其中不是函数关系的有()A.0 个B.1 个C.2 个D.3 个4.当K2 3.841时,认为事件 A 与事件 B ()A.有95%的把握有关B.有99%的把握有关C.没有理由说它们有关D.不确定5.已知回归直线方程y bx a ,其中 a 3且样本点中心为(1,2),则回归直线方程为()A.y x 3 B.y 2x 3 C.y x 3 D.y x 3 6.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300 名学生,得到如下列联表:你认为性别与是否喜欢数学课程之间有关系的把握有()A.0 B.95% C.99% D.100%8.在回归直线方程y a bx 中,回归系数 b 表示()A.当x 0时,y的平均值B.x变动一个单位时,y 的实际变动量C.y 变动一个单位时,x的平均变动量D.x 变动一个单位时,y的平均变动量9.对于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的C.回归分析中,如果r 2 1,说明x 与y 之间完全相关D.样本相关系数r ( 1,1)10. 在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x 轴上,预报变量在y轴上(C)可以选择两个变量中任意一个变量在x轴上(D)选择两个变量中任意一个变量在y 轴上11、一位母亲记录了儿子3~9 岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93 用这个模型预测这个孩子10 岁时的身高,则正确的叙述是()A. 身高一定是145.83cm;B.身高在145.83cm 以上;C.身高在145.83cm以下;D. 身高在145.83cm 左右.12、两个变量y 与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98B. 模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D. 模型4的相关指数R2为0.2514、工人月工资y(元)依劳动生产率x(千元)变化的回归直线方程为y? 60 90x ,下列判断正确的是()A.劳动生产率为1000元时,工资为50 元B. 劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90 元D. 劳动生产率为1000元时,工资为90元15、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就()A. 越大B.越小C.无法判断D.以上都不对16、对分类变量X 与Y 的随机变量K 2的观测值K ,说法正确的是()A . k 越大," X 与Y 有关系”可信程度越小;B . k 越小," X 与Y 有关系”可信程度越小;C . k 越接近于0," X 与Y 无关”程度越小D . k 越大," X 与Y 无关”程度越大17、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100 个吸烟的人中必有99人患有肺病;B. 从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D. 以上三种说法都不正确.18、设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y 关于x 的回归直线的斜率是b,纵截距是a ,那么必有()A. b 与r 的符号相同B. a 与r 的符号相同C. b 与r 的相反D. a 与r 的符号相反则与的线性回归方程为必过()A.(2,2)点B. (1.5 ,0)点C. (1,2)点D. (1.5 ,4)点20、已知回归直线的斜率的估计值是1.23 ,样本点的中心为(4 ,5),则回归直线的方程是()A. y =1.23x + 4B. y =1.23x+5C. y =1.23x+0.08D. y =0.08x+1.2321、为研究变量 x 和 y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程 l 1和l 2 ,两人计算知 x 相同, y 也相同,下列正确的是 ( )A. l 1与l 2重合B. l 1与l 2一定平行C. l 1与l 2相交于点 (x,y)D. 无法判断 l 1和l 2是否相交 22、下列说法正确的有 ( )①回归方程适用于一切样本和总体。
②回归方程一般都有时间性。
③样本取值的范围会影响回 归方程的适用范围。
④回归方程得到的预报值是预报变量的精确值。
23、考察棉花种子经过处理跟生病之间的关系 得到如下表数据:根据以上数据,则 ( ) A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C.种子是否经过处理决定是否生病 D. 以上都是错误的 24.某化工厂为预测某产品的回收率 y ,需要研究它和原料有效成份含量之间的相关关系,现取了 8 对观测值,计算得:8x i y i 1849 ,则 y 与 x 的回归直线方程是()i1A. y 11.47 2.62x B. y 11.47 2.62x C. y 2.62x 11.47 x D. y 11.47 2.62x25.如图所示,图中有 5 组数据,去掉 B 组数据后,剩下的 4 组 性最大( )A. EB. C C. D D. A26.为调查吸烟是否对患肺癌有影响, 某肿瘤研究所随机地调查 如下结果(单位:人)根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A. 90% B. 95% C. 99% D. 100%27.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:A. ①②B. ②③C. ③④ 数据的线性相关了 9965 人,得到D. ①③888x i 52 , y i 228 , x i 2478 , i 1i 1i1你认为婴儿的性别与出生时间有关系的把握为()A.80% B.90% C.95% D.99%28.已知线性相关关系的两个变量建立的回归直线方程为y a bx ,方程中的回归系数b()A.可以小于0 B.只能大于0 C.可以为0 D.只能小于029.每一吨铸铁成本y c (元)与铸件废品率x%建立的回归方程y c 56 8 x,下列说法正确的是()A.废品率每增加1%,成本每吨增加64 元B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8 元D.如果废品率增加1%,则每吨成本为56 元30.下列说法中正确的有:①若r 0,则x增大时,y也相应增大;②若r 0,则x增大时,y也相应增大;③若r 1,或r 1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上()A.①② B.②③C.①③ D.①②③二、填空题31.对于回归直线方程y 4.75x 257 ,当x 28时,y的估计值为.32.直线回归方程y a bx 恒过定点.34、若一组观测值(x1,y1)(x2,y2)⋯(x n,y n)之间满足y i=bx i+a+e i (i=1 、2. ⋯n)若e i 恒为0,则R2为35、若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为___________ 回归平方和为____37、某考察团对全国10大城市进行职工人均平均工资x与居民人均消费y进行统计调查, y与x具有相关关系,回归方程y? 0.66x 1.562 (单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为()三、解答题38、某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392 名成年人进行调查,所得数据如下表所示:100件产品,对于教育机构的研究项目,根据上述数据能得出什么结论.39、某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取 检验后得到如下联表: 请问甲、乙两线生产的产品合格率在多大程度上有关系? 40、若两个分类变量 X 与 Y 的列联表为: 则“X 与 Y 之间有关系”这个结论出错的可能性为多少? 四、课下练习 1.在画两个变量的散点图时,下面哪个叙述是正确的 ( A. 预报变量在 x 轴上,解释变量在 C.可以选择两个变量中任意一个在 2.下列说法正确的有 ( ) ①回归方程适用于一切样本和总体。
y 轴上x 轴上) B.解释变量在 D. 以选择两个变量中任意一个在 y 轴上 x 轴上,预报变量在 y 轴上 ②回归方程一般都有时间性。
③样本取值的范围会影 响回归方程的适用范围。
④回归方程得到的预报值是预报变量的精确值。