高一数学统计案例练习题
- 格式:pdf
- 大小:44.41 KB
- 文档页数:5
高一数学统计试题1.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为()A.B.C.D.2【答案】D【解析】由题意知,解得a=-1,∴样本方差为S2=,故选D.【考点】方差与标准差.2.已知x与y之间的几组数据如下表:则y与x的线性回归方程=x+必过点()A.(1,2) B.(2,6) C. D.(3,7)【答案】C【解析】回归直线必过样本中心点,由表格可求得.【考点】回归分析.3.用秦九韶算法计算多项式在时的值时,的值为【答案】-57【解析】由秦九韶算法知,当时,.【考点】算法案例.4.为预防X病毒爆发,某生物技术公司研制出一种X病毒疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),公司选定2000个样本分成三组,测试结果如下表:组组组67390已知在全体样本中随机抽取1个,抽到组疫苗有效的概率是0.33.(1)现用分层抽样的方法在全体样本中抽取360个测试结果,应在组抽取样本多少个?(2)已知,,求通过测试的概率.【答案】(1)90(2)【解析】(I)根据分层抽样的定义,按每层中的比例即可计算出组抽取样本的个数;(II)由(I),再结合题设条件,列举出所有可能的组合的个数及没有通过测试的组合的个数,再由概率公式及概率的性质求出通过测试的概率.(I)∵,∴,∵,∴应在组抽取样个数是(个).(II)∵,,,∴(,)的可能性是 (465,35),(466,34),(467,33),(468,32),(469,31),(470,30),若测试没有通过,则,,(,)的可能性是(465,35),(466,34),通过测试的概率是.【考点】1、分层抽样;2.、古典概型;3、估测能力.5.某校从高一年级学生中随机抽取40名学生作为样本,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六组:,,后得到如图的频率分布直方图.(Ⅰ)求图中实数的值;(Ⅱ)若该校高一年级共有学生500人,试估计该校高一年级在考试中成绩不低于60分的人数;(Ⅲ)若从样本中数学成绩在与两个分数段内的学生中随机选取两名学生,试用列举法求这两名学生的数学成绩之差的绝对值不大于10的概率.【答案】(1)0.03(2)425(3)【解析】解:(Ⅰ)由可得 2分(Ⅱ)数学成绩不低于60分的概率为:4分数学成绩不低于60分的人数为人 5分(Ⅲ)数学成绩在的学生人数:人 6分数学成绩在的学生人数:人 7分设数学成绩在的学生为,数学成绩在的学生为 8分两名学生的结果为:,共种 10分其中两名学生的数学成绩之差的绝对值不大于10的情况有,,,,,,共7种, 12分因此,抽取的两名学生的数学成绩之差的绝对值不大于10的概率为 13分【考点】直方图以及古典概型点评:主要是考查了直方图以及古典概型概率的计算,属于基础题。
2015年高三复习高中数学统计案例习题(有详细答案)一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.363.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,324.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.80005.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.2006.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.287.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.6710.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.12011.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.4512.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.6013.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.1815.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.19.下表是某单位在2013年1﹣5月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 5用水量y 4.5 4 3 2.5 1.8(Ⅰ)若由线性回归方程得到的预测数据与实际检验数据的误差不超过0.05,视为“预测可靠”,通过公式得,那么由该单位前4个月的数据中所得到的线性回归方程预测5月份的用水量是否可靠?说明理由;(Ⅱ)从这5个月中任取2个月的用水量,求所取2个月的用水量之和小于7(单位:百吨)的概率.参考公式:回归直线方程是:,.20.某校高三数学竞赛初赛考试后,对考生的成绩进行统计(考生成绩均不低于90分,满分为150分),将成绩按如下方式分成六组,第一组[90,100)、第二组[100,110)…,第六组[140,150],如图为其频率分布直方图的一部分,若第四、五、六组的人数依次成等差数列,且第六组有4人.(Ⅰ)求第四和第五组频率,并补全频率分布直方图;(Ⅱ)若不低于120分的同学进入决赛,不低于140分的同学为种子选手,完成下面2×2列联表(即填写空格处的数据),并判断是否有99%的把握认为“进入决赛的同学成为种子选手与专家培训有关”.[120,140)[140,150]合计参加培训8 8未参加培训合计 4附:K2=P(K2≥k0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001K0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82821.为了了解某中学高二女生的身高情况,该校对高二女生的身高进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:(单位:cm)(1)表中m、n、M、N所表示的数分别是多少?(2)绘制频率分布直方图;(3)估计该校女生身高小于162.5cm的百分比.22.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求x值;(2)(理科)从成绩不低于80分的学生中随机的选取2人,该2人中成绩在90以上(含90分)的人数记为ξ,求ξ的概率分布列及数学期望Eξ.(文)从从成绩不低于80分的学生中随机的选取3人,该3人中至少有2人成绩在90以上(含90分)的概率.23.某网站针对2014年中国好声音歌手A,B,C三人进行网上投票,结果如下观众年龄支持A 支持B 支持C20岁以下200 400 80020岁以上(含20岁)100 100 400(1)在所有参与该活动的人中,用分层抽样的方法抽取n人,其中有6人支持A,求n的值.(2)在支持C的人中,用分层抽样的方法抽取6人作为一个总体,从这6人中任意选取2人,求恰有1人在20岁以下的概率.24.某校100名学生期中考试数学成绩的频率分布直方图如图,其中成绩分组区间如下:组号第一组第二组第三组第四组第五组分组[50,60)[60,70)[70,80)[80,90)[90,100](Ⅰ)求图中a的值;(Ⅱ)根据频率分布直方图,估计这100名学生期中考试数学成绩的平均分;(Ⅲ)现用分层抽样的方法从第3、4、5组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率?25.从某实验中,得到一组样本容量为60的数据,分组情况如下:(Ⅰ)求出表中m,a的值;分组5~15 15~25 25~35 35~45频数 6 2l m频率 a 0.05(Ⅱ)估计这组数据的平均数.26.某校高三文科分为四个班.高三数学调研测试后,随机地在各班抽取部分学生进行测试成绩统计,各班被抽取的学生人数恰好成等差数列,人数最少的班被抽取了22人.抽取出来的所有学生的测试成绩统计结果的频率分布条形图如图所示,其中120~130(包括120分但不包括130分)的频率为0.05,此分数段的人数为5人.(1)问各班被抽取的学生人数各为多少人?(2)求平均成绩;(3)在抽取的所有学生中,任取一名学生,求分数不小于90分的概率.27.在参加世界杯足球赛的32支球队中,随机抽取20名队员,调查其年龄为25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28.(1)填写下面的频率分布表(2)并画出频率分布直方图.(3)据此估计全体队员在哪个年龄段的人数最多?占总数的百分之几?分组频数频率20.5~22.522.5~24.524.5~26.526.5~28.528.5~30.5合计28.如图是调查某地某公司1000名员工的月收入后制作的直方图.(1)求该公司员工的月平均收入及员工月收入的中位数;(2)在收入为1000至1500元和收入为3500至4000元的员工中用分层抽样的方法抽取一个容量15的样本,员工甲、乙的月收入分别为1200元、3800元,求甲乙同时被抽到的概率.29.某市为了解全市居民日常用水量的分布情况,现采用抽样调查的方式,获得了n位居民某年的月均用水量(单位:t),样本统计结果如图表:(Ⅰ)分别求出x,n,y的值;(Ⅱ)若从样本中月均用水量在[5,6]内的5位居民a,b,c,d,e中任选2人作进一步的调查研究,求居民a被选中的概率.分组频数频率[0,1)25 y[1,2)0.19[2,3)50 x[3,4)0.23[4,5)0.18[5,6] 530.为了分析某次考试数学成绩情况,用简单随机抽样从某班中抽取25名学生的成绩(百分制)作为样本,得到频率分布表如下:分数[50,60)[60,70)[70,80)[80,90)[90,100]频数2 3 9 a 1频率0.08 0.12 0.36 b 0.04(Ⅰ)求样本频率分布表中a,b的值,并根据上述频率分布表,在下表中作出样本频率分布直方图;(Ⅱ)计算这25名学生的平均数及方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从成绩在[50,70)的学生中任选2人,求至少有1人的成绩在[60,70)中的概率.参考答案与试题解析一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样考点:分层抽样方法.专题:阅读型.分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.故选C.点评:本小题考查抽样方法,主要考查抽样方法,属基本题.2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.36考点:分层抽样方法.专题:计算题.分析:根据社区里的高收入家庭户和高收入家庭户要抽取的户数,得到每个个体被抽到的概率,用求到的概率乘以低收入家庭户的户数,得到结果.解答:解:∵区现有480个住户,高收入家庭120户,抽取了6户∴每个个体被抽到的概率是∴该社区本次被抽取的总户数为=24,故选B.点评:本题考查分层抽样方法,这种题目类型是高考题目中一定会出现的题目,运算量不大,是一个必得分题目.3.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32考点:系统抽样方法.专题:计算题.分析:由系统抽样的特点知,将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,这时间隔一般为总体的个数除以样本容量.从所给的四个选项中可以看出间隔相等且组距为10的一组数据是由系统抽样得到的.解答:解:从50枚某型导弹中随机抽取5枚,采用系统抽样间隔应为=10,只有B答案中导弹的编号间隔为10,故选B.点评:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本.4.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.8000考点:频率分布直方图.专题:概率与统计.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的面积等于这一组的频率.底部周长小于100cm的矩形的面积求和乘以样本容量即可.解答:解:由图可知:底部周长小于100cm段的频率为(0.01+0.02)×10=0.3,则底部周长大于100cm的段的频率为1﹣0.3=0.7那么在这片树木中底部周长大于100cm的株树大约10000×0.7=7000人.故选C.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.5.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.200考点:频率分布直方图.专题:概率与统计.分析:根据直方图中的各个矩形的面积代表了频率,各个矩形面积之和为1,求出小长方形面积最大的一组的频率,再根据频数=频率×样本容量,求出频数即可.解答:解:∵直方图中的各个矩形的面积代表了频率,这5个小方形的面积由小到大构成等差数列{a n},a2=2a1,∴d=a1,a3=3a1,a4=4a1,a5=5a1根据各个矩形面积之和为1,则a1+a2+a3+a4+a5=15a1=1∴a1=,小长方形面积最大的一组的频率为a5=5×=根据频率=可求出频数=300×=100故选:A.点评:本题考查了频率、频数的应用问题,各小组频数之和等于样本容量,各小组频率之和等于1.6.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.28考点:众数、中位数、平均数.专题:概率与统计.分析:利用中位数的定义即可得出.解答:解:这组数据为16,17,19,22,25,27,28,30,30,32,36,40的中位数是=27.5.故选:A.点评:本题考查了中位数的定义及其计算方法,属于基础题.7.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B考点:众数、中位数、平均数.专题:概率与统计.分析:本题可以由折线图上的数据做出两个城市的平均气温和方差,也可以根据两个折线图的高低和变化的趋势即波动的大小,得到结果.解答:解:由折线图可知A市的平均气温是,B市的平均气温是=11.7,由折线图也可以看出B市的气温较高,可以看出B市的气温的变化不大,方差较小;故选D.点评:本题考查了折线图以及平均数和方差的求法;求两组数据的平均值和方差是研究数据常做的两件事,平均值反映数据的平均水平,而方差反映数据的波动大小,从两个方面可以准确的把握数据的情况.8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④考点:散点图.专题:计算题.分析:通过观察散点图可以知道,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.解答:解:由题图③可知,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,由题图④可知,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.故选D.点评:本题考查散点图,是通过读图来解决问题,考查读图能力,粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关.9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.67考点:线性回归方程.专题:计算题;概率与统计.分析:由题意,将20代入可得68.2,故可能值为68.解答:解:由题意,y=0.68×20+54.6=68.2,又由表可知加工时间y(min)都是以整数记,故a可能为68,故选B.点评:本题考查了线性回归方程的应用及数学问题与实际问题的转化,属于基础题.10.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120考点:频率分布直方图.专题:图表型.分析:根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.解答:解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选B.点评:本小题主要考查频率、频数、统计和概率等知识,考查数形结合、化归与转化的数学思想方法,以及运算求解能力.11.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45考点:频率分布直方图.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,小矩形的面积等于这一组的频率,则所以面积和为1,建立等量关系即可求得长度在[25,30)内的频率即得.解答:解:设长度在[25,30)内的频率为a,根据频率分布直方图得:a+5×0.02+5×0.06+5×0.03=1⇒a=0.45.则根据频率分布直方图估计从该批产品中随机抽取一件,则其为二等品的概率为0.45.故选D.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.12.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.60考点:频率分布直方图.专题:概率与统计.分析:由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.解答:解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选B.点评:本题考查的知识点是频率分布直方图,结合已知中的频率分布直方图,结合频率=矩形的高×组距,求出满足条件的事件发生的频率是解答本题的关键.13.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户考点:分层抽样方法.专题:概率与统计.分析:由分层抽样的计算方法:中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得出答案.解答:解:由已知可得中等收入家庭中应抽选出的户数==56.故选C.点评:本题考查了分层抽样,掌握分层抽样的计算方法是解决问题的关键.14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.18考点:分层抽样方法.专题:计算题.分析:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,由此解得x 的值.解答:解:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,解得x=18,故选D.点评:本题主要考查分层抽样的定义和方法,利用了总体中各层的个体数之比等于样本中对应各层的样本数之比,属于基础题.15.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人考点:分层抽样方法.专题:计算题.分析:先求出每个个体被抽到的概率,用该层的个体数乘以每个个体被抽到的概率,就等于该层应抽取的个体数.解答:解:每个个体被抽到的概率等于=,老年人中被抽取到参加健康检查的人数是40×=4,故选C.点评:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?考点:频率分布直方图;频率分布表.专题:概率与统计.分析:(1)根据上表求出身高不低于1.65m且不高于1.71m的频率与不低于1.63m的频率;(2)将测量数据分组,求频数与频率,列出频率分布表,画出频率分布直方图;(3)根据图形得出正确的结论以及估计结果.解答:解:(1)根据上表得,身高不低于1.65m且不高于1.71m的频率是=≈0.567,∴约占总体的56.7%;不低于1.63m的频率是1﹣=1﹣0.15=0.85,约占总体的85%;(2)将测量数据分布6组,∴=0.033,∴组距是0.04,计算频数与频率,列出频率分布表,如下;分组频数频率156.5﹣160.5 7 0.11160.5﹣164.5 9 0.15164.5﹣168.5 15 0.25168.5﹣172.5 22 0.37172.5﹣176.5 6 0.10176.5﹣180.5 1 0.02合计60 1.00画出样本频率分布直方图,如图所示;(3)根据图形知,该校年满16周岁的男生在168.5﹣172.5内的人数所占的比例最大,如果年满16周岁的男生有360人,那么在这个范围的人数估计约为360×0.37=133人.点评:本题考查了频率分布直方图的应用问题,也考查了列表和画图的能力,解题时应根据图中数据进行有关的计算,是基础题.17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.考点:回归分析的初步应用.专题:计算题;概率与统计.分析:求平均值,回归直线必过样本点的中心.解答:解:==3,==8,故回归方程=x+所表示的直线必经过点(3,8).点评:本题考查了回归分析,回归直线必过样本点的中心,同时考查了平均数的求法,属于基础题.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.考点:茎叶图;众数、中位数、平均数;极差、方差与标准差.专题:概率与统计.分析:(I)由茎叶图知甲乙两同学的成绩分别为:甲:82 81 79 88 乙:85 77 83 85.利用“列举法”及其古典概型的概率计算公式即可得出.(II)分别计算出甲乙的平均成绩及其方差即可得出.。
2015年高三复习高中数学统计案例(有答案)一.选择题(共18小题)1.(2014•四川)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读2.(2014•重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性.=0.4x+2.3 =2x﹣2.4 C=﹣2x+9.5D.=﹣0.3x+4.4得到回归方程为=bx+a,则()4.(2014•唐山二模)用简单随机抽样的方法从含有100个个体的总体中依次抽取一个容量为5的样本,则个体m .C D.5.(2014•揭阳三模)某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人6.(2014•黄冈模拟)2014年3月,为了调查教师对第十二届全国人民代表大会二次会议的了解程度,安庆市拟采用分层抽样的方法从A,B,C三所不同的中学抽取60名教师进行调查.已知A,B,C学校中分别有180,270,7.(2014•湖北模拟)某学校用分层抽样的方法从三个年级抽取若干学生,调查“马年春节”学生参加社会实践活动情)8.(2014•闸北区三模)某初级中学领导采用系统抽样方法,从该校预备年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k==16,即每16人抽取一个人.在1~16中随机9.(2014•大连一模)某小礼堂有25排座位,每排有20个座位.一次心理讲座时礼堂中坐满了学生,讲座后为了10.(2014•江西模拟)月底,某商场想通过抽取发票的10%估计该月的销售总额.先将该月的全部销售发票存根进行了编号:1,2,3,…,然后拟采用系统抽样的方法获取一个样本.若从编号为1,2,…,10的前10张发票存根中随机抽取一张,然后再按系统抽样的方法依编号顺序逐次产生第二张、第三张、第四张、…,则抽样中产生的第11.(2014•福建模拟)为调查某校学生喜欢数学课的人数比例,采用如下调查方法:(1)在该校中随机抽取100名学生,并编号为1,2,3, (100)(2)在箱内放置两个白球和三个红球,让抽取的100名学生分别从箱中随机摸出一球,记住其颜色并放回;(3)请下列两类学生举手:(ⅰ)摸到白球且号数为偶数的学生;(ⅱ)摸到红球且不喜欢数学课的学生.13.(2014•安徽模拟)在样本的频率分布直方图中,共有11个小长方形,若中间一个长方形的面积等于其他十个小长方形面积的和的,且样本容量是160,则中间一组的频数为()14.(2014•江西模拟)在样本的频率分布直方图中,一共有m(m≥3)个小矩形,第3个小矩形的面积等于其余m﹣1个小矩形面积之和的,且样本容量为100,则第3组的频数是()15.(2014•许昌二模)在抽查产品尺寸的过程中,将尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组C D16.(2014•锦州二模)学校为了解学生在课外读物方面的支出情况,抽取了n个同学进行调查,结果显示这些同学的支出都在[10,50)(单位:元),其中支出在[30,50)(单位:元)的同学有67人,其频率分布直方图如图所示,则n的值为()17.(2014•浙江二模)如图是某班50位学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90)[90,100),则图中x的值等于()0.048C18.(2013•临汾模拟)某一个班全体学生参加物理测试,成绩的频率分布直方图如图,则该班的平均分估计是()二.解答题(共12小题)19.(2014•广东)随机观测生产某种零件的某工作厂25名工人的日加工零件个数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据1212(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.20.(2014•凉州区二模)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:(Ⅰ)分别估计用A配方,B配方生产的产品的优质品率;(Ⅱ)已知用B配方生成的一件产品的利润y(单位:元)与其质量指标值t的关系式为y=从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)21.(2014•安徽)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联附:K2=.22.(2014•辽宁)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表”;(Ⅱ)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:X2=23.(2014•烟台三模)某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果从中任取2人,求至少有1人的学历为研究生的概率;(Ⅱ)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值.24.(2014•肇庆二模)为考察高中生的性别与是否喜欢数学课程之间的关系,在我市某普通中学高中生中随机抽取”?(2)若采用分层抽样的方法从不喜欢数学课的学生中随机抽取5人,则男生和女生抽取的人数分别是多少?(3)从(2)随机抽取的5人中再随机抽取3人,该3人中女生的人数记为ξ,求ξ的数学期望.25.(2014•仙游县模拟)如图所示是预测到的某地5月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择5月1日至5月13日中的某一天到达该市,并停留2天.(Ⅰ)求此人到达当日空气重度污染的概率;(Ⅱ)求此人在该市停留期间只有1天空气质量优良的概率;(Ⅲ)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)26.(2014•唐山二模)某种水果的单个质量在500g以上视为特等品随机抽取1000个水果.结果有50个特等品.将这50个水果的质量数据分组,得到所示的频率分布表.(Ⅰ)估计该水果的质量不少于560g的概率;27.(2014•遵义二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为酒后驾车;当Q>80时,为醉酒驾车.济南市公安局交通管理部门于2011年2月的某天晚上8点至11点在市区设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图,为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(1)求此次拦查中醉酒驾车的人数;(2)从违法驾车的60人中按酒后驾车和醉酒驾车利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取3人,求3人中含有醉酒驾车人数x的分布列和期望.28.(2014•河南一模)某企业员工500人参加“学雷锋”志愿活动,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.6人,年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(Ⅱ)的前提下,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.29.(2014•大港区二模)某市为增强市民的环境保护意识,面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示.(1)若从第3,4,5组中用分层抽样的方法抽取6名志愿者参广场的宣传活动,应从第3,4,5组各抽取多少名志愿者?(2)在(1)的条件下,该县决定在这6名志愿者中随机抽取2名志愿者介绍宣传经验,求第4组至少有一名志愿者被抽中的概率.30.(2014•太原二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为“酒后驾车”;当Q>80时,为“醉酒驾车”某市公安局交通管理部门于2013年11月的某天晚上8点至11点在该市区解放路某处设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(Ⅰ)求此次拦查中“醉酒驾车”的人数;(Ⅱ)从违法驾车的60人中按“酒后驾车”和“醉酒驾车”利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取2人,求2人中其中1人为“酒后驾车”另1人为“醉酒驾车”的概率.参考答案与试题解析一.选择题(共18小题)1.(2014•四川)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读2.(2014•重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性.=0.4x+2.3 =2x﹣2.4 C=﹣2x+9.5D.=﹣0.3x+4.4样本平均数=3.5得到回归方程为=bx+a,则()=5.5,∴=4.(2014•唐山二模)用简单随机抽样的方法从含有100个个体的总体中依次抽取一个容量为5的样本,则个体m .C D.个个体,某个个体被抽到的概率为×.5.(2014•揭阳三模)某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人=×=9×6.(2014•黄冈模拟)2014年3月,为了调查教师对第十二届全国人民代表大会二次会议的了解程度,安庆市拟采用分层抽样的方法从A,B,C三所不同的中学抽取60名教师进行调查.已知A,B,C学校中分别有180,270,7.(2014•湖北模拟)某学校用分层抽样的方法从三个年级抽取若干学生,调查“马年春节”学生参加社会实践活动情)故有=,,解得8.(2014•闸北区三模)某初级中学领导采用系统抽样方法,从该校预备年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k==16,即每16人抽取一个人.在1~16中随机9.(2014•大连一模)某小礼堂有25排座位,每排有20个座位.一次心理讲座时礼堂中坐满了学生,讲座后为了10.(2014•江西模拟)月底,某商场想通过抽取发票的10%估计该月的销售总额.先将该月的全部销售发票存根进行了编号:1,2,3,…,然后拟采用系统抽样的方法获取一个样本.若从编号为1,2,…,10的前10张发票存根中随机抽取一张,然后再按系统抽样的方法依编号顺序逐次产生第二张、第三张、第四张、…,则抽样中产生的第11.(2014•福建模拟)为调查某校学生喜欢数学课的人数比例,采用如下调查方法:(1)在该校中随机抽取100名学生,并编号为1,2,3, (100)(2)在箱内放置两个白球和三个红球,让抽取的100名学生分别从箱中随机摸出一球,记住其颜色并放回;(3)请下列两类学生举手:(ⅰ)摸到白球且号数为偶数的学生;(ⅱ)摸到红球且不喜欢数学课的学生.,摸到白球的概率为=0.4×0.4=2013.(2014•安徽模拟)在样本的频率分布直方图中,共有11个小长方形,若中间一个长方形的面积等于其他十个小长方形面积的和的,且样本容量是160,则中间一组的频数为()14.(2014•江西模拟)在样本的频率分布直方图中,一共有m(m≥3)个小矩形,第3个小矩形的面积等于其余m ﹣1个小矩形面积之和的,且样本容量为100,则第3组的频数是()15.(2014•许昌二模)在抽查产品尺寸的过程中,将尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组C D,列出方程求出∴∴=16.(2014•锦州二模)学校为了解学生在课外读物方面的支出情况,抽取了n个同学进行调查,结果显示这些同学的支出都在[10,50)(单位:元),其中支出在[30,50)(单位:元)的同学有67人,其频率分布直方图如图所示,则n的值为()根据频率计算公式,可得=0.6717.(2014•浙江二模)如图是某班50位学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90)[90,100),则图中x的值等于()0.048C18.(2013•临汾模拟)某一个班全体学生参加物理测试,成绩的频率分布直方图如图,则该班的平均分估计是()二.解答题(共12小题)19.(2014•广东)随机观测生产某种零件的某工作厂25名工人的日加工零件个数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.为事件,的概率为=,),的概率为.20.(2014•凉州区二模)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:(Ⅱ)已知用B配方生成的一件产品的利润y(单位:元)与其质量指标值t的关系式为y=从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)配方生产的产品中优质的频率为配方生产的产品中优质品的频率为21.(2014•安徽)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联附:K2=.×=90≈22.(2014•辽宁)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表”;(Ⅱ)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:X2=人,共有名喜欢甜品,有=3人喜欢甜品的概率23.(2014•烟台三模)某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果从中任取2人,求至少有1人的学历为研究生的概率;(Ⅱ)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值.∴人的教育程度为研究生的概率为)解:依题意得:∴24.(2014•肇庆二模)为考察高中生的性别与是否喜欢数学课程之间的关系,在我市某普通中学高中生中随机抽取”?(2)若采用分层抽样的方法从不喜欢数学课的学生中随机抽取5人,则男生和女生抽取的人数分别是多少?(3)从(2)随机抽取的5人中再随机抽取3人,该3人中女生的人数记为ξ,求ξ的数学期望.)∵)男生抽取的人数有:(人)∵,,1 2 3的数学期望为25.(2014•仙游县模拟)如图所示是预测到的某地5月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择5月1日至5月13日中的某一天到达该市,并停留2天.(Ⅰ)求此人到达当日空气重度污染的概率;(Ⅱ)求此人在该市停留期间只有1天空气质量优良的概率;(Ⅲ)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)…=26.(2014•唐山二模)某种水果的单个质量在500g以上视为特等品随机抽取1000个水果.结果有50个特等品.将这50个水果的质量数据分组,得到所示的频率分布表.(Ⅰ)估计该水果的质量不少于560g的概率;,结合表格易得所要求的数据;=,解出+=0.16+0.04=0.2,解得27.(2014•遵义二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为酒后驾车;当Q>80时,为醉酒驾车.济南市公安局交通管理部门于2011年2月的某天晚上8点至11点在市区设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图,为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(1)求此次拦查中醉酒驾车的人数;(2)从违法驾车的60人中按酒后驾车和醉酒驾车利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取3人,求3人中含有醉酒驾车人数x的分布列和期望.===28.(2014•河南一模)某企业员工500人参加“学雷锋”志愿活动,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(Ⅱ)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(Ⅱ)的前提下,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.29.(2014•大港区二模)某市为增强市民的环境保护意识,面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示.(1)若从第3,4,5组中用分层抽样的方法抽取6名志愿者参广场的宣传活动,应从第3,4,5组各抽取多少名志愿者?(2)在(1)的条件下,该县决定在这6名志愿者中随机抽取2名志愿者介绍宣传经验,求第4组至少有一名志愿者被抽中的概率.,=.30.(2014•太原二模)中华人民共和国《道路交通安全法》中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20≤Q≤80时,为“酒后驾车”;当Q>80时,为“醉酒驾车”某市公安局交通管理部门于2013年11月的某天晚上8点至11点在该市区解放路某处设点进行一次拦查行动,共依法查出了60名饮酒后违法驾驶机动车者,如图为这60名驾驶员抽血检测后所得结果画出的频率分布直方图(其中Q≥140的人数计入120≤Q<140人数之内).(Ⅰ)求此次拦查中“醉酒驾车”的人数;(Ⅱ)从违法驾车的60人中按“酒后驾车”和“醉酒驾车”利用分层抽样抽取8人做样本进行研究,再从抽取的8人中任取2人,求2人中其中1人为“酒后驾车”另1人为“醉酒驾车”的概率.种,。
8.5 统计案例(精讲)(提升版)思维导图考点一独立性检验【例1】(2022·吉林·梅河口市第五中学高三开学考试)某中学准备组建“文科”兴趣特长社团,由课外活动小组对高一学生进行了问卷调查,问卷共100道题,每题1分,总分100分,该课外活动小组随机抽取了100名学生的问卷成绩(单位:分)进行统计,将数据按照[0,20),[20,40),[40,60),[60,80),[80,100]分成5组,绘制的频率分布直方图如图所示,若将不低于60分的称为“文科方向”学生,低于60分的称为“理科方向”学生.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99.5%的把握认为“文科方向”与性别有关?理科方向文科方向总计男40女45考点呈现例题剖析总计 1001人,共抽取4次,记被抽取的4人中“文科方向”的人数为X ,若每次抽取的结果是相互独立的,求X 的分布列和数学期望.参考公式:()()()()22()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.参考临界值:()2P k αχ=0.10 0.05 0.025 0.010 0.005 0.001k2.7063.841 5.024 6.635 7.879 10.828【一隅三反】1.(2022·白山模拟)十三届全国人大四次会议表决通过了关于国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议,决定批准这个规划纲要,纲要指出:“加强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流、大束流、高能、特种应用及第三代半导体等离子注入机,工艺段覆盖至28nm,为我国芯片制造产业链补上重要一环,为全球芯片制造企业提供离子注入机一站式解决方案.此次技术的突破可以说为国产芯片的制造做出了重大贡献.该企业使用新技术对某款芯片进行试生产,在试产初期,生产一件该款芯片有三道工序,每道工序的生产互不影响,这三道工序的次品率分别为118,119,120.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.()2P K k≥0.0500.0100.0050.001 k 3.841 6.6357.87910.828(①P①100X(2)某手机生产厂商将该款芯片投入到某新款手机上使用,并对部分芯片做了技术改良,推出了两种型号的手机,甲型号手机采用没有改良的芯片,乙型号手机采用改良了的芯片,现对使用这两种型号的手机用户进行回访,就他们对开机速度进行满意度调查.据统计,回访的100名用户中,使用甲型号手机的有30人,其中对开机速度满意的有15人;使用乙型号手机的有70人,其中对开机速度满意的有55人.完成下列22⨯列联表,并判断是否有99.5%的把握认为该项技术改良与用户对开机速度的满意度有关.甲型号乙型号合计满意不满意合计2.(2022·陕西咸阳·三模(理))2022年北京冬奥组委发布的《北京2022年冬奥会和冬残奥会经济遗产报告(2022)》显示,北京冬奥会已签约45家赞助企业,冬奥会赞助成为一项跨度时间较长的营销方式.为了解该45家赞助企业每天销售额与每天线上销售时间之间的相关关系,某平台对45家赞助企业进行跟踪调查,其中每天线上销售时间不少于8小时的企业有20家,余下的企业中,每天的销售额不足30万元的企业占35,统计后得到如下22⨯列联表:销售额不少于30万元销售额不足30万元合计线上销售时间不少于8小时 17 20 线上销售时间不足8小时合计45售时间有关?(2)按销售额在上述赞助企业中采用分层抽样方法抽取5家企业.在销售额不足30万元的企业中抽取时,记“抽到线上销售时间不少于8小时的企业数”为X ,求X 的分布列和数学期望. 附: ()20P K k ≥0.050 0.010 0.001 0k3.841 6.635 10.828参考公式:()()()()2 n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.考点二 线性回归方程【例2-1】(2022·齐齐哈尔模拟)某单位为了解夏季用电量与月份的关系,对本单位2021年5月份到8月份的日平均用电量y (单位:千度)进行了统计分析,得出下表数据:月份(x )5 6 7 8 日平均用电量(y )1.93.4t7.11.7877ˆ.0y x =-t 的值为( )A .5.8B .5.6C .5.4D .5.2【例2-2】(2022·湖南模拟)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价x (元/件) 8 8.2 8.4 8.6 8.8 9 销量y (万件)908483807568附:参考公式:回归方程ˆˆˆybx a =+,其中()()()iii ii 1i 1222iii 1i 1ˆnnx x y y x y nxyb x x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 参考数据:614066i ii x y==∑,621434.2i i x ==∑.(1)(i )根据以上数据,求y 关于x 的线性回归方程;(ii )若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润.(2)为了解该产品的价格是否合理,在试销平台上购买了该产品的顾客中随机抽了400人,阅读“购买后的评价”得知:对价格满意的有300人,基本满意的有50人,不满意的有50人.为进一步了解顾客对该产品价格满意度形成的原因,在购买该产品的顾客中随机抽取4人进行电话回访,记抽取的4人中对价格满意的人数为随机变量X ,求随机变量X 的分布列和数学期望.(视频率为相应事件发生的概率)【一隅三反】1.(2022·安徽三模)对某位同学5次体育测试的成绩(单位:分)进行统计得到如下表格:第x 次 1 2 3 4 5 测试成绩y3940484850根据上表,可得关于的线性回归方程为ˆ3ˆy x a =+,下列结论不正确的是( )A .ˆ36a= B .这5次测试成绩的方差为20.8 C .y 与x 的线性相关系数0r < D .预测第6次体育测试的成绩约为542.(2022·安徽模拟)新冠疫情期间,口罩的消耗量日益增加,某药店出于口罩进货量的考虑,连续9天统计了第i (i 1239)x =,,,,天的口罩的销售量i y (百件),得到的数据如下:99i i i=1i=145171x y ==∑∑,,()99922ii i i i=1i=1i=1312528510953x x y y y ==-=∑∑∑,,. 参考公式:相关系数()()()()iii=122iii=1i=1nnnx x y y r x x y y --=--∑∑∑数据()i i ()i 123x y n =,,,,,,其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计分别为()()()iii i1222i i11ˆˆˆnn i inni i x x y y x y nxybay bx x x xnx ===---===---∑∑∑∑, (1)若用线性回归模型ˆˆˆybx a =+拟合y 与x 之间的关系,求该回归直线的方程; (2)统计学家甲认为用(1)中的线性回归模型(下面简称模型1)进行拟合,不够精确,于是尝试使用非线性模型(下面简称模型2)得到i x 与i y 之间的关系,且模型2的相关系数20989r =.,试通过计算说明模型1,2中,哪一个模型的拟合效果更好. 3.(2022·湖南模拟)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价x (元/件) 8 8.2 8.4 8.6 8.8 9 销量y (万件)908483807568附:参考公式:回归方程ˆˆˆybx a =+,其中()()()iiiii 1i 1222iii 1i 1ˆnnx x y y x y nxyb x x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 参考数据:614066i ii x y==∑,621434.2i i x ==∑.(1)(i )根据以上数据,求y 关于x 的线性回归方程;(ii )若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润.(2)为了解该产品的价格是否合理,在试销平台上购买了该产品的顾客中随机抽了400人,阅读“购买后的评价”得知:对价格满意的有300人,基本满意的有50人,不满意的有50人.为进一步了解顾客对该产品价格满意度形成的原因,在购买该产品的顾客中随机抽取4人进行电话回访,记抽取的4人中对价格满意的人数为随机变量X,求随机变量X的分布列和数学期望.(视频率为相应事件发生的概率)考点三非线性回归方程【例3】(2022·福建·三明一中模拟预测)当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近5年区块链企业总数量相关数据,如下表年份20172018201920202021编号x12345企业总数量y(单位:千个) 2.156 3.7278.30524.27936.224(1)根据表中数据判断,y a bx=+与e dxy c=(其中 2.71828e=…为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由),并根据你的判断结果求y关于x的回归方程;(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;①每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;①在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,求甲公司获得“优胜公司”的概率.参考数据:5174.691i i y ==∑,51312.761i i i x y ==∑,5110.980i i z ==∑,5140.457i i i x z ==∑(其中ln z y =). 附:样本(),(1,2,,)i i x y i n =的最小二乘法估计公式为1221ˆni ii nii x y nx ybxnx==-=-∑∑,ˆa y bx=-.【一隅三反】1.(2022·山西二模)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017-2021年中国在线直播用户规模(单位:亿人),其中2017年-2021年对应的代码依次为1-5.年份代码x 1 2 3 4 5 市场规模y3.984.565.045.866.36参考数据: 5.16y =, 1.68v =,145.10i ii v y==∑,其中i i v x =.参考公式:对于一组数据()11v y ,,()22v y ,,…,()n n v y ,,其回归直线ˆˆˆybv a =+的斜率和截距的最小二乘估计公式分别为1221ˆni ii ni i v y nvybv nv ==-=-∑∑,ˆˆay bv =-. (1)由上表数据可知,可用函数模型ˆˆyx a =拟合y 与x 的关系,请建立y 关于x 的回归方程(ˆa ,ˆb 的值精确到0.01);(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p ,现从中国在线直播购物用户中随机抽取4人,记这4人中选择在品牌官方直播间购物的人数为X ,若()()34P X P X ===,求X 的分布列与期望.2.(2022·广东广州·一模)人们用大数据来描述和定义信息时代产生的海量数据,并利用这些数据处理事务和做出决策,某公司通过大数据收集到该公司销售的某电子产品1月至5月的销售量如下表. 月份x1 2 3 4 5 销售量y (万件)4.95.86.88.310.2该公司为了预测未来几个月的销售量,建立了y 关于x 的回归模型:ˆv . (1)根据所给数据与回归模型,求y 关于x 的回归方程(ˆu 的值精确到0.1);(2)已知该公司的月利润z (单位:万元)与x ,y 的关系为z x x=,根据(1)的结果,问该公司哪一个月的月利润预报值最大? 参考公式:对于一组数据()()()1122,,,,,,n n x y x y x y ,其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-.11 / 113.(2022·广东肇庆·二模)下表是我国从2016年到2020年能源消费总量近似值y (单位:千万吨标准煤)的数据表格: 年份2016 2017 2018 2019 2020 年份代号x1 2 3 4 5 能源消费总量近似值y (单位:千万吨标准煤) 442 456 472 488 498以x 为解释变量,y 为预报变量,若以11为回归方程,则相关指数210.9946R ≈,若以22ˆln ya b x =+为回归方程,则相关指数220.9568R ≈. (1)判断11ˆyb x a =+与22ˆln y a b x =+哪一个更适宜作为能源消费总量近似值y 关于年份代号x 的回归方程,并说明理由;(2)根据(1)的判断结果及表中数据,求出y 关于年份代号x 的回归方程.参考数据:512356i i y ==∑,517212i i i x y ==∑.参考公式:回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211ˆn ni i i ii i n n ii i i x x y y x y nxy b x x x nx ====---==--∑∑∑∑,ˆˆa y bx =-.。
高中数学:统计与统计案例练习一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100 名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1 : 3 : 5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()领率组距A. 200 C. 400 0.0350.015B. 240D. 48010平均每周上网时间(h)解析:选C 设频率分布直方图中从左到右前3个小矩形的面积分别为A3K5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)X2 = 0.1.由于频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即尸=0.1.所以平均每周上网时间少于4h的学生所占比例为尸+3P=0.4,由此估计学生人数为0.4X1 000 =400.2. AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0〜50),二级良(51〜100),三级轻度污染(101〜150),四级中度污染(151〜200),五级重度污染(201〜300),六级严重污染(大于300).如图是昆明市2021年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2021年4月份空气质量优的天数为 ()A. 3B. 4C. 12D. 2142解析:选c 从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为 1 V.Z 22所以估计昆明市2021年4月份空气质量为优的天数为30X5=12,应选C.3.〔成都模拟〕某城市收集并整理了该市2021年1月份至10月份各月最低气温与最高气 温〔单位:C 〕的数据,绘制了下面的折线图.该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误 的是〔〕A.最低气温与最高气温为正相关B. 10月的最高气温不低于5月的最高气温C.月温差〔最高气温减最低气温〕的最大值出现在1月D.最低气温低于0C 的月份有4个解析:选D 在A 中,最低气温与最高气温为正相关,故A 正确;在B 中,10月的最高气温 不低于5月的最高气温,故B 正确;在C 中,月温差〔最高气温减最低气温〕的最大值出现在1月, 故C 正确:在D 中,最低气温低于0℃的月份有3个,故D 错误.应选D.4 .〔承德模拟〕为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取 了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体 中倾向选择生育二胎与倾向选择不生育二胎的人数比例图〔如下图〕,其中阴影局部表示倾向 选择生育二胎的对应比例,那么以下表达中错误的选项是〔〕A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关♦最高气温 ♦最低气温C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为 60X60% =36,女性人数为40X60%=24,不相同.应选C.5 .(石家庄模拟)某学校48两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过 茎叶图比拟两个班兴趣小组成绩的平均值及标准差.3 4 28 8 4 6 8 65152①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;@B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为()A.①④C. ®®其方差为白义[(53—78尸+(62—78/ +…+ (95—78)2]=121.6, 那么其标准差为'121.6%11.03;45+48+5H -------- F91B 班兴趣小组的平均成成为'」=66,其方差为表义[(45—66)2+(48 - 66)2 + ... + (91-66)2] =169.2, 那么其标准差为1169.2%13.01.应选A.6 .某商场对某一商品搞活动,该商品每一个的进价为3元,销售价为8元,每天售出的 第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如下图,设M 个)为每天商 品的销量,M 元)为该商场每天箱售这种商品的利润.从日利润不少于96元的几天里任选2天, 那么选出的这2天日利润都是97元的概率为()4 5 5 1 6 2 7 38班8 3 6 4 5 3 4 02B.②③D.①③解析:选A A 班兴趣小组的平均成绩为 53+62+64+…+92+95--------------- ---------------- =785x, x=18, 19, y =<l95+(x-19)(4-3), x=20, 21, J5x, x=18, 19, 即 L176+x, x=20, 21.当日销量不少于20个时,日利泗不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利泗为96元的有3天,记为日利泗为97元的有2天,记为人丛从中任选2天有 (.4),(〃石),(.力),(.1),3/),(48),3«),(c4),(.,8),(48),共 10 种情况.其中选出的这2天日利泗都是97元的有(A,8)1种情况. 故所求概率为关.应选B. 二、填空题7 .某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0 销量w 瓶504443403528x,y 的关系符合回归方程£=£+2其中分=-20.假设该品牌饮料的进价为2元,为使利润 最大,零售价应定为 元.解析:依题意得:x =3.5, y =40,A所以.=40—(- 20)X3.5=110,所以回归直线方程为f=-20x+110,利润 L = (A —2)(-20A + 110)= -201+ 150x-220,B 选• •1 - 9 1 - 5 A.C 解BioD.g由题意知频数(天)0 18 19 20 2 俏量〔个〕所以x=* = 3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是.解析:设所求的人数为〃,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08 +0.16) X 2.5=0.7, n=0.7 X 200=140.答案:1409.为比拟甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:C) 制成如下图的茎叶图,甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,那么甲地该月11时的平均气温的标准差为.甲9 8 2 62 m 03 I解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+〃?,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,那么乙地该月11时的平均气温为(26+28+29+31+31计5 = 29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m + 32)+5 = 30,解得〃?=1,那么甲地该月11时的平均气温的标准差为嗝义[(28 - 30产+(29 - 30)2+(30 - 30/+(31 - 30/+(32 - 30户]=\(2.答案:^2三、解做题10.某篮球运发动的投篮命中率为50%,他想提升自己的投篮水平,制定了一个夏季练习计划,为了了解练习效果,执行练习前他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为463执行练习后也统计了10场比赛的得分,茎叶图如下图:0 8 91 2 4 4 5 6 82 1 3(1)请计算该篮球运发动执行练习后统计的10场比赛得分的中位数、平均得分与方差;⑵如果仅从执行练习前后统计的各10场比赛得分数据分析,你认为练习方案对该运发动的投篮水平的提升是否有帮助?为什么?解:(1)练习后得分的中位数为上芋=14.5;平均得分为8+9+12+14+14+15+16+18 + 21+23= 15:10方差为击义[(8—15)2 + (9 — 15>+(12 —15>+(14 — 15)2+(14 — 15> + (15 —15>+(16 — 15产+(18-15)2+(21-15)2+(23 —15)2]=20.6.(2)尽管中位数练习后比练习前稍小,但平均得分一样,练习前方差20.6小于练习前方差46.3, 说明练习后得分稳定性提升了(阐述观点合理即可),这是投篮水平提升的表现.故此练习方案对该篮球运发动的投篮水平的提升有帮助.11.(西安八校联考)在2021年俄罗斯世界杯期间,莫斯科的局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:⑴销售单价),与等级代码数值x之间存在线性相关关系,求),关于x的线性回归方程(系数精确到0.1);(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(xi1 ),3,光),…其回归直线f=源+2的斜率和截距的最小2Xyi一〃x y八 '। A — A——二乘估计分别为Z? = ----------------- a= y —b x .n _Xxr-n x 26 6参考数据:2>»=8 440, 2e = 25 564.—38+48 + 58 + 68 + 78 + 88解:(1)由题意,得x -■= 63,- 16.8+18.8+20.8 + 22.8 + 24+25.8 _y = 6 =21.5,yA_8 440 - 6X63X21.5〜h = ~~6Z—=25 564—6X63X63「026 A 2A — A 一a= y -bx =21.5-0.2X63 = 8.9.故所求线性回归方程为f=0.2x+8.9.⑵由(1)知,当%=98 时,>=0.2X98+8.9=28.5.・•・估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术测试的100人的成绩进行了统计, 绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).(1)求图中.的值;(2)估计该次测试的平均分不(同一组中的数据用该组的区间中点值代表);(3)根据条件完成下面2X2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.P(K?2k)0.40 0.25 0.15 0.1()0.050.025k0.708 1.323 2.072 2.706 3.841 5.024解:(1)由频率分布直方图中各小长方形面积总和为1,得(2.+ 0.020+0.03.+0.040)义10=1,解得〃=0...5.⑵由频率分布直方图知洛小组的中点值依次是55,65,75,85,95, 对应的频率分别为0.05.30,0.40,0.20.05,那么估计该次测试的平均分为 x = 55X0.05 + 65X0.30 + 75X0.40 + 85X0.20 + 95X0.05 = 74(分). ⑶由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25, 故晋级成功的人数为100X0.25 = 25,填写2X2列联表如下:晋级成功 晋级失败合计男 16 34 50 女 9 41 50 合计2575100100X(16X41 ——25X75X50X50^2,613>2.072,所以有85%的把握认为“晋级成功〞与性别有关.1 .为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单 位:小时)如下:248 256 232 243 188 268 278 266 289 312 274296 288 302 295 228 287 217 329 283K 2=n(acl-bc)2(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:0.0100 ——⑵由题意可得8乂(0.30+0.10+0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190X0.05 + 210X0.05 + 230X0.10 + 250X0.15 + 270X0.20 + 290X0.30 + 310X0.10 + 330X0.05 = 269(小时),所以样本的平均无故障连续使用时限为269小时.2 .海水养殖场进行某水产品的新、旧网箱养殖方法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg 〞,估计A 的概率;⑵填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量V50 kg箱产量250 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比拟. 附:P (心2)0.050 0.010 0.001 k3.841 6.635 10.8280.01500.0125频率 仇距0.0075 0.0050 0.0025.厂工丁丁丁丁厂!无故障连续使用时用/小时新养殖法、n(ad-bc)1 _ .K-= . , , ,,其中〃=a+/?+c+d.(a+Z?)(c 十d)(a十c)(Z?+d)解:⑴旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)X5=0.62.因此,事件A的概率估计值为0.62.⑵根据箱产量的频率分布直方图得到联表:K2=---------- -------------------- 15 705100X100 X 96X104由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图说明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x =+£即=9.97,5=、*ZG L x )21 /=1 \ / 1O/=1/ 1 16 _ / 16 16 _=、/讳16 X 2比0.212, / L G-8.5)2^ 18.439,Z (x,- x )(L8.5)=—2.78,其中为为抽取的第i个零件的尺寸,i= 1,2, (16)(1)求⑶,i)(i= 12…,16)的相关系数二并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设加V0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(刀-35,7 +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(7 -35,7 +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(H,v)(i = 12…4的相关系数£(X,-7)(57-7)r=I ______/ / ・、/(),008公丫0・09・、/ £ d )2、/ £ 8 - 5 )216 _Z (XL x )(/—8.5)尸1解:(1)由样本数据得8,i)(i= 1,2,…,16)的相关系数为r= --------- /--- 1/16 _ / 16、/ Z (即- X C-8.5)2 -2.78剔除第13个数据,剩下数据的样本方差为aX 〔1 591.134 —9.22?—15X 10.022〕=0.008,A Q 这条生产线当天生产的零件尺寸的标准差的估计值为廊而比0.09.4.〔昆明模拟〕〞工资条里显红利,个税新政入民心〞.随着2021年新年钟声的敲响,我国 自1980年以来,力度最大的一次个人所得税〔简称个税〕改革迎来了全面实施的阶段.某IT 从业 者为了解自己在个税新政下能享受多少税收红利,绘制了他在26〜35岁〔2021〜2021年〕之间各 年的月平均收入〕,〔单位:千元〕的散点图:20・・・・ 16- ・ , 12- ., 8 ■ •4°123456789 io"年龄代码工注:年龄代码1~10分别对应年的26〜35岁⑴由散点图知,可用回归模型y=h\n x+a 拟合〕,与x 的关系,试根据有关数据建立〕,关于x 的回归方程;〔2〕如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用〔1〕的结果,将月平 均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.1010 10 _10_ _ 10附注:参考数据:= 55,2〕〉= 155.5,N 〔即一x 〕2 =82.5,2 — x〕〔F — y 〕 = 94.9,26= i=li=li=lJ =1io _ io _ _15.1,2 缶- 1〕2=4.84,£〔力一 t 〕〔yi- y 〕 =242其中"=ln 为;取 In 11 =24,In 36=361=1 /=1参考公式:回归方程.=筋+味中斜率和截距的最小二乘估计分别为公= n ______ _X 〔出一〃〕〔.- V 〕 曰 A - A — -------------------------- \a= v —b u .Z 〔3一 〃 〕2月平均收入y千元解:(1)令 f=lnx,那么 y=bf+a10__Z & -,)()L y)24.2, b ~ ~__Z _痴_5ze —)2r=l10Zu-_2__155.5-_2_=而=-^-=15.55, t =苗A — A —a= y —b t = 15.55 —5X 1.51=8,所以〕,关于/的回归方程为〕,=5/+8.1015.1 lo"=L51由于/=lnx,所以y关于x的回归方程为y=51nx+8.⑵由⑴得,该IT从业者36岁时月平均收入为y=51n 11+8 = 5X2.4+8 = 20〔千元〕.旧个税政策下每个月应缴纳的个人所得税为1 500X3%+3 000X10%+4 500X20%+〔20 000-3 500-9 000〕X25% = 3 120〔元〕.新个税政策下每个月应缴纳的个人所得税为3 000X3%+〔20 000-5 OOO-3OOO-3 000〕X 10%=990〔元〕.故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(70).I— 0 180.212X716X18.439 ',由于lrlV0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于7 =9.97,产0.212,由样本数据可以看出抽取的第13个零件的尺寸在(T—3s,7 + 3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为右义(16义9.97—9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162X?=16X0.212I2+16X9.972^1 591.134,。
一、选择题1.某人射击一次命中目标的概率为12,且每次射击相互独立,则此人射击 7次,有4次命中且恰有3次连续命中的概率为( ) A .3761()2CB .2741()2AC .2741()2CD .1741()2C2.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22⨯列联表,则至少有( )的把握认为喜爱打篮球与性别有关.附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.A .99.9%B .99.5%C .99%D .97.5%3.某市通过随机询问100名不同年级的学生是否能做到“扶跌倒老人”,得到如下列联表:则下列结论正确的是( ) 附参照表:参考公式:22()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++A .在犯错误的概率不超过90%的前提下,认为“学生能否做到‘扶跌倒老人’与年级高低有关”B .在犯错误的概率不超过1%的前提下,“学生能否做到‘扶跌倒老人’与年级高低无关”C .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低有关”D .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低无关”4.甲、乙两名同学参加2018年高考,根据高三年级一年来的各种大、中、小型数学模拟考试总结出来的数据显示,甲、乙两人能考140分以上的概率分别为12和45,甲、乙两人是否考140分以上相互独立,则预估这两个人在2018年高考中恰有一人数学考140 分以上的概率为( ) A .12B .23C .34D .135.已知12P(B|A)=,P(A)=35,则()P AB 等于( ) A .56B .910 C .215D .1156.甲罐中有5个红球,2个白球和3个黑球,乙罐中有6个红球,2个白球和2个黑球,先从甲罐中随机取出一个球放入乙罐,分别以1A ,2A ,3A 表示由甲罐取出的球是红球、白球和黑球的事件,再从乙罐中随机取出一个球,以B 表示由乙罐取出的球是红球的事件,下列结论中不正确...的是( ) A .事件B 与事件1A 不相互独立 B .1A 、2A 、3A 是两两互斥的事件 C .17(|)11P B A =D .3()5P B =7.甲、乙两人抢答竞赛题,甲答对的概率为15,乙答对的概率为14,则两人中恰有一人答对的概率为 A .720B .12 20C .120D .2208.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由22()()()()()n ad bc K a b c d a c b d -=++++并参照附表,得到的正确结论是( )A .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B .在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C .有99.9%的把握认为“爱好游泳运动与性别有关”D .有99.9%的把握认为“爱好游泳运动与性别无关”9.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如右表,则下列说法正确的是( )使用智能手机 不使用智能手机 总计 学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 总计201030参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:20()P K k ≥0.10 0.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828A .有99.9%的把握认为使用智能手机对学习有影响.B .有99.9%的把握认为使用智能手机对学习无影响.C .在犯错误的概率不超过0.005的前提下认为使用智能手机对学习有影响.D .在犯错误的概率不超过0.005的前提下认为使用智能手机对学习无影响. 10.下面是22⨯列联表:则表中a b,的值分别为()A.84,60 B.42,64 C.42, 74 D.74, 4211.下列结论中正确的是()A.若两个变量的线性关系性越强,则相关系数的绝对值越接近于0B.回归直线至少经过样本数据中的一个点C.独立性检验得到的结论一定正确D.利用随机变量2x来判断“两个独立事件,X Y的关系”时,算出的2x值越大,判断“,X Y 有关”的把握越大12.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()参考公式附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:A.130 B.190 C.240 D.250二、填空题13.有甲、乙两台机床生产某种零件,甲获得正品乙不是正品的概率为14,乙获得正品甲不是正品的概率为16,且每台获得正品的概率均大于12,则甲乙同时生产这种零件,至少一台获得正品的概率是___________.14.从包括甲乙两人的6名学生中选出3人作为代表,记事件A:甲被选为代表,事件B:乙没有被选为代表,则()P B A │等于_________. 15.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.16.在10个形状大小均相同的球中有4个红球和6个白球,不放回地依次摸出2个球,在第1次摸出红球的条件下,第2次也摸出红球的概率为_________. 17.已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.18.某团队派遣甲、乙、丙、丁四人分别完成一项任务,已知甲完成任务的概率为14,乙完成任务的概率为12,丙、丁完成任务的概率均为23,若四人完成任务与否相互独立,则至少2人完成任务的概率为____.19.现有A ,B 两队参加关于“十九大”知识问答竞赛,每队3人,每人回答一个问题,答对者为本队赢1分,答错得0分;A 队中每人答对的概率均为23,B 队中3人答对的概率分别为23,23,13,且各答题人答题正确与否之间互不影响,若事件M 表示“A 队得2分”,事件N 表示“B 队得1分”,则()P MN =______.20.某校为了解家长对学校食堂的满意情况,分别从高一、高二年级随机抽取了20位家长的满意度评分,其频数分布表如下:假设两个年级家长的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率.现从高一、高二年级各随机抽取1名家长,记事件A:“高一家长的满意度等级高于高二家长的满意度等级”,则事件A发生的概率为__________.三、解答题21.随着生活质量的提升,家庭轿车保有量逐年递增.方便之余却加剧了交通拥堵和环保问题.绿色出行引领时尚,共享单车进驻城市黄泽市有统计数据显示.2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年齡分为“年轻人”(20岁~391岁)和“非年轻人”( 19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的经常使用共享单车的称为“单车族”.使用次数为5次或不足5次的称为“非单车族”.已知在“单车族”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为400的样本,请你根据图表中的数据,补全下列22列联表,并判断是否有95%的把握认为经常使用共享单车与年龄有关?使用共享单车情况与年龄列联表是“非年轻人”的人数为随机变量,X 求X 的分布列与期望. 参考数据:独立性检验界值表其中,()()()()()2,n ad bc n a b c d K a b c d a c b d -=+++=++++(注:保留三位小数). 22.奶茶是年轻人非常喜欢的饮品.某机构对于奶茶的消费情况在一商圈附近做了一些调查,发现女性喜欢奶茶的人数明显高于男性,每月喝奶茶的次数也比男性高,但单次奶茶消费金额男性似乎明显高于女性.针对每月奶茶消费是否超过百元进行调查,已知在调查的200人中女性人数是男性人数的4倍,统计如下:22⨯关?(2)在月消费超百元的调查者中,同时进行对于品牌喜好的调查.发现喜欢A 品牌的男女均为3人,现从喜欢A 品牌的这6人中抽取2人送纪念品,求这两人恰好都是女性的概率. 附:()()()()()22n ad bc K a b c d a c b d -=++++. 23.某工厂A ,B 两条相互独立的生产线生产同款产品,在产量一样的情况下,通过日常监控得知,A ,B 生产线生产的产品为合格品的概率分别为p 和21(0.51)p p -.(1)从A ,B 生产线上各抽检一件产品,若使得产品至少有一件合格的概率不低于99.5%,求p 的最小值0p ;(2)假设不合格的产品均可进行返工修复为合格品,以(1)中确定的0p 作为p 的值. ①已知A ,B 生产线的不合格品返工后每件产品可分别挽回损失5元和3元,若从两条生产线上各随机抽检1000件产品,以挽回损失的平均数为判断依据,估计哪条生产线的挽回损失较多?②若最终的合格品(包括返工修复后的合格品)按照一、二、三等级分类后,每件可分别获利10元、8元、6元,现从A ,B 生产线的最终合格品中各随机抽取100件进行分级检测,结果统计如图所示,用样本的频率分布估计总体分布,记该工厂生产一件产品的利润为X ,求X 的分布列并估计该厂产量2000件时利润的期望值.24.某小区停车场的收费标准为:每车每次停车时间不超过2小时免费,超过2小时的部分每小时收费1元(不足1小时的部分按1小时计算).现有甲乙两人独立来停车场停车(各停车一次),且两人停车时间均不超过5小时,设甲、乙两人停车时间(小时)与取车概率如表所示: 停车时间 取车概率 停车人员 (0,2](2,3](3,4](4,5]甲12xxx乙1613y(1)求甲、乙两人所付车费相同的概率;(2)设甲、乙两人所付停车费之和为随机变量ξ,求ξ的分布列和数学期望()E ξ. 25.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量()g y 与尺寸(mm)x 之间近似满足关系式b y c x =⋅(b ,c 为大于0的常数).按照某指标测定,当产品质量与尺寸的比在区间(0.302,0.388)内时为优等品.现随机抽取6件合格产品,测得数据如下:(1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率; (2)根据测得数据作了初步处理,得相关统计量的值如下表:根据所给统计量,求y 关于x 的回归方程. 附:对于样本(),(1,2,,6)i i v u i =,其回归直线u b v a =⋅+的斜率和截距的最小二乘法估计公式分别为:()()()1122211ˆnniii i i i nniii i v v u u v u nvubv v vnv ====---==--∑∑∑∑,ˆˆa u bv=-, 2.7183e ≈. 26.贝诺酯为对乙酰氨基酚与阿司匹林的酯化产物,是一种新型的抗炎、抗风湿、解热镇痛药,主要用于类风湿关节炎、急慢性风湿性关节炎、神经痛及术后疼痛.药监部门要利用小白鼠扭体实验,对某厂生产的该药品的镇痛效果进行检测,若用药后的小白鼠扭体次数没有减少,扭体时间间隔没有变长,则认定镇痛效果不明显. (1)若该药品对雌性小白鼠镇痛效果明显的概率为23,对雄性小白鼠镇痛效果明显的概率为45,药监部门要利用两只雌性和两只雄性小白鼠检测该药药效,对4只小白鼠逐一检测.若在检测过程中,一只小白鼠用药后镇痛效果明显,记录积分为1,镇痛效果不明显,则记录积分为1-.用随机变量X 表示检测4只小白鼠后的总积分,求随机变量X 的分布列和数学期望()E X ;(2)若该药品对每只雌性小白鼠镇痛效果明显的概率均为p ,现对6只雌性小白鼠逐一进行检测,当检测到镇痛效果不明显的小白鼠时,停止检测.设至少检测5只雌性小白鼠才能发现镇痛效果不明显的概率为()f p ,求()f p 最大时p 的值.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】由于射击一次命中目标的概率为12,所以关键先求出射击7次有4次命中且恰有3次连续命中的所有可能数,即根据独立事件概率公式得结果. 【详解】因为射击7次有4次命中且恰有3次连续命中有24A 种情况,所以所求概率为7241A 2⎛⎫⋅ ⎪⎝⎭.选B. 【点睛】本题考查排列组合以及独立事件概率公式,考查基本分析求解能力,属中档题.2.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.3.C解析:C 【解析】分析:根据列联表中数据,利用公式求得2 3.03K ≈,参照临界值表即可得到正确结论. 详解:由公式()()()()()22n d bc k a b c d a c b d -=++++可得2 3.03K ≈,参照临界值表,2.7063.030 3.841<<,∴0090以上的把握认为,“学生能否做到‘扶跌倒老人’与年级高低有关”,故选C.点睛:本题考查了独立性检验的应用,属于基础题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.4.A解析:A 【解析】分析:根据互斥事件概率加法公式以及独立事件概率乘积公式求概率.详解:因为这两个人在2018年高考中恰有一人数学考140 分以上的概率为甲考140 分以上乙未考到140 分以上事件概率与乙考140 分以上甲未考到140 分以上事件概率的和,而 甲考140 分以上乙未考到140 分以上事件概率为14(1)25⨯-,乙考140 分以上甲未考到140 分以上事件概率为14(1)25-⨯,因此,所求概率为14(1)25⨯-1451(1)25102+-⨯==, 选A.点睛:本题考查互斥事件概率加法公式以及独立事件概率乘积公式,考查基本求解能力.5.C解析:C 【解析】分析:根据条件概率的计算公式,即可求解答案. 详解:由题意,根据条件概率的计算公式()()|()P AB P B A P A =, 则()()()122|3515P AB P B A P A =⋅=⨯=,故选C. 点睛:本题主要考查了条件概率的计算公式的应用,其中熟记条件概率的计算公式是解答的关键,着重考查了推理与运算能力.6.D解析:D 【解析】分析:由题意1A ,2A ,3A是两两互斥事件,条件概率公式求出1(|)P B A ,()()()()123P B P A B P A B P A B =++,对照选项即可求出答案.详解:由题意1A ,2A ,3A是两两互斥事件, ()()()12351213,,10210510P A P A P A =====, ()()()111177211|1112P BA P B A P A ⨯===,()23|11P B A =,()33|11P B A =,而()()()()123P B P A B P A B P A B =++()()()()()()112233|||P A P B A P A P B A P A P B A =++1713332115111011=⨯+⨯+⨯ 511=. 所以D 不正确. 故选:D.点睛:本题考查相互独立事件,解题的关键是理解题设中的各个事件,且熟练掌握相互独立事件的概率简洁公式,条件概率的求法,本题较复杂,正确理解事件的内蕴是解题的关键.7.A解析:A 【解析】第一种:甲答对,乙答错,此时概率为11315420⎛⎫⨯-=⎪⎝⎭;第二种:甲答错,乙答对,此时的概率为11415420⎛⎫-⨯= ⎪⎝⎭. 综上,两人中恰有一人答对的概率为347202020+=. 故选A.8.A解析:A 【解析】()()()()()22n ad bc K a b c d a c b d -=++++2110(1200400)7.82 6.63560506050-=≈>⨯⨯⨯所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”,选A.9.C解析:C 【解析】 经计算,()2230421681020101218K ⨯-⨯==⨯⨯⨯,27.87910.828K <<,对照数表知,在犯错误的概率不超过0.005的前提下认为使用智能手机对学习有影响,故选C .点睛:本题考查了独立性检验的应用问题,是基础题;其解题步骤为:(1)认真读题,取出相关数据,作出22⨯列联表;(2)根据22⨯列联表中的数据,计算2K 的观测值k ;(3)通过观测值k 与临界值0k 比较,得出事件有关的可能性大小.10.B解析:B 【解析】因2163a +=,故42a =,又22a b +=,则64b = ,应选答案B 。
20XX年高中测试高中试题试卷科目:年级:考点:监考老师:日期:统计案例测试题一一、选择题:本大题共道小题,每小题分,共分,在每小题给出的四个选项中,只有一项符合题目要求1、对于散点图下列说法中正确一个是()(A)通过散点图一定可以看出变量之间的变化规律(B)通过散点图一定不可以看出变量之间的变化规律(C)通过散点图可以看出正相关与负相关有明显区别(D)通过散点图看不出正相关与负相关有什么区别2、在画两个变量的散点图时,下面叙述正确的是()(A)预报变量在轴上,解释变量在轴上(B)解释变量在轴上,预报变量在轴上(C)可以选择两个变量中的任意一个变量在轴上(D)可以选择两个变量中的任意一个变量在轴上3、如果根据性别与是否爱好运动的列联表,得到,所以判断性别与运动有关,那么这种判断出错的可能性为()(A)(B)(C)(D)4、下列关于线性回归的说法,不正确的是()(A)变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;(B)在平面直角坐标系中用描点法的方法得到表示具有相关关系的两个变量的一组数据的图形叫散点图;(C)线性回归直线方程最能代表观测值之间的关系;(D)任何一组观测值都能得到具有代表意义的回归直线方程;5、在两个变量与的回归模型中,分别选择了四个不同的模型,它们的相关指数如下,其中拟合效果最好的为()(A)模型①的相关指数为(B)模型②的相关指数为(C)模型③的相关指数为(D)模型④的相关指数为6、关于如何求回归直线的方程,下列说法正确的一项是()(A)先画一条,测出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测出此时的斜率与截距,就可得到回归直线方程(B)在散点图中,选两点,画一条直线,使所画直线两侧的点数一样多或基本相同,求出此直线方程,则该方程即为所求回归方程(C)在散点图中多选几组点,分别求出各直线的斜率与截距,再求它们的平均值,就得到了回归直线的斜率与截距,即可产生回归方程(D)上述三种方法都不可行7、若对于变量与的组统计数据的回归模型中,相关指数,又知残差平方和为,那么的值为()(A)(B)(C)(D)8、右表是对与喜欢足球与否的统计列联表依据表中的数据,得到()(A)(B)(C)(D)9、某医院用光电比色计检验尿汞时,得尿汞含量与消光系数读数的结果如下:如果与之间具有线性相关关系,那么当消光系数的读数为时,()(A)汞含量约为(B)汞含量高于(C)汞含量低于(D)汞含量一定是10、由一组样本数据得到的回归直线方程,那么下面说法正确的是()(A)直线必过点(B)直线必经过一点(C)直线经过中某两个特殊点(D)直线必不过点11、根据下面的列联表得到如下中个判断:①有的把握认为患肝病与嗜酒有关;②有的把握认为患肝病与嗜酒有关;③认为患肝病与嗜酒有关的出错的可能为;④认为患肝病与嗜酒有关的出错的可能为;其中正确命题的个数为()(A)(B)(C)(D)12、对于两个变量之间的相关系数,下列说法中正确的是()(A)越大,相关程度越大(B)越小,相关程度越大(C)越大,相关程度越小;越小,相关程度越大(D)且越接近于,相关程度越大;越接近于,相关程度越小;二、填空题:本大题共小题,每小题分,共分,把答案填在题中的横线上13、下表是关于出生男婴与女婴调查的列联表那么,A=,B=,C=,D=,E=;14、如右表中给出五组数据,从中选出四组使其线性相关最大,且保留第一组,那么,应去掉第组。
统计重点题型归纳一、选择题(共10小题)1.对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09B.0.20C.0.25D.0.452.某校老年、中年和青年教师的人数见如表,采用分层插样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为()A.90B.100C.180D.3003.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.1674.根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关5.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588B.480C.450D.1206.某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45B.50C.55D.607.已知某地区中小学学生的近视情况分布如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20B.100,20C.200,10D.100,108.为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.189.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为P1,P2,P3,则()A.P1=P2<P3B.P2=P3<P1C.P1=P3<P2D.P1=P2=P3 10.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08B.07C.02D.01二、填空题(共4小题)11.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.12.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.13.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示:(Ⅰ)直方图中x的值为;(Ⅱ)在这些用户中,用电量落在区间[100,250)内的户数为.14.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方向,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取名学生.三、解答题(共5小题)15.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?16.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(Ⅰ)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(Ⅱ)求频率分布直方图中的a,b的值;(Ⅲ)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写结论)17.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.参考答案一、选择题(共10小题)1.【分析】在频率分布表中,由频率与频数的关系,计算可得各组的频率,根据频率的和等于1可求得二等品的概率.【解答】解:由频率分布直方图知识可知:在区间[15,20)和[25,30)上的概率为0.04×5+[1﹣(0.02+0.04+0.06+0.03)×5]=0.45.故选:D.2.【分析】由题意,老年和青年教师的人数比为900:1600=9:16,即可得出结论.【解答】解:由题意,老年和青年教师的人数比为900:1600=9:16,因为青年教师有320人,所以老年教师有180人,故选:C.3.【分析】利用百分比,可得该校女教师的人数.【解答】解:初中部女教师的人数为110×70%=77;高中部女教师的人数为150×40%=60,∴该校女教师的人数为77+60=137,故选:C.4.【分析】A从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量减少的最多,故A正确;B从2007年开始二氧化硫排放量变少,故B正确;C从图中看出,2006年以来我国二氧化硫年排放量越来越少,故C正确;D 2006年以来我国二氧化硫年排放量越来越少,与年份负相关,故D错误.【解答】解:A从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量明显减少,且减少的最多,故A正确;B2004﹣2006年二氧化硫排放量越来越多,从2007年开始二氧化硫排放量变少,故B正确;C从图中看出,2006年以来我国二氧化硫年排放量越来越少,故C正确;D2006年以来我国二氧化硫年排放量越来越少,而不是与年份正相关,故D错误.故选:D.5.【分析】根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.【解答】解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选:B.6.【分析】由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.【解答】解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选:B.7.【分析】根据图1可得总体个数,根据抽取比例可得样本容量,计算分层抽样的抽取比例,求得样本中的高中学生数,再利用图2求得样本中抽取的高中学生近视人数.【解答】解:由图1知:总体个数为3500+2000+4500=10000,∴样本容量=10000×2%=200,分层抽样抽取的比例为,∴高中生抽取的学生数为40,∴抽取的高中生近视人数为40×50%=20.故选:A.8.【分析】由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案;【解答】解:由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.故选:C.9.【分析】根据简单随机抽样、系统抽样和分层抽样的定义即可得到结论.【解答】解:根据简单随机抽样、系统抽样和分层抽样的定义可知,无论哪种抽样,每个个体被抽中的概率都是相等的,即P1=P2=P3.故选:D.10.【分析】从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字开始向右读,依次为65,72,08,02,63,14,07,02,43,69,97,28,01,98,…,其中08,02,14,07,01符合条件,故可得结论.【解答】解:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件,第三个数为08,符合条件,以下符合条件依次为:08,02,14,07,01,故第5个数为01.故选:D.二、填空题(共4小题)11.【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出应抽取的男生人数.【解答】解:根据题意得,用分层抽样在各层中的抽样比为=,则应抽取的男生人数是500×=25人,故答案为:25.12.【分析】(1)频率分布直方图中每一个矩形的面积表示频率,先算出频率,在根据频率和为1,算出a的值;(2)先求出消费金额在区间[0.5,0.9]内的购物者的频率,再求频数.【解答】解:(1)由题意,根据直方图的性质得(1.5+2.5+a+2.0+0.8+0.2)×0.1=1,解得a=3(2)由直方图得(3+2.0+0.8+0.2)×0.1×10000=6000故答案为:(1)3 (2)600013.【分析】(I)根据频率分布直方图中,各组的频率之和为1,我们易得到一个关于x的方程,解方程即可得到答案.(II)由已知中的频率分布直方图,利用[100,250)之间各小组的纵坐标(矩形的高)乘以组距得到[100,250)的频率,利用频率乘以样本容量即可求出频数.【解答】解:(Ⅰ)依题意及频率分布直方图知,0.0024×50+0.0036×50+0.0060×50+x×50+0.0024×50+0.0012×50=1,解得x=0.0044.(II)样本数据落在[100,150)内的频率为0.0036×50=0.18,样本数据落在[150,200)内的频率为0.006×50=0.3.样本数据落在[200,250)内的频率为0.0044×50=0.22,故在这些用户中,用电量落在区间[100,250)内的户数为(0.18+0.30+0.22)×100=70.故答案为:0.0044;70.14.【分析】先求出一年级本科生人数所占总本科生人数的比例,再用样本容量乘以该比列,即为所求.【解答】解:根据分层抽样的定义和方法,一年级本科生人数所占的比例为=,故应从一年级本科生中抽取名学生数为300×=60,故答案为:60.三、解答题(共3小题)15.【分析】(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解方程可得;(2)由直方图中众数为最高矩形上端的中点可得,可得中位数在[220,240)内,设中位数为a,解方程(0.002+0.0095++0.011)×20+0.0125×(a﹣220)=0.5可得;(3)可得各段的用户分别为25,15,10,5,可得抽取比例,可得要抽取的户数.【解答】解:(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解方程可得x=0.0075,∴直方图中x的值为0.0075;(2)月平均用电量的众数是=230,∵(0.002+0.0095+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.002+0.0095+0.011)×20+0.0125×(a﹣220)=0.5可得a=224,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.0125×20×100=25,月平均用电量为[240,260)的用户有0.0075×20×100=15,月平均用电量为[260,280)的用户有0.005×20×100=10,月平均用电量为[280,300)的用户有0.0025×20×100=5,∴抽取比例为=,∴月平均用电量在[220,240)的用户中应抽取25×=5户.16.【分析】(Ⅰ)根据频率分布表求出1周课外阅读时间少于12小时的频数,再根据频率=求频率;(Ⅱ)根据小矩形的高=求a、b的值;(Ⅲ)利用平均数公式求得数据的平均数,可得答案.【解答】解:(Ⅰ)由频率分布表知:1周课外阅读时间少于12小时的频数为6+8+17+22+25+12=90,∴1周课外阅读时间少于12小时的频率为=0.9;(Ⅱ)由频率分布表知:数据在[4,6)的频数为17,∴频率为0.17,∴a=0.085;数据在[8,10)的频数为25,∴频率为0.25,∴b=0.125;(Ⅲ)数据的平均数为1×0.06+3×0.08+5×0.17+7×0.22+9×0.25+11×0.12+13×0.06+15×0.02+17×0.02=7.68(小时),∴样本中的100名学生该周课外阅读时间的平均数在第四组.17.【分析】(I)根据分布表的数据,画出频率直方图,求解即可.(II)计算得出∁A表示事件:“A地区用户的满意度等级为不满意”,∁B表示事件:“B地区用户的满意度等级为不满意”,P(∁A),P(∁B),即可判断不满意的情况.【解答】解:(Ⅰ)通过两个地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值,B地区的用户满意度评分的比较集中,而A地区的用户满意度评分的比较分散.(Ⅱ)A地区用户的满意度等级为不满意的概率大.记∁A表示事件:“A地区用户的满意度等级为不满意”,∁B表示事件:“B地区用户的满意度等级为不满意”,由直方图得P(∁A)=(0.01+0.02+0.03)×10=0.6得P(∁B)=(0.005+0.02)×10=0.25∴A地区用户的满意度等级为不满意的概率大.。
高一数学统计练习题含答案解析(2)高一数学统计练习题(第Ⅲ卷)15. (12分)为了让学生了解环保,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)进行统计.请你根据下面尚未完成的频率分布表和频率分布直方图,解答下列问题:分组频数频率[50,60) 4 0.08[60,70) 8 0.16[70,80) 10 0.20[80,90) 16 0.32[90,100]合计(1)填充频率分布表中的空格;(2)不具体计算频率/组距,补全频率分布直方图.解:(1)40.08=50,即样本容量为50.第五小组的频数为50-4-8-10-16=12,第五小组的频率为1250=0.24.又各小组频率之和为1,所以频率分布表中的四个空格应分别填12,0.24,50,1.(6分)(2)根据小长方形的高与频数成正比,设第一个小长方形的高为h1,第二个小长方形的高为h2,第五个小长方形的高为h5.由等量关系得h1h2=48,h1h5=412,所以h2=2h1,h5=3h1.这样即可补全频率分布直方图如下:(12分)16.(12分)甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示.(1)填写下表:平均数方差中位数命中9环及以上甲 7 1.2 1乙 5.4 3(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.解:(1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.可知x乙=110(2+4+6+8+7+7+8+9+9+10)=7,所以填7,乙的射靶环数由小到大排列为:2,4,6,7,7,8,8,9,9,10.所以中位数为7+82=7.5;甲10次射靶环数从小到大排列为:5,6,6,7,7 ,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:平均数方差中位数命中9环及以上甲 7 1.2 7 1乙 7 5.4 7.5 3(6分)(2)①甲、乙的平均数相同:均为7,但s2甲②甲、乙平均水平相同,而乙的中位数比甲大,可预见乙射靶环数的优秀次数比甲的多,所以乙的成绩比甲好些.③甲、乙平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,有潜力可挖.(12分)1 7.(12分)(2013•新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.61.22.7 1.5 2.93.0 3.12.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.51.8 0.62.1 1.1 2.5 1.22.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A药的观测数据的平均数为x,B药的观测数据的平均数为y.由观测结果可得x=120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3 .0+3.1+3.2+3.5)=2.3,y=120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7 +1. 8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x>y,因此可看出A药的疗效更好.(6分)(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.(12分)18.(14分)(2013•重庆卷)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得∑10i=1xi=80,∑10i=1yi=20,∑10i=1xiyi=184,∑10i=1x2i=720.(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y=bx+a中,b=∑ni=1xiyi-nx-y-∑ni=1x2i-nx2,a=y- bx,其中x,y为样本平均值.线性回归方程也可写为y^=b^x+a^.解:(1)由题意知n=10,x=1n∑ni=1xi=8010=8,y=1n∑ni=1yi=2010=2.又lxx=∑ni=1x2i-nx2=720-10×82=80,lxy=∑ni=1xiyi-nx-y-=184-10×8×2=24,由此得b=lxylxx=2480=0.3,a=y-bx=2-0.3×8=-0.4,故所求回归方程为y=0.3x-0.4.(6分)(2)由于变量y的值随x的值增加而增加(b=0.3>0),故x与y之间是正相关.(10分)(3)将x=7代入回归方程可以预测家庭的月储蓄为y=0.3×7-0.4=1.7(千元).(14分)。
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.2019年10月18日-27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为12;②在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”;则正确命题的个数为( )附:22()()()()()n ad bc K a b c d a c b d -=++++A .0B .1C .2D .33.下列关于回归分析与独立性检验的说法正确的是() A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;4.已知x 与y 之间的几组数据如下表:x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a'D .b<b',a>a'5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k ,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响6.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示: 序号 12345678910 11 12 13 14 15 16 17 18 19 20数学成绩 95 75 80 94 92 65 67 84 987167 93 64 787790 57 83 72 83物理成绩90 63 72 87 917158 82 93 817782 48 85 69 91 61 84 78 86若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( )A .95%B .97.5%C .99.5%D .99.9%7.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;8.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bc K a c b d a d b c -++++,其中n a b c d =+++.20()P K k ≥0.100.050.01 0.0050k 2.7063.8416.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们( )A .没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”9.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表女 男 合计读营养说明 16 28 44 不读营养说明 20 8 28 总计363672请问性别和读营养说明之间在多大程度上有关系 ( ) A .99%的可能性 B .99.75%的可能性 C .99.5%的可能性 D .97.5%的可能性10.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1 B .2C .3D .411.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 14.若两个分类变量X 与Y 的列联表为:则“X 与Y 之间有关系”这个结论出错的可能性为________.15.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”. 参考附表:(参考公式:K 2=()()()()()2n ad bc a b c d a c b d -++++,其中n=a+b+c+d)16.如表是降耗技术改造后生产某产品过程中记录产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆˆ0.70.3yx =+,那么表中m 的值为__________.17.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 18.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c互不相同,则这个三位数为”有缘数”的概率是__________. 19.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上)20.在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示: 价格x 9 9.5 10 10.5 11 销售量y1110865由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,其线性回归方程是:3.2y x a =-+,则a =__________.三、解答题21.某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据绘制成散点图.光照时长为x (单位:小时),大棚蔬菜产量为y (单位:千斤每亩),记ln w x =.(1)根据散点图判断,y a bx =+与ln y c d x =+⋅,哪一个适宜作为大棚蔬菜产量y 关于光照时长x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(结果保留小数点后两位)(3)根据实际种植情况,发现上述回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求方程估计当光照时长为2e 小时(自然对数的底 2.71828e ≈),大棚蔬菜亩产约为多少. 参数数据:参考公式:β关于α的线性回归方程m n βα=⋅+中,1221i ii nii n m n αβαβαα==-⋅=-∑∑,n m βα=-⋅22.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期.一研究团队统计了某地区200名患者的相关信息,得到如下表格:(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据将如下列联表补充完整,并根据列联表判断是否有99%的把握认为该传染病的潜伏期与患者年龄有关.(2)将200名患者的潜伏期超过6天的频率视为该地区每名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该团队随机调查了该地区20名患者,其中潜伏期超过6天的人数为X ,求随机变量X 的期望和方差. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 23.新冠肺炎疫情防控时期,各级各类学校纷纷组织师生开展了“停课不停学”活动,为了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表:参考公式:在线性回归方程y bx a =+,()()()()1122211n niii ii i nniii i x x y y x y nx yb x x xn x====---==--∑∑∑∑,a y bx =-(2)针对全班45名同学(25名女生,20名男生)的线上学习满意度调查中,女姓满意率为80%,男生满意率为75%,填写下面列联表,判断能否在犯错误概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?参考公式和数据:()()()()()2n ad bc x a b c d a c b d -=++++,()20.0500.0100.0013.8416.63510.828P x k k ≥24.为了了解某校高中生的身体质量情况,某调查机构进行了一次高一学生体重和身高的抽样调查,从中抽取了8名学生(编号为18)的身高(cm)x 和体重(kg)y 数据.如下表,某调查机构分析发现学生的身高和体重之间有较强的线性相关关系,在编号为6的体检数据丢失之前,调查员甲已进行相关的数据分析并计算出该组数据的线性回归方程为ˆˆ0.5ya x =+,且根据回归方程预估一名身高为180cm 的学生体重为71kg ,计算得到的其他数据如下:81170,89920i ii x x y===∑.(1)求a 的值及表格中8名学生体重的平均值y ;(2)在数据处理时,调查员乙发现编号为8的学生体重数据有误,应为63kg ,身高数据无误.请你根据调查员乙更正的数据重新计算线性回归方程,并据此预估一名身高为180cm 的学生的体重.附:回归直线方程ˆˆˆy a bx=+的斜率和截距的最小二乘法估计分别为:1221ˆni ii ni i x ynx ybx nx==-=-∑∑,ˆˆa y bx=-. 25.冠状病毒是一个大型病毒家族,今年出现的新型冠状病毒(nCoV )是以前从未在人体中发现的冠状病毒新毒株.(1)某科研团队为研究潜伏期与新冠肺炎患者年龄的关系,组织专家统计了该地区新冠肺炎患者新冠病毒潜伏期的相关信息,其中被统计的患者中60岁以下的人数与60岁以上的人数相同,60岁以下且潜伏期在7天以下的人数约占15,60岁以上且潜伏期在7天以下的人数约占35,若研究得到在犯错误概率不超过0.010的前提下,认为潜伏期与新冠肺炎患者年龄有关,现设被统计的60岁以上的人员人数为5x ,请完成下面2×2列联表并计算被统计的60岁以上的人员至少多少人?附1:()()()()()22n ad bc X a b c d a c b d -=++++,其中n a b c d =+++()20P X k ≥0.100 0.050 0.010 0.005 0.001 0k 2.7063.8416.6357.87910.828(2)某地区的新冠肺炎治愈人数y (人)与3月份的时间x (日)满足回归直线方程ˆˆˆybx a =+,统计数据如下: 3月日期(日) 2 3 4 5 6治愈人数(人)25304045t已知5=11405i i y y ==∑,52=190i i x =∑,5=1885i i i x y =∑,请利用所给数据求t 和回归直线方程ˆˆˆy bx a =+;附2:()1221ˆni ii ni i x y nx ybx n x ==-⋅=-∑∑,ˆˆa y bx=-. 26.某企业组织应聘该企业的100名应届毕业生参加专业能力测试(满分100分),这100名毕业生的成绩的频率分布直方图如图所示.(Ⅰ)该企业拟以成绩的中位数作为分数线来确定进入面试阶段的毕业生名单,根据频率分布直方图求进入该企业面试的分数线;(Ⅱ)若被测试的毕业生中有40名女生,进入面试的有15名女生,35名男生,填写下面列联表,并根据列联表判断是否有95%的把握认为成绩与性别有关.成绩<分数线成绩≥分数线 总计附:()()()()()22n ad bc K a b c d a c b d -=++++)2k【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B 【分析】依次判断每个选项:计算概率为25得到①错误;计算2 5.952K ≈得到②错,③对得到答案. 【详解】任取1名参赛人员,抽到对主办方表示满意的男性运动员的概率为20025005=,故①错误;22(2003050220)5005.95225025042080K ⨯-⨯⨯=≈⨯⨯⨯,故②错,③对故选:B . 【点睛】本题考查了概率的计算和独立性检验,意在考查学生的综合应用能力.3.D解析:D 【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案. 【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A 、B 、C 均错误,故答案选D . 【点睛】本题主要考查了回归分析与独立性检验的定义的区别.4.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.7.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.8.B解析:B 【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K 的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人, 又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人, 又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530) 4.762 3.8412109075225K ⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”, 故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.9.C解析:C 【详解】由题意可知16,28,20,8a b c d ====,44,28,36,36a b c d a c c d +=+=+=+=,72n a b c d =+++=,代入公式()()()()()22n ad bc K a b c d a c b d -=++++得()227216828208.4244283636K ⨯⨯-⨯=≈⨯⨯⨯,由于28.427.879K ≈>,我们就有0099.5的把握认为性别和读营养说明之间有关系,即性别和读营养说明之间有0099.5的可能是有关系的,故选C .10.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.11.D解析:D 【解析】 试题由题根据二列联表得出;2K=()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,对应参考值得 2 5.024K >,则有10.0250.975-=,即有97.5%的把握认为文化程度与月收入有关系。
本资料来源于《七彩教育网》
练习试题三
一、选择题
1.下列说法正确的有()
①最小二乘法指的是把各个离差加起来作为总离差,并使之达到最小值的方法;
②最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法;
③线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法;
④因为由任何一观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.A.1个B.2个C.3个D.4个
2.设有一个回归直线方程2 1.5
y x,则变量x增加1个单位时()A.y平均增加 1.5个单位
B.y平均增加2个单位
C.y平均减少 1.5个单位
D.y平均减少2个单位
3.线性回归直线方程y a bx必过定点()
A.(00)
x y,
x,C.(0)y,D.()
,B.(0)
4.下列变量关系是相关关系的是()
①学生的学习态度与学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
A.①②B.①③C.②③D.②④
5.下列变量关系是函数关系的是()
A.三角形的边长与面积之间的关系
B.等边三角形的边长与面积之间的关系
C.四边形的边长与面积之间的关系
D.菱形的边长与面积之间的关系
答
二、填空题
6.线性回归模型y bx a e中,b,a.
7.我们可用相关指数2
R来刻画回归的效果,其计算公式为.
8.我们常利用随机变量2
K来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,其思想类似于数学上的.
9.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为
.
10.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表
患慢性气管炎未患慢性气管炎合计
吸烟43 162 205
不吸烟13 121 134
合计56 283 339
根据列联表数据,求得2
K.
三、解答题
11.在7块面积相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg)
施化肥量x15 20 25 30 35 40 45 水稻产量y330 345 365 405 445 450 455 (1)试求y对x的线性回归方程;
(2)当施化肥量28
x kg时,预测水稻产量.
12.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:
积极支持企业改革不赞成企业改革合计工作积极54 40 94
工作一般32 63 95
合计86 103 189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
13.某10名同学的数学、物理、语文成绩如下表:
数111
8
111
797
物
1
9
9
7
9
8
8
7
7
7
语
8
1
111111
9
9
试分别研究他们的数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,你能发现什么
规律?
答案
1.答案:B
2.答案:C
3.答案:D
4.答案:A
5.答案:B
6.答案:
1
2
1
()()()
n
i
i i n
i
i x x y y x x ,y
bx
7.答案:2
2
12
1
()1
()
n
i
i i n
i
i y y R
y y 8.答案:反证法9.答案:正相关10.答案:7.469 11. 解:(1) 4.75256.79y
x
;
(2)389.79kg
12.解:根据列联表中的数据,得到
2
2189(54634032)10.76
949586103
K.
因10.767.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”是有
关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.
13.解:可求出物理成绩与数学成绩的相关系数0.870.75
r,从而认为物理成绩与数学成绩之间具有很强的线性相关关系.而由语文成绩与数学成绩的相关系数0.092
r远小于0.75,说明语文成绩与数学成绩不具有线性相关关系.因此,数学成绩好的同学,一般来
说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩也可能好,也
可能差,它们之间的关系不大.。