高中数学统计案例测试题
- 格式:doc
- 大小:279.50 KB
- 文档页数:10
一、选择题1.下列说法:①对于独立性检验,2χ的值越大,说明两事件相关程度越大;②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则c ,k 的值分别是4e 和0.3;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程y a bx =+中,2b =,1x =,3y =,则1a =;④通过回归直线y bx a =+及回归系数b ,可以精确反映变量的取值和变化趋势,其中正确的个数是( ) A .1B .2C .3D .42.为了提升全民身体素质,学校十分重视学生体育锻炼.某校篮球运动员进行投篮练习,若他前一球投进则后一球投进的概率为34,若他前一球投不进则后一球投进的概率为14.若他第1球投进的概率为34,则他第3球投进的概率为( ) A .34B .58C .116D .9163.甲、乙两人进行乒乓球比赛,假设每局比赛甲胜的概率是0.6,乙胜的概率是0.4.那么采用5局3胜制还是7局4胜制对乙更有利?( ) A .5局3胜制B .7局4胜制C .都一样D .说不清楚4.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( ) 参考数据及公式如下:2()=()()()()n ad bc K a b c d a c b d -++++A .12B .11C .10D .185.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:由2222()110(40302030),7.8()()()()60506050n ad bc K K a b c d a c b d -⨯⨯-⨯==≈++++⨯⨯⨯算得 附表:参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”6.某学校10位同学组成的志愿者组织分别由李老师和张老师负责,每次献爱心活动均需该组织4位同学参加.假设李老师和张老师分别将各自活动通知的信息独立,随机地发给4位同学,且所发信息都能收到.则甲同学收到李老师或张老师所发活动通知的信息的概率为( ) A .25B .1225C .1625D .457.A B 两支篮球队进行比赛,约定先胜3局者获得比赛的胜利,比赛随即结束.除第五局A 队获胜的概率是12外,其余每局比赛B 队获胜的概率都是13.假设各局比赛结果相互独立.则A 队以3:2获得比赛胜利的概率为( ) A .427B .281C .1681D .8278.某市通过随机询问100名不同年级的学生是否能做到“扶跌倒老人”,得到如下列联表:低年级 30 15则下列结论正确的是( ) 附参照表:2()P K k ≥0.10 0.025 0.01 k 2.7065.0246.635参考公式:22()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++A .在犯错误的概率不超过90%的前提下,认为“学生能否做到‘扶跌倒老人’与年级高低有关”B .在犯错误的概率不超过1%的前提下,“学生能否做到‘扶跌倒老人’与年级高低无关”C .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低有关”D .有90%以上的把握认为“学生能否做到‘扶跌倒老人’与年级高低无关” 9.在一次独立性检验中,得出列表如下:AA合计 B100 400500B900 a90a + 合计190400a +590a +且最后发现,两个分类变量A 和B 没有任何关系,则a 的可能值是( ) A .720 B .360C .180D .9010.学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽样调查100人,得到如下数据:根据表中数据,通过计算统计量并参考以下临界数据:若由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过A.B.C.D.11.甲、乙两人同时报考某一所大学,甲被录取的概率为0.6,乙被录取的概率为0.7,两人是否被录取互不影响,则其中至少有一人被录取的概率为( )A.0.12 B.0.42 C.0.46 D.0.8812.甲乙丙三位同学独立的解决同一个问题,已知三位同学单独正确解决这个问题的概率分别为12,13,15,则有人能够解决这个问题的概率为()A.130B.415C.1115D.1315二、填空题13.两个实习生加工一个零件,产品为一等品的概率分别为23和34,则这两个零件中恰有一个一等品的概率为__________.14.掷三个骰子,出现的三个点数的乘积为偶数的概率是________.15.某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如下图所示:得出下面四个结论:①甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前②乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前③甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前④乙同学的总成绩排名比丙同学的总成绩排名更靠前则所有正确结论的序号是_________.16.已知x、y之间的一组数据如下:x0123则线性回归方程ˆya bx =+所表示的直线必经过点________. 17.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.18.某学生在上学路上要经过4个路口,假设在各路口是否遇到红灯是相互独立的,遇到红灯的概率都是13,那么该生在上学路上到第3个路口首次遇到红灯的概率为__________.19.甲袋中装有2个白球,2个黑球,乙袋中装有2个白球,4个黑球,从甲、乙两袋中各取一球均为白球的概率为______________20.某班主任对全班50名学生的积极性和对待班级工作的态度进行了调查,统计数据如下表所示:则至少有________的把握认为学生的学习积极性与对待班级工作的态度有关.(请用百分数表示).注:独立性检验界值表三、解答题21.在我国,大学生就业压力日益严峻,伴随着政府政策的引导与社会观念的转变,大学生的创业意识与就业方向也悄然发生转变.某大学生在国家提供的税收,担保贷款等多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y (单位:万元)与时间i t (单位:年)的数据,列表如下:(1)依据表中给出的数据,是否可用线性回归模型拟合y 与t 的关系,请计算相关系数r 并加以说明(计算结果精确到0.01).(若0.75r >,则线性相关程度很高,可用线性回归模型拟合)(2)该专营店为吸引顾客,特推出两种促销方案. 方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.(ⅰ)某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客换得100元现金奖励的概率(ⅱ)某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择方案一返回200元现金,还是选择方案二参加四次抽奖?说明理由.附:相关系数公式:()()nnii i itt y y t yntyr---==∑∑,7.547≈,5185.2i i i t y ==∑,=22.某校将进行篮球定点投篮测试,规则为:每人至多投3次,先在M 处投一次三分球,投进得3分,未投进不得分,以后均在N 处投两分球,每投进一次得2分,未投进不得分.测试者累计得分高于3分即通过测试,并终止投篮.甲、乙两位同学为了通过测试,进行了五轮投篮训练,每人每轮在M 处和N 处各投10次,根据他们每轮两分球和三分球的命中次数情况分别得到如图表:若以每人五轮投篮训练命中频率的平均值作为其测试时每次投篮命中的概率.(1)求甲同学通过测试的概率;(2)在甲、乙两位同学均通过测试的条件下,求甲得分比乙得分高的概率.23.奶茶是年轻人非常喜欢的饮品.某机构对于奶茶的消费情况在一商圈附近做了一些调查,发现女性喜欢奶茶的人数明显高于男性,每月喝奶茶的次数也比男性高,但单次奶茶消费金额男性似乎明显高于女性.针对每月奶茶消费是否超过百元进行调查,已知在调查的200人中女性人数是男性人数的4倍,统计如下:超过百元未超过百元合计男8女144合计200关?(2)在月消费超百元的调查者中,同时进行对于品牌喜好的调查.发现喜欢A 品牌的男女均为3人,现从喜欢A 品牌的这6人中抽取2人送纪念品,求这两人恰好都是女性的概率. 附:()20P K k ≥0.10 0.010 0.001 0k2.7066.63510.828()()()()()2n ad bc K a b c d a c b d -=++++. 24.为激活国内消费布场,挽回疫情造成的损失,国家出台一系列的促进国内消费的优惠政策,某机构从某一电商的线上交易大数据中来跟踪调查消费者的购买力,界定3至8月份购买商品在5000元以上人群属“购买力强人群”,购买商品在5000元以下人群属“购买力弱人群”.现从电商平台消费人群中随机选出200人,发现这200人中属购买力强的人数占80%,并将这200人按年龄分组,记第1组[)15,25,第2组[)25,35,第3组[)35,45,第4组[)45,55,第5组[)55,65,得到的频率分布直方图,如图所示.(1)求出频率分布直方图中的a 值和这200人的平均年龄;(2)从第2,3,5组中用分层抽样的方法抽取12人,并再从这12人中随机抽取3人进行电话回访,求这三人恰好属于不同组别的概率;(3)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中“购买力弱人群”的中老年人有20人,问是否有99%的把握认为是否“购买力强人群”与年龄有关? 附:()20P K K 0.150 0.100 0.050 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.828()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++ 25.某外卖平台为提高外卖配送效率,针对外卖配送业务提出了两种新的配送方案,为比较两种配送方案的效率,共选取50名外卖骑手,并将他们随机分成两组,每组25人,第一组骑手用甲配送方案,第二组骑手用乙配送方案.根据骑手在相同时间内完成配送订单的数量(单位:单)绘制了如图茎叶图:(1)根据茎叶图,求各组内25位骑手完成订单数的中位数,已知用甲配送方案的25位骑手完成订单数的平均数为52,结合中位数与平均数判断哪种配送方案的效率更高,并说明理由;(2)设所有50名骑手在相同时间内完成订单数的平均数m ,将完成订单数超过m 记为“优秀”,不超过m 记为“一般”,然后将骑手的对应人数填入如表列联表;(3)根据(2)中的列联表,判断能否有95%的把握认为两种配送方案的效率有差异.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.26.新能源汽车已经走进我们的生活,逐渐为大家所青睐.现在有某品牌的新能源汽车在甲市进行预售,预售场面异常火爆,故该经销商采用竞价策略基本规则是:①竞价者都是网络报价,每个人并不知晓其他人的报价,也不知道参与竞价的总人数;②竞价采用“一月一期制”,当月竞价时间截止后,系统根据当期汽车配额,按照竞价人的出价从高到低分配名额.某人拟参加2020年6月份的汽车竞价,他为了预测最低成交价,根据网站的公告,统计了最近5个月参与竞价的人数(如下表)(1)由收集数据的散点图发现,可用线性回归模型拟合竞价人数y (万人)与月份编号t 之间的相关关系.请用最小二乘法求y 关于t 的线性回归方程:ˆ bt y a =+,并预测2020年6月份(月份编号为6)参与竞价的人数;(2)某市场调研机构对200位拟参加2020年6月份汽车竞价人员的报价进行了一个抽样调查,得到如表所示的频数表:(i )求这200位竞价人员报价的平均值x 和样本方差s 2(同一区间的报价用该价格区间的中点值代替)(ii )假设所有参与竞价人员的报价X 可视为服从正态分布()2,,N μσ且μ与σ2可分别由(i )中所示的样本平均数x 及s 2估计.若2020年月6份计划提供的新能源车辆数为3174,根据市场调研,最低成交价高于样本平均数x ,请你预测(需说明理由)最低成交价. 参考公式及数据:①回归方程ˆˆˆy bx a =+,其中1221ˆˆˆ,ni ii nii x y nx ybay bx xnx ==-⋅==--∑∑ ②5521155, 2.6;ii i i i tx y ====≈∑∑③若随机变量X 服从正态分布()2,,N μσ则()()0.6826,220.9544,P X P X μσμσμσμσ-<<+=-<<+= ()330.9974P X μσμσ-<<+=.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【分析】根据独立性检验、非线性回归方程以及回归直线方程相关知识进行判断. 【详解】对于命题①,根据独立性检验的性质知,两个分类变量2χ越大,说明两个分类变量相关程度越大,命题①正确;对于命题②,由kxy ce =,两边取自然对数,可得ln ln y c kx =+,令ln z y =,得ln z kx c =+,0.34z x =+,所以ln 40.3c k =⎧⎨=⎩,则40.3c e k ⎧=⎨=⎩,命题②正确;对于命题③,回归直线方程y a bx =+中,3211a y bx =-=-⨯=,命题③正确; 对于命题④,通过回归直线y bx a =+及回归系数b ,可估计和预测变量的取值和变化趋势,命题④错误.故选C. 【点睛】本题考查了回归直线方程、非线性回归方程变换以及独立性检验相关知识,考查推理能力,属于中等题.2.D解析:D 【分析】分两种情况讨论:第2球投进和第2球投不进,利用独立事件的概率公式可得出所求事件的概率. 【详解】分以下两种情况讨论: (1)第2球投进,其概率为3311544448⨯+⨯=,第3球投进的概率为53158432⨯=; (2)第2球投不进,其概率为53188-=,第3球投进的概率为3138432⨯=. 综上所述:第3球投进的概率为1539323216+=,故选D. 【点睛】本题考查概率的求法,考查独立事件概率乘法公式的应用,同时也考查对立事件概率公式的应用,解题时要注意对事件进行分类讨论,考查运算求解能力,属于中等题.3.A解析:A 【分析】分别计算出乙在5局3胜制和7局4胜制情形下对应的概率,然后进行比较即可得出答案. 【详解】当采用5局3胜制时,乙可以3:0,3:1,3:2战胜甲,故乙获胜的概率为:322222340.4+0.40.60.40.40.60.40.3174C C ⨯⨯+⨯⨯≈;当采用7局4胜制时,乙可以4:0,4:1,4:2,4:3战胜甲,故乙获胜的概率为:4333323334560.4+0.40.60.40.40.60.4+0.40.60.40.2898C C C ⨯⨯+⨯⨯⨯⨯≈,显然采用5局3胜制对乙更有利,故选A. 【点睛】本题主要考查相互独立事件同时发生的概率,意在考查学生的计算能力和分析能力,难度中等.4.A解析:A 【分析】设男生人数为x ,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论. 【详解】设男生人数为x ,依题意可得列联表如下:则2 3.841K >,由222235236183 3.841822x x x K x x x x x ⎛⎫- ⎪⎝⎭==>⋅⋅⋅,解得10.24x >, ,26x x为整数,∴若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则男生至少有12人,故选A. 【点睛】本题主要考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.5.A解析:A 【详解】由27.8 6.635K ≈>,而()26.6350.010P K ≥=,故由独立性检验的意义可知选A6.C解析:C 【分析】甲同学收到李老师或张老师所发活动通知的信息的对立事件是甲同学既没收到李老师的信息也没收到张老师的信息,李老师的信息与张老师的信息是相互独立的,由此可计算概率. 【详解】设甲同学收到李老师的信息为事件A ,收到张老师的信息为事件B ,A 、B 相互独立,42()()105P A P B ===, 则甲同学收到李老师或张老师所发活动通知的信息的概率为33161()1(1())(1())15525P AB P A P B -=---=-⨯=.故选C . 【点睛】本题考查相互独立事件的概率,考查对立事件的概率.在求两个事件中至少有一个发生的概率时一般先求其对立事件的概率,即两个事件都不发生的概率.这样可减少计算,保证正确.7.A解析:A 【解析】分析:若“A 队以3:2胜利”,则前四局A 、B 各胜两局,第五局A 胜利,利用独立事件同时发生的概率公式可得结果. 详解:若“A 队以3:2胜利”, 则前四局A 、B 各胜两局, 第五局A 胜利,因为各局比赛结果相互独立, 所以队以3:2获得比赛胜利的概率为2224211433227P C ⎛⎫⎛⎫=⨯⨯= ⎪ ⎪⎝⎭⎝⎭,故选A. 点睛:本题主要考查阅读能力,独立事件同时发生的概率公式,意在考查利用所学知识解决实际问题的能力,属于中档题.8.C解析:C 【解析】分析:根据列联表中数据,利用公式求得2 3.03K ≈,参照临界值表即可得到正确结论. 详解:由公式()()()()()22n d bc k a b c d a c b d -=++++可得2 3.03K ≈,参照临界值表,2.7063.030 3.841<<,∴0090以上的把握认为,“学生能否做到‘扶跌倒老人’与年级高低有关”,故选C.点睛:本题考查了独立性检验的应用,属于基础题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.9.B解析:B 【解析】∵两个分类变量A 和B 没有任何关系,∴()()()()2259010090400 2.70219040090500a a K a a +-⨯=<⨯++,代入验证可知360a =满足,故选B.10.A解析:A 【解析】 由题意可得,所以, 由此认为“学生对2018年俄罗斯世界杯的关注与性别有关”,则此结论出错的概率不超过,故选A.【方法点睛】本题主要考查独立性检验的应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成列联表;(2)根据公式计算的值;(3) 查表比较与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)11.D解析:D 【解析】由题意知,甲、乙都不被录取的概率为(1-0.6)(1-0.7)=0.12. ∴至少有一人被录取的概率为1-0.12=0.88.故选D. 考点:相互独立事件的概率.12.C解析:C 【分析】先利用相互独立事件的概率乘法公式求出“三人都未解答这个问题”的概率,利用对立事件的概率公式得到“有人能够解决这个问题”的概率即可. 【详解】三人都未解答这个问题的概率为 (112-)(113-)(115-)415=,故有人能够解决这个问题的概率为14111515-=, 故选:C . 【点睛】本题考查了相互独立事件的概率乘法公式、互斥事件和对立事件的概率公式,考查了正难则反的原则,属于中档题.二、填空题13.【分析】利用相互独立事件概率乘法公式直接求解【详解】解:两个实习生加工一个零件产品为一等品的概率分别为和这两个零件中恰有一个一等品的概率为:故答案为:【点睛】本题考查概率的求法考查相互独立事件概率乘 解析:512【分析】利用相互独立事件概率乘法公式直接求解. 【详解】解:两个实习生加工一个零件,产品为一等品的概率分别为23和34, ∴这两个零件中恰有一个一等品的概率为:2323511343412p ⎛⎫⎛⎫=⨯-+-⨯= ⎪ ⎪⎝⎭⎝⎭. 故答案为:512. 【点睛】本题考查概率的求法,考查相互独立事件概率乘法公式等基础知识,考查运算求解能力,属于基础题.14.【分析】若点数的乘积为偶数此至少有一个骰子的点数为偶数考虑反面情况:三个骰子全部是奇数的概率用减去此概率即可得到结果【详解】因为三个点数的乘积为偶数时则至少有一个点数为偶数若三个点数均为奇数此时对应解析:7 8【分析】若点数的乘积为偶数,此至少有一个骰子的点数为偶数,考虑反面情况:三个骰子全部是奇数的概率,用1减去此概率即可得到结果.【详解】因为三个点数的乘积为偶数时,则至少有一个点数为偶数,若三个点数均为奇数,此时对应的概率为:311 28⎛⎫=⎪⎝⎭,所以至少有一个点数为偶数的概率为:17188 P=-=.故答案为:7 8 .【点睛】本题考查相互独立事件的概率计算,难度一般.概率计算时,若出现至多、至少这样的描述,可考虑从问题的反面解决问题.15.③④【解析】根据图示可得甲同学的逻辑思维成绩排名很靠前但总排名靠后说明阅读表达成绩排名靠后;乙同学的逻辑思维成绩排名适中但总排名靠前说明阅读表达成绩排名靠前;丙同学的逻辑思维成绩排名及阅读表达成绩排解析:③④【解析】根据图示可得,甲同学的逻辑思维成绩排名很靠前但总排名靠后,说明阅读表达成绩排名靠后;乙同学的逻辑思维成绩排名适中但总排名靠前,说明阅读表达成绩排名靠前;丙同学的逻辑思维成绩排名及阅读表达成绩排名居中,则乙同学的总成绩排名比丙同学的总成绩排名更靠前;甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前,故③④正确.故答案为③④.16.(155)【解析】由题意可得:线性回归方程过样本中心点即线性回归方程所表示的直线必经过点(155)点睛:(1)正确理解计算的公式和准确的计算是求线性回归方程的关键(2)回归直线方程必过样本点中心解析:(1.5,5)【解析】由题意可得:0123 1.54x +++==,826454y +++==, 线性回归方程过样本中心点,即线性回归方程ˆya bx =+所表示的直线必经过点(1.5,5) 点睛:(1)正确理解计算,b a 的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y bx a =+必过样本点中心(),x y .17.②③【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③【详解】①为系统抽样①不正确;④分类变量与它们的随机变量的观测值为当越小与有关系的把握程度越解析:②③ 【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③. 【详解】①为系统抽样, ①不正确;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越小,④不正确;根据相关系数的性质可知②正确;由回归方程的性质可知③正确.故答案为②③. 【点睛】本题通过对多个命题真假的判断,综合考查系统抽样、相关系数、回归方程、独立性检验,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.18.【解析】前两个不是红灯第三个是红灯所以概率为解析:427【解析】前两个不是红灯,第三个是红灯,所以概率为2114(1)3327-= 19.【分析】利用等可能事件的概率分别求得从甲袋和乙袋中取一球取到白球的概率然后再利用独立事件的概率求解【详解】从甲袋中取一球取到白球的概率为从甲袋中取一球取到白球的概率为所以从甲乙两袋中各取一球均为白球解析:16【分析】利用等可能事件的概率,分别求得从甲袋和乙袋中取一球取到白球的概率,然后再利用独立事件的概率求解.【详解】从甲袋中取一球取到白球的概率为2142p ==, 从甲袋中取一球取到白球的概率为2163p ==, 所以从甲、乙两袋中各取一球均为白球的概率为111236p =⨯=. 故答案为:16【点睛】本题主要考查等可能事件的概率和独立事件的概率的求法,属于中档题.20.【分析】根据列联表计算可得由可得结果【详解】由题意得:至少有的把握认为学生的学习积极性与对待班级工作的态度有关故答案为:【点睛】本题考查独立性检验问题的求解考查基础公式的应用 解析:99.9%【分析】根据22⨯列联表计算可得2K ,由210.828K >可得结果. 【详解】由题意得:()225018197611.53810.82825252426K ⨯⨯-⨯=≈>⨯⨯⨯, ∴至少有10.1%99.9%-=的把握认为学生的学习积极性与对待班级工作的态度有关.故答案为:99.9%. 【点睛】本题考查独立性检验问题的求解,考查基础公式的应用.三、解答题21.(1)0.97r ≈;y 与t 的线性相关程度很高,可以用线性回归模型拟合;(2)(ⅰ)1225;(ⅱ)选择参加四次抽奖;答案见解析. 【分析】(1)由题表计算出t ,y .55i it ytyr -=∑(2)(ⅰ)设其获得100元现金奖励为事件A ,由独立事件的概率乘法公式可得()P A ;(ⅱ)设X 表示该顾客在四次抽奖中中奖的次数.则24,5XB ⎛⎫⎪⎝⎭,计算出()E X 和奖。
一、选择题1.某校高二(1)班甲、乙两同学进行投篮比赛,他们进球的概率分别是34和45,现甲、乙各投篮一次,恰有一人进球的概率是( ) A .120B .320C .15D .7202.某校学生会为研究该校学生的性别与语文、数学、英语成绩这3个变量之间的关系,随机抽查了100名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中( )表1表2表3 语文 性别不及格 及格 总计 数学 性别不及格 及格 总计 英语 性别不及格 及格 总男 14 36 50 男 10 40 50 男 25 25 女 16 34 50 女 20 30 50 女 5 45 总计3070100总计3070100总计30701A .语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小B .数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小C .英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小D .英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小 3.某人射击一次命中目标的概率为12,且每次射击相互独立,则此人射击 7次,有4次命中且恰有3次连续命中的概率为( ) A .3761()2CB .2741()2AC .2741()2CD .1741()2C4.在一次抗洪抢险中,准备用射击的方法引爆漂流的汽油桶.现有5发子弹,第一次命中只能使汽油流出,第二次命中才能引爆,每次射击相互独立,且命中概率都是34.则打光子弹的概率是( ) A .9256B .13256C .45512D .910245.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关,则男生至少有( )参考公式:0.10 0.05 0.025 0.010 0.005 0.001 2.7063.8415.0246.6357.87910.828A .12人B .18人C .24人D .30人6.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( ) 参考数据及公式如下:20()P K k ≥ 0.050 0.0100.0010k3.841 6.635 10.8282()=()()()()n ad bc K a b c d a c b d -++++A .12B .11C .10D .187.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22⨯列联表,则至少有( )的把握认为喜爱打篮球与性别有关.喜爱打篮球 不喜爱打篮球 合计男生 25530 女生 151530合计40 20 60附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.20()P K k ≥ 0.100.050.025 0.010 0.005 0.001 0k 2.706 3.8415.0246.6357.78910.828A .99.9%B .99.5%C .99%D .97.5%8.甲、乙两名同学参加2018年高考,根据高三年级一年来的各种大、中、小型数学模拟考试总结出来的数据显示,甲、乙两人能考140分以上的概率分别为12和45,甲、乙两人是否考140分以上相互独立,则预估这两个人在2018年高考中恰有一人数学考140 分以上的概率为( ) A .12B .23C .34D .139.2018年元旦期间,某高速公路收费站的三个高速收费口每天通过的小汽车数X (单位:辆)均服从正态分布()2600,Nσ,若()5007000.6P X <<=,假设三个收费口均能正常工作,则这个收费口每天至少有一个超过700辆的概率为( ) A .1125B .12125 C .61125 D .6412510.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样11.为了解学生对街舞的喜欢是否与性别有关,在全校学生中进行抽样调查,根据数据,求得2K 的观测值0 4.804k ≈,则至少有( )的把握认为对街舞的喜欢与性别有关.参考数据:A .90%B .95%C .97.5%D .99%12.甲、乙两队进行篮球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,比赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队不超过4场即获胜的概率是( ) A .0.18B .0.21C .0.39D .0.42二、填空题13.有7个评委各自独立对A 、B 两位选手投票表决,两位选手旗鼓相当,每位评委公平投票且不得弃权.若7位评委依次揭晓票选结果,则A 选手在每位评委投票揭晓后票数始终保持领先的概率是______.14.有9粒种子分种在3个坑内,每坑放3粒,每粒种子发芽概率为0.5,若一个坑内至少有1粒种子发芽,则这个坑不需要补种;若一个坑内的种子都没有发芽,则这个坑需要补种,假定每个坑至多补种一次,需要补种的坑数为2的概率等于_______.15.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________. 16.三个元件正常工作的概率分别为,,,将两个元件并联后再和串联接入电路,如图所示,则电路不发生故障的概率为_________.17.从包括甲乙两人的6名学生中选出3人作为代表,记事件A :甲被选为代表,事件B :乙没有被选为代表,则()P B A │等于_________.18.甲袋中装有2个白球,2个黑球,乙袋中装有2个白球,4个黑球,从甲、乙两袋中各取一球均为白球的概率为______________19.把一枚硬币任意抛掷三次,事件A =“至少出现一次反面”,事件B =“恰好出现一次正面”,则(/)P B A =__________.20.投到某出版社的稿件,先由两位初审专家进行评审,若能通过两位初审专家的评审,则直接予以录用,若两位初审专家都未予通过,则不予录用,若恰能通过一位初审专家的评审,则再由第三位专家进行复审,若能通过复审专家的评审,则予以录用,否则不予录用.设稿件能通过各初审专家评审的概率均为12,复审的稿件能通过评审的概率为14,各专家独立评审,则投到该出版社的1篇稿件被录用的概率为__________.三、解答题21.为落实中央“坚持五育并举,全面发展素质教育,强化体育锻炼”的指示精神,小明和小亮两名同学每天利用课余时间进行羽毛球比赛.规定每一局比赛中获胜方记2分,失败方记0分,没有平局,谁先获得10分就获胜,比赛结束.假设每局比赛小明获胜的概率都是23. (1)求比赛结束时恰好打了7局的概率;(2)若现在是小明6:2的比分领先,记X 表示结束比赛还需打的局数,求X 的分布列及期望.22.某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50kg ,每件尺寸限制为40cm 60cm 100cm ⨯⨯,其中头等舱乘客免费行李额为40kg ,经济舱乘客免费行李额为20kg .某调研小组随机抽取了100位国内航班旅客进行调查,得到如表所示的数据:(1)请完成22⨯列联表,并判断是否在犯错概率不超过0.05的前提下,认为托运超额行李与乘客乘坐座位的等级有关?(2)调研小组为感谢参与调查的旅客,决定从托运行李超出免费行李额且不超出的旅客中(其中女性旅客4人)随机抽取4人,对其中的女性旅客赠送“100元超额行李补贴券”,记赠送的补贴券总金额为X 元,求X 的分布列与数学期望.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:23.某工厂A ,B 两条相互独立的生产线生产同款产品,在产量一样的情况下,通过日常监控得知,A ,B 生产线生产的产品为合格品的概率分别为p 和21(0.51)p p -.(1)从A ,B 生产线上各抽检一件产品,若使得产品至少有一件合格的概率不低于99.5%,求p 的最小值0p ;(2)假设不合格的产品均可进行返工修复为合格品,以(1)中确定的0p 作为p 的值. ①已知A ,B 生产线的不合格品返工后每件产品可分别挽回损失5元和3元,若从两条生产线上各随机抽检1000件产品,以挽回损失的平均数为判断依据,估计哪条生产线的挽回损失较多?②若最终的合格品(包括返工修复后的合格品)按照一、二、三等级分类后,每件可分别获利10元、8元、6元,现从A ,B 生产线的最终合格品中各随机抽取100件进行分级检测,结果统计如图所示,用样本的频率分布估计总体分布,记该工厂生产一件产品的利润为X ,求X 的分布列并估计该厂产量2000件时利润的期望值.24.某种疾病可分为Ⅰ、Ⅱ两种类型.为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中女性是男性的2倍,男性患Ⅰ型病的人数占男性病人的56,女性患Ⅰ型病的人数占女性病人的13. (1)若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物.两个团队各至多安排2个接种周期进行试验.甲团队研发的药物每次接种后产生抗体的概率为p ,每人每次接种花费()0m m >元,每个周期至多接种3次,第一个周期连续2次出现抗体则终止本接种周期进入第二个接种周期,否则需依次接种至第一周期结束,再进入第二周期;第二接种周期连续2次出现抗体则终止试验,否则需依次接种至至试验结束;乙团队研发的药物每次接种后产生抗体的概率为q ,每人每次花费()0n n >元,每个周期接种3次,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.①若甲团队的试验平均花费大于乙团队的试验平均花费,求p 、q 、m 、n 满足的关系式;②若m n =,2p q =,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:()()()()()22n ad bc K a b c d a c b d -=++++,()20P K k ≥ 0.100.05 0.01 0.005 0.001 0k 2.7063.8416.6357.87910.82825.某大型运动会的组委会为了搞好接待工作,招募了30名男志愿者和20名女志愿者.调查发现,这些志愿者中有部分志愿者喜爱运动,另一部分志愿者不喜欢运动,并得到了如下等高条形图和22⨯列联表:喜爱运动 不喜爱运动 总计 男生 ab30 女生 cd20 总计50(1)求出列联表中a 、b 、c 、d 的值;(2)是否有99%的把握认为喜爱运动与性别有关?附:参考公式和数据:22()()()()()n ad bc K a b c d a c b d -=++++,(其中n a b c d =+++)20()P K k ≥ 0.5000.100 0.050 0.010 0.001 0k 0.4552.7063.8416.63510.82826.某花圃为提高某品种花苗质量,开展技术创新活动,分别用甲、乙两种方法培育该品种花苗.为比较两种培育方法的效果,选取了40棵花苗,随机分成两组,每组20棵.第一组花苗用甲方法培育,第二组用乙方法培育.培育完成后,对每棵花苗进行综合评分,绘制了如图所示的茎叶图:(1)分别求两种方法培育的花苗综合评分的中位数.你认为哪一种方法培育的花苗综合评分更高?并说明理由.(2)综合评分超过80的花苗称为优质花苗,填写下面的列联表,并判断是否有99.5%的把握认为优质花苗与培育方法有关?优质花苗 非优质花苗 合计甲培育法 乙培育法 合计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥ 0.0100.050 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】利用相互独立事件的概率乘法公式求得 甲投进而乙没有投进的概率,以及乙投进而甲没有投进的概率,相加即得所求. 【详解】甲投进而乙没有投进的概率为343(1)4520⨯-=,乙投进而甲没有投进的概率为341(1)455-⨯=,故甲、乙各投篮一次,恰有一人投进球的概率是 31720520+=,故选:D 【点睛】本题主要考查了相互独立事件的概率乘法公式的应用,体现了分类讨论的数学思想,属于中档题.2.C解析:C 【分析】根据题目所给的数据填写2×2列联表即可;计算K 的观测值K 2,对照题目中的表格,得出统计结论. 【详解】因为()()2210014341636100103020403070505030705050⨯⨯-⨯⨯⨯-⨯<⨯⨯⨯⨯⨯⨯()2100254552530705050⨯⨯-⨯<⨯⨯⨯,所以英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小. 故选C 【点睛】本题考查了独立性检验的应用问题,也考查了计算能力的应用问题,是基础题目. 3.B解析:B 【分析】由于射击一次命中目标的概率为12,所以关键先求出射击7次有4次命中且恰有3次连续命中的所有可能数,即根据独立事件概率公式得结果. 【详解】因为射击7次有4次命中且恰有3次连续命中有24A 种情况,所以所求概率为7241A 2⎛⎫⋅ ⎪⎝⎭.选B. 【点睛】本题考查排列组合以及独立事件概率公式,考查基本分析求解能力,属中档题.4.B解析:B 【分析】打光所有子弹,分中0次、中一次、中2次. 【详解】5次中0次:5 1 4⎛⎫ ⎪⎝⎭5次中一次:4 153144 C⎛⎫⨯⨯ ⎪⎝⎭5次中两次:前4次中一次,最后一次必中314331 444C⎛⎫⨯⨯⨯ ⎪⎝⎭则打光子弹的概率是514⎛⎫⎪⎝⎭+4153144C⎛⎫⨯⨯ ⎪⎝⎭+314331444C⎛⎫⨯⨯⨯ ⎪⎝⎭=13256,选B【点睛】本题需理解打光所有子弹的含义:可能引爆,也可能未引爆.5.B解析:B【解析】【分析】设男生人数为,女生人数为,完善列联表,计算解不等式得到答案.【详解】设男生人数为,女生人数为喜欢抖音不喜欢抖音总计男生女生总计男女人数为整数故答案选B【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.6.A解析:A【分析】设男生人数为x ,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论. 【详解】设男生人数为x ,依题意可得列联表如下:则2 3.841K >,由222235236183 3.841822x x x K x x x x x ⎛⎫- ⎪⎝⎭==>⋅⋅⋅,解得10.24x >, ,26x x为整数, ∴若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则男生至少有12人,故选A. 【点睛】本题主要考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.7.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.8.A解析:A 【解析】分析:根据互斥事件概率加法公式以及独立事件概率乘积公式求概率.详解:因为这两个人在2018年高考中恰有一人数学考140 分以上的概率为甲考140 分以上乙未考到140 分以上事件概率与乙考140 分以上甲未考到140 分以上事件概率的和,而 甲考140 分以上乙未考到140 分以上事件概率为14(1)25⨯-,乙考140 分以上甲未考到140 分以上事件概率为14(1)25-⨯,因此,所求概率为14(1)25⨯-1451(1)25102+-⨯==, 选A.点睛:本题考查互斥事件概率加法公式以及独立事件概率乘积公式,考查基本求解能力.9.C解析:C 【解析】分析:根据正态曲线的对称性求解即可.详解:根据正态曲线的对称性,每个收费口超过700辆的概率()()()111700150070010.60.2225P X P X ⎡⎤≥=-<<=⨯-==⎣⎦, ∴这三个收费口每天至少有一个超过700辆的概率 3161115125P ⎛⎫=--=⎪⎝⎭,故选C. 点睛:本题主要考查正态分布的性质与实际应用,属于中档题.有关正态分布的应用题考查知识点较为清晰,只要掌握以下两点,问题就能迎刃而解:(1)仔细阅读,将实际问题与正态分布“挂起钩来”;(2)熟练掌握正态分布的性质,特别是状态曲线的对称性以及各个区间概率之间的关系.10.A解析:A 【解析】在A 中,设随机变量X 服从正态分布N (10,0.01),则由正态分布性质得1(10)2P X >=,故A 正确; 在B 中,线性回归直线一定过样本中心点(),x y ,故B 错误;在C 中,若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故C 错误;在D 中,先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是系统抽样法,故D 错误. 故选:A11.B解析:B 【解析】因为4.804>3.841,所以有95%的把握认为对街舞的喜欢与性别有关.12.C解析:C 【分析】利用相互独立事件概率乘法公式和互斥事件概率加法公式直接求解. 【详解】解:甲、乙两队进行排球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立, 则甲队以3:1获胜的概率是:()()()10.60.610.50.50.610.60.50.510.60.60.50.50.21P =⨯⨯-⨯+⨯-⨯⨯+-⨯⨯⨯=.甲队以3:0获胜的概率是: 20.60.60.50.18P =⨯⨯=则甲队不超过4场即获胜的概率120.210.180.39P P P =+=+= 故选:C 【点睛】本题考查概率的求法,考查相互独立事件概率乘法公式和互斥事件概率加法公式等基础知识,考查运算求解能力,属于中档题.二、填空题13.【分析】将比分分为四种情况讨论计算概率【详解】由条件可知前两名投票的都投给选手并且投给每位选手的概率是若投票给两位选手的比分为则概率为若比分为则投给选手的方法有种所以概率为若比分为则投给选手的两票不 解析:532【分析】将比分分为7:0,6:1,5:2,4:3四种情况讨论计算概率. 【详解】由条件可知前两名投票的都投给选手A ,并且投给每位选手的概率是12P =. 若投票给A 、B 两位选手的比分为7:0,则概率为712⎛⎫ ⎪⎝⎭, 若比分为6:1,则投给选手B 的方法有155C =种,所以概率为7152⎛⎫⋅ ⎪⎝⎭若比分为5:2,则投给选手B 的两票不能在第三和第四的位置,有2519C -=种,所以概率为7192⎛⎫⋅ ⎪⎝⎭, 若比分为4:3,则投给A 的票不能是最后一位,且不能占5,6位,有2415C -=种,所以概率为7152⎛⎫⋅ ⎪⎝⎭, 所以概率()7151595232P ⎛⎫=+++⋅=⎪⎝⎭. 故答案为:532【点睛】本题考查独立事件同时发生的概率,重点考查分类的思想,属于中档题型.14.【分析】先计算出粒种子都没有发芽的概率即得出每个坑需要补种的概率然后利用独立重复试验的概率得出所求事件的概率【详解】由独立事件的概率乘法公式可知粒种子没有粒发芽的概率为所以一个坑需要补种的概率为由独 解析:21512【分析】先计算出3粒种子都没有发芽的概率,即得出每个坑需要补种的概率,然后利用独立重复试验的概率得出所求事件的概率. 【详解】由独立事件的概率乘法公式可知,3粒种子没有1粒发芽的概率为31128⎛⎫= ⎪⎝⎭, 所以,一个坑需要补种的概率为18, 由独立重复试验的概率公式可得,需要补种的坑数为2的概率为223172188512C ⎛⎫⋅⋅= ⎪⎝⎭, 故答案为21512. 【点睛】本题考查独立事件概率乘法公式的应用,同时也考查了独立重复试验恰有()k k N *∈次发生的概率,要弄清楚事件的基本类型,并结合相应的概率公式进行计算,考查分析问题和理解问题的能力,属于中等题.15.②③【分析】①根据相关指数的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量的观测值k 的关系进行判断【详解】①在线性回归模型中相关指数表示解释变量对于预报变量解析:②③ 【分析】①根据相关指数2R 的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量2K 的观测值k 的关系进行判断. 【详解】①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好,所以①错误;②在回归直线方程ˆy=0.8x−12中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.8个单位,正确;③两个变量相关性越强,则相关系数的绝对值就越接近于1,正确;④对分类变量X 与Y ,对它们的随机变量K2的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越小,所以④错误; 故正确命题的序号是②③. 【点睛】该题考查的是有关统计的问题,涉及到的知识点有线性回归分析,两个变量之间相关关系强弱的判断,独立性检验,属于简单题目.16.【解析】分析:组成的并联电路可从反面计算即先计算发生故障的概率然后用对立事件概率得出不发生故障概率详解:由题意故答案为点睛:零件不发生故障的概率分别为则它们组成的电路中如果是串联电路则不发生故障的概 解析:【解析】分析:23,T T 组成的并联电路可从反面计算,即先计算发生故障的概率,然后用对立事件概率得出不发生故障概率. 详解:由题意11115(1)24432P =⨯-⨯=. 故答案为1532. 点睛:零件12,,,k a a a 不发生故障的概率分别为12,,,k p p p ,则它们组成的电路中,如果是串联电路,则不发生故障的概率易于计算,即为12k p p p ,如果组成的是并联电路,则发生故障的概率易于计算,即为12(1)(1)(1)k p p p ---.17.【解析】因为所以应填答案解析:35【解析】因为()()2254336613,210C C P A P AB C C ====,所以3(|)5P B A =。
高中数学:统计与统计案例练习一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100 名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1 : 3 : 5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()领率组距A. 200 C. 400 0.0350.015B. 240D. 48010平均每周上网时间(h)解析:选C 设频率分布直方图中从左到右前3个小矩形的面积分别为A3K5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)X2 = 0.1.由于频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即尸=0.1.所以平均每周上网时间少于4h的学生所占比例为尸+3P=0.4,由此估计学生人数为0.4X1 000 =400.2. AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0〜50),二级良(51〜100),三级轻度污染(101〜150),四级中度污染(151〜200),五级重度污染(201〜300),六级严重污染(大于300).如图是昆明市2021年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2021年4月份空气质量优的天数为 ()A. 3B. 4C. 12D. 2142解析:选c 从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为 1 V.Z 22所以估计昆明市2021年4月份空气质量为优的天数为30X5=12,应选C.3.〔成都模拟〕某城市收集并整理了该市2021年1月份至10月份各月最低气温与最高气 温〔单位:C 〕的数据,绘制了下面的折线图.该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误 的是〔〕A.最低气温与最高气温为正相关B. 10月的最高气温不低于5月的最高气温C.月温差〔最高气温减最低气温〕的最大值出现在1月D.最低气温低于0C 的月份有4个解析:选D 在A 中,最低气温与最高气温为正相关,故A 正确;在B 中,10月的最高气温 不低于5月的最高气温,故B 正确;在C 中,月温差〔最高气温减最低气温〕的最大值出现在1月, 故C 正确:在D 中,最低气温低于0℃的月份有3个,故D 错误.应选D.4 .〔承德模拟〕为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取 了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体 中倾向选择生育二胎与倾向选择不生育二胎的人数比例图〔如下图〕,其中阴影局部表示倾向 选择生育二胎的对应比例,那么以下表达中错误的选项是〔〕A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关♦最高气温 ♦最低气温C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为 60X60% =36,女性人数为40X60%=24,不相同.应选C.5 .(石家庄模拟)某学校48两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过 茎叶图比拟两个班兴趣小组成绩的平均值及标准差.3 4 28 8 4 6 8 65152①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;@B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为()A.①④C. ®®其方差为白义[(53—78尸+(62—78/ +…+ (95—78)2]=121.6, 那么其标准差为'121.6%11.03;45+48+5H -------- F91B 班兴趣小组的平均成成为'」=66,其方差为表义[(45—66)2+(48 - 66)2 + ... + (91-66)2] =169.2, 那么其标准差为1169.2%13.01.应选A.6 .某商场对某一商品搞活动,该商品每一个的进价为3元,销售价为8元,每天售出的 第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如下图,设M 个)为每天商 品的销量,M 元)为该商场每天箱售这种商品的利润.从日利润不少于96元的几天里任选2天, 那么选出的这2天日利润都是97元的概率为()4 5 5 1 6 2 7 38班8 3 6 4 5 3 4 02B.②③D.①③解析:选A A 班兴趣小组的平均成绩为 53+62+64+…+92+95--------------- ---------------- =785x, x=18, 19, y =<l95+(x-19)(4-3), x=20, 21, J5x, x=18, 19, 即 L176+x, x=20, 21.当日销量不少于20个时,日利泗不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利泗为96元的有3天,记为日利泗为97元的有2天,记为人丛从中任选2天有 (.4),(〃石),(.力),(.1),3/),(48),3«),(c4),(.,8),(48),共 10 种情况.其中选出的这2天日利泗都是97元的有(A,8)1种情况. 故所求概率为关.应选B. 二、填空题7 .某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0 销量w 瓶504443403528x,y 的关系符合回归方程£=£+2其中分=-20.假设该品牌饮料的进价为2元,为使利润 最大,零售价应定为 元.解析:依题意得:x =3.5, y =40,A所以.=40—(- 20)X3.5=110,所以回归直线方程为f=-20x+110,利润 L = (A —2)(-20A + 110)= -201+ 150x-220,B 选• •1 - 9 1 - 5 A.C 解BioD.g由题意知频数(天)0 18 19 20 2 俏量〔个〕所以x=* = 3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是.解析:设所求的人数为〃,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08 +0.16) X 2.5=0.7, n=0.7 X 200=140.答案:1409.为比拟甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:C) 制成如下图的茎叶图,甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,那么甲地该月11时的平均气温的标准差为.甲9 8 2 62 m 03 I解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+〃?,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,那么乙地该月11时的平均气温为(26+28+29+31+31计5 = 29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m + 32)+5 = 30,解得〃?=1,那么甲地该月11时的平均气温的标准差为嗝义[(28 - 30产+(29 - 30)2+(30 - 30/+(31 - 30/+(32 - 30户]=\(2.答案:^2三、解做题10.某篮球运发动的投篮命中率为50%,他想提升自己的投篮水平,制定了一个夏季练习计划,为了了解练习效果,执行练习前他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为463执行练习后也统计了10场比赛的得分,茎叶图如下图:0 8 91 2 4 4 5 6 82 1 3(1)请计算该篮球运发动执行练习后统计的10场比赛得分的中位数、平均得分与方差;⑵如果仅从执行练习前后统计的各10场比赛得分数据分析,你认为练习方案对该运发动的投篮水平的提升是否有帮助?为什么?解:(1)练习后得分的中位数为上芋=14.5;平均得分为8+9+12+14+14+15+16+18 + 21+23= 15:10方差为击义[(8—15)2 + (9 — 15>+(12 —15>+(14 — 15)2+(14 — 15> + (15 —15>+(16 — 15产+(18-15)2+(21-15)2+(23 —15)2]=20.6.(2)尽管中位数练习后比练习前稍小,但平均得分一样,练习前方差20.6小于练习前方差46.3, 说明练习后得分稳定性提升了(阐述观点合理即可),这是投篮水平提升的表现.故此练习方案对该篮球运发动的投篮水平的提升有帮助.11.(西安八校联考)在2021年俄罗斯世界杯期间,莫斯科的局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:⑴销售单价),与等级代码数值x之间存在线性相关关系,求),关于x的线性回归方程(系数精确到0.1);(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(xi1 ),3,光),…其回归直线f=源+2的斜率和截距的最小2Xyi一〃x y八 '। A — A——二乘估计分别为Z? = ----------------- a= y —b x .n _Xxr-n x 26 6参考数据:2>»=8 440, 2e = 25 564.—38+48 + 58 + 68 + 78 + 88解:(1)由题意,得x -■= 63,- 16.8+18.8+20.8 + 22.8 + 24+25.8 _y = 6 =21.5,yA_8 440 - 6X63X21.5〜h = ~~6Z—=25 564—6X63X63「026 A 2A — A 一a= y -bx =21.5-0.2X63 = 8.9.故所求线性回归方程为f=0.2x+8.9.⑵由(1)知,当%=98 时,>=0.2X98+8.9=28.5.・•・估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术测试的100人的成绩进行了统计, 绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).(1)求图中.的值;(2)估计该次测试的平均分不(同一组中的数据用该组的区间中点值代表);(3)根据条件完成下面2X2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.P(K?2k)0.40 0.25 0.15 0.1()0.050.025k0.708 1.323 2.072 2.706 3.841 5.024解:(1)由频率分布直方图中各小长方形面积总和为1,得(2.+ 0.020+0.03.+0.040)义10=1,解得〃=0...5.⑵由频率分布直方图知洛小组的中点值依次是55,65,75,85,95, 对应的频率分别为0.05.30,0.40,0.20.05,那么估计该次测试的平均分为 x = 55X0.05 + 65X0.30 + 75X0.40 + 85X0.20 + 95X0.05 = 74(分). ⑶由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25, 故晋级成功的人数为100X0.25 = 25,填写2X2列联表如下:晋级成功 晋级失败合计男 16 34 50 女 9 41 50 合计2575100100X(16X41 ——25X75X50X50^2,613>2.072,所以有85%的把握认为“晋级成功〞与性别有关.1 .为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单 位:小时)如下:248 256 232 243 188 268 278 266 289 312 274296 288 302 295 228 287 217 329 283K 2=n(acl-bc)2(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:0.0100 ——⑵由题意可得8乂(0.30+0.10+0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190X0.05 + 210X0.05 + 230X0.10 + 250X0.15 + 270X0.20 + 290X0.30 + 310X0.10 + 330X0.05 = 269(小时),所以样本的平均无故障连续使用时限为269小时.2 .海水养殖场进行某水产品的新、旧网箱养殖方法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg 〞,估计A 的概率;⑵填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量V50 kg箱产量250 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比拟. 附:P (心2)0.050 0.010 0.001 k3.841 6.635 10.8280.01500.0125频率 仇距0.0075 0.0050 0.0025.厂工丁丁丁丁厂!无故障连续使用时用/小时新养殖法、n(ad-bc)1 _ .K-= . , , ,,其中〃=a+/?+c+d.(a+Z?)(c 十d)(a十c)(Z?+d)解:⑴旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)X5=0.62.因此,事件A的概率估计值为0.62.⑵根据箱产量的频率分布直方图得到联表:K2=---------- -------------------- 15 705100X100 X 96X104由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图说明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x =+£即=9.97,5=、*ZG L x )21 /=1 \ / 1O/=1/ 1 16 _ / 16 16 _=、/讳16 X 2比0.212, / L G-8.5)2^ 18.439,Z (x,- x )(L8.5)=—2.78,其中为为抽取的第i个零件的尺寸,i= 1,2, (16)(1)求⑶,i)(i= 12…,16)的相关系数二并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设加V0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(刀-35,7 +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(7 -35,7 +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(H,v)(i = 12…4的相关系数£(X,-7)(57-7)r=I ______/ / ・、/(),008公丫0・09・、/ £ d )2、/ £ 8 - 5 )216 _Z (XL x )(/—8.5)尸1解:(1)由样本数据得8,i)(i= 1,2,…,16)的相关系数为r= --------- /--- 1/16 _ / 16、/ Z (即- X C-8.5)2 -2.78剔除第13个数据,剩下数据的样本方差为aX 〔1 591.134 —9.22?—15X 10.022〕=0.008,A Q 这条生产线当天生产的零件尺寸的标准差的估计值为廊而比0.09.4.〔昆明模拟〕〞工资条里显红利,个税新政入民心〞.随着2021年新年钟声的敲响,我国 自1980年以来,力度最大的一次个人所得税〔简称个税〕改革迎来了全面实施的阶段.某IT 从业 者为了解自己在个税新政下能享受多少税收红利,绘制了他在26〜35岁〔2021〜2021年〕之间各 年的月平均收入〕,〔单位:千元〕的散点图:20・・・・ 16- ・ , 12- ., 8 ■ •4°123456789 io"年龄代码工注:年龄代码1~10分别对应年的26〜35岁⑴由散点图知,可用回归模型y=h\n x+a 拟合〕,与x 的关系,试根据有关数据建立〕,关于x 的回归方程;〔2〕如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用〔1〕的结果,将月平 均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.1010 10 _10_ _ 10附注:参考数据:= 55,2〕〉= 155.5,N 〔即一x 〕2 =82.5,2 — x〕〔F — y 〕 = 94.9,26= i=li=li=lJ =1io _ io _ _15.1,2 缶- 1〕2=4.84,£〔力一 t 〕〔yi- y 〕 =242其中"=ln 为;取 In 11 =24,In 36=361=1 /=1参考公式:回归方程.=筋+味中斜率和截距的最小二乘估计分别为公= n ______ _X 〔出一〃〕〔.- V 〕 曰 A - A — -------------------------- \a= v —b u .Z 〔3一 〃 〕2月平均收入y千元解:(1)令 f=lnx,那么 y=bf+a10__Z & -,)()L y)24.2, b ~ ~__Z _痴_5ze —)2r=l10Zu-_2__155.5-_2_=而=-^-=15.55, t =苗A — A —a= y —b t = 15.55 —5X 1.51=8,所以〕,关于/的回归方程为〕,=5/+8.1015.1 lo"=L51由于/=lnx,所以y关于x的回归方程为y=51nx+8.⑵由⑴得,该IT从业者36岁时月平均收入为y=51n 11+8 = 5X2.4+8 = 20〔千元〕.旧个税政策下每个月应缴纳的个人所得税为1 500X3%+3 000X10%+4 500X20%+〔20 000-3 500-9 000〕X25% = 3 120〔元〕.新个税政策下每个月应缴纳的个人所得税为3 000X3%+〔20 000-5 OOO-3OOO-3 000〕X 10%=990〔元〕.故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(70).I— 0 180.212X716X18.439 ',由于lrlV0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于7 =9.97,产0.212,由样本数据可以看出抽取的第13个零件的尺寸在(T—3s,7 + 3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为右义(16义9.97—9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162X?=16X0.212I2+16X9.972^1 591.134,。
高三数学统计案例试题1.一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机器零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制所在的范围是()A.10转/s以下B.15转/s以下C.20转/s以下D.25转/s以下【答案】B【解析】则a=-b=-0.857 5.∴回归直线方程为=0.728 6x-0.857 5.要使y≤10,则0.728 6x-0.857 5≤10,∴x≤14.901 9.因此,机器的转速应该控制在15转/s以下.故选B.2.登山族为了了解某山高y(km)与气温x(°C)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:气温x(°C)181310-1由表中数据,得到线性回归方程,由此请估计出山高为72(km)处气温的度数为()A.-10B.-8C.-6D.-6【答案】C【解析】由题意可得=10,=40.5,所以=+2=40.5+2×10=60.5,所以,当=72时,,解得x≈-6,故选C.【考点】回归分析3.为了调查某大学学生在周日上网的时间,随机对名男生和名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表上网时间(分5253025151020402010(Ⅰ)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(Ⅱ)完成表3的列联表,并回答能否有90%的把握认为“学生周日上网时间与性别有关”?(Ⅲ)从表3的男生中“上网时间少于60分钟”和“上网时间不少于60分钟”的人数中用分层抽样的方法抽取一个容量为5的样本,再从中任取两人,求至少有一人上网时间超过60分钟的概率.表3 :上网时间少于60分钟上网时间不少于60分钟合计附:,其中【答案】(I)225;(II)否;(III).【解析】(I)统计得到女生样本中的上网时间不少于60分钟的频数,根据频数与容量之比等于频率,易得到全校上网时间不少于60分钟的人数;(II)由以上列联表1、2的数据,可统计得到表3的数据,根据独立性检验原理可知:没有90%的把握认为“学生周日上网时间与性别有关”;(III)五名男生中任取两人的基本事件数10个,根据表3可知男生上网超过60分钟与不超过60分钟的人数比为3:2,再写出至少一人超过60分钟的事件数7个,易求得概率为.试题解析:(1)设估计上网时间不少于60分钟的人数,依据题意有,解得:,所以估计其中上网时间不少于60分钟的人数是225人.(2)根据题目所给数据得到如下列联表:上网时间少于60分钟上网时间不少于60分钟合计其中 ,因此,没有90%的把握认为“学生周日上网时间与性别有关”.(3)因为上网时间少于60分钟与上网时间不少于60分钟的人数之比为,所以5人中上网时间少于60分钟的有3人,记为上网时间不少于60分钟的有2人,记为从中任取两人的所有基本事件为:(),(),(),(),(),(),(),(),(),(),共10种,其中“至少有一人上网时间超过60分钟”包含了7种, .【考点】1、用样本估计总体; 2、独立性检验;3、古典概型的概率求法.4.为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共10000 株的生长情况进行研究,现采用分层抽样方法抽取50株作为样本,统计结果如下:高茎矮茎合计10株玉米,再从这10株玉米中随机选出3株,求选到的3株之中既有圆粒玉米又有皱粒玉米的概率;(2) 根据对玉米生长情况作出的统计,是否能在犯错误的概率不超过0.050的前提下认为玉米的圆粒与玉米的高茎有关?(下面的临界值表和公式可供参考:,其中)【答案】(1);(2) 能在犯错误的概率不超过0.050的前提下认为玉米的圆粒与玉米的高茎有关.【解析】本小题通过统计与概率的相关知识,具体涉及到随机变量的分布列、数学期望的求法和统计案例中独立性检验等知识内容,考查学生对数据处理的能力,对考生的运算求解能力、推理论证能力都有较高要求. 本题属于统计概率部分综合题,对考生的统计学的知识考查比较全面,是一道的统计学知识应用的基础试题. .(1)采用分层抽样的比例关系确定个数,然后利用排列组合的知识,借助随机事件的概率求解;(2)根据已知的公式,经过仔细的计算出的值,然后借助表格进行数据对比,得到相关性的结论.试题解析:(1) 现采用分层抽样的方法,从样本中取出的10株玉米中圆粒的有6株,皱粒的有4株,所以从中再次选出3株时,既有圆粒又有皱粒的概率为. (6分) (2) 根据已知列联表:所以.又,因此能在犯错误的概率不超过0.050的前提下认为玉米的圆粒与玉米的高茎有关. (12分)【考点】(1)随机变量的分布列;(2)统计案例中独立性检验5.(本小题共12分)现对某市工薪阶层关于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入的频数分布及对“楼市限购令”赞成人数如下表.月收入(单[15,25[25,35[35,45[45,55[55,65[65,75510151055(1)由以上统计数据填下面2乘2列联表并问是否有99%的把握认为“月收入以5500为分界点对“楼市限购令” 的态度有差异;(2)若对在[15,25),[25,35)的被调查中各随机选取两人进行追踪调查,记选中的4人中不赞成“楼市限购令”人数为,求随机变量的分布列。
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
第九章 统计9.3 统计案例 公司员工的肥胖情况调查分析(基础练)一、单选题(共5小题,满分25分,每小题5分)1.甲、乙两名射击运动员分别进行了5次射击训练,成绩(单位:环)如下: 甲:7,8,8,8,9 乙:6,6,7,7,10;若甲、乙两名运动员的平均成绩分别用21,x x 表示,方差分别为 2221,s s 表示,则( )A.21x x >, 2221s s > B.21x x >, 2221s s < C.21x x <, 2221s s < D.21x x <, 2221s s >【答案】 B【解析】85988871=++++=x , 2.751077661=++++=x ,故 21x x > .s 21;s22, 故s s 2221< , 故选:B.2.已知数据x 1,x 2,x 3,…,x n 是上海普通职工n(n ≥3,n ∈N *)个人的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入x n +1,则在这n +1个数据中,下列说法不正确的是( ) A .年收入平均数大大增大 B .中位数可能不变 C .方差变大 D .方差可能不变【答案】D【解析】插入大的极端值,平均数增加,中位数可能不变,方差也因为加入此数据更加分散而变大.故选:D3.一组数据的方差为2s ,平均数为x ,将这组数据中的每一个数都乘以2,所得的一组新数据的方差和平均数分别为( ) A .212s ,12x B .22s ,2x C .24s ,2x D .2s ,x【答案】C【解析】设该组数据为123,,,,n x x x x ,将这组数据中的每一个数都乘以2,则有1232,22,,2,n x x x x ⋯,平均数为2x .又()()()2222121n s x x x x x x n ⎡⎤=⨯-+-++-⎢⎥⎣⎦,则新数据的方差为()()()22221212222224n x x x x x x s n ⎡⎤⨯-+-++-=⎣⎦, 故选:C.4.如图是某公司2020年1月到10月的销售额(单位:万元)的折线图,销售额在35万元以下为亏损,超过35万元为盈利,则下列说法错误的是( )A .这10个月中销售额最低的是1月份B .从1月到6月销售额逐渐增加C .这10个月中有3个月是亏损的D .这10个月销售额的中位数是43万元 【答案】B【解析】根据折线图知,这10个月中销售额最低的是1月份,为30万元,所以A 正确; 从1月到6月销售额是先增加后减少,再增加,所以B 错误;1月,3月和4月的销售额低于35万元,其它月份都高于35万元,所以C 正确; 这10个月的销售额从小到大排列为30,32,34,40,41,45,48,60,78,80万元, 其中位数是()14145432⨯+=万元,所以D 正确. 故选:B 5.某校从参加高一年级期末考试的学生中抽取60名学生的成绩(均为整数),其成绩的频率分布直方图如图所示,由此估计此次考试成绩的中位数,众数和平均数分别是( )A.73.3,75,72 B.73.3,80,73C.70,70,76 D.70,75,75【答案】A【解析】由频率分布直方图知,小于70的有24人,大于80的有18人,则在[70,80]之间18人,所以中位数为70103+≈73.3;众数就是分布图里最高的小矩形底边的中点,即[70,80]的中点横坐标,是75;平均数为45×0.05+55×0.15+65×0.20+75×0.30+85×0.25+95×0.05=72.故选: A.二、多选题(共3小题,满分15分,每小题5分,少选得3分,多选不得分)6.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是()A.甲的化学成绩领先年级平均分最多.B.甲有2个科目的成绩低于年级平均分.C.甲的成绩最好的前两个科目是化学和地理.D .对甲而言,物理、化学、地理是比较理想的一种选科结果. 【答案】A【解析】根据雷达图,可知物理成绩领先年级平均分最多,即A 错误; 甲的政治、历史两个科目的成绩低于年级平均分,即B 正确; 甲的成绩最好的前两个科目是化学和地理,即C 正确;对甲而言,物理成绩比年级平均分高,历史成绩比年级平均分低,而化学、生物、地理、政治中优势最明显的两科为化学和地理,故物理、化学、地理的成绩是比较理想的一种选科结果,即D 正确. 故选:A.7.某地区城乡居民储蓄存款年底余额(单位:亿元)变化情况如图所示,下列判断一定正确的是( )A .该地区城乡居民储蓄存款年底余额总数逐年上升B .到2019年农村居民存款年底总余额已超过了城镇居民存款年底总余额C .城镇居民存款年底余额逐年下降D .2017年城乡居民存款年底余额增长率大约为225% 【答案】AD【解析】由条形图可知,余额总数逐年上升,故A 项正确;由城乡储蓄构成百分比可知,2019年农村居民存款年底总余额占36.1%,城镇居民存款年底总余额占63.9%,没有超过,故B 项错误;城镇居民存款年底余额所占的比重逐年下降,但城镇居民存款年底余额2014年,2017年,2019年分别为6.8198(亿元),155.085(亿元),973.197(亿元),总体不是逐年下降的,故C 项错误,2017年城乡居民存款年底余额增长率大约为21165225%65-≈,故D 项正确.故选:AD. 8.如图是某公司2018年1月至12月空调销售任务及完成情况的统计图,如10月份销售任务是400台,完成率为90%,下列叙述正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年总销售量为4870台D .2018年月销售量最大的是6月份 【答案】ABC【解析】由题图可知选项A 正确; 2018年月销售任务的平均值为10020033003400500700800100045060012++⨯+⨯++++=<,故选项B 正确;2018年总销售量为1000.82001300(0.5 1.50.6)400(1.20.90.9)500 1.17000.8⨯+⨯+⨯+++⨯+++⨯+⨯800110000.74870+⨯+⨯=,故选项C 正确;2018年月销售量最大的是5月份,为800台,故选项D 不正确. 故选:ABC 三、填空题(共3小题,满分15分,每小题5分,一题两空,第一空2分)9.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为_________ 【答案】0.7【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7. 故答案为:0.710.为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的认为作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互相不相同,则样本数据中的最大值为 . 【答案】10【解析】设样本数据为:12345,,,,x x x x x ()1234557x x x x x ∴++++÷=()()222157754s x x ⎡⎤=-++-÷=⎣⎦()()22151********,35x x x x x x x ∴-++-=++++=若样本数据中的最大值为11,不妨设511x =,由于样本数据互不相同,与()()22157720x x -++-=这是不可能成立的,若样本数据为4,6,7,8,10,代入验证知两式均成立,此时样本数据中的最大值为 10, 故答案为:1011.为实现国民经济新“三步走”的发展战略目标,国家加大了扶贫攻坚的力度.某地区在2015 年以前的年均脱贫率(脱离贫困的户数占当年贫困户总数的比)为.2015年开始,全面实施“精准扶贫”政策后,扶贫效果明显提高,其中2019年度实施的扶贫项目,各项目参加户数占比(参加该项目户数占 2019 年贫困户总数的比)及该项目的脱贫率见下表:实施项目 种植业 养殖业 工厂就业 服务业 参加用户比脱贫率那么2019年的年脱贫率是实施“精准扶贫”政策前的年均脱贫率的______倍 【答案】 【解析】设贫困户总数为a,脱贫率,所以 .故 2019年的年脱贫率是实施“精准扶贫”政策前的年均脱贫率的 倍. 故答案为:四、解答题:(本题共3小题,共45分。
高中统计案例试题及答案一、选择题1. 以下哪个选项是描述数据集中趋势的统计量?A. 方差B. 标准差C. 平均数D. 极差答案:C2. 一组数据的中位数是所有数据排序后位于中间位置的数值,如果数据个数为奇数,则中位数是:A. 第一个数据B. 最后一个数据C. 位于中间位置的数值D. 无法确定答案:C3. 以下哪个统计图适合展示时间序列数据的变化趋势?A. 条形图B. 饼图C. 折线图D. 散点图答案:C二、填空题4. 某班级有30名学生,他们的数学成绩分别为:70, 85, 90, 75, 95, 80, 85, 70, 80, 90, 85, 95, 75, 70, 80, 90, 85, 95, 75, 70, 80, 85, 90, 95, 75。
这组数据的平均数是____。
答案:825. 如果一组数据的方差是25,那么它的标准差是____。
答案:5三、简答题6. 描述统计学中的“样本”和“总体”的概念,并举例说明。
答案:在统计学中,“总体”指的是研究对象的全体,而“样本”是从总体中随机抽取的一部分个体。
例如,如果我们想要了解全国高中生的数学成绩水平,全国所有高中生的数学成绩就是总体,而如果我们随机抽取了1000名高中生的数学成绩进行研究,这1000名高中生的数学成绩就是我们的样本。
四、计算题7. 某工厂生产了一批零件,其长度的测量数据如下:20, 22, 21, 23, 20, 21, 22, 21, 22, 23。
请计算这组数据的平均数、中位数、方差和标准差。
答案:平均数 = (20+22+21+23+20+21+22+21+22+23) / 10 = 21.5中位数 = (21+22) / 2 = 21.5方差 = [(20-21.5)² + (22-21.5)² + ... + (23-21.5)²] / 10 = 1.65标准差= √1.65 ≈ 1.29结束语:通过上述试题及答案,我们可以看出,统计学是一门应用广泛的学科,它可以帮助我们更好地理解和分析数据。
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.2019年10月18日-27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为12;②在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”;则正确命题的个数为( )附:22()()()()()n ad bc K a b c d a c b d -=++++A .0B .1C .2D .33.下列关于回归分析与独立性检验的说法正确的是() A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;4.已知x 与y 之间的几组数据如下表:x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a'D .b<b',a>a'5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k ,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响6.某学校课题组为了研究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示: 序号 12345678910 11 12 13 14 15 16 17 18 19 20数学成绩 95 75 80 94 92 65 67 84 987167 93 64 787790 57 83 72 83物理成绩90 63 72 87 917158 82 93 817782 48 85 69 91 61 84 78 86若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀,则有多少把握认为学生的数学成绩与物理成绩有关系( )A .95%B .97.5%C .99.5%D .99.9%7.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;8.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bc K a c b d a d b c -++++,其中n a b c d =+++.20()P K k ≥0.100.050.01 0.0050k 2.7063.8416.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们( )A .没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”9.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表女 男 合计读营养说明 16 28 44 不读营养说明 20 8 28 总计363672请问性别和读营养说明之间在多大程度上有关系 ( ) A .99%的可能性 B .99.75%的可能性 C .99.5%的可能性 D .97.5%的可能性10.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1 B .2C .3D .411.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K =()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%12.已知回归方程0.8585.7y x ∧=-,则该方程在样本()165,57 处的残差为( ) A .111.55B .54.5C .3.45D .2.45二、填空题13.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 14.若两个分类变量X 与Y 的列联表为:则“X 与Y 之间有关系”这个结论出错的可能性为________.15.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”. 参考附表:(参考公式:K 2=()()()()()2n ad bc a b c d a c b d -++++,其中n=a+b+c+d)16.如表是降耗技术改造后生产某产品过程中记录产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆˆ0.70.3yx =+,那么表中m 的值为__________.17.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 18.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c互不相同,则这个三位数为”有缘数”的概率是__________. 19.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上)20.在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示: 价格x 9 9.5 10 10.5 11 销售量y1110865由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,其线性回归方程是:3.2y x a =-+,则a =__________.三、解答题21.某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据绘制成散点图.光照时长为x (单位:小时),大棚蔬菜产量为y (单位:千斤每亩),记ln w x =.(1)根据散点图判断,y a bx =+与ln y c d x =+⋅,哪一个适宜作为大棚蔬菜产量y 关于光照时长x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(结果保留小数点后两位)(3)根据实际种植情况,发现上述回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求方程估计当光照时长为2e 小时(自然对数的底 2.71828e ≈),大棚蔬菜亩产约为多少. 参数数据:参考公式:β关于α的线性回归方程m n βα=⋅+中,1221i ii nii n m n αβαβαα==-⋅=-∑∑,n m βα=-⋅22.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期.一研究团队统计了某地区200名患者的相关信息,得到如下表格:(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据将如下列联表补充完整,并根据列联表判断是否有99%的把握认为该传染病的潜伏期与患者年龄有关.(2)将200名患者的潜伏期超过6天的频率视为该地区每名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该团队随机调查了该地区20名患者,其中潜伏期超过6天的人数为X ,求随机变量X 的期望和方差. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 23.新冠肺炎疫情防控时期,各级各类学校纷纷组织师生开展了“停课不停学”活动,为了解班级线上学习情况,某位班主任老师进行了有关调查研究.(1)从班级随机选出5名同学,对比研究了线上学习前后两次数学考试成绩,如下表:参考公式:在线性回归方程y bx a =+,()()()()1122211n niii ii i nniii i x x y y x y nx yb x x xn x====---==--∑∑∑∑,a y bx =-(2)针对全班45名同学(25名女生,20名男生)的线上学习满意度调查中,女姓满意率为80%,男生满意率为75%,填写下面列联表,判断能否在犯错误概率不超过0.01的前提下,认为线上学习满意度与学生性别有关?参考公式和数据:()()()()()2n ad bc x a b c d a c b d -=++++,()20.0500.0100.0013.8416.63510.828P x k k ≥24.为了了解某校高中生的身体质量情况,某调查机构进行了一次高一学生体重和身高的抽样调查,从中抽取了8名学生(编号为18)的身高(cm)x 和体重(kg)y 数据.如下表,某调查机构分析发现学生的身高和体重之间有较强的线性相关关系,在编号为6的体检数据丢失之前,调查员甲已进行相关的数据分析并计算出该组数据的线性回归方程为ˆˆ0.5ya x =+,且根据回归方程预估一名身高为180cm 的学生体重为71kg ,计算得到的其他数据如下:81170,89920i ii x x y===∑.(1)求a 的值及表格中8名学生体重的平均值y ;(2)在数据处理时,调查员乙发现编号为8的学生体重数据有误,应为63kg ,身高数据无误.请你根据调查员乙更正的数据重新计算线性回归方程,并据此预估一名身高为180cm 的学生的体重.附:回归直线方程ˆˆˆy a bx=+的斜率和截距的最小二乘法估计分别为:1221ˆni ii ni i x ynx ybx nx==-=-∑∑,ˆˆa y bx=-. 25.冠状病毒是一个大型病毒家族,今年出现的新型冠状病毒(nCoV )是以前从未在人体中发现的冠状病毒新毒株.(1)某科研团队为研究潜伏期与新冠肺炎患者年龄的关系,组织专家统计了该地区新冠肺炎患者新冠病毒潜伏期的相关信息,其中被统计的患者中60岁以下的人数与60岁以上的人数相同,60岁以下且潜伏期在7天以下的人数约占15,60岁以上且潜伏期在7天以下的人数约占35,若研究得到在犯错误概率不超过0.010的前提下,认为潜伏期与新冠肺炎患者年龄有关,现设被统计的60岁以上的人员人数为5x ,请完成下面2×2列联表并计算被统计的60岁以上的人员至少多少人?附1:()()()()()22n ad bc X a b c d a c b d -=++++,其中n a b c d =+++()20P X k ≥0.100 0.050 0.010 0.005 0.001 0k 2.7063.8416.6357.87910.828(2)某地区的新冠肺炎治愈人数y (人)与3月份的时间x (日)满足回归直线方程ˆˆˆybx a =+,统计数据如下: 3月日期(日) 2 3 4 5 6治愈人数(人)25304045t已知5=11405i i y y ==∑,52=190i i x =∑,5=1885i i i x y =∑,请利用所给数据求t 和回归直线方程ˆˆˆy bx a =+;附2:()1221ˆni ii ni i x y nx ybx n x ==-⋅=-∑∑,ˆˆa y bx=-. 26.某企业组织应聘该企业的100名应届毕业生参加专业能力测试(满分100分),这100名毕业生的成绩的频率分布直方图如图所示.(Ⅰ)该企业拟以成绩的中位数作为分数线来确定进入面试阶段的毕业生名单,根据频率分布直方图求进入该企业面试的分数线;(Ⅱ)若被测试的毕业生中有40名女生,进入面试的有15名女生,35名男生,填写下面列联表,并根据列联表判断是否有95%的把握认为成绩与性别有关.成绩<分数线成绩≥分数线 总计附:()()()()()22n ad bc K a b c d a c b d -=++++)2k【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B 【分析】依次判断每个选项:计算概率为25得到①错误;计算2 5.952K ≈得到②错,③对得到答案. 【详解】任取1名参赛人员,抽到对主办方表示满意的男性运动员的概率为20025005=,故①错误;22(2003050220)5005.95225025042080K ⨯-⨯⨯=≈⨯⨯⨯,故②错,③对故选:B . 【点睛】本题考查了概率的计算和独立性检验,意在考查学生的综合应用能力.3.D解析:D 【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案. 【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A 、B 、C 均错误,故答案选D . 【点睛】本题主要考查了回归分析与独立性检验的定义的区别.4.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.C解析:C 【解析】分析:根据题意,列出22⨯列联表,求出观测值2K ,根据观测值对应的数值得出结论. 详解:根据题意,列出22⨯列联表,如下;则220(51212)8.80177.879671413K ⨯⨯-⨯==>⨯⨯⨯,因为观测值对应的数值为0.005,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.故选C.点睛:本题考查了独立性检验的应用,属于基础题.考查利用数学知识研究实际问题的能力以及相应的运算能力.7.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.8.B解析:B 【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K 的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人, 又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人, 又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530) 4.762 3.8412109075225K ⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”, 故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.9.C解析:C 【详解】由题意可知16,28,20,8a b c d ====,44,28,36,36a b c d a c c d +=+=+=+=,72n a b c d =+++=,代入公式()()()()()22n ad bc K a b c d a c b d -=++++得()227216828208.4244283636K ⨯⨯-⨯=≈⨯⨯⨯,由于28.427.879K ≈>,我们就有0099.5的把握认为性别和读营养说明之间有关系,即性别和读营养说明之间有0099.5的可能是有关系的,故选C .10.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.11.D解析:D 【解析】 试题由题根据二列联表得出;2K=()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,对应参考值得 2 5.024K >,则有10.0250.975-=,即有97.5%的把握认为文化程度与月收入有关系。
一、选择题1.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是()A.①回归分析,②取平均值B.①独立性检验,②回归分析C.①回归分析,②独立性检验D.①独立性检验,②取平均值2.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,参考公式和数据:22()()()()()n ad bcKa cb d a bc d-=++++,其中n a b c d=+++.则以下判断正确的是A.至少有97.5%的把握认为学生选报文理科与性别有关B.至多有97.5%的把握认为学生选报文理科与性别有关C.至少有95%的把握认为学生选报文理科与性别有关D.至多有95%的把握认为学生选报文理科与性别有关3.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过()附:()()()()()22n ad bcKa b c d a c b d-=++++A.0.01 B.0.025 C.0.10 D.0.054.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合5.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()P(K2≥k)…0.250.150.100.0250.0100.005…k…1.3232.0722.7065.0246.6357.879…A.90% B.95% C.97.5% D.99.5%6.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1; ③若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .47.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关8.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 9.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程^^^y b x a =+必过(),x y ;④在一个22⨯列联表中,由计算得213.079K =,则有99%以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A .0 B .1 C .2D .310.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系 12.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .58二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.15.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表: 专业 性别非统计专业统计专业男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.16.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③某项测量结果ξ服从正态分布()21,σN ,()50.81ξP ≤=,则()30.19ξP ≤-=;④对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56yx =-,数据列表是:则其中的数据a =__________.19.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 的距离是19; ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表: 年龄段(岁) ()0,20[)20,40[)40,60[)60100,网购人数 2632348 男性人数1510 105(1)若把年龄在[2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?网购迷 非网购迷 总计男性 女性 总计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥0.10 0.05 0.01 0.001两人年龄都小于20岁的概率.22.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望.参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:23.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x和对应的销售额y(万元)进行了调查得到以下数据:关系数r的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii xx =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii n ii x y nx y bxnx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑24.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,25.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.2.C解析:C【解析】由题易得22⨯列联表如下:则2K的观测值为()220235104.432 3.841128713k⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C.【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.3.B解析:B 【解析】分析:根据表格中所给数据,代入公式()()()()()22n ad bc K a b c d a c b d -=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果. 详解:根据表中数据得到()2250181589 5.059 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”, 则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.4.A解析:A 【解析】回归直线方程过样本中心点,过A 选项正确.5.C解析:C 【详解】∵2 6.023 5.024K=>∴可断言市民收入增减与旅游欲望有关的把握为97.5%.故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bcKa b c d a c b d-=++++,计算出2K的值;(3)查表比较2K与临界值的大小关系,作统计判断.6.B解析:B【解析】由题意得,若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为4,所以③不正确;对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.7.C解析:C【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.8.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.考点:独立性检验的意义.9.B解析:B【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y35x=-,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y= b x+a必过点(),x y,③正确;因为213.079 6.635K=>,故有0099以上的把握认为这两个变量间有关系,④正确,即错误的个数为1,故选B. 10.B解析:B【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.12.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k>,即2452()3636969 3.84171711931818x x x x xxkx x xx⋅-⋅==>⋅⋅⋅,解得12.697x>.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.故答案为:18.【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题. 14.(1)(3)【解析】分析:根据独立性检验残差图相关系数回归分析的定义及性质逐一分析四个答案的真假即可详解:对于(1)根据2×2列联表中的数据计算得出≥6635而P(≥6635)≈001则有99的把握解析:(1)(3).【解析】分析:根据独立性检验、残差图、相关系数、回归分析的定义及性质,逐一分析四个答案的真假即可.详解:对于(1),根据2×2列联表中的数据计算得出2K≥6.635, 而P(2K≥6.635)≈0.01,则有99%的把握认为两个分类变量有关系,故(1)正确.对于(2),根据残差图的意义可得,当带状区域的宽度较小时,说明选用的模型比价合适,而当带状区域的宽度较大时,说明选用的模型不合适,故(2)不正确.对于(3),在线性回归分析中,相关系数为r,|r|越接近于1,则相关程度越大;|r|越接近于0,则相关程度越小.故(3)正确.对于(4),在回归直线y=0.5x−85中,当x=200时,y=15,但实际观测值可能不是15,故(4)不正确.综上可得(1)(3)正确.点睛:本题考查回归分析和独立性检验的基本知识,属于基础类题目,解题的关键是熟记相关的的概念和性质.15.5【解析】因为随机变量K2的观测值k>3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想解析:5% 【解析】因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 考点:独立性检验思想.16.40【解析】试题分析:根据所给的表格做出本组数据的样本中心点根据样本中心点在线性回归直线上利用待定系数法做出a 的值现在方程是一个确定的方程根据所给的x 的值代入线性回归方程预报要销售的件数解:由表格得解析:40 【解析】试题分析:根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a 的值,现在方程是一个确定的方程,根据所给的x 的值,代入线性回归方程,预报要销售的件数.解:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30 即样本中心点的坐标为:(10,40), 又∵样本中心点(10,40)在回归方程 上且b=﹣2∴30=10×(﹣2)+a , 解得:a=50, ∴当x=5时,y=﹣2×(5)+50=40. 故答案为40.考点:回归分析的初步应用.17.【解析】试题分析:对于①从匀速传递的新产品生产流水线上质检员每20分钟抽取一件新产品进行某项指标检测这样的抽样是系统抽样而不是分层抽样故①错;对于②两个随机变量的相关性知识可知②正确;对于③变量所以 解析:2【解析】试题分析:对于①,从匀速传递的新产品生产流水线上,质检员每20分钟抽取一件新产品进行某项指标检测,这样的抽样是系统抽样,而不是分层抽样,故①错;对于②,两个随机变量的相关性知识可知②正确;对于③变量2(1,)N ξσ~,所以()()30.191510.810.19ξξP ≤-==-P ≤=-=,故③正确;对于④,随机变量2K 观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,故④错,所以真命题有2个. 考点:1. 回归分析的基本思想及其应用初步;2.统计与概率.18.163【解析】由根据回归直线经过样本中心即得由得故答案为解析:163 【解析】由4953565864565y ++++==,根据回归直线经过样本中心(),x y ,即560.7973.56x =⨯-,得164x =,由1551611671741645a x ++++==,得163a =,故答案为163.19.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.20.①④【解析】分析:根据性回归方程独立性检验相关关系以及命题的否定等知识选出正确的得到结果详解:线性回归方程必过样本中心点故①正确命题的否定是故②错误③相关系数r 绝对值越小表明两个变量相关性越弱故不正解析:①④ 【解析】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.详解:线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,故①正确.命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃≥+<” 故②错误 ③相关系数r 绝对值越小,表明两个变量相关性越弱,故不正确;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系,正确. 故答案为①④.点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.三、解答题21.(1)列联表答案见解析,能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)310.【分析】(1)根据表格中的数据可题中信息可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)计算得出年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b ,列举出所有的基本事件,并确定事件“所抽的两人年龄都小于20岁”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)由题中信息可完善22⨯列联表如下表所示:计算得()2100201446207.605 6.63566344060K ⨯⨯-⨯=≈>⨯⨯⨯,故能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)年龄在()0,20、[)20,40网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b .从中随机抽取2人的一切可能结果所组成的基本事件共10个:()1,2、()1,3、()1,a 、()1,b 、()2,3、()2,a 、()2,b 、()3,a 、()3,b 、(),a b .用A 表示“两人年龄都小于20岁”这一事件,则事件A 由3个基本事件组成:()1,2、()1,3、()2,3.故事件A 的概率为()310P A =. 【点睛】方法点睛:求解古典概型的概率方法如下: (1)列举法; (2)列表法; (3)树状图法; (4)排列、组合数的应用.22.(1)没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析,()2E X =.【分析】(1)根据表格中数据和题中信息可完善22⨯列联表,计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2、3,计算出随机变量X 在不同取值下的概率,可得出随机变量X 的分布列,进而可求得随机变量X 的数学期望值. 【详解】(1)22⨯列联表如下表所示:()22505102015258.33310.828203025253χ⨯⨯-⨯==≈<⨯⨯⨯,所以,没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)9人中学习成绩优秀的人有209630⨯=人,学习成绩一般的有109330⨯=人, X 可能的取值有0、1、2、3,()3911084P X C ===,()1263393114C C P X C ===,()21633915228C C P X C ===,()363953?21C P X C ===.所以,随机变量X 的分布列为()1232142821E X =⨯+⨯+⨯=. 【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.23.(1)0.94r ≈,线性相关性较弱;(2) +77.3ˆyx =。
统计案例测试题一一、选择题:本大题共12道小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项符合题目要求1、对于散点图下列说法中正确一个是( ) (A )通过散点图一定可以看出变量之间的变化规律 (B )通过散点图一定不可以看出变量之间的变化规律 (C )通过散点图可以看出正相关与负相关有明显区别 (D )通过散点图看不出正相关与负相关有什么区别2、在画两个变量的散点图时,下面叙述正确的是( ) (A )预报变量在x 轴上,解释变量在y 轴上 (B )解释变量在x 轴上,预报变量在y 轴上 (C )可以选择两个变量中的任意一个变量在x 轴上 (D )可以选择两个变量中的任意一个变量在y 轴上3、如果根据性别与是否爱好运动的列联表,得到841.3852.3>≈k ,所以判断性别与运动有关,那么这种判断出错的可能性为( )(A )0020 (B )0015 (C )0010 (D )005 4、下列关于线性回归的说法,不正确的是( )(A )变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;(B )在平面直角坐标系中用描点法的方法得到表示具有相关关系的两个变量的一组数据的图形叫散点图;(C )线性回归直线方程最能代表观测值y x ,之间的关系; (D )任何一组观测值都能得到具有代表意义的回归直线方程;5、在两个变量y 与x 的回归模型中,分别选择了四个不同的模型,它们的相关指数2R 如下,其中拟合效果最好的为( )(A )模型①的相关指数为976.0 (B )模型②的相关指数为776.0 (C )模型③的相关指数为076.0 (D )模型④的相关指数为351.0 6、关于如何求回归直线的方程,下列说法正确的一项是( )(A )先画一条,测出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测出此时的斜率与截距,就可得到回归直线方程(B )在散点图中,选两点,画一条直线,使所画直线两侧的点数一样多或基本相同,求出此直线方程,则该方程即为所求回归方程(C )在散点图中多选几组点,分别求出各直线的斜率与截距,再求它们的平均值,就得到了回归直线的斜率与截距,即可产生回归方程(D )上述三种方法都不可行7、若对于变量y 与x 的10组统计数据的回归模型中,相关指数95.02=R ,又知残差平方和为53.120,那么∑=-1012)(i iy y的值为( )(A )06.241 (B )6.2410 (C )08.253 (D )8.2530 8、右表是对与喜欢足球与否的统计列联表依据表中的数据,得到( ) (A )564.92=K(B )564.32=K (C )706.22<K (D )841.32>K9、某医院用光电比色计检验尿汞时,得尿汞含量)/(L mg 与消光系数读数的结果如下:如果y 与x 之间具有线性相关关系,那么当消光系数的读数为480时,( )(A )汞含量约为L mg /27.13 (B )汞含量高于L mg /27.13 (C )汞含量低于L mg /27.13 (D )汞含量一定是L mg /27.1310、由一组样本数据),(,),,(),,(2221n n y x y x y x 得到的回归直线方程a bx y +=∧,那么下面说法正确的是( )(A )直线a bx y +=∧必过点),(--y x(B )直线a bx y +=∧必经过),(,),,(),,(2221n n y x y x y x 一点 (C )直线a bx y +=∧经过),(,),,(),,(2221n n y x y x y x 中某两个特殊点(D )直线a bx y +=∧必不过点),(--y x 11、根据下面的列联表得到如下中个判断:①有009.99的把握认为患肝病与嗜酒有关;②有0099的把握认为患肝病与嗜酒有关;③认为患肝病与嗜酒有关的出错的可能为001;④认为患肝病与嗜酒有关的出错的可能为0010;其中正确命题的个数为( )(A )0 (B )1 (C )2 (D )3 12、对于两个变量之间的相关系数r ,下列说法中正确的是( ) (A )||r 越大,相关程度越大 (B )||r 越小,相关程度越大(C )||r 越大,相关程度越小;||r 越小,相关程度越大(D )1||≤r 且||r 越接近于1,相关程度越大; ||r 越接近于0,相关程度越小; 二、填空题:本大题共4小题,每小题4分,共16分,把答案填在题中的横线上 13、下表是关于出生男婴与女婴调查的列联表那么,A= ,B= ,C= ,D= ,E= ;14、如右表中给出五组数据),(y x ,从中选出四组使其线性相关最大,且保留第一组)3,5(--,那么,应去掉第 组。
15、某学校对校本课程《人与自然》的选修情况进行了统计,得到如下数据:那么,选修《人与自然》与性别有关的把握是 ;16、、如图,有5组),(y x 数据,去掉 组(即填A ,B ,C ,D ,E 中的某一个) 后,剩下的四组数据的线性相关系数最大。
三、解答题:本大题共6小题,共74分,解答应写出文字说明、证明过程或演算步骤 17、(本小题满分12分)有甲、乙两个班,进行数学考试,按学生考试及格与不及格统计成绩后,得到如下的列联表根据表中数据,你有多大把握认为成绩及格与班级有关? 18、(本小题满分12分)假设关于某设备的使用年限x 和所支出的维修费用y 有如下的统计资料若由资料知y 对x 呈线性相关关系,试求: (1)线性回归方程(2)估计使用年限为10年时,维修费用大约是多少? 19、(本小题满分12分)吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不得影响,影响学生的健康成长,下表是性别与吃零食的列联表试画出列联表的三维柱形图、二维条形图与等高条件形图,并结合图形判断性别与吃零食是否有关?20、(本小题满分12分)一机器可以按不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少,随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件的个数,现观测得到),(y x 的四组观测值为)11,16(),9,14(),8,12(),5,8(。
若实际生产中所允许的每小时有缺点的物件数不超过10,则机器的速度每秒不得超过多少转?21、(本小题满分12分)在大街上,随机调查339名成人,有关吸烟、不吸烟、患支气管炎、不患支气管炎的数据如下表根据表中数据,(1)判断:吸烟与患支气管炎是否有关?(2)用假设检验的思想予以证明。
22、(本小题满分14分)某同学6次考试的数学)(x 、语文)(y 成绩在班中的排名如下表:数学成绩)(x 7 6 5 3 2 1 语文成绩)(y13119642对上述数据分别用a bx y +=与d cx y +=2来拟合y 与x 之间的关系,并用残差分析两者的拟合效果。
统计案例测试题的答案与提示一、选择题 1、答案:(C ); 2、答案:(B ); 3、答案:(D ); 4、答案:(D ); 5、答案:(A ) 6、答案:(D );7、答案:(B );由∑∑==∧---=10121012)()(1i ii iy yy yR ,得∑=--=1012)(53.120195.0i iy y得=-∑=1012)(i iy y6.24108、答案:(D );由841.3722.4))()()(()(22>=++++-=d b c a d c b a bc ad n K9、答案(A ) 10、答案:(A );11、答案:(D );由635.6828.10632.56))()()(()(22>>=++++-=d b c a d c b a bc ad n K12、答案:(D ); 二、填空题13、答案:A=47,B=92,C=88,D=82,E=53; 14、答案:应去掉第三组;画散点图可以发现。
15、答案:828.108.163))()()(()(22>=++++-=d b c a d c b a bc ad n K ,即有009.99的把握,认为选修《人与自然》与性别有关16、答案:D ; 三、解答题:17、由列联表中的数据,得706.26527.073174545)3573810(90))()()(()(222<=⨯⨯⨯⨯-⨯⨯=++++-=d b c a d c b a bc ad n K没有充分的证据显示“及格或不及格否与班级有关”。
18、(1)由计算器得23.1=b ,08.0=a 那么,回归直线方程为08.023.1+=∧x y (2)当10=x 时,38.12=∧y即使用年限为10年时,维修费用大约是38.12万元。
19、三维柱形图如下:二维条形图如下:等高条形图如下:由上述三图可知:性别与吃零食有关。
20、由于5.12)1614128(41=+++=x ,25.8)11985(41=+++=y 5.25))((41=--∑=i i iy y x x,35)(412=-∑=i i x x ,75.18)(412=-∑=i i y y ,那么75.0995.075.18355.25>=⨯=r ,因此,y 与x 之间具有很强的线性相关关系。
于是由公式,得729.0=∧b ,857.0-=∧a ,那么y 与x 之间的回归直线方程为=∧y857.0729.0-x ,由10857.0729.0≤-=∧x y ,得15893.14≈≤x即每小时有缺点的物件数不超过10时,机器的速度每秒不得超过15转。
21、(1)由列联表中的数据,得635.6469.728356134205)1214316213(339))()()(()(222>=⨯⨯⨯⨯-⨯⨯=++++-=d b c a d c b a bc ad n K所以,有0099的把握认为吸烟与患支气管炎有关。
(2)假设吸烟与患支气管炎无关,由于01.0)635.6(2≈>=K P A ,即A 为小概率事件,而小概率事件发生了,进而假设错误,得到吸烟与患支气管炎有关。
22、首先用a bx y +=来拟合y 与x 之间的关系由于4=x ,5.7=y ,50))((61=--∑=i i iy y x x,28)(612=-∑=i i x x ,那么=∧b786.12850)())((61261==---∑∑==i ii i ix xy y x x,而356.04786.15.7=⨯-=-=∧∧x b y a ,此时可得,356.0786.1+=∧x y ,此时的残差平方和214.0)(612=-∑=∧i i i y y再用d cx y +=2来拟合y 与x 之间的关系,令2x t =,则排名表为t 49 36 25 9 4 1y 13 11 9 64 2由于667.20=t ,5.7=y ,400))((61=--∑=i i iy y t t,333.1857)(612=-∑=i i t t ,那么=∧b 215.0333.1857400)())((61261==---∑∑==i ii i it ty y t t,056.3667.20215.05.7=⨯-=⋅-=∧∧t b y a ,此时可得,056.3215.0+=∧x y ,此时的残差平方和355.3)(612=-∑=∧i i iy y由于214.0355.3>,可知用a bx y +=来拟合y 与x 之间的关系效果最好。