第九章 第一节 随机抽样1
- 格式:ppt
- 大小:645.50 KB
- 文档页数:52
第1讲 随机抽样 用样本估计总体A 组基础巩固一、单选题1.(2024·陕西汉中模拟)某射击运动员连续射击5次,命环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( B )A .7.6B .7.8C .8D .8.2[解析] 由题意可知该组数据为6,7,8,9,9,∴平均数x =6+7+8+9+95=7.8.故选B.2.(2023·陕西西安联考)某社区有1 500名老年居民、2 100名中青年居民和1 800名儿童居民.为了解该社区居民对社区工作的满意度,现采用分层抽样的方法从这些居民中抽取一个容量为n 的样本,若中青年居民比老年居民多抽取20人,则n =( C )A .120B .150C .180D .210[解析] 由题可知⎝ ⎛⎭⎪⎫2 1001 500+2 100+1 800- 1 5001 500+2 100+1 800×n =20,解得n =180.故选C.3.(2023·湖南部分学校联考)已知某班共有学生46人,该班语文老师为了了解学生每天阅读课外书籍的时长情况,决定利用随机数表法从全班学生中抽取10人进行调查.将46名学生按01,02,…,46进行编号.现提供随机数表的第7行至第9行:84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 56 57 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 32 21 12 34 29 78 64 56 07 82 82 42 07 44 38 15 51 00 13 42 99 66 02 79 54 若从表中第7行第41列开始向右依次读取2个数据,每行结束后,下一行依然向右读数,则得到的第8个样本编号是( D )A .07B .12C .39D .44 [解析] 依次抽取的样本编号为12,06,01,16,19,10,12,07,44,39,38.剔除重复号码12,故选D.4.(2024·江苏南京六校联合调研)已知样本数据3x 1+1,3x 2+1,3x 3+1,3x 4+1,3x 5+1,3x 6+1的平均数为16,方差为9,则另一组数据x 1,x 2,x 3,x 4,x 5,x 6,12的方差为( C )A.467B .477C .487D .7[解析] 设数据x 1,x 2,x 3,x 4,x 5,x 6的平均数为x ,方差为s 2,由3x +1=16,9s2=9,得x =16∑i =16x i =5,s 2=16∑i =16 (x i -5)2=1,则x 1,x 2,x 3,x 4,x 5,x 6,12的平均数为5×6+127=6,方差为∑i =16x i -62+12-627=∑i =16x i -5-12+367=∑i =16x i -52-2∑i =16x i -5+1×6+367=∑i =16x i -52-2∑i =16x i +1027=6s 2-2×6x +1027=487.故选C.5.(2022·全国高考甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识,为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( B )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差[解析] 讲座前中位数为70%+75%2>70%,所以A 错;讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B 对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C 错;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D 错.故选B.6.(2024·四川南充高级中学月考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( D )A.100,10 B.100,20C.200,10 D.200,20[解析]依题意可得样本容量为(3 500+2 000+4 500)×2%=200,其中高中生抽取2 000×2%=40人,因为样本中高中生的近视率为50%,所以抽取的高中生近视人数为40×50%=20人;故选D.7.(2024·江苏基地校大联考改编)如图为甲、乙两人在同一星期内每日步数的折线统计图,则下列结论错误的是( C )A.这一星期内甲的日步数的中位数为11 600B.这一星期内甲的日步数的极差大于乙的日步数的极差C.这一星期内乙的日步数的方差大于甲的日步数的方差D.这一星期内乙的日步数的下四分位数是7 030[解析]甲的步数从小到大排列为:2 435,7 965,9 500,11 600,12 700,16 000,16 800,中位数是11 600.故A正确;这一星期内甲的日步数的极差16 800-2 435=14 365,这一星期内乙的日步数的极差14 200-5 340=8 860,这一星期内甲的日步数的极差大于乙的日步数的极差,故B正确;由图知甲的波动程度大,故方差大故C错误;乙的步数从小到大排列为:5 340,7 030,10 060,11 600,12 300,12 970,14 200,7×25%=1.75,故这一星期内乙的日步数为25%分位数是7 030,故D正确.故选C.8.(2023·江西赣州模拟)某校随机抽取了100名学生测量体重,经统计,这些学生的体重数据(单位:kg)全部介于45至70之间,将数据整理得到如图所示的频率分布直方图,则下列结论错误的是( D )A .频率分布直方图中a 的值为0.07B .这100名学生中体重低于60 kg 的人数为70C .据此可以估计该校学生体重的第78百分位数约为62D .据此可以估计该校学生体重的平均数约为56.25[解析] 因为5×(0.01+0.02+0.04+0.06+a )=1,解得a =0.07,所以A 正确;体重低于60 kg 的频率为5×(0.01+0.06+0.07)=0.7,所以人数为0.7×100=70,所以B 正确;因为5×(0.01+0.06+0.07)=0.7,5×(0.01+0.06+0.07+0.04)=0.9,所以体重的第78百分位数位于[60,65)之间,设体重的第78百分位数为x ,则(0.01+0.07+0.06)×5+(x -60)×0.04=0.78,解得x =62,所以C 正确;体重的平均数约为0.01×5×47.5+0.07×5×52.5+0.06×5×57.5+0.04×5×62.5+0.02×5×67.5=57.25,所以D 错误.故选D.二、多选题9.(2024·安徽安庆、池州、铜陵部分学校联考)甲乙两名射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4 乙9578768677则A .甲乙两人射击成绩的平均数相同 B .甲乙两人射击成绩的中位数相同 C .甲命中环数的极差大于乙命中环数的极差 D .甲比乙射击成绩更稳定[解析] 可求甲乙平均数为x 1=x 2=7,中位数均为7,故A ,B 正确;甲的极差为6,乙的极差为4,故C 正确;甲的方差为:17×(1+4+4+9+4+9+9)=407,乙的方差为:17×(4+4+1+1+1+1)=127,故D 错误.10.(2024·湖北宜荆荆恩联考、广东深圳宝安区调研)下列说法正确的有( AC )A .从40个个体中随机抽取一个容量为10的样本,则每个个体被抽到的概率都是0.25B .已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是5C .数据26,11,14,31,15,17,19,23的50%分位数是18D .若样本数据x 1,x 2,…,x n 的标准差为4,则数据2x 1+1,2x 2+1,…,2x n +1的标准差为16[解析] 从40个个体中随机抽取一个容量为10的样本,则每个个体被抽到的概率都是1040=0.25,故A 正确;已知一组数据1,2,m,6,7的平均数为4,则m =4×5-(1+2+6+7)=4,这组数据的方差为15×[(1-4)2+(2-4)2+(4-4)2+(6-4)2+(7-4)2]=265,故B 错误;这组数据从小到大排列为:11,14,15,17,19,23,26,31,共8个,故其50%分位数为第4个数17和第5个数19的平均数,为18,故C 正确;若样本数据x 1,x 2,…,x n 的标准差为4,则方差为16,故数据2x 1+1,2x 2+1,…,2x n +1的方差为16×22=64,标准差为8,故D 错误.故选AC.11.(2024·江西南昌摸底)“未来之星”少儿才艺大赛,选手通过自我介绍和才艺表演,展示仪表形象、表达能力、风度气质等自身的整体形象,评委现场打分.若九位评委对某选手打分分别是x 1,x 2,…,x 9,记这组数据的平均分、中位数、标准差、极差分别为x ,z ,s ,j ,去掉这组数据的一个最高分和一个最低分后,其平均分、中位数、标准差、极差分别为x ′,z ′,s ′,j ′,则下列判断中一定正确的是( BCD )A.x =x ′ B .z =z ′ C .s ≥s ′D .j ≥j ′[解析] 根据平均数的性质可知x =x ′不一定成立,例如九个数一个90,其他都是80,显然该等式不成立,因此A 不正确;根据中位数的定义可知这九个数据从小到大排列,中间的一个数据是中位数,去掉最高和最低不影响中间的数据,所以B 正确;根据标准差的意义可知去掉最高和最低分,数据有可能会更集中,所以选项C 正确;因为去掉最高和最低分,极差有可能减小,所以选项D 正确,故选BCD.12.(2024·江西新余一中开学考)下列命题是真命题的有( BD )A .分层抽样调查后的样本中甲、乙、丙三种个体的比例为3∶1∶2,如果抽取的甲个体数为9,则样本容量为30B .某一组样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在区间[114.5,124.5]内的频率为0.4C .甲、乙两队队员体重的平均数分别为60,68,人数之比为1∶3,则甲、乙两队全部队员体重的平均数为67D .一组数6,5,4,3,3,3,2,2,2,1的85%分位数为5[解析] 根据样本的抽样比等于各层的抽样比,样本容量为9÷33+1+2=18,故选项A 错误;样本数据落在区间[114.5,124.5]内的有120,122,116,120共4个,所以样本数据落在区间[114.5,124.5]内的频率为410=0.4,故选项B 正确;甲、乙两队的人数之比为1∶3,则甲队队员在所有队员中所占权重为11+3=14,乙队队员在所有队员中所占权重为31+3=34,则甲、乙两队全部队员体重的平均数为x =14×60+34×68=66,故选项C 错误;将该组数据从小到大排列为:1,2,2,2,3,3,3,4,5,6,由10×85%=8.5,则该组数据的85%分位数是第9个数,该数为5,故选项D 正确.13.(2024·陕西西安、河北保定部分学校联考)某公司统计了2023年1月至6月的月销售额(单位:万元),并与2022年比较,得到同比增长率数据,绘制了如图所示的统计图,则下列说法正确的是( ACD )注:同比增长率=(今年月销售额-去年同期月销售额)÷去年同期月销售额×100%. A .2023年1月至6月的月销售额的极差为8B .2023年1月至6月的月销售额的第60百分位数为8C .2023年1月至6月的月销售额的中位数为9.5D .2022年5月的月销售额为10万元[解析] 2023年1月至6月的月销售额的极差为8,故A 正确;因为6×60%=3.6,所以2023年1月至6月的月销售额的第60百分位数为11,故B 错误;2023年1月至6月的月销售额的中位数为9.5,故C 正确;设2022年5月的月销售额为x 万元,则11-xx×100%=10%,解得x =10,故D 正确.故选ACD.三、填空题14.(2023·辽宁沈阳东北育才学校模拟)已知一组样本数据x 1,x 2,x 3…x 10,且x 21+x 22+x 23+…+x 210=185,平均数x =4,则该组数据的方差s 2= 2.5 .[解析] 由题意知x 1+x 2+x 3…+x 10=4×10=40,又s 2=x 1-42+x 2-42+x 3-42+…+x 10-4210=x 21+x 22+x 23+…+x 210-8x 1+x 2+x 3…+x 10+16×1010=185-8×40+16×1010=18.5-32+16=2.5.15.(2024·浙江名校联盟高考研究卷改编)从树人小学二年级学生中随机抽取100名学生,将他们的身高(单位:cm)数据绘制成频率分布直方图如图,则下列结论正确的是 ①② (填上所有正确结论的序号)①a =0.030②估计树人小学这100名二年级学生的平均身高为124.5 cm ③估计树人小学这100名二年级学生身高的中位数为122.5 cm ④估计树人小学这100名二年级学生身高的众数为120 cm[解析] a =0.1-(0.005+0.01+0.02+0.035)=0.03.①正确.平均身高:105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm),②正确.由(x -120)×0.03=0.1得x ≈123.3(cm),③错.身高的众数为115 cm.④错.故填①②.B 组能力提升1.(2024·山西大同质检)一组数据按从小到大的顺序排列为1,3,5,6,m,10,12,13,若该组数据的中位数是极差的58,则该组数据的第60百分位数是( C )A .7.5B .8C .9D .9.5[解析] 由题意得6+m 2=58×(13-1),∴m =9.故选C.2.(多选题)(2024·安徽皖东智校协作联盟联考)某学校共有学生2 000人,其中高一800人,高二高三各600人,学校为了了解学生在寒假期间每天的读书时间,按照分层随机抽样的方法从全校学生中抽取100人,其中高一学生,高二学生,高三学生每天读书时间的平均数分别为x 1=2.7,x 2=3.1,x 3=3.3,每天读书时间的方差分别为s 21=1,s 22=2,s 23=3,则下列正确的是( ACD )A.从高二年级抽取30人B.被抽取的学生中,高二年级每天的总读书时间比高一年级多15小时C.被抽取的学生每天的读书时间的平均数为3小时D.估计全体学生每天的读书时间的方差为s2=1.966[解析]根据分层抽样,分别从高一学生,高二学生,高三学生中抽取40人,30人,30人,故A正确;抽取的高二年级每天的总读书时间为x2×30=93,抽取的高一年级每天的总读书时间为x1×40=108,高二年级每天的总读书时间比高一年级少15小时,故B错误;被抽取的学生每天的读书时间的平均数为40100×2.7+30100×3.1+30100×3.3=3(小时),故C正确;被抽取的学生每天的读书时间的方差为40100×[1+(2.7-3)2]+30100×[2+(3.1-3)2]+30100×[3+(3.3-3)2]=1.966,∴估计全体学生每天的读书时间的方差为s2=1.966,故D正确.故选ACD.3.(多选题)(2023高考新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( BD )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差[解析]x2,x3,x4,x5的平均数不一定等于x1,x2,…,x6的平均数,A错误;x2,x3,x4,x5的中位数等于x3+x42,x1,x2,…,x6的中位数等于x3+x42,B正确;设样本数据x1,x2,…,x6为0,1,2,8,9,10,可知x1,x2,…,x6的平均数是5,x2,x3,x4,x5的平均数是5,x1,x2,…,x6的方差s21=16×[(0-5)2+(1-5)2+(2-5)2+(8-5)2+(9-5)2+(10-5)2]=503,x2,x3,x4,x5的方差s22=14×[(1-5)2+(2-5)2+(8-5)2+(9-5)2]=252,s21>s22,∴s1>s2,C错误;x6>x5,x2>x1,∴x6-x1>x5-x2,D正确.故选BD.4.(2023·陕西渭南模拟)2022年2月28日,国家统计局发布了我国2021年国民经济和社会发展统计公报,在以习近平同志为核心的党中央坚强领导下,实现了“十四五”良好开局.2021年,全国居民人均可支配收入和消费支出均较上一年有所增长,结合如下统计图表,下列说法中正确的是( B )A .2017~2021年全国居民人均可支配收入逐年递减B .2021年全国居民人均消费支出24 100元C .2020年全国居民人均可支配收入较前一年下降D .2021年全国居民人均消费支出构成中食品烟酒和居住占比超过60%[解析] 根据条形图可知,2017~2021年全国居民人均可支配收入逐年递增,A 错误.根据扇形图可知,2021年全国居民人均消费支出为:5 641+1 419+7 178+569+2 115+2 599+3 156+1 423=24 100元,B 正确.根据条形图可知,2020年全国居民人均可支配收入较前一年上升,C 错误.2021年全国居民人均消费支出构成中食品烟酒和居住占比:7 178+5 64124 100×100%≈53.2%<60%,D 错误.故选B.5.(2023·全国乙卷)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i ,y i (i =1,2,…,10).试验结果如下: 试验序号i 1 2 3 4 5 6 7 8 9 10 伸缩率x i 545 533 551 522 575 544 541 568 596 548 伸缩率y i536527543530560533522550576536记z i =x i -y i (i =1,2,…,10),记z 1,z 2,…,z 10的样本平均数为z ,样本方差为s2.(1)求z,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(如果z≥2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高) [解析](1)x=545+533+551+522+575+544+541+568+596+54810=552.3,y=536+527+543+530+560+533+522+550+576+53610=541.3,z=x-y=552.3-541.3=11,z i=x i-y i的值分别为:9,6,8,-8,15,11,19,18,20,12,∴s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知:z=11,2s210=2 6.1=24.4,故有z≥2s210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.。