高考数学一轮复习第十章统计与统计案例第一节随机抽样课件理
- 格式:ppt
- 大小:1.03 MB
- 文档页数:34
第十章统计与统计案例第一节随机抽样一、基础知识1.简单随机抽样(1)定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)常用方法:抽签法和随机数法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样(1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.(2)系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.n 是样本容量)是整数时,取k=Nn当总体中的个体数不能被样本容量整除时,可先用简单随机抽样的方法从总体中剔除几个个体,使剩下的个体数能被样本容量整除,然后再按系统抽样进行.这时在整个抽样过程中每个个体被抽取的可能性仍然相等.;二、常用结论(1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.(3)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.(4)三种抽样方法的特点、联系及适用范围考点一简单随机抽样[典例] 下列抽取样本的方式属于简单随机抽样的个数有( )①从无限多个个体中抽取100 个个体作为样本;②盒子里共有80 个零件,从中选出5 个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③用抽签方法从10 件产品中选取3 件进行质量检验;④某班有56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛.A.0 个B.1 个C.2 个D.3 个[解析] ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样,因为它是有放回抽样;③明显为简单随机抽样;④不是简单随机抽样,因为不是等可能抽样.[答案] B[解题技法] 应用简单随机抽样应注意的问题= (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的 数字舍去.[题组训练]A.08 C .02 D .012.利用简单随机抽样,从 n 个个体中抽取一个容量为 10 的样本.若第二次抽取时,余 下的每个个体被抽到的概率为1,则在整个抽样过程中,每个个体被抽到的概率为()3A.1 4C. 5 14解析:选 C 根据题意, 9 1,n -1 3B.1 3 D.10 27 解得 n =28.故在整个抽样过程中每个个体被抽到的概率为10= 5.28 14考点二 系统抽样[典例] (1)某校为了解 1 000 名高一新生的身体生长状况,用系统抽样法(按等距的规A .16B .17C .18D .19(2)中央电视台为了解观众对某综艺节目的意见,准备从 502 名现场观众中抽取 10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除个个体,抽样间隔为 .[解析] (1)因为从 1 000 名学生中抽取一个容量为 40 的样本,所以系统抽样的分段间隔 为1 000=25,40设第一组随机抽取的号码为 x ,(2)把 502 名观众平均分成 50 组,由于 502 除以 50 的商是 10,余数是 2,所以每组有 10 名观众,还剩 2 名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从 502500,并均匀分成 50 段,每段含50010 个个体.所以需剔除 2 个个体,抽样间隔为 10. 50[答案] (1)C (2)2 10[变透练清]解析:从 1 000 名学生中抽取一个容量为 40 的样本,系统抽样分 40 组,每组1 000=2540 个号码,每组抽取一个,从 501 到 750 恰好是第 21 组到第 30 组,共抽取 10 人.答案:10本,若在第 1 组中随机抽取的号码为 5,则在第 6 组中抽取的号码为.解析:由题知分组间隔为64=8,又第 1 组中抽取的号码为 5,所以第 6 组中抽取的号8 码为 5×8+5=45.答案:45系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是 第 1 组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.[提醒] 系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽 样从总体中剔除几个个体,然后再按系统抽样进行.考点三 分层抽样=[典例] 某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000 人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽取100 人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( ) A.25,25,25,25 B.48,72,64,16C.20,40,30,10 D.24,36,32,8[ 解析] 法一:因为抽样比为100 = 1 ,所以每类人中应抽取的人数分别为20 000 2004 800×1=24,7 200×1=36,6 400×1=32,1 600×1=8. 200 200 200 200法二:最喜爱、喜爱、一般、不喜欢的比例为4 800∶7 200∶6 400∶1 600=6∶9∶8∶2,所以每类人中应抽取的人数分别为6×100=24,9×100=36,6+9+8+28 2×100=32,×100=8.6+9+8+26+9+8+2[答案] D6+9+8+2[解题技法] 分层抽样问题的类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.(3) 分层抽样的计算应根据抽样比构造方程求解,其中“ 抽样比=样本容量=总体容量各层样本数量”.各层个体数量[题组训练]1.(2019·山西五校联考)某校为了解学生的学习情况,采用分层抽样的方法从高一1 000 人、高二1 200 人、高三n 人中抽取81 人进行问卷调查,若高二被抽取的人数为30,则n =( )A.860 B.720C.1 020 D.1 040解析:选D 由已知条件知抽样比为30=1,从而81=1,解得n=1 200 40 1 000+1 200+n 40= ,06 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 491 040,故选 D.2.(2018·广州高中综合测试)已知某地区中小学学生人数如图所示.为了解该区学生参加某项社会实践活动的意向,拟采用分层抽样的方法来进 行调查.若高中需抽取 20 名学生,则小学与初中共需抽取的学生人数为.解析:设小学与初中共需抽取的学生人数为 x ,依题意可得1 20020解得 x =85.答案:85[课时跟踪检测]2 700+2 400+1 200 x +201.从 2 019 名学生中选取 50 名学生参加全国数学联赛,若采用以下方法选取:先用简 单随机抽样法从 2 019 名学生中剔除 19 名学生,剩下的 2 000 名学生再按系统抽样的方法抽取,则每名学生入选的概率()A .不全相等B .均不相等C .都相等,且为 502 019解析:选 C 从 N 个个体中抽取 M名学生入选的概率都相等,且为 50.2 019D .都相等,且为 140个个体,则每个个体被抽到的概率都等于M,故每N2.福利彩票“双色球”中红球的号码可以从 01,02,03,…,32,33 这 33 个两位号码中选取,小明利用如下所示的随机数表选取红色球的 6 个号码,选取方法是从第 1 行第 9 列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )A.12 B .33 C .06D .16解析:选 C 被选中的红色球的号码依次为 17,12,33,06,32,22,所以第四个被选中的红色球的号码为 06.3.某班共有学生 52 人,现根据座号,用系统抽样的方法,抽取一个容量为 4 的样本.已知 5 号、18 号、44 号同学在样本中,那么样本中还有一个同学的座号是()A .23B .2781 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 85C .31D .33解析:选 C 分段间隔为52=13,故样本中还有一个同学的座号为 18+13=31.4 4.某工厂在 12 月份共生产了 3 600 双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为 a ,b ,c ,且 a ,b , c 构成等差数列,则第二车间生产的产品数为()A .800 双B .1 000 双C .1 200 双D .1 500 双解析:选 C 因为 a ,b ,c 成等差数列,所以 2b =a +c ,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占 12 月份生产 总数的三分之一,即为 1 200 双皮靴.5.(2018·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A .100,20B .200,20C .200,10D .100,10解析:选 B 由题图甲可知学生总人数是 10 000,样本容量为 10 000×2%=200,抽取的高中生人数是 2 000×2%=40,由题图乙可知高中生的近视率为 50%,所以抽取高中生的近视人数为 40×50%=20,故选 B.=6,则在第 7 组中抽取的号码是() A .63 B .64 C .65D .66解析:选 A 若 m =6,则在第 7 组中抽取的号码个位数字与 13 的个位数字相同,而第A .7B .9C .10D .15解析:选 C 960÷32=30,故由题意可得抽到的号码构成以 9 为首项,以 30 为公差的等差数列,其通项公式为 a n =9+30(n -1)=30n -21.由 450<30n -21≤750,解得 15.7< n ≤25.7.又 n 为正整数,所以 16≤n ≤25,故做问卷 B 的人数为 25-16+1=10.故选 C.8.某企业三月中旬生产 A ,B ,C 三种产品共 3 000 件,根据分层抽样的结果,企业统计员制作了如下的统计表格:产品类别 A B C产品数量(件) 1 300 样本容量(件)130A 产品的样本容量比 C 产品的样本容量多 10,根据以上信息,可得 C 的产品数量是件.解析:设样本容量为 x ,则 x ×1 300=130,∴x =300.3 000 ∴A 产品和 C 产品在样本中共有 300-130=170(件). 设 C 产品的样本容量为 y ,则 y +y +10=170,∴y =80.∴C 产品的数量为3 00080=800(件). 300 答案:8009.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取 100 件做使用寿命的测试,则第一分厂应抽取的件数为;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为 1 020 小时、980 小时、1 030 小时,估计这个企业所生产的该产品的平均使用寿命为小时.解析:第一分厂应抽取的件数为 100×50%=50;该产品的平均使用寿命为 1 020×0.5 +980×0.2+1 030×0.3=1 015.答案:50 1 015×5 抽得的号码为 004,这 600 名选手穿着三种颜色的衣服,从 001 到 301 穿红色衣服,从 302 到 496 穿白色衣服,从 497 到 600 穿黄色衣服,则抽到穿白色衣服的选手人数为.2 5≤k ≤42,因此抽到穿白色衣服的选手人数为 42-25=17(人). 6答案:1711.某初级中学共有学生 2 000 名,各年级男、女生人数如下表:(1)求 x 的值;(2)现用分层抽样的方法在全校抽取 48 名学生,问应在初三年级抽取多少名? 解 :(1)∵ x=0.19,∴x =380.2 000(2)初三年级人数为 y +z =2 000-(373+377+380+370)=500,现用分层抽样的方法在 全校抽取 48 名学生,应在初三年级抽取的人数为 48×500=12(名).2 000第二节 用样本估计总体一、基础知识1.频率分布直方图(1)纵轴表示频率频率;(2),即小长方形的高= 组距 组距频率=频率; 小长方形的面积=组距×组距(3)各个小方形的面积总和等于 1 . 2.频率分布表的画法极差第一步:求极差,决定组数和组距,组距= ;组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.茎叶图茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数.4.中位数、众数、平均数的定义 (1)中位数将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的中位数.(2)众数一组数据中出现次数最多的数据叫做这组数据的众数. (3)平均数一组数据的算术平均数即为这组数据的平均数,n 个数据 x 1,x 2,…,x n 的平均数 x = 1(x 1+x 2+…+x n ). n5.样本的数字特征如果有 n 个数据 x 1,x 2,…,x n ,那么这 n 个数的(1)平均数 x =1(x 1+x 2+…+x n ).n(2)标准差 s =(3)方差s2=1-x )2+(x -x )2+…+(x -x )2].[(x1 2 nn二、常用结论1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x ,则mx1+a,mx2+a,mx3+a,…,mx n+a 的平均数是m x +a.(2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b 的方差为a2s2.考点一茎叶图[典例] (2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A.3,5 B.5,5C.3,7 D.5,7[解析] 由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以15×[56+62+65+74+(70+x)]=1×(59+61+67+65+78),解得x=3.5[答案] A[解题技法] 茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.甲 乙[题组训练]1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清, 但曾计算得该组数据的极差与中位数之和为 61,则被污染的数字为()A .1B .2C .3D .4解析:选 B 由图可知该组数据的极差为 48-20=28,则该组数据的中位数为 61-28 =33,易得被污染的数字为 2.2.甲、乙两名篮球运动员 5 场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为 x 甲, x 乙,则下列结论正确的是()A. x 甲< x 乙;乙比甲得分稳定B. x 甲> x 乙;甲比乙得分稳定C. x 甲> x 乙;乙比甲得分稳定D. x 甲< x 乙;甲比乙得分稳定解析:选 A 因为 x =2+7+8+16+22=11, x 5 =8+12+18+21+25=16.8,所5以 x < x 且乙比甲成绩稳定.考点二 频率分布直方图[典例] 某城市 100 户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200), [200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中 x 的值;(2)求月平均用电量的众数和中位数.[解] (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,解得 x =0.007 5.即直方图中 x 的值为 0.007 5.甲乙=(2)月平均用电量的众数是220+240=230. 2∵(0.002+0.009 5+0.011)×20=0.45<0.5, (0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5, ∴月平均用电量的中位数在[220,240)内.设中位数为 a ,则 0.45+0.012 5×(a -220)=0.5,解得 a =224,即中位数为 224. [变透练清]1.某校随机抽取 20 个班,调查各班有出国意向的人数,所得数据的茎叶图如图所示.以 5 为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],所作的频率分布直方图是()解析:选 A 以 5 为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],各组的频数依次为 1,1,4,2,4,3,3,2,可知画出的频率分布直方图为选项 A 中的图.2.(变结论)在本例条件下,在月平均电量为[220,240),[240,260),[260,280),[280,300] 的四组用户中,用分层抽样的方法抽取 11 户居民,则月平均用电量在[220,240)的用户中应抽取户.解析:月平均用电量在[220,240)的用户有 0.012 5×20×100=25(户).同理可得月平均 用电量在[240,260)的用户有 15 户,月平均用电量在[260,280]的用户有 10 户,月平均用电 量在[280,300]的用户有 5 户,故抽取比例为111.25+15+10+5 5所以月平均用电量在[220,240)的用户中应抽取 25×1=5(户).5 答案:53.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9 组,制成了如图所示的频率分布直方图.(1) 求直方图中 a 的值;(2)设该市有30 万居民,估计全市居民中月均用水量不低于3 吨的人数,说明理由.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]6组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估计全市居民中月均用水量不低于3 吨的人数为3.6 万.理由如下:由(1)知,100 位居民中月均用水量不低于3 吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30 万居民中月均用水量不低于 3 吨的人数为300 000×0.12=36 000=3.6(万).考点三样本的数字特征考法(一) 样本的数字特征与频率分布直方图交汇[典例] (2019·辽宁师范大学附属中学模拟)某校初三年级有400 名学生,随机抽查了40 名学生测试1 分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是( )A.该校初三学生1 分钟仰卧起坐的次数的中位数为25B.该校初三学生1 分钟仰卧起坐的次数的众数为24C.该校初三学生1 分钟仰卧起坐的次数超过30 的人数约有80D.该校初三学生1 分钟仰卧起坐的次数少于20 的人数约为8[解析] 第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三.组数据的频率为 0.08×5=0.4,∴中位数在第三组内,设中位数为 25+x ,则 x ×0.08=0.5 -0.1-0.3=0.1,∴x =1.25,∴中位数为 26.25,故 A 错误;第三组数据所在的矩形最高, 第三组数据的中间值为 27.5,∴众数为 27.5,故 B 错误;1 分钟仰卧起坐的次数超过 30 的频率为 0.2,∴超过 30 次的人数为 400×0.2=80,故 C 正确;1 分钟仰卧起坐的次数少于20 的频率为 0.1,∴1 分钟仰卧起坐的次数少于 20 的人数为 400×0.1=40,故 D 错误.故选 C.[答案] C [解题技法]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数; (2)中位数左边和右边的小长方形的面积和是相等的; (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积 乘以小长方形底边中点的横坐标之和.考法(二) 样本的数字特征与茎叶图交汇[典例] 将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为 91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示,则7 个剩余分数的方差为.[解析] 由茎叶图可知去掉的两个数是 87,99,所以 87+90×2+91×2+94+90+x =91×7,解得 x =4.故 s 2=1[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=36 [答案] 367 [解题技法]7 7样本的数字特征与茎叶图综合问题的注意点(1)在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.(2)茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据, 因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.考法(三) 样本的数字特征与优化决策问题交汇[典例] (2018·周口调研)甲、乙两人在相同条件下各射击 10 次,每次中靶环数情况如图所示.(1)请填写下表(写出计算过程):平均数 方差命中 9环及 9 环以上的次数甲 乙(2)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中 9 环及 9 环以上的次数相结合看(分析谁的成绩好些); ③从折线图上两人射击命中环数的走势看(分析谁更有潜力). [解] 由题图,知甲射击 10 次中靶环数分别为 9,5,7,8,7,6,8,6,7,7. 将它们由小到大排列为 5,6,6,7,7,7,7,8,8,9. 乙射击 10 次中靶环数分别为 2,4,6,8,7,7,8,9,9,10. 将它们由小到大排列为 2,4,6,7,7,8,8,9,9,10.(1) x = 1 ×(5+6×2+7×4+8×2+9)=7(环), 10x = 1 ×(2+4+6+7×2+8×2+9×2+10)=7(环), 10 s 2 = 1 ×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]= 1 ×(4+2+0+2+4) 10 10 =1.2,s 2 = 1 ×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2] 10 = 1×(25+9+1+0+2+8+9)=5.4. 10 填表如下:平均数 方差 命中 9 环及 9 环以上的次数甲乙甲乙(2)甲乙∴甲成绩比乙稳定.②∵平均数相同,命中9 环及9 环以上的次数甲比乙少,∴乙成绩比甲好些.③∵甲成绩在平均数上下波动,而乙处于上升势头,从第三次以后就没有比甲少的情况发生,∴乙更有潜力.[解题技法]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[题组训练]1.对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示),则该样本中的中位数、众数、极差分别是( )A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53解析:选A 样本共3045+47个,中位数为=46;显然样本数据出现次数最多的为45,2故众数为45;极差为68-12=56,故选A.2.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:平均环数x8.3 8.88.8 8.7方差s2 3.5 3.6 2.2 5.4) A.甲B.乙C.丙D.丁解析:选C 由表格中数据可知,乙、丙平均环数最高,但丙方差最小,说明成绩好,且技术稳定,选C.3.某仪器厂从新生产的一批零件中随机抽取40 个进行检测,如图是根据抽样检测得到的零件的质量(单位:克)绘制的频率分布直方图,样本数据按照[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96]分成8 组,将其按从左到右的顺序分别记为第一组,第二组,……,第八组.则样本数据的中位数在第组.解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075 0+0.100 0)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.100 0×2=8,故中位数在第四组.答案:四[课时跟踪检测]A 级1.一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60) 上的频率为0.8,则估计样本在[40,60)内的数据个数为( )A.14 B.15C.16 D.17解析:选B 由题意,样本中数据在[20,60)上的频数为30×0.8=24,所以估计样本在[40,60)内的数据个数为24-4-5=15.2.(2019·长春质检)如图所示是某学校某年级的三个班在一学期内的六次数学测试的平均成绩 y 关于测试序号 x 的函数图象,为了容易看出一个班级的成绩变化,将离散的点用虚线连接,根据图象,给出下列结论:①一班成绩始终高于年级平均水平,整体成绩比较好; ②二班成绩不够稳定,波动程度较大;③三班成绩虽然多数时间低于年级平均水平,但在稳步提升. 其中正确结论的个数为()A .0B .1C .2D .3解析:选 D ①由图可知一班每次考试的平均成绩都在年级平均成绩之上,故①正确.② 由图可知二班平均成绩的图象高低变化明显,可知成绩不稳定,波动程度较大,故②正确.③ 由图可知三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下方,故③正确.故选 D.3.(2018·贵阳检测)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行 整理后分为 5 组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是 40,则成绩在 80~100 分的学生人数是()A .15B .18C .20D .25解析:选 A 根据频率分布直方图,得第二小组的频率是 0.04×10=0.4,∵频数是 40, ∴样本容量是40=100,又成绩在 80~100 分的频率是(0.01+0.005)×10=0.15,∴成绩在0.4 80~100 分的学生人数是 100×0.15=15.故选 A.4.2017 年 4 月,泉州有四处湿地被列入福建省首批重要湿地名录,某同学决定从其中 A ,B 两地选择一处进行实地考察.因此,他通过网站了ABA B A B解上周去过这两个地方的人对它们的综合评分,并将评分数据记录为右图的茎叶图,记 A ,B 两地综合评分数据的均值分别为 x A , x B ,方差分别为 s 2 ,s 2 .若以备受好评为依据,则AB下述判断较合理的是( )A .因为 x A > xB ,s 2 >s 2,所以应该去A 地B .因为 x > x ,s 2 <s 2 ,所以应该去 A 地ABABC .因为 x < x ,s 2 >s 2 ,所以应该去 B 地ABABD .因为 x A < x B ,s 2 <s 2 ,所以应该去 B 地解析:选 B 因 为 x A =1×(72+86+87+89+92+94)≈86.67,x B =1×(74+73+88 6 6 +86+95+94)=85,s 2 ≈1[(72-86.67)2+(86-86.67)2+(87-86.67)2+(89-86.67)2+(92-86.67)2+(94- 6 86.67)2]≈50.56,s 2 =1[(74-85)2+(73-85)2+(88-85)2+(86-85)2+(95-85)2+(94-85)2]=76, 6所以 x > x ,s 2 <s 2 (A 数据集中,B 数据分散),ABAB所以 A 地好评分高,且评价稳定.故选 B.5.(2018·青岛三中期中)已知数据 x 1,x 2,…,x n 的平均数 x =5,方差 s 2=4,则数据 3x 1+7,3x 2+7,…,3x n +7 的平均数和标准差分别为()A .15,36B .22,6C .15,6D .22,36解析:选 B ∵x 1,x 2,x 3,…,x n 的平均数为 5, x 1+x 2+…+x n 3x 1+3x 2+…+3x n 3(x 1+x 2+…+x n ) ∴ =5,∴ n +7= n n +7=3×5+7=22.∵x 1,x 2,x 3,…,x n 的方差为 4,∴3x 1+7,3x 2+7,3x 3+7,…,3x n +7 的方差是 32×4 =36,故数据 3x 1+7,3x 2+7,…,3x n +7 的平均数和标准差分别为 22,6,故选 B.6.(2018·江苏高考)已知5 位裁判给某运动员打出的分数的茎叶图如图所示那么这 5 位裁判打出的分数的平均数为 .解析:这 5 位裁判打出的分数分别是 89,89,90,91,91,因此这 5 位裁判打出的分数的平89+89+90+91+91均数为 5答案:90=90.7.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理 后,作出了如图所示的频率分布直方图.已知图中从左到右的前 3 个小组的频率之比为 1∶ 3∶5,第 2 个小组的频数为 15,则被抽查的美术生的人数是.解析:设被抽查的美术生的人数为n ,因为后2 个小组的频率之和为(0.037 5+ 0.0125)×5=0.25,所以前 3 个小组的频率之和为 0.75.又前 3 个小组的频率之比为 1∶3∶5,第 2个小组的频数为 15,所以前 3 个小组的频数分别为 5,15,25,所以 n =5+15+25 60.0.75答案:608.某人 5 次上班途中所花的时间(单位:分钟)分别为 x ,y,10,11,9.已知这组数据的平均数为 10,方差为 2,则|x -y |的值为.解析:由题意知这组数据的平均数为 10,方差为 2, 可得 x +y =20,(x -10)2+(y -10)2=8,设 x =10+t ,y =10-t ,由(x -10)2+(y -10)2=8 得 t 2=4, 所以|x -y |=2|t |=4.答 案 :4 9.某班 100 名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间 是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中 a 的值;(2)根据频率分布直方图,估计这 100 名学生语文成绩的平均分;(3)若这 100 名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如表所示,求数学成绩在[50,90)之外的人数.分数段 [50,60) [60,70) [70,80) [80,90) x ∶y1∶12∶13∶44∶5(2)因为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以这100 名学生语文成=。