2021年高考数学高分套路 三种抽样方法(解析版)
- 格式:pdf
- 大小:474.44 KB
- 文档页数:14
2021年高考数学一轮复习 9.3抽样方法练习理B;因为人数比为28∶54∶81,且36不能整除(28+54+81),而在选项D中,人数比为27∶54∶81=1∶2∶3,且(27+54+81)能被36整除,故选D最合适.答案:D4.(xx·江西卷)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )解析:从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.答案:D5.(xx·云南曲靖模拟)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32解析:间隔距离为10,故可能编号是3,13,23,33,43,故选B.答案:B6.已知某单位有职工120人,男职工有90人,现采用分层抽样(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为( )A.30 B.36C.40 D.无法确定解析:设样本容量为n,则n120×90=27,解得n=36.答案:B7.某校对全校男女学生共1 600名进行健康调查,选用分层抽样法抽取一个容量为200的样本.已知女生比男生少抽了10人,则该校的女生人数应是________人.解析:设男生人数为x,女生人数为y,则x+y=1 600,2001 600x-2001 600y=10,解得y=760.答案:7608.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.解析:由题意可得高二年级应该抽取学生50×33+3+4=15名. 答案:159.一个总体中共有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现采用系统抽样的方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是________.解析:根据题意,第7组中的号码是[60,69]内的正整数.因为m =6,k =7,m +k =13,所抽取的号码个位数字为3,于是此号码为63.答案:6310.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工________人.解析:依题意知抽取超过45岁的职工为25200×80=10人. 答案:1011.某班有50个同学,其中男生30人、女生20人,某次导师要抽5位同学打扫卫生,依性别按人数作分层抽样,则班上的男同学甲被抽中的概率是________.答案:11012.某校高中部有三个年级,其中高三有学生1 000人,现采用分层抽样法抽取一个容量为185的样本,已知在高一年级抽取了75人,高二年级抽取了60人,则高中部共有多少学生?解析:方法一 从高三年级抽取的学生人数为185-(75+60)=50人,而抽取的比例为501 000=120,所以高中部共有的学生为185÷120=3 700人. 方法二 1 000÷(185-75-60)185=3 700人. 13.在某次数学考试中,抽查了1 000名学生的成绩,得到频率分布直方图如图所示,规定85分及其以上为优秀.(1)下表是这次抽查成绩的频数分布表,试求正整数a ,b 的值; 区间 [75,80) [80,85) [85,90) [90,95) [95,100] 人数 50 a 350 300 b优秀的学生人数.解析:(1)依题意,a =0.04×5×1 000=200,b =0.02×5×1 000=100.(2)设抽取成绩为优秀的学生人数为x ,则x 40=350+300+1001 000,解得x =30, 即抽取成绩为优秀的学生人数为30名.14.(xx·河北衡水中学模拟)选择合适的抽样方法抽样,写出抽样过程.(1)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个入样;(2)有甲厂生产的300个篮球,抽取30个入样.解析:(1)总体由差异明显的两个层次组成,需选用分层抽样法.第一步,确定抽取个数.因为样本容量与总体的个数比为10∶30=1∶3,所以甲厂生产的应抽取213=7(个), 乙厂生产的应抽取93=3(个). 第二步,用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.第三步,将抽取的10个篮球组成样本.(2)总体容量较大,样本容量也较大,宜用系统抽样法.第一步,将300个篮球用随机方式编号,编号为000,001,002,…,299,并分成30段.第二步,在第一段000,001,002,…,009这十个编号中用简单随机抽样法抽出一个如(002)作为起始号码.第三步,将编号为002,012,022,…,292的个体抽出组成样本.24187 5E7B 幻34456 8698 蚘33479 82C7 苇23378 5B52 孒22932 5994 妔39899 9BDB 鯛21061 5245 剅27228 6A5C 橜 30969 78F9 磹[yR22039 5617 嘗。
18.2 抽样技术要点精讲三种常用抽样方法:1、简单随机抽样:设一个总体的个数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.实现简单随机抽样,常用抽签法和随机数表法.(1)抽签法制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;抽签:抽签时,每次从中抽出1个号签,连续抽取次;成样:对应号签就得到一个容量为的样本.抽签法简便易行,当总体的个体数不多时,适宜采用这种方法.(2)随机数表法编号:对总体进行编号,保证位数一致;数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等.在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码.成样:对应号签就得到一个容量为的样本.结论:①用简单随机抽样,从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;②基于此,简单随机抽样体现了抽样的客观性与公平性;③简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样.2、系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).系统抽样的步骤可概括为:(1)将总体中的个体编号.采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段.为将整个的编号进行分段,要确定分段的间隔.当是整数时,;当不是整数时,通过从总体中剔除一些个体使剩下的个体数N´能被整除,这时;(3)确定起始的个体编号.在第1段用简单随机抽样确定起始的个体编号;(4)抽取样本.按照先确定的规则(常将加上间隔)抽取样本:.3、分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层.结论:(1)分层抽样是等概率抽样,它也是公平的.用分层抽样从个体数为N的总体中抽取一个容量为的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于;(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,在实践中的应用更为广泛.典型例题【例1】为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是()A、1000名运动员是总体B、每个运动员是个体C、抽取的100名运动员是样本D、样本容量是100【答案】D【解析】这个问题我们研究的是运动员的年龄情况,因此应选D.该题属于易错题,一定要区分开总体与总体容量、样本与样本容量等概念.【例2】今用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本.问:①总体中的某一个体在第一次抽取时被抽到的概率是多少?②个体不是在第1次被抽到,而是在第2次被抽到的概率是多少?③在整个抽样过程中,个体被抽到的概率是多少?【答案】(1),(2),(3).【解析】由问题(1)的解答,出示简单随机抽样的定义,问题(2)是本讲难点.基于此,简单随机抽样体现了抽样的客观性与公平性.。
考点29 三种抽样方法【思维导图】【常见考法】考法一简单随机抽样1.总体由编号为01,02,…,39,40的40个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()50 44 66 44 21 66 06 58 05 62 61 65 54 35 02 42 35 48 96 32 14 52 41 52 4822 66 22 15 86 26 63 75 41 99 58 42 36 72 24 58 37 52 18 51 03 37 18 39 11A.23 B.21 C.35 D.322.某口罩生产工厂为了了解口罩的质量,现将生产的50个口罩编号为01,02,…,50,利用如下随机数表从中抽取10个进行检测.若从下表中第1行第7列的数字开始向右依次读取2个数据作为1个编号,则被抽取的第8个个体的编号为()A.18 B.50 C.11 D.17考法二系统抽样1.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是A .8号学生B .200号学生C .616号学生D .815号学生2.某班有学生60人,现将所有学生按1,2,3,…,60随机编号,若采用系统抽样的方法抽取一个容量为5的样本(等距抽样),已知编号为4,,28,,52a b 号学生在样本中,则a b +=( ) A .42 B .45 C .52 D .563.从编号0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为( )A .72B .74C .76D .78 考法三 分层抽样1.某高中学校三个年级共有学生2800名,需要用分层抽样的方法抽取一个容量为40的样本,已知高一年级有学生910名,高二年级抽出的样本人数占样本总数的310,则抽出的样本中有高三年级学生人数为( ) A .14 B .15 C .16D .17 2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C .200D .2503.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从乙车间的产品中抽取了4件,则n =( )A .9B .10C .12D .13。
2021年新高考数学总复习:获取数据的基本途径及随机抽样1.下面的抽样方法为简单随机抽样的是( )A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B .某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C .某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D .用抽签方法从10件产品中选取3件进行质量检验解析:A ,B 选项中为系统抽样,C 为分层抽样.答案:D2.用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是 ( )A.110,110B.310,15C.15,310D.310,310解析:在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110,故选A. 答案:A3.(一题多解)某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C.200 D.250解析:法一由题意可得70n-70=3 5001 500,解得n=100.法二由题意,抽样比为703 500=150,总体容量为3 500+1 500=5000,故n=5 000×150=100.答案:A4.(2020·青岛二中质检)某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,…,599,600,从中抽取60个样本,如下提供随机数表的第4行到第6行:3221 1834 2978 6454 0732 5242 0644 3812 2343 5677 3578 9056 42(第4行)8442 1253 3134 5786 0736 2530 0732 8623 4578 8907 2368 9608 04(第5行)3256 7808 4367 8953 5577 3489 9483 7522 5355 7832 4577 8923 45(第6行)若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号为()A.522 B.324C.535 D.578解析:由题意知前6个编号为436,535,577,348,522,578,则第6个编号为578.答案:D5.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3解析:由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.答案:D6.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个样本编号为()A.700 B.669C.695 D.676解析:由题意可知,第一组随机抽取的编号为015,分段间隔数k=Nn=1 00050=20,由题意知抽出的这些号码是以15为首项,20为公差的等差数列,则抽取的第35个样本编号为15+(35-1)×20=695.答案:C7.交通管理部门为了解机动车驾驶员(简称“驾驶员”)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A.101 B.808C.1 212 D.2 012解析:甲社区每个个体被抽到的概率为1296=18,样本容量为12+21+25+43=101,所以四个社区中驾驶员的总人数N=10118=808.答案:B8.(2020·河南省示范性高中联考)某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校2 400名学生中抽取30人进行调查.现将2 400名学生随机地从1~2 400编号,按编号顺序平均分成30组(1~80号,81~160号,…,2 321~2 400号),若第3组与第4组抽出的号码之和为432,则第6组抽到的号码是() A.416 B.432C.448 D.464解析:设第n组抽到的号码是a n,则{a n}构成以80为公差的等差数列,所以a3=a1+80×2=160+a1,a4=a1+240.则a3+a4=2a1+400=432,解得a1=16,故第6组抽取的号码a6=16+5×80=416.答案:A9.(2019·潍坊联合调研)为检验某校高一年级学生的身高情况,现采用先分层抽样后简单随机抽样的方法,抽取一个容量为210的样本,已知每个学生被抽到的概率为0.3,且男女生的比是4∶3,则该校高一年级女生的人数是________.解析:抽取的高一年级女生的人数为210×37=90,则该校高一年级女生的人数为90÷0.3=300,故答案为300.答案:30010.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是________号.解析:由系统抽样的原理知,抽样的间隔为52÷4=13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,即7号,20号,33号,46号.所以样本中还有一位同学的编号为20号.答案:2011.某校高三年级共有30个班,学校心理咨询室为了了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为75,则抽到的最小的编号为________.解析:系统抽样的抽取间隔为305=6. 设抽到的最小编号为x ,则x +(6+x )+(12+x )+(18+x )+(24+x )=75,所以x =3.答案:312.一支田径队有男运动员56人,女运动员m 人,用分层抽样抽出一个容量为n 的样本,在这个样本中随机取一个当队长的概率为128,且样本中的男队员比女队员多4人,则m =________. 解析:由题意知n =28,设样本中有男队员x 人,女队员有y 人.则⎩⎨⎧x +y =28,x -y =4,56m =x y.解得⎩⎪⎨⎪⎧x =16,y =12,m =42. 答案:42[B级能力提升]13.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是() A.3 B.4C.5 D.6解析:抽样间隔为k=357=5.因此将编号1~35的35个数据分成7组,每组有5个数据.又因在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人.答案:B14.某工厂的三个车间在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从第一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生产的产品数为()A.800 B.1 000C.1 200 D.1 500解析:因为a,b,c成等差数列,所以2b=a+c.所以a+b+c3=b.所以第二车间抽取的产品数占抽样产品总数的13.根据分层抽样的性质,可知第二车间生产的产品数占总数的13,即为1 3×3 600=1 200.答案:C15.某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是________件.解析:设样本容量为x,则x3 000×1 300=130,所以x=300.所以A产品和C产品在样本中共有300-130=170(件).设C产品的样本容量为y,则y+y+10=170,所以y=80.所以C产品的数量为3 000300×80=800(件).答案:800[C级素养升华]16.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,若第5组抽取号码为22,则第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.解析:将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件得,200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x人,则40200=x100,解得x=20.答案:3720。
抽样方法-课文知识点解析1.常用抽样方法:简单随机抽样、分层抽样和系统抽样.2.简单随机抽样一般地,从总体中抽取一定量的样本,在抽取过程中要保证每个个体被抽到的概率相同,这样的抽样方法叫简单随机抽样.通常采用抽签法和产生随机数字的方法(利用工具产生随机数). (1)抽签法抽签法的实施步骤:a.给调查对象群体(共有N个)中的每个对象编号(号码可以从1到N).b.准备“抽签”工具(签可以是纸条、卡片或小球),实施“抽签”.先把号码写在形状、大小相同的签上,然后把签放在同一个箱子里,进行均匀搅拌,每次从中抽出一个签,连续抽n次,就得到一个容量为n的样本.c.对样本中的每一个体进行测量或调查,得到数据,通过分析数据得出结论.例如:请用抽签法设计一个调查方案,调查你所在学校学生喜欢体育活动的情况.(以总体数量为N)抽取n个样本为例.第一步,给全体同学编号,号码从1到N;第二步,准备N个大小、形状相同的签,把号码(1~N)写在签上,每次抽取一个签,连续抽n次,就得到一个容量为n的样本;第三步,对样本中的每一个体进行调查.可设计一个问卷,如下. 你对体育活动的喜欢程度A.喜欢B.一般C.不喜欢说明:只准选择一个答案.然后请抽取的几个同学如实填写问卷,统计出数据,填入下表.由样本情况估计全校所有同学喜欢体育活动的情况,从而得出调查结论,写出调查报告.(2)产生随机数把总体中的N个个体依次编上0,1,2,…,N-1的号码,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,…,N-1中的随机数,产生的随机数是几,就选几号个体,直到抽到预先规定的样本数.利用转盘或摸球产生随机数,这种方法大家都比较熟悉,并且简便易行,尤其当总体容量不大时.这种方法的缺点是当总体容量很大时,制作转盘和进行摸球就比较困难了.利用随机数表产生随机数,是其中最重要、最常用的一种方法.下面举例说明如何利用随机数表来抽取样本.为了检验某种产品的质量,决定从40件产品中抽取10件进行检查.在利用随机数表抽取这个样本时,可按下面步骤进行. 全析提示我们知道要做到绝对地随机抽取样本非常困难,因此在抽样过程中尽可能避免人为因素的影响,而抽签法和产生随机数字法恰好具备此特点.抽签法最大的优点是简便易行,但此种方法不宜适用于总体数量较大的对象,一般适用于个体数量较少的对象.要点提炼一个调查方案的设计一定要科学、合理,要易于操作,易得出数据便于统计;问卷的设计更要具有科学性,选项要全面、合理.通过调查方案的设计和实施,有利于提高同学们的思维、逻辑、组织和实践能力,这也符合素质教育的要求.全析提示利用抽签法抽取样本时,编号应从1开始;而利用随机数抽取样本时,编号应从0开始.利用随机数表产生随机数是最常用的产生随机数的方法,要掌握此种方法的步骤.表3-17816 6572 0802 6314 0702 4369 9728 0198 3204 9243 4935 8200 3623 4869 6938 7481 2976 3413 2841 4241 2424 1985 9313 2322 8303 9822 5888 2410 1158 2729 6443 2943 5556 8526 6166 8231 2438 8455 4618 44452635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 5379 7076 2694 2927 4399 5519 8106 85019264 4607 2021 3920 7766 3817 3256 1640 5858 7766 3170 0500 2593 0545 5370 7814 2889 6628 6757 8231 1589 0062 0047 3815 5131 8186 3709 4521 6665 5325 5383 2702 9055 7196 2172 3207 1114 1384 4359 44887900 5870 2602 8813 5509 4324 0030 4750 3693 9212 0557 7369 7162 9568 1312 9438 0380 3338 0138 4560 4230 6496 3806 0347 0246 4469 9719 8316 1285 0357 2389 2390 7266 0081 6897 2851 4666 0620 4596 34009312 4779 5737 8918 4550 3994 5573 9229 6111 6098 0965 7352 6847 3034 9977 3770 2310 4476 9148 0679 2662 2062 0522 9234 9826 8857 8675 6642 5471 8820 4308 2105 6703 8248 6064 6962 0053 8188 6494 45091110 9486 6533 3954 1944 1516 1682 3404 9651 1456 5613 0357 4244 3341 9605 3567 8350 5728 4338 0824 7899 1307 5814 8688 6982 5126 7736 3383 6215 3441 8578 2277 6490 7644 7085 8361 5662 4141 9877 37478570 2150 8140 4355 5321 2548 0208 7543 9169 0408 4353 6122 8913 9930 4169 6032 2127 0162 6176 4969 8185 9312 8748 8575 8090 9872 1968 0263 0081 2662 6831 3106 2959 9011 1448 4346 7019 8148 1557 8400第一步,先将40件产品编号,可以编为00,01,02, (38)39;全析提示用随机数表产生随机数分三步,一第二步,在随机数表中任选一个数开始,由于总体的编号是两位数,我们可以一次选取其中的两列,组成一个两位数.我们从附表的第17列和第18列的第2行开始选数;第三步,从选定的数36开始,得到第一个两位数,将它取出;继续向下读,由上至下分别是24,11,24,16,76,70,29,43,77,25,15,66,11,55,71,42,12,46,45,68,26,54,00,…其中24,11重复出现,76,70,43,77,66,55,71,42,46,45,68,54超过39,不能选取,这样选取的10个样本的编号分别为36,24,11,16,29,25,15,12,26,00.课本例1,严格地按照用随机数表产生随机数的步骤进行的.在选数的过程中,是从表3-1中第6列和第7列这两列的第4行开始,由上至下的顺序进行选数的.事实上,定位置和选数的顺序是任意的.下面我们用另外一种顺序选取10个样本.第一步,将总体中的每个个体进行编号:00,01,02,…,79; 第二步,由于总体是一个两位数的编号,每次要从随机数表中选取两列组成两位数.从随机数表中任意一个位置,比如从表3-1中第1列和第2列这两列的第三行开始选数,由左至右分别是29,76,34,13,28,41,42,41,24,24,19,85,93,13,23,…其中13,41,24重复出现,83,93超过79,不能选取,这样选取的10个样本的编号分别为29,76,34,13,28,41,42,24,19,23. 3.分层抽样将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中随机抽取一定的样本,这种抽样方法通常叫做分层抽样,有时也称为类型抽样.例如教材中的问题2,如若用简单随机抽样,则抽到的15个样本很可能不能按照它们的家数之比抽取,这样得到的数据就不能真实地反映情况,误差很大;为了避免这种情况,我们按照大型、中型、小型的比例,从100家大型商店中抽出1个代表,从500家中型商店中抽出5个代表,从900家小型商店中抽出9个代表. 再例如,一个单位有职工500人,其中不到35岁的有125人,35岁~49岁的有280人,50岁以上的有95人.为了了解这个单位职工身体状况有关的某项指标,要从中抽取一个容量为100的样本.由于职工年龄与这项指标有关,决定采用分层抽样的方法进行抽取.因为样本容量与总体个数的比为 100∶500=1∶5,所以在各年龄段抽取的个体数依次是 5125,5280,595,即25,56,19.在各年龄段分别抽取时,可采用简单随机抽样,将各年龄段抽取的个体合在一起,就是所要抽取的样本.是编号;二是定位置;三选数.定住位置后,读数的方向可以向右,也可以向左、向上、向下等.取数过程中,要把不符合要求的数(超过最大编码)和与前面重复的数去掉.利用随机数表选取样本的一般步骤:①编号;②定位;③选数.选数过程中,重复的数字只取一个,超过最大编号的数不能取.思维拓展定位置是任意的,选数的顺序是任意的,没有任何约束,所以选取的样本的编号可以是多种多样的,并不唯一.全析提示当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占比例进行抽样.由于分层抽样充分地利用了我们所掌握的信息,使样本具有较好地代表性,而在各层中进行抽样时,大多数情况下采用简单随机抽样,有时也会用到其他方法,这样需根据问题的需要来决定.本例符合分层抽样的特点和适用范围.课本例2,显然不同类型的农田之间的产量有较大差异,也就是说,总体由差异明显的几部分组成,故采用分层抽样的方法,对不同类型的农田按其总数的比例来抽取.假设本例中共有农田500亩,山地、丘陵、平原和洼地各占农田总数的10%、20%、40%和30%,欲抽取50亩进行产量调查,则应抽取5亩山地、10亩丘陵、20亩平原和15亩洼地.课本例3,由于不同层次管理人员的收入差异很大,故采取分层抽样的方法.不同层抽取样本的数目等于抽取样本总数与不同层次管理人员所占总体比例的积,所以应抽取:高层管理人员:100×5%=5(人),中层管理人员:100×15%=15(人),一般员工:100×80%=80(人).4.系统抽样系统抽样是将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按照相同的间隔(称为抽抽样距)抽取其他样本,这种抽样方法有时也叫等距抽样或机械抽样.例如,为了了解参加某种知识竞赛的1000名学生的成绩,打算从中抽一个容量为50的样本.假定这1000名学生的编号是1,2,…,1000,由于50∶1000=1∶20,我们将总体分成50个部分,其中每一部分包括20个个体,例如第一部分的编号是1,2,3,…,20,然后在第一部分随机抽取一个号码,比如它是18号,那么可以从第18号起,每隔20个抽取一个号码,这样得到了一个容量为50的样本,它们的号码分别是:18,38,58,…,978,998.由于总体中的个体数1000正好能被样本容量整除,可以用它们的比值作为抽样距.如果不能整除,比如总体中的个数为1003,样本容量仍为50,这时可先用简单随机抽样先从总体中剔除3个个体,使剩下的个体数1000能被50整除,然后再按系统抽样法往下进行.在抽样时,如果总体的排列存在明显的周期性或者事先是排好序的,那么利用系统抽样进行抽样时将会产生明显的偏差,因为这样抽取的样本不具有代表性.如课本P20思考交流中的两个问题,第一个问题中,抽取的样本不具备代表性,身体偏高;第二个问题中,采取这样的抽样方法,只对周一的交通流量进行了统计,无法代表一个月的状况,只要改变抽样距,如抽样距改为6,就可以了.课本例4,由于总体个体数太大,又无明显的层次差异,所以不能采用简单随机抽样和分层抽样,采用系统抽样是比较合适的.课本给出了系统抽样的一般步骤,要严格地按步骤进行抽样.第一步,确定分段情况,所抽取样本数就是需要分的段数,应为50;确定抽样距,抽样距=总体个体数/抽取样本数=10000/50=200;第二步,按顺序进行编号;要点提炼采用分层抽样时,不同层次所选取的样本数=抽取样本总数×该层所占总体的比例.全析提示当总体容量和样本容量都很大时,采用简单随机抽样或分层抽样,都是非常麻烦的,系统抽样正好能解决这个问题.要点提炼用系统抽样抽取一定容量的样本时,首先要分清总体中的个数是否能被样本容量整除,否则就会出现抽样距不等的情况,就不合乎系统抽样的原则.全析提示在利用系统抽样进行抽样时,要注意总体的排列有没有明显的周期性,这时抽样距的选取要恰当,要打乱周期性;如果总体事先排好序,要先打乱顺序,再抽样,以达到抽取的样本具有广泛的代表性.系统抽样的步骤:①确定分段情况和抽样距;②编号;③确定第一个样本编号;④等距抽样.在确定第一个样本编号时,一定要采用简单随机抽样,并且一定要在第一段内抽取,否则无法保证等距抽样.对于系统抽样,经常遇见的两种情况要加以区分,以避免不必要的麻烦.第三步,采用简单随机抽样从第一个时间段抽取第一个样本;第四步,等距抽样,顺序抽取相应编号的样本.课本例5,本例与例4的不同之处在于,总体个体数不能被样本总数整除,这时可把商作为抽样距,余数得通过简单随机抽样从总体中剔除,对剩余进行编号,其余完全同例4.5.三种抽样方法的比较上面介绍了简单随机抽样、分层抽样和系统抽样.下面通过列表将它们作一个简单的比较.三种抽样方法的比较熟悉三种抽样方法各自的特点和适用范围,以便针对不同的实际问题,采取不同的抽样方法.。
高三数学知识点之抽样方法广大同学要想顺利通过高考,接受更好的高等教育,就要做好考试前的复习准备。
为大家整理了高三数学知识点之抽样方法,希望对大家有所帮助。
一、简单随机抽样设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时,各个体被抽到的概率相等,就称这样的抽样为简单随机抽样。
一般地如果用简单随机抽样从个体数为N的总体中抽取一个容量为n的样本那么每个个体被抽到的概率等于n/N.常用的简单随机抽样方法有:抽签法、随机数法。
1.抽签法一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
2.随机数法随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。
二、活用随机抽样系统抽样的最基本特征是等距性,每组内所抽取的号码需要依据第一组抽取的号码和组距是唯一确定,每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项,组距d为公差的等差数列{an},第k组抽取样本的号码,ak=m+(k-1)d,如本题中根据第一组的样本号码和组距,可得第k组抽取号码应该为9+30*(k-1)三、系统抽样当总体中的个体数较多时,采用简单随机抽样显得较为费事,这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。
四、分层抽样当已知总体有差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常常将总体分为几个部分,然后按照各个部分所占比例进行抽样,这种抽样叫做分层抽样,其中所分层的各部分叫做层以上就是高三数学知识点之抽样方法,以供同学们参考。
⾼中数学抽样⽅法-课⽂知识点解析然后请抽取的⼏个同学如实填写问卷,统计出数据,填⼊下表.⼒,这也符合素质教育的要求.抽样⽅法-课⽂知识点解析1.常⽤抽样⽅法:简单随机抽样、分层抽样和系统抽样.2.简单随机抽样⼀般地,从总体中抽取⼀定量的样本,在抽取过程中要保证每个个体被抽到的概率相同,这样的抽样⽅法叫简单随机抽样.通常采⽤抽签法和产⽣随机数字的⽅法(利⽤⼯具产⽣随机数).(1)抽签法抽签法的实施步骤:a.给调查对象群体(共有N个)中的每个对象编号(号码可以从1到N).b.准备“抽签”⼯具(签可以是纸条、卡⽚或⼩球),实施“抽签”.先把号码写在形状、⼤⼩相同的签上,然后把签放在同⼀个箱⼦⾥,进⾏均匀搅拌,每次从中抽出⼀个签,连续抽n次,就得到⼀个容量为n的样本.c.对样本中的每⼀个体进⾏测量或调查,得到数据,通过分析数据得出结论.例如:请⽤抽签法设计⼀个调查⽅案,调查你所在学校学⽣喜欢体育活动的情况.(以总体数量为N)抽取n个样本为例.第⼀步,给全体同学编号,号码从1到N;第⼆步,准备N个⼤⼩、形状相同的签,把号码(1~N)写在签全析提⽰我们知道要做到绝对地随机抽取样本⾮常困难,因此在抽样过程中尽可能避免⼈为因素的影响,⽽抽签法和产⽣随机数字法恰好具备此特点.抽签法最⼤的优点是简便易⾏,但此种⽅法不宜适⽤于总体数量较⼤的对象,⼀般适⽤于个体数量较少的对象.要点提炼上,每次抽取⼀个签,连续抽n次,就得到⼀个容量为n的样本;⼀个调查⽅案的设计⼀定要科学、合理,要易于操作,易得出数据便第三步,对样本中的每⼀个体进⾏调查.可设计⼀个问卷,如下.你对体育活动的喜欢程度A.喜欢B.⼀般C.不喜欢说明:只准选择⼀个答案.查结论,写出调查报告.(2)产⽣随机数把总体中的N个个体依次编上0,1,2,…,N-1的号码,然后利⽤⼯具(转盘或摸球、随机数表、科学计算器或计算机)产⽣0,1,…,N-1中的随机数,产⽣的随机数是⼏,就选⼏号个体,直到抽到预先规定的样本数.利⽤转盘或摸球产⽣随机数,这种⽅法⼤家都⽐较熟悉,并且简便易⾏,尤其当总体容量不⼤时.这种⽅法的缺点是当总体容量很⼤时,制作转盘和进⾏摸球就⽐较困难了.利⽤随机数表产⽣随机数,是其中最重要、最常⽤的⼀种⽅法.下⾯举例说明如何利⽤随机数表来抽取样本.为了检验某种产品的质量,决定从40件产品中抽取10件进⾏检于统计;问卷的设计更要具有科学性,选项要全⾯、合理.通过调查⽅案的设计和实施,有利于提⾼同学们的思维、逻辑、组织和实践能全析提⽰利⽤抽签法抽取样本时,编号应从1开始;⽽利⽤随机数抽取样本时,编号应从0开始.利⽤随机数表产⽣随机数是最常⽤的产⽣随机数的⽅法,要掌握此种⽅法的步骤.查.在利⽤随机数表抽取这个样本时,可按下⾯步骤进⾏.表3-178166572080263140702436997280198 32049243493582003623486969387481 29763413284142412424198593132322 83039822588824101158272964432943 55568526616682312438845546184445 26357900337091601620388277574950 32114919730649167677873399746732 27486198716441487086288885191620 74770111163024042979799196835125 5379707626942927439955198106850192644607202139207766381732561640 58587766317005002593054553707814 28896628675782311589006200473815 51318186370945216665532553832702 90557196217232071114138443594488 79005870260288135509432400304750 36939212055773697162956813129438 03803338013845604230649638060347 02464469971983161285035723892390 7266008168972851466606204596340093124779573789184550399455739229 61116098096573526847303499773770 23104476914806792662206205229234 98268857867566425471882043082105 67038248606469620053818864944509 11109486653339541944151616823404 9651 1456 5613 0357 4244 3341 96053567 8350 5728 4338 0824 7899 1307 5814 8688 6982 51267736 3383 6215 344185782277 64907644 7085 8361 5662 4141 9877 37478570 215081404355 5321 2548 0208 7543 9169 0408 4353 6122 8913 9930 4169 6032 2127 0162 6176 4969 8185 9312 8748 8575 8090 9872 1968 0263 0081 2662 6831 31062959 9011 1448 4346 7019 8148 1557 8400第⼀步,先将40件产品编号,可以编为全析提⽰⽤随机数表产⽣随机数分三步,⼀00,01,02,…,38,39;第⼆步,在随机数表中任选⼀个数开始,由于总体的编号是两位数,我们可以⼀次选取其中的两列,组成⼀个两位数.我们从附表的第17列和第18列的第2⾏开始选数;第三步,从选定的数36开始,得到第⼀个两位数,将它取出;继续向下读,由上⾄下分别是24,11,24,16,76,70,29,43,77,25,15,66,11,55,71,42,12,46,45,68,26,54,00,…其中24,11重复出现,76,70,43,77,66,55,71,42,46,45,68,54超过39,不能选取,这样选取的10个样本的编号分别为36,24,11,16,29,25,15,12,26,00.课本例1,严格地按照⽤随机数表产⽣随机数的步骤进⾏的.在选数的过程中,是从表3-1中第6列和第7列这两列的第4⾏开始,由上⾄下的顺序进⾏选数的.事实上,定位置和选数的顺序是任意的.下⾯我们⽤另外⼀种顺序选取10个样本.第⼀步,将总体中的每个个体进⾏编号:00,01,02, (79)第⼆步,由于总体是⼀个两位数的编号,每次要从随机数表中选取两列组成两位数.从随机数表中任意⼀个位置,⽐如从表3-1中第1列和第2列这两列的第三⾏开始选数,由左⾄右分别是29,76,34,13,28,41,42,41,24,24,19,85,93,13,23,…其中13,41,24重复出现,83,93超过79,不能选取,这样选取的10个样本的编号分别为29,76,34,13,28,41,42,24,19,23.3.分层抽样将总体按其属性特征分成若⼲类型(有时称作层),然后在每个类型中随机抽取⼀定的样本,这种抽样⽅法通常叫做分层抽样,有时也称为类型抽样.例如教材中的问题2,如若⽤简单随机抽样,则抽到的15个样本很可能不能按照它们的家数之⽐抽取,这样得到的数据就不能是编号;⼆是定位置;三选数.定住位置后,读数的⽅向可以向右,也可以向左、向上、向下等.取数过程中,要把不符合要求的数(超过最⼤编码)和与前⾯重复的数去掉.利⽤随机数表选取样本的⼀般步骤:①编号;②定位;③选数.选数过程中,重复的数字只取⼀个,超过最⼤编号的数不能取.思维拓展定位置是任意的,选数的顺序是任意的,没有任何约束,所以选取的样本的编号可以是多种多样的,并不唯⼀.全析提⽰当已知总体由差异明显的⼏部分组成时,为了使样本充分地反映总体的情况,常将总体分成⼏部分,然后按照各部分所占⽐例进⾏抽样.由于分层抽样充分地利⽤了我们所掌握的信息,使样本具有较好地代表性,⽽在各层中进⾏抽样时,⼤真实地反映情况,误差很⼤;为了避免这种情况,我们按照⼤型、多数情况下采⽤简单随机抽样,有中型、⼩型的⽐例,从100家⼤型商店中抽出1个代表,从500时也会⽤到其他⽅法,这样需根据家中型商店中抽出5个代表,从900家⼩型商店中抽出9个代表.问题的需要来决定.再例如,⼀个单位有职⼯500⼈,其中不到35岁的有125⼈,35岁~49岁的有280⼈,50岁以上的有95⼈.为了了解这个单位职⼯⾝体状况有关的某项指标,要从中抽取⼀个容量为100的样本.由于职⼯年龄与这项指标有关,决定采⽤分层抽样的⽅法进⾏抽取.因为样本容量与总体个数的⽐为100∶500=1∶5,所以在各年龄段抽取的个体数依次是本例符合分层抽样的特点和适⽤范围.。
超几何分布一.离散型随机变量的概率分布(1)随着试验结果变化而变化的变量叫做随机变量,常用字母X,Y,ξ,η,…表示,所有取值可以一一列出的随机变量叫做离散型随机变量.(2)一般地,若离散型随机变量X可能取的不同值为x1,x2,…,x i,…,x n,X取每一个值x i(i=1,2,…,n)的概率P(X=x i)=p i,则称表为离散型随机变量X的概率分布表.(3)离散型随机变量的概率分布的性质:①p i≥0,i=1,2,…,n;②p1+p2+…+p i+…+p n=1.离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率之和.二.两点分布如果随机变量X的概率分布表为其中0<p<1,则称离散型随机变量X服从两点分布.三.超几何分布1.概念:一般地,设有N 件产品,其中有M (M ≤N )件次品.从中任取n (n ≤N )件产品,用X 表示取出的n 件产品中次品的件数,那么P (X =r )=C r M C n -rN -MC n N(r =0,1,2,…,l ).即其中l =min(M ,n ),且n ≤N ,M ≤N ,n ,M ,N ∈N *.如果一个随机变量X 的概率分布具有上表的形式,则称随机变量X 服从超几何分布.2.超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征是: ①考察对象分两类; ②已知各类对象的个数;③从中抽取若干个个体,考察某类个体个数X 的概率分布 四.离散型随机变量的均值与方差 1.离散型随机变量的均值与方差一般地,若离散型随机变量X 的分布列为:(1)称1122()n n E X x p x p x p =++⋅⋅⋅+为随机变量X 的均值或数学期望,它反映了离散型随机变量取值的平均水平. (2)称21()(())nii i D X x E X p ==-∑为随机变量X 的方差,它刻画了随机变量X 与其均值E (X )的平均偏X 的标准差. 2.均值与方差的性质若Y =aX +b ,其中a ,b 为常数,则Y 也是随机变量,且E(aX+b)=aE(X)+b;D(aX+b)=a2D(X)考向一分布列性质【例1】(1)设离散型随机变量X的概率分布为下表,求2X+1的概率分布.(2)若(1)中条件不变,求随机变量η=|X-1|的概率分布.(3)若(1)中条件不变,求随机变量η=X2的概率分布.【答案】见解析【解析】(1)由概率分布的性质知,0.2+0.1+0.1+0.3+m=1,得m=0.3.列表为从而2X+1的概率分布为(2)由(1)知m=0.3,列表为∴P(η=1)=P(X=0)+P(X=2)=0.2+0.1=0.3,P(η=0)=P(X=1)=0.1,P(η=2)=P(X=3)=0.3,P(η=3)=P(X=4)=0.3.故η=|X-1|的概率分布为(3)依题意知η的值为0,1,4,9,16.列表为从而η=X2的概率分布为【举一反三】1.设X 是一个离散型随机变量,其概率分布为则q =________. 【答案】 32-336【解析】 ∵13+2-3q +q 2=1,∴q 2-3q +43=0,解得q =32±336.又由题意知0<q 2<23,∴q =32-336.2.设随机变量ξ的概率分布为P (ξ=k )=m ⎝ ⎛⎭⎪⎫23k(k =1,2,3),则m 的值为________.【答案】2738【解析】 由概率分布的性质得P (ξ=1)+P (ξ=2)+P (ξ=3)=m ×23+m ×⎝ ⎛⎭⎪⎫232+m ×⎝ ⎛⎭⎪⎫233=38m 27=1,∴m =2738. 考向二 超几何分布【例2-1】 某外语学校的一个社团中有7名同学,其中2人只会法语,2人只会英语,3人既会法语又会英语,现选派3人到法国的学校交流访问.求: (1)在选派的3人中恰有2人会法语的概率;(2)在选派的3人中既会法语又会英语的人数X 的概率分布. 【答案】(1)47. (2)见解析【解析】(1)设事件A :选派的3人中恰有2人会法语,则P (A )=C 25C 12C 37=47.(2)由题意知,X 服从超几何分布,X 的可能取值为0,1,2,3,P (X =0)=C 34C 37=435, P (X =1)=C 24C 13C 37=1835,P (X =2)=C 14C 23C 37=1235, P (X =3)=C 33C 37=135,∴X 的概率分布为X 0 1 2 3 P43518351235135【例2-2】为了减少雾霾,还城市一片蓝天,某市政府于12月4日到12月31日在主城区实行车辆限号出行政策,鼓励民众不开车低碳出行,某甲乙两个单位各有200名员工,为了了解员工低碳出行的情况,统计了12月5日到12月14日共10天的低碳出行的人数,画出茎叶图如下: (1)若甲单位数据的平均数是122,求x ;(2)现从如图的数据中任取4天的数据(甲、乙两单位中各取2天),记其中甲、乙两单位员工低碳出行人数不低于130人的天数为1ζ, 2ζ,令12=ηζζ+,求η的分布列和期望.【答案】(1)8;(2)答案见解析.【解析】(1)由题意()10510711311511912612013213414112210x ++++++++++=,解得8x =.(2)由题意知,随机变量η的所有可能取值有0,1,2,3,4.()227622101070;45C C p C C η=== ()112736221010911;225C C C p C C η===()222211113674736422101012;3C C C C C C C C p C C η++=== ()211112364734221010223;225C C C C C C p C C η+=== ()223422101024;225C C p C C η===η∴的分布列为:∴()79112227012344522532252255E η=⨯+⨯+⨯+⨯+⨯=.【举一反三】1.某普通高中为了解本校高三年级学生数学学习情况,对一模考试数学成绩进行分析,从中抽取了n名学生的成绩作为样本进行统计(该校全体学生的成绩均在[]60,150),按下列分组[)60,70,[)70,80,[)80,90,[)90,100,[)100,110,[)110,120,[)120,130,[)130,140,[]140,150作出频率分布直方图,如图1;样本中分数在[)70,90内的所有数据的茎叶图如图2:根据往年录取数据划出预录分数线,分数区间与可能被录取院校层次如表.(1)求n的值及频率分布直方图中的,x y值;(2)根据样本估计总体的思想,以事件发生的频率作为概率,若在该校高三年级学生中任取2人,求此2人都不能录取为专科的概率;(3)在选取的样本中,从可能录取为自招和专科两个层次的学生中随机抽取3名学生进行调研,用ξ表示所抽取的3名学生中为自招的人数,求随机变量ξ的分布列和数学期望.【套路总结】超几何分布的两个特点①超几何分布是不放回抽样问题;②随机变量为抽到的某类个体的个数.(2)超几何分布的应用条件①两类不同的物品(或人、事);【答案】(1)0.014;(2)616625;(3)见解析 【解析】(1)由图2知分数在[)70,80的学生有4名, 又由图1知,频率为:0.008100.08⨯=,则:4500.08n == 50.015010x ∴==⨯,()10.0420.0820.10.120.160.240.01410y -⨯+⨯++++==(2)能被专科院校录取的人数为:()500.0040.008106⨯+⨯=人抽取的50人中,成绩能被专科院校录取的频率是:635025= ∴从该校高三年级学生中任取1人能被专科院校录取的概率为325, 记该校高三年级学生中任取2人,都不能被专科院校录取的事件为A则此2人都不能录取为专科的概率:()23616125625P A ⎛⎫=-=⎪⎝⎭(3)选取的样本中能被专科院校录取的人数为6人成绩能过自招线人数为:()500.0120.0040.0081012⨯++⨯=人, 又随机变量ξ的所有可能取值为0,1,2,3∴()363182050816204C P C ξ∴====;()2161231818015181668C C P C ξ====; ()1261231839633281668C C P C ξ====;()03612318220553816204C C P C ξ==== ∴随机变量ξ的分布列为:()5153355012322046868204E ξ∴=⨯+⨯+⨯+⨯=1.随机变量X 的概率分布如下:其中a ,b ,c 成等差数列,则P (|X |=1)=________,公差d 的取值范围是________. 【答案】 23⎣⎢⎡⎦⎥⎤-13,13 【解析】 ∵a ,b ,c 成等差数列,∴2b =a +c . 又a +b +c =1,∴b =13,∴P (|X |=1)=a +c =23.又a =13-d ,c =13+d ,根据概率分布的性质,得0≤13-d ≤23,0≤13+d ≤23,∴-13≤d ≤13.2.若离散型随机变量X 的分布列是则常数c的值为_____.【答案】【解析】由随机变量的分布列知,9c2﹣c≥0,3﹣8c≥0,9c2﹣c+3﹣8c=1,∴c =.故答案为:.3.我国城市空气污染指数范围及相应的空气质量类别见下表:空气污染指数空气质量空气污染指数空气质量0--50 优201--250 中度污染51--100 良251--300 中度重污染101--150 轻微污染>300 重污染151----200 轻度污染我们把某天的空气污染指数在0-100时称作A类天,101--200时称作B类天,大于200时称作C类天.下图是某市2018年全年监测数据中随机抽取的18天数据作为样本做的茎叶图:(百位为茎,十、个位为叶)(1)从这18天中任取3天,求至少含2个A类天的概率;(2)从这18天中任取3天,记X是达到A类或B类天的天数,求X的分布列.【答案】(1);(2)见解析【解析】(1)从这18天中任取3天,取法种数有种,3天中至少有2个A类天的取法种数有种,所以这3天至少有2个A类天的概率;(2)的一切可能的取值是,当时,;当时,;当时,;当时,;的分布列为:X 3 2 1 0P数学期望。
三种抽样方法【套路秘籍】---千里之行始于足下一.简单随机抽样1.概念:一般地,从元素个数为N 的总体中逐个不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.2.最常用的简单随机抽样的方法:抽签法和随机数法.3.适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小.二.系统抽样1.概念及步骤:假设要从容量为N 的总体中抽取容量为n 的样本,第一步,先将总体的N 个个体编号;第二步,确定分隔间距k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k =N n ;当N n(n 是样本容量)不是整数时,先用简单随机抽样剔除N n -[N n ]个个体,取k =[N n];第三步,在第1段用简单随机抽样确定第一个个体编号l (l ≤k );第四步,按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号l k +,再加k 得到第3个个体编号2l k +,依次进行下去,直到获取整个样本.2.系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等.三.分层抽样1.概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.2.应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.【修炼套路】---为君聊赋《今日诗》,努力请从今日始考向一简单随机抽样【例1】已知下列抽取样本的方式:①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.其中,不是简单随机抽样的个数是A.1B.2C.3D.4【答案】D【解析】①不是简单随机抽样,原因是简单随机抽样中总体的个数是有限的,而题中是无限的;②不是简单随机抽样,原因是简单随机抽样是不放回地抽取,而题中是放回地;③不是简单随机抽样,原因是简单随机抽样是逐个抽取,而题中是一次性抽取;④不是简单随机抽样,原因是个子最高的5名同学是56名同学中特定的,不存在随机性,不是等可能抽样.故选择D.【套路总结】简单随机抽样的特征要判断所给的抽样方法是否是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点:有限性、逐一性、不放回性、等可能性.①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.【举一反三】1.某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,,599,600从中抽取60个样本,如下提供随机数表的第4行到第6行:32211834297864540732524206443812234356773578905642 84421253313457860736253007328623457889072368960804 32567808436789535577348994837522535578324577892345若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号A.522B.324C.535D.578【答案】D【解析】第6行第6列开始的数为808(不合适),436,789(不合适),535,577,348,994(不合适),837(不合适),522,536(重复不合适),578则满足条件的6个编号为4346,535,577,348,522,578则第6个编号为578本题正确选项:D2.某工厂利用随机数表对产生的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,…,599,600.从中抽取60个样本,下图提供随机数表的第4行到第6行;若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号是()A.B.C.D.【答案】D【解析】从表中第6行第6列开始向右依次读取3个数据,开始的数为608不合适,436合适,767不合适,837不合适,535,577,348合适,994,837不合适,522合适,535与前面的数字重复,不合适,578合适.则满足条件的6个编号为436,535,577,348,522,578,则第6个编号为578故选:D3.某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第5行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是()84421253313457860736253007328623457889072368960804 32567808436789535577348994837522535578324577892345A.328B.623C.457D.072【答案】B【解析】从表中第5行第6列开始向右读取数据,得到前6个编号分别是:253,313,457,007,328,623,则得到的第6个样本编号是623,故选B.考点二系统抽样【例2】(1)下列抽样中不是系统抽样的是()A.从编号为1~15的15个小球中任选3个作为样本,按从小到大排序,随机确定起点编号i,再把编号为i+5,i+10(超过15则从1再数起)的小球入样B.某糖果厂在用传送带将生产的糖果送入自动化包装机之前,检验人员从传送带上每隔10分钟抽一块糖果检验C.某人在一个十字路口随机发送广告纸,直到发完1000份为止D.某会议室有15排,每排20个座位,现要求每排座位号为14的参会人员留下来座谈(2)从编号为001,002,…,400的400个产品中用系统抽样的方法抽取一个容量为16样本,已知样本中最小的编号为007,则样本中最大的编号应该为()A.382B.483C.482D.483(3)某市为了了解高三学生第一次模拟考试的成绩,现采用系统抽样的方法从12000名学生中抽取一个容量为40的样本,则分段间隔为()A.400B.300C.200D.120【答案】(1)C(2)A(3)B【解析】(1)系统抽样首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式.由系统抽样的概念知A,B,D都是系统抽样,C是简单随机抽样.故选:C.(2)∵样本中编号最小的编号为007,容量为16,∴样本数据组距为,则对应的最大的编号数x=7+25(16﹣1)=382,故选:A.(3)∵从12000名学生中抽取40个样本,∴样本数据间隔为12000÷40=300,故选:B.【举一反三】1.某校高三年级共有学生900人,编号为1,2,3,,900,现用系统抽样的方法抽取一个容量为45的样本,若在第一组抽取的编号是5,则抽取的45人中,编号落在区间的人数为A.10B.11C.12D.13【答案】C【解析】900人中抽取样本容量为45的样本,样本组距为:;则编号落在区间的人数为,故选C。
2.某班级有50名学生,现采取系统抽样的方法在这50名学生中抽出10名,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,,第十组46~50号,若在第三组中抽得号码为12号的学生,则在第八组中抽得号码为______的学生.A.36B.37C.41D.42【答案】B【解析】由这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,...,第十组46~50号,在第三组中抽得号码为12的学生,则在第八组中抽得号码为12+(8-3)5=37.故选B.3.学校某课题组为了解本校高二年级学生的饮食均衡发展情况,现对各班级学生进行抽样调查已知高二班共有52名同学,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是A.13B.19C.20D.51【答案】C【解析】样本间隔为,则另外一个同学的编号为,故选:C.考点三分层抽样【例3】(1)某中学为了解高一、高二、高三这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A.随机数法B.分层抽样法C.抽签法D.系统抽样法(2)为了解小学生近视情况,决定随机从同一个学校二年级到四年级的学生中抽取60名学生检测视力,其中二年级共有学生240人,三年级共有学生200人,四年级共有学生160人,按年级用分层抽样法抽取样本,则从三年级抽取的学生人数为A.24B.20C.16D.18【答案】(1)B(2)B【解析】(1)由于为了解高一、高二、高三这三个年级之间的学生视力是否存在显著差异,从这三个年级中按人数比例抽取部分学生进行调查,这种抽样方法属于分层抽样,故选B.(2)由题意,分层抽样的抽样比为,因为三年级共有学生200人,所以从三年级抽取的学生人数为200×=20.故选B.【举一反三】1.某单位有职工100人,30岁以下的有20人,30岁到40岁之间的有60人,40岁以上的有20人,今用分层抽样的方法从中抽取20人,则各年龄段分别抽取的人数为()A.2,6,10B.4,12,4C.8,8,4D.12,14,15【答案】B【解析】由题意结合分层抽样的定义可知:30岁以下的应抽取人,30岁到40岁之间的应抽取人,40岁以上的应抽取人.本题选择B选项.2.经调查,某市骑行共享单车的老年人、中年人、青年人的比例为1:3:6,用分层抽样的方法抽取了一个容量为n的样本进行调查,其中中年人数为12人,则n=()A.30B.40C.60D.80【答案】B【解析】由题设老年人和青年人人数分别为x,y,由分层抽样得x:12:y=1:3:6,解得x=4,y=24,则n=4+12+24=40故选:B.【运用套路】---纸上得来终觉浅,绝知此事要躬行1.总体由编号为01,02,…,19,20共20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.12B.07C.15D.16【来源】河北省枣强中学2018-2019学年高二上学期期末考试数学(文)试题【答案】C【解析】从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字中小于20的编号依次为03,07,12,16,07,15,其中第二个和第四个都是07,重复.可知对应的数值为03,07,12,16,15则第5个个体的编号为15.故选:C.2.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某学校高一年级有12名女排球运动员,要从中选出3人调查学习负担情况,记作②,那么完成上述2项调查应采用的抽样方法是A.①用随机抽样法,②用系统抽样法B.①用分层抽样法,②用随机抽样法C.①用系统抽样法,②用分层抽样法D.①用分层抽样法,②用系统抽样法【答案】B【解析】对于①,因为社会购买力的某项指标,受到家庭收入的影响,而社区中各个家庭收入差别明显,所以要从中抽一个样本容量是100的样本应该用分层抽样法;对于②,由于样本容量不大,且抽取的人数较少,故可采用简单随机抽样法抽取样本所以选B3.某班有学生52人,现用系统抽样的方法,抽取一个容量为4的样本,已知座位号3号,29号,42号的同学都在样本中,那么样本中还有一位同学的座位号是A.16B.19C.24D.36【答案】A【解析】由题意,系统抽样的样本间隔为,则另外一个座位号为3+13=16,故选A.4.从已经编号的名学生中抽取20人进行调查,采用系统抽样法若第1组抽取的号码是2,则第10组抽取的号码是A.74B.83C.92D.96【答案】B【解析】样本间隔为,第10组抽取的号码是,故选:B.5.事件一:假设某地区有高中生2400人,初中生10900人,小学生11000人.为了了解该地区学生的视力健康状况,从中抽取的学生进行调查.事件二:某校为了了解高一年级学生对教师教学的满意率,打算从高一年级500名学生中抽取50名进行调查.对于事件一和事件二,恰当的抽样方法分别是()A.系统抽样,分层抽样B.系统抽样,简单随机抽样C.简单随机抽样,系统抽样D.分层抽样,系统抽样【答案】D【解析】事件一,由于学生的近视情况与学生的年龄有一定的关系,故此事件应选用分层抽样;事件二,本事件中总体容量较大,样本容量也较大,可以采取系统抽样的方法进行抽样,可保证每个个体有同样的机会被抽到,故选D.6.高二(1)班有50名学生,随机编的学号为1,2,...,50,现用系统抽样方法,从中选出5名学生,则这5名学生的学号可能是A.6、16、26、36、46B.5、12、24、36、48C.7、17、23、31、45D.2、12、26、31、44【答案】A【解析】利用系统抽样,把编号分为5段,每段10个,每段抽取一个,号码间隔为10,由此可得B、C、D 均错误,A正确,故选A.7.一个年级有16个班级,每个班级学生从1到50号编排,为了交流学习经验,要求每班编号为14的同学留下进行交流,这里运用的是()A.分层抽样B.抽签法C.随机数表法D.系统抽样【答案】D【解析】学生人数比较多,把每个班级学生从1到50号编排,要求每班编号为14的同学留下进行交流,这样选出的样本是具有相同的间隔的样本,是采用系统抽样.8.某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校2400名学生中抽取30人进行调查.现将2400名学生随机地从1~2400编号,按编号顺序平均分成30组(1~80号,81~160号,…,2321~2400号),若第3组与第4组抽出的号码之和为432,则第6组抽到的号码是()A.416B.432C.448D.464【答案】A【解析】设第组抽到的号码是,则构成以80为公差的等差数列,所以,,所以,解得,所以.故选:A9.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为的样本进行调查,其中从丙车间的产品中抽取了3件,则()A.9B.13C.12D.10【答案】B【解析】由分层抽样方法列方程得:,解得:,故选:B10.某学校从编号依次为01,02,…,90的90个学生中用系统抽样(等间距抽样)的方法抽取一个样本,已知样本中相邻的两个组的编号分别为14,23,则该样本中来自第四组的学生的编号为______.【答案】32【解析】样本间隔为23﹣14=9,则第一个编号为5,第四个编号为14+2×9=14+18=32,故答案为:3211.某单位有260名职工,现采用系统抽样的方法抽取13人做问卷调查,将260人按1,2,,260随机编号,则抽取的13人中,编号落入区间的人数为______.【答案】3【解析】从260人中抽取13人,抽取的间距为,区间内的人数为,则抽取人数为,故答案为:3.12.将参加数学竞赛的1000名学生编号如下:0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法把编号分成50个部分,如果第一部分编号为0001,0002,0003,…,0020,第一部分随机抽取一个号码为0015,那么抽取的第41个号码为________.【答案】0815【解析】因为总体的个数为1000,样本容量为50,所以分组间隔,因为第一部分随机抽取一个号码为0015,所以抽取的第41个号码为.故答案为081513.某校高三科创班共48人,班主任为了解学生高考前的心理状况,将学生按1至48的学号用系统抽样方法抽取8人进行调查,若抽到的最大学号为48,则抽到的最小学号为______.【答案】6【解析】由系统抽样方法从学号为1到48的48名学生中抽取8名学生进行调查,把48人分成8组,抽到的最大学号为48,它是第8组的最后一名,则抽到的最小学号为第一组的最后一名6号.故答案为:6.14.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.【答案】2【解析】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除.∵,故应从总体中随机剔除个体的数目是2,故答案为2.15.为调查一单位落实“中央某项规定”情况,采用系统抽样方法从该单位480人中抽取32人做问卷调查,将他们随机编号为1,2,…,480,分组后在第一组采用简单随机抽样的方法抽到的号码为3。