高中数学-系统抽样
- 格式:ppt
- 大小:843.50 KB
- 文档页数:45
高中数学统计抽样方法精选题目(附答案)一、抽样方法1.简单随机抽样(1)特征:①一个一个不放回的抽取;②每个个体被抽到可能性相等.(2)常用方法:①抽签法;②随机数表法.2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.1.(1)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7B.9C.10 D.15(2)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.[解析](1)从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为a n=9+30(n-1)=30n-21,由451≤30n-21≤750,得23615≤n≤25710,所以n=16,17,…,25,共有25-16+1=10人.(2)小学中抽取30×150150+75+25=18所学校;从中学中抽取30×75150+75+25=9所学校.[答案](1)C(2)189注:1.系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样. (4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn . 2.与分层抽样有关问题的常见类型及解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数. 2.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A .抽签法B .系统抽样法C .分层抽样法D .随机数法解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为________.解析:高三年级学生人数为430-160-180=90,设高三年级抽取x 人,由分层抽样可得32180=x90,解得x =16. 答案:164.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为________.解析:因为分层抽样的抽样比应相等,所以420960=14样本容量,样本容量=960×14420=32.答案:32二、用样本的频率分布估计总体的频率分布1.频率分布直方图2.茎叶图5.(1)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.(2)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].①求图中a的值;②根据频率分布直方图,估计这100名学生语文成绩的平均分;③若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y 1∶12∶13∶44∶5 [为50×0.18=9.答案:9(2)解:①由频率分布直方图可知(0.04+0.03+0.02+2a)×10=1.所以a=0.005.②该100名学生的语文成绩的平均分约为x=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.③由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段[50,60)[60,70)[70,80)[80,90)x 5403020x∶y 1∶12∶13∶44∶5y 5204025100-(5+20+40+25)=10.注:与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.6.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2 B.0.4C.0.5 D.0.6解析:选B由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为410=0.4,故选B.7.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为()A .300B .360C .420D .450解析:选B 样本中体重大于70.5公斤的频率为: (0.04+0.034+0.016)×2=0.090×2=0.18.故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 000×0.18=360(人). 8.某商场在庆元宵节促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.解析:总销售额为2.50.1=25(万元),故11时至12时的销售额为0.4×25=10(万元).答案:10三、用样本的数字特征估计总体的数字特征有关数据的数字特征9.(1)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差(3)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[解析] (1)从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56,故选择A.(2)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.故选C.(3)假设这组数据按从小到大的顺序排列为x 1,x 2,x 3,x 4,则⎩⎨⎧x 1+x 2+x 3+x44=2,x 2+x32=2,∴⎩⎪⎨⎪⎧x 1+x 4=4,x 2+x 3=4, 又s = 14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2] =12(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2=122[(x 1-2)2+(x 2-2)2]=1, ∴(x 1-2)2+(x 2-2)2=2. 同理可求得(x 3-2)2+(x 4-2)2=2.由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2+(y -2)2=2上的点,分析知x 1,x 2,x 3,x 4应为1,1,3,3.[答案] (1)A (2)C (3)1,1,3,3 注:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.10.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选B 法一:∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.11.甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是__________,气温波动较大的城市是__________.解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度为9+13+17×2+18+226=16,乙城市上半年的平均温度为12+14+17+20+24+276=19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大.答案:乙 乙12.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1)x 甲=99+100+98+100+100+1036=100(mm),x 乙=99+100+102+99+100+1006=100(mm),s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73(mm 2), s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1(mm 2).(2)因为s 2甲>s 2乙,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.四、线性回归1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关:①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b x .13.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润. 注:(1)线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.(2)回归直线方程恒过点(x ,y ).14.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解:(1)将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}共15个基本事件,设抽到相邻两个月的事件为A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}共5个基本事件,∴P (A )=515=13.(2)由表中数据求得x =11,y =24,∑i =14x i y i =1 092,∑i =14x 2i =498.代入公式可得b ^=187.再由a ^=y -b ^x ,求得a ^=-307,所以y 关于x 的线性回归方程为 y ^=187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪1507-22=47<2; 同样,当x =6时,y ^=787,⎪⎪⎪⎪787-12=67<2. 所以该小组所得线性回归方程是理想的.。
第二章统计2.1.2 系统抽样(第1课时)一、学习目标1.理解系统抽样的概念2.掌握系统抽样的一般步骤,会利用系统抽样抽取样本3.理解系统抽样与简单抽样的关系,能够灵活应用系统抽样的方法解决统计问题【重点、难点】系统抽样的概念及其灵活应用;应用系统抽样的方法解决统计问题二、学习过程1.系统抽样的概念:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成_____的若干部分,然后按照预先制定的规则,从每一部分抽取_____个体,得到所需要的样本,这种抽样的方法叫做系统抽样.2.系统抽样的特点:(1)(2)(3)(4)3.系统抽样的一般步骤:(1)(2).(3)(4)不是整数,应如何处理?4.在系统抽样中,若Nn答:【典型例题】例1.某市场想通过检查发票及销售记录的2%来快速估计每月的销量总额.采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序往后将65号,115号,165号,…抽出,发票上的销售额组成一个调查样本.这种抽取样本的方法是 ( ).A.抽签法 B.随机数法C.系统抽样法D.其他的抽样方法例2.某校高中二年级有253名学生,为了了解他们的视力情况,准备按1∶5的比例抽取一个样本,试用系统抽样方法进行抽取,并写出过程.【变式拓展】1. 下列抽样方法不是系统抽样的是 ( ).A.从标有1~15号的15个球中,任选三个作样本,按从小号到大号的顺序,随机选起点i0,以后选i0+5,i0+10(超过15则从1再数起)号入选B.工厂生产的产品用传送带将产品送入包装车间前,在一天时间内检验人员从传送带上每隔五分钟抽一件产品进行检验C.做某项市场调查,规定在商场门口随机抽一个人进行询问调查,直到达到事先规定的调查人数为止D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈三、学习总结系统抽样与简单随机抽样的区别与联系:四、随堂检测1.系统抽样适用的总体应是( )A.容量较少的总体B.总体容量较多C.个体数较多但均衡的总体D.任何总体2.某厂从50件产品中,依次抽取到编号为4,8,12,16,20,24,28,32,36,40,44,48的产品进行质检,这种抽样方法最有可能是( )A.随机数表法B.抽签法C.系统抽样D.以上都不是3.要从某学校的10 000个学生中抽取100个进行健康体检,采用何种抽样方法较好?并写出过程.。
概率统计一,统计初步1.简单随机抽样简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法.2.系统抽样(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.(2)系统抽样的步骤:①编号.采用随机的方式将总体中的个体编号.②分段.先确定分段的间隔k.当Nn(N为总体中的个体数,n为样本容量)是整数时,k=Nn;当Nn不是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数N′能被n整除,这时k=N′n.③确定起始个体编号.在第1段用简单随机抽样确定起始的个体编号S.④按照事先确定的规则抽取样本.通常是将S加上间隔k,得到第2个个体编号S +k,再将(S+k)加上k,得到第3个个体编号S+2k,这样继续下去,获得容量为n 的样本.其样本编号依次是:S,S+k,S+2k,…,S+(n-1)k.3.分层抽样(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法叫做分层抽样.分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,分层要恰当.(2)分层抽样的步骤①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.(3)分层抽样的优点分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用.4.绘制频率分布直方图把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1.5.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.6.平均数、中位数和众数(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数.(3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数).(4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.7.方差、标准差(1)设样本数据为x1,x2,…,x n样本平均数为x-,则s2=1n[(x1-x-)2+(x2-x-)2+…+(x n-x-)2]=1n[(x12+x22+…+x n2)-n x2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.(2)数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则反映一组数据围绕平均数波动的大小.8.两个变量的线性相关(1)散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图.利用散点图可以判断变量之间有无相关关系.(2)正相关、负相关如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.9.回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.(1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程的求法——最小二乘法.设具有线性相关关系的两个变量x、y的一组观察值为(x i,y i)(i=1,2,…,n),则回归直线方程y^=a^+b^x的系数为:⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧ b ^=∑i =1n x i y i -n x ·y ∑i =1n x i 2-n x 2=∑i =1n (x i -x -)(y i -y -)∑i =1n (x i -x -)2a^=y --b ^x 其中x -=1n ∑i =1n x i ,y -=1n ∑i =1n y i ,(x -,y -)称作样本点的中心. a ^,b ^表示由观察值用最小二乘法求得的a ,b 的估计值,叫回归系数.10.独立性检验(1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量.(2)两个分类变量X 与Y 的频数表,称作2×2列联表.二.随机事件的概率1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件.(1)在条件S 下,一定会发生的事件叫做相对于条件S 的必然事件.(2)在条件S 下,一定不会发生的事件叫做相对于条件S 的不可能事件.(3)必然事件与不可能事件统称为确定事件.(4)在条件S 下可能发生也可能不发生的事件,叫做随机事件.(5)确定事件和随机事件统称为事件,一般用大写字母,,,A B C 表示. 2.频率与概率(1)在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数A n 为事件A 出现的频数,称事件A 出现的比例()A n n f A n=为事件A 出现的频率. (2)对于给定的随机事件A ,如果随着试验次数的增加,事件A 发生的频率()n f A 稳定在某个常数上,把这个常数记作()p A ,称为事件A 的概率,简称为A 的概率.3.互斥事件与对立事件互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即A B 为不可能事件(A B φ=),则称事件A 与事件B 互斥,其含义是:事件A 与事件B 在任何一次试验中不会同时发生.一般地,如果事件12,,,n A A A 中的任何两个都是互斥的,那么就说事件12,,,n A A A 彼此互斥.对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即A B 为不可能事件,而A B 为必然事件,那么事件A 与事件B 互为对立事件,其含义是:事件A 与事件B 在任何一次试验中有且仅有一个发生.互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.两个事件互斥是两个事件对立的必要非充分条件.4.事件的关系与运算 B 或A B +) B (或AB ) B 为不可能事件B φ= B 为不可能事件B 为必然事件与事件B 互为对立事件 B φ=且B =Ω5.随机事件的概率事件A 的概率:在大量重复进行同一试验时,事件A 发生的频率nm 总接近于某个常数,在它附近摆动,这时就把这个常数叫做事件A 的概率,记作()p A . 由定义可知()01p A ≤≤,显然必然事件的概率是1,不可能事件的概率是0.5.概率的几个基本性质(1)概率的取值范围:()01p A ≤≤.(2)必然事件的概率:()1p A =.(3)不可能事件的概率:()0p A =.(4)互斥事件的概率加法公式:①()()()p A B p A p B =+(,A B 互斥),且有()()()1p A A p A p A +=+=. ②()()()()1212n n p A A A p A p A p A =+++ (12,,,n A A A 彼此互斥).(5)对立事件的概率:()()1P A P A =-.三.古典概型1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件A 由几个基本事件组成.如果一次试验中可能出现的结果有n 个,即此试验由n 个基本事件组成,而且所有结果出现的可能性都相等,那么每一基本事件的概率都是n 1.如果某个事件A 包含的结果有m 个,那么事件A 的概率P (A )=n m . 基本事件的特点(1)任何两个基本事件是互斥的.(2)任何事件都可以表示成基本事件的和(除不可能事件).2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型. ①试验中所有可能出现的基本事件只有有限个,即有限性.②每个基本事件发生的可能性相等,即等可能性.概率公式:P (A )=A 包含的基本事件的个数基本事件的总数.四.几何概型1.(1)随机数的概念:随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的.(2)随机数的产生方法①利用函数计算器可以得到0~1之间的随机数;②在Scilab 语言中,应用不同的函数可产生0~1或a~b 之间的随机数.2.几何概型(1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,则称这样的概率模型为为几何概率模型,简称几何概型.(2)特点:①无限性:在一次试验中,可能出现的结果有无限多个; ②等可能性:每个结果的发生具有等可能性.(3)几何概型的解题步骤:首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问题,与两个变量有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的问题,先确定试验的全部结果和事件A 构成的区域长度(角度、弧长等),最后代公式()p A =构成事件A 的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积;如果是二维、三维的问题,先设出二维或三维变量,再列出试验的全部结果和事件A 分别满足的约束条件,作出两个区域,最后计算两个区域的面积或体积代公式.(4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联系.3.几种常见的几何概型(1)设线段l 是线段L 的一部分,向线段L 上任投一点.若落在线段l 上的点数与线段L 的长度成正比,而与线段l 在线段l 上的相对位置无关,则点落在线段l 上的概率为:P=l 的长度/L 的长度(2)设平面区域g 是平面区域G 的一部分,向区域G 上任投一点,若落在区域g 上的点数与区域g 的面积成正比,而与区域g 在区域G 上的相对位置无关,则点落在区域g 上概率为:P=g 的面积/G 的面积(3)设空间区域上v 是空间区域V 的一部分,向区域V 上任投一点.若落在区域v 上的点数与区域v 的体积成正比,而与区域v 在区域v 上的相对位置无关,则点落在区域V 上的概率为:P=v 的体积/V 的体积。
高中数学概率统计知识点总结一、抽样方法1.简单随机抽样 2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法.3.系统抽样:K (抽样距离)=N (总体规模)/n (样本规模)4.分层抽样:二、样本估计总体的方式1、用样本的频率分布估计总体分布(1)频率分布直方图的画法;(2)频率的算法;(3)频率分布折线图;(4)总体密度曲线;(5)茎叶图。
化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
2、用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数的算法;(2)标准差、方差公式.3、样本均值:nx x x x n +++= 21 4、.样本标准差:n x x x x x x s s n 222212)()()(-++-+-==三、两个变量的线性相关1、正相关2、负相关正相关:自变量增加,因变量也同时增加(即单调递增) 负相关:自变量增长,因变量减少(即单调递减)四、概率的基本概念(1)必然事件(2)不可能事件(3)确定事件(4)随机事件(5)频数与频率(6)频率与概率的区别与联系必然事件和不可能事件统称为确定事件1他们都是统计系统各元件发生的可能性大小;2、频率一般是大概统计数据经验值,概率是系统固有的准确值; 3频率是近似值,概率是准确值4、频率值一般容易得到,所以一般用来代替概率进行定量分析,首先要知道系统各元件发生故障的频率或概率.事件的频率与概率是度量事件出现可能性大小的两个统计特征数.频率是个试验值,或使用时的统计值,具有随机性,可能取多个数值。
因此,只能近似地反映事件出现可能性的大小概率是个理论值,是由事件的本质所决定的,只能取唯一值,它能精确地反映事件出现可能性的大小虽然概率能精确反映事件出现可能性的大小,但它通过大量试验才能得到,这在实际工作中往往是难以做到的.所以,从应用角度来看,频率比概率更有用,它可以从所积累的比较多的统计资料中得到需要指出的是用频率代替概率,并不否认概率能更精确、更全面地反映事件出现可能性的大小,只是由于在目前的条件下,取得概率比取得频率更为困难。
高中数学系统抽样教案
教学目标:
1. 理解系统抽样的概念和原理。
2. 掌握系统抽样的方法和步骤。
3. 能够运用系统抽样进行统计调查。
教学重点:
1. 理解系统抽样的概念和方法。
2. 掌握系统抽样的步骤。
教学难点:
1. 理解系统抽样和随机抽样的区别。
2. 运用系统抽样进行具体问题的解决。
教学准备:
1. 讲义、课件、黑板、彩色笔。
2. 学生配备纸和笔。
教学过程:
一、导入
老师简要介绍抽样的概念和在统计学中的应用,引入系统抽样的概念。
二、讲解
1. 介绍系统抽样的定义和原理。
2. 分析系统抽样与随机抽样的区别。
3. 详细讲解系统抽样的步骤和方法。
三、实例分析
老师通过实际例子演示系统抽样的具体操作过程,让学生理解系统抽样的实际应用。
四、练习
1. 学生自行完成一道系统抽样的练习题。
2. 老师随机抽取几位学生上台解答,帮助学生加深对系统抽样的理解。
五、总结
老师对系统抽样的概念、原理、步骤进行总结,并强调学生掌握系统抽样方法的重要性。
六、作业
布置系统抽样的作业,要求学生能够独立完成相关问题,并在下节课上交。
教学反思:
系统抽样是统计学中常用的一种抽样方法,它能够在一定程度上减少抽样误差,提高统计结果的准确性。
在教学中,要注重让学生理解系统抽样的原理和方法,引导他们能够熟练运用系统抽样进行实际问题的解决。
2.1.2 系统抽样[读教材·填要点]1.系统抽样的概念先将总体从1开始编号,然后按号码顺序以一定的间隔进行抽取,然后从号码为1~k 的第一个间隔中随机地抽取一个号码,然后按此间隔等距抽取即得所求样本.2.系统抽样的步骤一般地,假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本.[小问题·大思维]1.系统抽样有什么特点?提示:(1)适用于总体中个体数较大且个体差异不明显的情况.(2)剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;(3)是等可能抽样.每个个体被抽到的可能性相等.2.如何区分一种抽样方法是系统抽样还是简单随机抽样?提示:(1)系统抽样的显著特点是抽出个体的编号是等距的.(2)简单随机抽样的间隔不是恒定的.系统抽样的概念[例1] A .从全班48名学生中随机抽取8人参加一项活动B .一个城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本C.从参加模拟考试的1 200名高中生中随机抽取100人分析试题作答情况D.从参加模拟考试的1 200名高中生中随机抽取10人了解某些情况[自主解答]A总体容量较小,样本容量也较小,可采用抽签法;B总体中的个体有明显的层次不适宜用系统抽样法;C总体容量较大,样本容量也较大,可用系统抽样法;D若总体容量较大,样本容量较小时可用随机数表法.[答案] C——————————————————1.应用系统抽样的前提条件(1)个体较多,但均衡的总体;(2)当总体容量较大,样本容量也较大时,适宜用系统抽样.2.系统抽样方法的判断(1)看能否保证每个个体被等可能抽到;(2)看是否将总体分成几个均衡的部分,是不是等间距抽样,且每一个部分都有个体入样.——————————————————————————————————————1.某商场想通过检查发票及销售记录的2%来快速估计每月的销售总额并采取如下方法:从某月发票的存根中随机抽一张,如15号,然后按顺序往后取出65号,115号,165号,…,将发票上的销售额组成一个调查样本.这种抽取样本的方法是() A.抽签法B.随机数表法C.系统抽样法D.其他方式的抽样解析:上述方法符合系统抽样的形式.答案:C系统抽样的应用[例2]50的样本,那么采用什么抽样方法比较恰当?简述抽样过程.[自主解答]适宜选用系统抽样,抽样过程如下:(1)随机地将这1 000名学生编号为000,001,002, (999)(2)将总体按编号顺序均分成50部分,每部分包括20个个体.(3)在第一部分的个体编号000,001,002,…,019中,利用简单随机抽样抽取一个号码,比如是017.(4)以017为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:017,037,057,…,977,997.若将“1 000名学生的成绩”改为“1 002名学生的成绩”,又该如何抽样?请写出抽样过程. 解:因为1 002=50×20+2,为了保证“等距”分段,应先剔除2人.(1)将1 002名学生用随机方式编号;(2)从总体中剔除2人(剔除方法可用随机数法),将剩下的1 000名学生重新编号(编号分别为000,001,002,…,999),并分成50段;(3)在第一段000,001,002,…,019这二十个编号中用简单随机抽样抽出一个(如003)作为起始号码;(4)将编号为003,023,043,…,983的个体抽出,组成样本.——————————————————1.解决系统抽样问题中两个关键的步骤为(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.2.当总体中的个体不能被样本容量整除时,需要在总体中剔除一些个体.——————————————————————————————————————2.某单位的在岗职工为620人,为了调查上班时,从家到单位的路上平均所用的时间,决定抽取10%的职工调查这一情况,如何采用系统抽样抽取样本?解:用系统抽样抽取样本,样本容量是620×10%=62.步骤是:(1)编号:把这620人随机编号为001,002,003, (620)(2)确定分段间隔k =62062=10,把620人分成62组,每组10人,每1组是编号为001~010的10人,第2组是编号为011~020的10人,依次下去,第62组是编号为611~620的10人.(3)采用简单随机抽样的方法,从第1组10人中抽出一人,不妨设编号为l (1≤l ≤10).(4)那么抽取的职工编号为l+10k(k=0,1,2,…,61),得到62个个体作为样本,如当l =3时的样本编号为003,013,023,…,603,613.从2 004名同学中,抽取一个容量为20的样本,写出用系统抽样法抽取的步骤.[错解](1)将2 004名同学随机方式编号;(2)从总体中剔除4名同学,将剩下的分成20段;(3)在第一段中用简单随机抽样抽取起始号码,比如66;(4)将编号为66,166,266,366,…,1 866,1 966作为样本.[错因]在第二步剔除4名同学后没有对剩余进行从0 000,0 001,…,1 999重新编号.[正解](1)采用随机的方式给这2 004名同学编号为0 001,0 002,…,2 004.(2)利用简单随机抽样剔除4个个体,并对剩余的2 000个个体重新编号为0 001,0 002,…,2 000.(3)分段.由于20∶2 000=1∶100,故将总体分为20个部分,其中每一部分100个个体.(4)在第1部分随机抽取1个号码,比如0 066号.(5)从第0 066号起,每隔100个抽取1个号码,这样得到容量为20的样本:0 066,0 166,0 266,0 366,0 466,0 566,0 666,0 766,0 866,0 966,1 066,1 166,1 266,1 366,1 466,1 566,1 666,1 766,1 866,1 966.1.在10 000个有机会中奖的号码(编号为0 000~9 999)中,有关部门按照随机抽样的方式确定后两位数字是68的号码为中奖号码.这是运用哪种抽样方法来确定中奖号码的()A.抽签法B.系统抽样法C.随机数表法D.其他抽样方法解析:由题意,中奖号码分别为0 068,0 168,0 268,…,9 968.显然这是将10 000个中奖号码平均分成100组,从第一组号码中抽取出0 068号,其余号码是在此基础上加上100的整数倍得到的,可见,这是用的系统抽样法.答案:B2.用系统抽样的方法从个体为1 003的总体中,抽取一个容量为50的样本,在整个抽样过程中每个个体被抽到的可能性是( )A.11 000B.11 003C.501 003D.120解析:根据系统抽样的方法可知,每个个体入样的可能性相同,均为n N,所以每个个体入样的可能性是501 003. 答案:C3.(2012·山东高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15解析:从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n 组抽到的号码为a n =9+30(n -1)=30n -21,由451≤30n -21≤750,得23615≤n ≤25710,所以n =16,17,…,25,共有25-16+1=10人. 答案:C4.采用系统抽样从含有8 000个个体的总体(编号为0 000,0 001,…,7 999)中抽取一个容量为50的样本.已知最后一个入样的编号为7 894,则第一个入样的编号是________.解析:样本间隔k =8 00050=160.最后一个编号为7 894,则7 894-49×160=54,所以第一个入样编号为0 054.答案:0 0545.下列抽样中,是系统抽样的是________(填上所有是系统抽样的序号).①电影院调查观众的某一指标,通知每排(每排人数相等)座号为16的观众留下来座谈;②搞某一市场调查,规定在商场门口随机抽一人询问,直到调查到规定的人数为止;③工厂生产的产品,用传送带将产品送入包装车间,质检人员从传送带上每隔5分钟抽取一件产品进行检验;④从标有1~15的15个球中,任选3个作样本,按从小到大的顺序排列,随机选起点i 0,以后i 0+5,i 0+10(超过15则从1再数起)号入样.解析:由系统抽样步骤可知,①③④符合要求.答案:①③④6.为了了解某地区今年高一学生期末考试数学科的成绩,拟从参加考试的15 000名学生的数学成绩中抽取容量为150的样本.请用系统抽样写出抽取过程.解:(1)将参加考试的15 000名学生随机地编号:1,2,3,…,15 000.(2)分段:由于样本容量与总体容量的比是1∶100,我们将总体平均分为150个部分,其中每一部分包括100个个体.(3)在第一部分,即1号到100号用简单随机抽样,抽取一个号码,比如是56.(4)以56作为起始数,然后顺次抽取156,256,356,…,14 956,这样就得到一个容量为150的样本.一、选择题1.有40件产品,编号从1至40,现在从中抽取4件检验,用系统抽样方法确定所抽的编号为()A.5,10,15,20B.2,12,22,32C.2,14,28,38 D.5,8,31,36答案:B2.中央电视台“动画城节目”为了对本周的热心小观众给予奖励,要从已确定编号的一万名小观众中抽出十名幸运小观众.现采用系统抽样的方法抽取,每组容量为() A.10 B.100C.1 000 D.10 000答案:C3.为了了解一次期终考试的1 253名学生的成绩,决定采用系统抽样方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是()A.2 B.3C.4 D.5解析:1 253÷50=25…3,故剔除3个.答案:B4.从2 004名学生中选取50名组成参观团,若采用下面的方法选取:先利用简单随机抽样从2 004人中剔除4人,剩下的2 000人再按系统抽样的方法进行,则每人入选的机会()A .不全相等B .均不相等C .都相等D .无法确定解析:系统抽样是等可能的,每人入样的机率均为502 004. 答案:C二、填空题5.一个总体中共有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样的方法抽取一个容量为10的样本,规定:如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码的个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是________.解析:本题的入手点在于题设中的“第k 组中抽取的号码的个位数字与m +k 的个位数字相同”.由题设可知:第7组的编号为60,61,62,63,…,69,而第7组中抽取的号码的个位数字与6+7=13的个位数字相同,故第7组抽取的号码是63.答案:636.(2011·罗源高一检测)为了了解1 203名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,现采用选取的号码间隔一样的系统抽样方法来确定所选取样本,则抽样间隔k =________.解析:由于1 20340不是整数,所以从1 203名学生中随机剔除3名,则分段间隔k =1 20040=30.答案:407.某班有学生48人,现用系统抽样的方法,抽取一个容量为4的样本,已知座位号分别为6,30,42的同学都在样本中,那么样本中另一位同学的座位号应该是________.解析:由题意,分段间隔k =484=12,所以6应该在第一组,所以第二组为6+484=18. 答案:188.已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第六十一组抽出的号码为________.解析:分段间隔是3 000150=20,由于第一组抽出号码为11,则第61组抽出号码为11+(61-1)×20=1 211.答案:1 211三、解答题9.要装订厂平均每小时大约装订图书362册,需要检验员每小时抽取40册图书,检验其质量状况,请你设计一个抽样方案.解:第一步,把这些图书分成40个组,由于36240的商是9,余数是2,所以每个小组有9册书,还剩2册书.这时抽样距就是9.第二步,先用简单随机抽样的方法从这些书中抽取2册,不进行检验.第三步,将剩下的书进行编号,编号分别为0,1, (359)第四步,从第一组(编号为0,1,…,8)的书中用简单随机抽样的方法,抽取1册书,比如说,其编号为k .第五步,顺次抽取编号分别为下面数字的书:k ,k +9,k +18,k +27,…,k +39×9.这样总共就抽取了40个样本.10.下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:本村人口:1 200人,户数300,每户平均人口数4人;应抽户数:30户;抽样间隔:1 20030=40; 确定随机数字:取一张人民币,编码的后两位数为12;确定第一样本户:编码的后两位数为12的户为第一样本户;确定第二样本户:12+40=52,52号为第二样本户;……(1)该村委采用了何种抽样方法?(2)抽样过程中存在哪些问题,并修改.(3)何处是用简单随机抽样.解:(1)系统抽样.(2)本题是对某村各户进行抽样,而不是对某村人口抽样,抽样间隔为:30030=10,其他步骤相应改为:取一张人民币,编码的后两位数为02(或其他00~09中的一个),确定第一样本户:编号为02的户为第一样本户;确定第二样本户:02+10=12,12号为第二样本户,….(3)确定随机数字用的是简单随机抽样即为取一张人民币,编码的后两位数为02.。
系统抽样判断题①系统抽样在起始部分抽样时采用简单随机抽样.( )②系统抽样时总体中的每个个体被剔除的机会均等.( )不是整数时,剔除多余的个体会影响抽样的公平性.( )③用系统抽样抽取样本,当Nn④全班54个人,若采用系统抽样的方法从中选取3人,则每个学生被抽到的可能性为1.( )18⑤搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止,是系统抽样.( )系统抽样的应用1.一个年级有12个班,每个班的同学从1至50排学号,为了交流学习经验,要求每班学号为14的同学留下进行交流,这里运用的是( )A.系统抽样B.分层抽样C.抽签法D.随机数表法2.我校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法,抽取4个班进行调查,若抽到的编号之和为48,则抽到的最小编号为( )A.2B.3C.4D.5思路点拨求出抽样的间隔,设抽到的最小编号为x,根据编号的和为48列方程求解即可.3.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A.50B.40C.25D.20思路点拨根据系统抽样的定义确定分段的间隔.4.采用系统抽样的方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,若抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为.思路点拨先确定分段的间隔,再求出编号分别落在区间[1,450]和[451,750]的人数,最后确定做问卷C 的人数.题组一系统抽样及系统抽样的特点1.某会议室有50排座位,每排有30个座位.一次报告会坐满了听众.会后留下座号为15的所有听众50人进行座谈.这是运用了( )A.抽签法B.随机数表法C.系统抽样D.有放回抽样2.下列抽样中,最适宜用系统抽样的是( )A.从某厂生产的15件产品中随机抽取5件入样B.从某厂生产的1 000件产品中随机抽取10件入样C.从某厂生产的1 000件产品中随机抽取100件入样D.某市的4个区共有2 000名学生,这4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样3.为调查某产品的销售情况,销售部门从下属的92家连锁店中用系统抽样的方法抽取了30家进行调查,那么剔除的个体数为( )A.2B.3C.4D.54.某厂将从64名员工中用系统抽样的方法抽取4名参加2015年职工劳技大赛,将这64名员工编号为1~64,若已知编号为8、24、56的员工在样本中,那么样本中另外一名员工的编号是.题组二系统抽样的应用5.为了解1 200名学生对学校教改实验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为( )A.40B.30C.20D.126.某客运公司为了了解客车的耗油情况,现采用系统抽样的方法按1∶10的比例抽取一个样本进行检测,将200辆客车依次编号为1,2,…,200,则其中抽取的4辆客车的编号可能是( )A.3,23,63,102B.31,61,87,127C.103,133,153,193D.57,68,98,1087.将参加数学夏令营的100名同学编号为001,002,…,100.现采用系统抽样方法抽取一个容量为25的样本,且第一段中随机抽得的号码为004,则在046至078号中,被抽中的人数为.8.一个总体中的100个个体的号码分别为0,1,2,…,99,依次将其均分为10个小组.要用系统抽样的方法抽取一个容量为10的样本,规定:如果在第1组(号码为0~9)中随机抽取的号码为m,那么依次错位地得到后面各组的号码,即第k 组中抽取的号码的个位数字为m+k-1或m+k-11(如果m+k≥11).若第6组中抽取的号码为52,则m= .9.某单位有在岗职工共624人,为了调查职工用于上班途中的时间,决定抽取68名职工进行调查.如何采用系统抽样的方法完成这一抽样?模拟(时间:30分钟;分值:35分)一、选择题(每小题5分,共25分)1.有20位同学,编号从1至20,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽取的编号为( )A.5,10,15,20B.2,6,10,14C.2,4,6,8D.5,8,11,142.从2 010名学生中选50人组成参观团,先用简单随机抽样方法剔除10人,再将其余2 000人从0到1999编号,按等距系统抽样方法选取,若第一组采用抽签法抽到的号码是30,则最后一组入选的号码是( )A.1 990B.1 991C.1 989D.1 9883.从2 008名学生中选取50名学生参加数学竞赛,若采用下面的方法选取:先用简单随机抽样从2 008人中剔除8人,剩下的2 000人再按系统抽样的方法抽取50人,则在2 008人中,每人入选的概率( )A.不全相等B.均不相等C.都相等,且为251004D.都相等,且为1404.为了解2 000名学生对学校食堂的意见,准备从中抽取一个容量为50的样本.若采用系统抽样,则分段间隔k 为( )A.20B.30C.40D.50 5.高三(1)班有学生52人,现将所有学生随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号,31号,44号学生在样本中,则样本中还有一个学生的编号是( )A.8B.13C.15D.18二、填空题(每小题5分,共10分)6.一个总体的60个个体的编号为0,1,2,3,…,59,现采用系统抽样的方法从中抽取一个容量为10的样本,请根据编号被6除余数为3的方法抽取样本,则抽取的样本中最大的一个号码为.7.某校为了了解参加某次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么从总体中应随机剔除的个体数目为.知识清单①很大 ②一个个体 ③等距抽样①√ ②√ ③× ④√ ⑤×1.A 把每个班级学生从1到50号编排,要求每班编号为14的同学留下进行交流,这样选出的样本是采用系统抽样的方法,故选A.2.B 抽样的间隔为244=6.设抽到的最小编号为x,则x+(6+x)+(12+x)+(18+x)=48,所以x=3.故选B.3.C 由系统抽样的定义知,分段间隔为1 00040=25.故答案为C. 4.答案 7解析 根据系统抽样的方法知分段的间隔为30,所以编号落入区间[1,450]的有15人, 编号落入区间[451,750]的有10人,所以做问卷C 的人数为32-15-10=7.基础过关1.C2.C C 总体容量大,个体无明显差异,样本容量较大,适宜用系统抽样,故选C.3.A 由92=3×30+2可知,应剔除2个个体,故选A.4.答案 40解析 由系统抽样的知识知,将64名员工对应的编号分成4组,每组16个号码,由题意8、24、56在样本中,知8、24、56分别是从第1,2,4组中抽取的,则第3组中抽取的号码是8+2×16=40.5.A ∵1 20030=40,∴分段的间隔k 为40.故选A.6.C 由于抽样比为110,所以共抽取110×200=20(辆).将200辆客车对应的编号分成20段,每段10个,从第一段(编号为1~10)中抽取一个号码l,则所抽取的号码为l,10+l,20+l,…,190+l,故所有抽取的号码的个位数字相同.故选C.7.答案 8解析 分段间隔为4,第一个号码为004,故001~100中是4的整数倍的号码被抽出,在046至078号中有048,052,056,060,064,068,072,076,共8个.8.答案 7解析 当k=6时,m+6-1=2或m+6-11=2(m+6≥11),解得m=-3(舍)或m=7(m+6≥11),故m=7.9.解析 抽样过程如下:S1 将624名职工用随机方式编号;S2 剔除12人(剔除方法可用随机数表法),将剩下的612名职工重新编号(分别为000,001,002,…,611),并均分成68段;S3 在第一段000,001,002,…,008这九个编号中用简单随机抽样抽出一个(如003)作为起始号码; S4 将编号为003,012,021,…,606的个体抽出,组成样本.模拟一、选择题1.A 根据题意知抽取间隔为20÷4=5,只有A 满足条件,故选A.2.A 抽样间隔为2 000÷50=40,若第一组采用抽签法抽到的号码是30,则最后一组入选的号码是30+49×40=1 990,故选A.3.C ∵在系统抽样中,若所给的总体的个体数不能被样本容量整除,则要先剔除几个个体,然后再分组,在剔除过程中,每个个体被剔除的概率相等,∴每个个体被抽到的概率为502 008=251 004,故选C.4.C 2 00050=40,故分段间隔k 为40.5.D 44-31=13,5+13=18.二、填空题6.答案 57解析 由题意知,抽取的第一个号码为3,抽样间隔为6,∴抽取的10个号码依次为:3,9,15,21,27,33,39,45,51,57,∴抽取的样本中最大的一个号码为57.7.答案 2解析 因为1 252=50×25+2,所以应随机剔除2个个体.。
教材习题研讨(系统抽样)
[教材习题研讨]
P 49 练习 方法点拨
1.答案:系统抽样适用于总体个体数目较多的情况,操作方便,每个个体被抽到的机会相等,当总体不是由差异明显的几部分组成时,得到的样本质量较高.当总体是由差异明显的几部分组成时,所得样本对于总体的代表性不能保证,此时宜采用其他抽样方法.
类比简单随机抽样,结合系统抽样的概念和步骤来分析阐述.样本对于总体的代表性是关键.
2.答案:由题意得N =118,n =16,
(1)随机将118名教师编号1,2,3, (118)
(2)因为 16118Z ,所以先用简单随机抽样(可用随机数表法)从总体中剔除6个个体;
(3)再重新编号1,2,3, (112)
(4)取k =16112=7,将总体分成16段; (5)在第一段用简单随机抽样抽取一个号码l (如l =3); (6)将l 加上间隔k 得到第2个个体编号(l +7),再加k 得到
第3个个体编号(l +14),依次进行下去,直到获得整个样本(如
编号:3,10,17,…,108).
依据概念和步骤,结合实际,具体情况具体分析. 当n
N 不是整数时,需剔除并补齐编号;第一段抽取个体时用简单随机抽样.每个个体被抽到的机会相等是样本代表性的保证,这就要求样
本的抽取具有随机性. 3.答案:这样得到的样本的代表性不能保证,因为身份证号码均有具体意义,不具有随机性且不连续(如末位数男的是奇数,女的是偶数),同时老年人,青年人,儿童对于调查内容存在明显
差异. 随机性是样本对于总体代表性的保证.。
【知识梳理】1.系统抽样的概念要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.2.系统抽样的步骤【常考题型】题型一、系统抽样的概念【例1】 (1)某商场欲通过检查部分发票及销售记录来快速估计每月的销售金额,采用如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序将65号,115号,165号,…,发票上的销售金额组成一个调查样本.这种抽取样本的方法是( )A .抽签法B .随机数法C .系统抽样法D .以上都不对(2)为了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k =________.[解析] (1)上述抽样方法是将发票平均分成若干组,每组50张,从第一组抽出了15号,以后各组抽15+50n (n ∈N *)号,符合系统抽样的特点.(2)根据样本容量为30,将1 200名学生分为30段,每段人数即间隔k =1 20030=40. [答案] (1)C (2)40【类题通法】系统抽样的判断方法判断一个抽样是否为系统抽样:(1)首先看是否在抽样前知道总体是由什么组成,多少个个体,(2)再看是否将总体分成几个均衡的部分,并在每一个部分中进行简单随机抽样,(3)最后看是否等距抽样.【对点训练】某影院有40排座位,每排有46个座位,一个报告会上坐满了听众,会后留下座号为20的所有听众进行座谈,这是运用了( )A .抽签法B .随机数表法C .系统抽样法D .放回抽样法解析:选C 此抽样方法将座位分成40组,每组46个个体,会后留下座号为20的相当于第一组抽20号,以后各组抽取20+46n ,符合系统抽样特点.题型二、系统抽样的设计【例2】 (1)某初级中学领导采用系统抽样方法,从该校预备年级800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k =80050=16,即每16人抽取一个人.在1~16中随机抽取一个数,如果抽到的是7,则从33~48这16个数中应取的数是________.[解析] ∵采用系统抽样方法,每16人抽取一个人,1~16中随机抽取一个数抽到的是7,∴在第k 组抽到的是7+16(k -1),∴从33~48这16个数中应取的数是7+16×2=39.[答案] 39(2)某企业对新招的504名员工进行岗前培训,为了了解员工的培训情况,试用系统抽样的方法按照下列要求抽取员工,请你写出具体步骤.①从中抽取8名员工,了解基本理论的掌握情况.②从中抽取50名员工,了解实际操作的掌握情况.[解] ①第一步,将504名员工随机编号,依次为001,002,003,…,503,504,将其等距分成8段,每一段有63个个体;第二步,在第一段(001~063)中用简单随机抽样方法随机抽取一个号码作为起始号码,比如26号;第三步,起始号+间隔的整数倍,确定各个个体:将编号为26,26+63,26+63×2,…,26+63×7的个体抽出组成样本.②第一步,用随机方式给每个个体编号:001,002,003,…,503,504;第二步,利用随机数表法剔除4个个体,比如剔除编号为004,135,069,308的4个个体,然后再对余下的500名员工重新编号,分别为001,002,003,…,499,500,并等距分成50段,每段10个个体;第三步,在第一段001,002,003,…,010中用简单随机抽样方法抽出一个号码(如006)作为起始号码;第四步,起始号+间隔的整数倍,确定各个个体,将编号为006,016,026,…,486,496的个体抽出组成样本.【类题通法】设计系统抽样应关注的几个问题(1)系统抽样一般是等距离抽取,适合总体中个体数较多,个体无明显差异的情况;(2)总体均匀分段,通常在第一段(也可以选在其他段)中采用简单随机抽样的方法抽取一个编号,再通过将此编号加段距的整数倍的方法得到其他的编号.注意要保证每一段中都能取到一个个体;(3)若总体不能均匀分段,要将多余的个体剔除(通常用随机数表的方法),不影响总体中每个个体被抽到的可能性.【对点训练】某校高中二年级有253名学生,为了了解他们的视力情况,准备按1∶5的比例抽取一个样本,试用系统抽样方法进行抽取,并写出过程.解:(1)先把这253名学生编号000,001, (252)(2)用随机数表法任取出3个号,从总体中剔除与这三个号对应的学生.(3)把余下的250名学生重新编号1,2,3, (250)(4)分段.取分段间隔k=5,将总体均分成50段.每段含5名学生.(5)以第一段即1~5号中随机抽取一个号作为起始号,如l.(6)从后面各段中依次取出l+5,l+10,l+15,…,l+245这49个号.这样就按1∶5的比例抽取了一个样本容量为50的样本.题型三、简单随机抽样与系统抽样的综合问题【例3】某集团有员工1 019人,其中获得过国家级表彰的有29人,其他人员990人.该集团拟组织一次出国学习,参加人员确定为:获得过国家级表彰的人员5人,其他人员30人,如何确定人选?[解]获得过国家级表彰的人员选5人,适宜使用抽签法:其他人员选30人,适宜使用系统抽样法.(1)确定获得过国家级表彰的人员人选:①用随机方式给29人编号,号码为1,2, (29)②将这29个号码分别写在一个小纸条上,揉成小球,制成号签;③将得到的号签放入一个不透明的袋子中,搅拌均匀;④从袋子中逐个抽取5个号签,并记录上面的号码;⑤从总体中将与抽到的号签的号码相一致的个体取出,人选就确定了.(2)确定其他人员人选:第一步:将990名其他人员重新编号(分别为1,2,…,990),并分成30段,每段33人; 第二步,在第一段1,2,…,33这33个编号中用简单随机抽样法抽出一个(如3)作为起始号码; 第三步,将编号为3,36,69,…,960的个体抽出,人选就确定了.(1),(2)确定的人选合在一起就是最终确定的人选.【类题通法】系统抽样与简单随机抽样的区别和联系1.区别(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本;(2)系统抽样所得样本的代表性与具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈一定的周期性,可能会使抽样的代表性很差;(3)系统抽样的应用比简单随机抽样的应用更广泛,尤其是工业生产线上产品质量的检验,不知道产品的数量,因此不能用简单随机抽样.2.联系(1)将总体均分后的起始部分进行抽样时,采用的是简单随机抽样;(2)与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的;(3)与简单随机抽样一样是不放回的抽样;(4)总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.【对点训练】下面给出某村委会调查本村各户收入情况做的抽样,阅读并回答问题.本村人口数:1 200,户数300,每户平均人口数4人;应抽户数:30;抽样间隔:1 20030=40; 确定随机数字:取一张人民币,后两位数为12;确定第一样本户:编号12的户为第一样本户;确定第二样本户:12+40=52,52号为第二样本户……(1)该村委会采用了何种抽样方法?(2)抽样过程存在哪些问题,试修改.(3)何处是用简单随机抽样?解:(1)系统抽样.(2)本题是对某村各户进行抽样,而不是对某村人口抽样.抽样间隔30030=10,其他步骤相应改为确定随机数字:取一张人民币,末位数为2.(假设)确定第一样本户:编号02的住户为第一样本户;确定第二样本户:2+10=12,12号为第二样本户.(3)确定随机数字:取一张人民币,其末位数为2.【练习反馈】1.为了检查某城市汽车尾气排放执行情况,在该城市的主要干道上抽取车牌末尾数字为5的汽车检查,这种抽样方法为( )A .抽签法B .随机数表法C .系统抽样法D .其他方式的抽样解析:选C 符合系统抽样的特点.2.从已编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )A .5,10,15,20,25B .3,13,23,33,43C .1,2,3,4,5D .2,4,6,16,32 解析:选B 用系统抽样的方法抽取到的导弹编号应该为k ,k +d ,k +2d ,k +3d ,k +4d ,其中d =505=10,k 是1到10中用简单随机抽样方法得到的编号,因此只有选项B 满足要求. 3.将参加数学竞赛的1 000名同学编号如下:0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样方法分成50个部分,如果第1部分编号为0001,0002,…,0020,第1部分随机抽取的一个号码为0015,则抽取的第40个号码为________.解析:利用系统抽样的概念,若n 部分中在第1部分抽取的号码为m ,分段间隔为d ,则在第k 部分中抽取的第k 个号码为m +(k -1)d ,所以抽取的第40个号码为0 015+39×20=0 795.答案:0 7954.一个总体中有100个个体,随机编号0,1,2,…,99.依编号顺序平均分成10个组,组号依次为1,2,3,…,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为t ,则在第k 组中抽取的号码个位数字与t +k 的个位数字相同,若t =7,则在第8组中抽取的号码应该是________.解析:∵k =8,t =7,t +k =15,∴在第8组中抽取的号码是75.答案:755.为了了解某地区今年高一学生期末考试数学成绩,拟从参加考试的15 000名学生的数学成绩中抽取容量为150的样本.请写出用系统抽样抽取的过程.解:(1)对全体学生的数学成绩进行编号:1,2,3,…,15 000.(2)分段:由于样本容量与总体容量的比是1∶100,我们将总体平均分为150个部分,其中每一部分含100个个体.(3)在第一部分,即1号到100号用简单随机抽样抽取一个号码,比如是56.(4)以56作为起始数,然后顺次抽取156,256,356,…,14 956,这样就得到一个样本容量为150的样本.。
高二数学第一学期期中必背知识点:系统抽样知识点总结数学是利用符号语言研究数量、结构、变化以及空间模型等概念的一门学科。
小编准备了高二数学第一学期期中必背知识点,具体请看以下内容。
1.系统抽样(等距抽样或机械抽样):
把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)
前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
高中是人生中的关键阶段,大家一定要好好把握高中,编辑老师为大家整理的高二数学第一学期期中必背知识点,希望大家喜欢。
系统抽样方法1.系统抽样方法【知识点的认识】1.定义:一般地,要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.2.系统抽样的特征:(1)当总体容量N 较大时,适宜采用系统抽样;(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此系统抽样又称等距抽样,这里的푁间隔一般为k =[푛](3)在第一部分的抽样采用简单随机抽样;(4)每个个体被抽到的可能性相等3.系统抽样与简单随机抽样的关系:(1)系统抽样是建立在简单随机抽样的基础之上的,当将总体均分后对每一部分进行抽样时,采用的是简单随机抽样;(2)系统抽样和简单随机抽样都是等概率抽样,它是公平的.4.系统抽样与简单随机抽样的优缺点:(1)当总体的个体数较大时,用系统抽样比用简单随机抽样更易实施,更节约成本;(2)系统抽样比简单随机抽样应用范围更广;(3)系统抽样所得到的样本的代表性和个体的编号有关,而简单随机抽样所得到的样本的代表性与编号无关,如果编号的特征随编号的变化呈一定的周期性,可能造成系统抽样的代表性很差.【解题方法点拨】系统抽样的一般步骤:(1)编号:采用随机的方式将总体中的个体编号;(2)分段:确定分段间隔k,对编号进行分段(N 为总体个数,n 为样本容量):푁①当푛∈푍时,k =푁푛,1/ 3푁②当푛∉푍时,通过从总体中剔除一些个体,使剩下的总体中的个体数N′能被n 整除,这时k =푁′푛(注意这时要重新编号 1﹣N′后,才能再分段)(3)确定起始编号:在第一段用简单随机抽样确定起始的个体编号l(l∈N,l≤k);(4)抽样:按事先确定的规则抽取样本,即l,l+k,l+2k,…,l+(n﹣1)k.【命题方向】1.考查系统抽样的定义例:某小礼堂有 25 排座位,每排有 20 个座位.一次心理讲座时礼堂中坐满了学生,讲座后为了了解有关情况,留下了座位号是 15 的 25 名学生进行测试,这里运用的抽样方法是()A.抽签法B.随机数表法C.系统抽样法D.分层抽样法分析:由题意可得,从第一排起,每隔 20 人抽取一个,所抽取的样本的间隔距相等,符合系统抽样的定义.解答:由题意可得,从第一排起,每隔 20 人抽取一个,所抽取的样本的间隔距相等,故属于系统抽样,故选C.点评:本题考查系统抽样的定义和方法,属于容易题.2.考查系统抽样的应用例:将参加夏令营的 100 名学生编号为 001,002,…,100.先采用系统抽样方法抽取一个容量为 20 的样本,若随机抽得的号码为 003,那么从 048 号到 081 号被抽中的人数是分析:根据系统抽样的定义,即可得到结论.解答:∵样本容量为 20,首个号码为 003,∴样本组距为 100÷20=5∴对应的号码数为 3+5(x﹣1)=5x﹣2,由 48≤5x﹣2≤81,得 10≤x≤16.6,即x=10,11,12,13,14,15,16,共 7 个,故答案为:7.点评:本题主要考查系统抽样的应用,利用系统抽样的定义建立号码关系是解决本题的关键,比较基础.2/ 33/ 3。