第二章 简单随机抽样
- 格式:pps
- 大小:1.04 MB
- 文档页数:62
第二章:统计 1、抽样方法:①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)注意:在N 个个体的总体中抽取出n 个个体组成样本, 每个个体被抽到的机会(概率)均为Nn。
2、总体分布的估计: ⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。
⑵茎叶图:①茎叶图适用于数据较少的情况, 从中便于看出数据的分布, 以及中位数、众位数等。
②个位数为叶, 十位数为茎, 右侧数据按照从小到大书写, 相同的数据重复写。
3、总体特征数的估计:⑴平均数:nx x x x x n++++=Λ321; 取值为n x x x ,,,21Λ的频率分别为n p p p ,,,21Λ, 则其平均数为n n p x p x p x +++Λ2211; 注意:频率分布表计算平均数要取组中值。
⑵方差与标准差:一组样本数据n x x x ,,,21Λ方差:212)(1∑=-=ni ix xns ;标准差:21)(1∑=-=ni ix xns注:方差与标准差越小, 说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。
⑶线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图, 判断线性相关关系 ③线性回归方程:a bx y +=∧(最小二乘法)1221ni i i ni i x y nx y b x nx a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑注意:线性回归直线经过定点),(y x 。
第三章:概率1、随机事件及其概率:⑴事件:试验的每一种可能的结果, 用大写英文字母表示;⑵必然事件、不可能事件、随机事件的特点; ⑶随机事件A 的概率:1)(0,)(≤≤=A P nmA P . 2、古典概型:⑴基本事件:一次试验中可能出现的每一个基本结果;⑵古典概型的特点: ①所有的基本事件只有有限个; ②每个基本事件都是等可能发生。
人教版高中数学必修三 第二章 统计2.1《随机抽样》知识梳理知识点一:简单随机抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧随机数法抽签法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.知识点二:系统抽样1.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k ,对编号进行分段.当N n(n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l(l ≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本.知识点三:简单随机抽样1.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.人教版高中数学必修三第二章统计2.1《随机抽样》跟踪检测一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是1 5B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .126.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,87.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A. 22,100x s +B. 22100,100x s ++C. 2,x sD. 2100,x s +9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④10.下列抽样实验中,最适宜用系统抽样的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B.某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.16712.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为()A.2个B.3个C.5个D.13个13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,614.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,5315.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,916.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. 18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.人.三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:60人进行更为详细的调查,应当怎样进行抽样?23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?2.1《随机抽样》跟踪检测解答一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况[答案] D2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量[答案] C3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对[答案] C[解析]按照一定的规律进行抽取为系统抽样.4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是15B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此 C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同[答案] A[解析] 无论采用哪种抽样,每个个体被抽到的概率相等.5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .12[答案] A[解析] 运动员共计98人,抽取比例为2898=27,因此男运动员56人中抽取16人.6.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,8[答案] C[解析] 由题意得x =15,16.8=51(9+15+10+y +18+24) y =8,选C. 7.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. 22,100x s + B. 22100,100x s ++ C. 2,x s D. 2100,x s +[答案] D[解析] 设增加工资后10位员工下月工资均值为'x ,方差为2's , 则平均数()()()12101'10010010010x x x x =++++⋅⋅⋅++⎡⎤⎣⎦ ()1210110010010x x x x =++++=+; ()()()222212101'100'100'100'10s x x x x x x ⎡⎤=+-++-+⋅⋅⋅++-⎣⎦ ()()()22221210110x x x x x x s ⎡⎤=-+-+⋅⋅⋅+-=⎣⎦.故选D . 9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④[答案] D10.下列抽样实验中,最适宜用系统抽样的是( )A .某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B .某厂生产的2 000个电子元件中随机抽取5个入样C .从某厂生产的2 000个电子元件中随机抽取200个入样D .从某厂生产的20个电子元件中随机抽取5个入样[答案] C[解析] A 中总体有明显层次,不适用系统抽样法;B 中样本容量很小,适宜用简单随机抽样法中的随机数法;D 中总体数很小,故适宜用抽签法,只有C 比较适用系统抽样法.11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93B.123C.137D.167[答案] C[解析] 由图可知该校女教师的人数为()11070%150160%7760137⨯+⨯-=+= 故选C12.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为( )A .2个B .3个C .5个D .13个[答案] A[考点]分层抽样方法[分析]由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x ,即可得出结论.解:由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x , ∴x=2,故选A .[点评]本题考查分层抽样,抽样过程中每个个体被抽到的可能性相同,这是解决抽样问题的依据,样本容量、总体个数、每个个体被抽到的概率,这三者可以做到知二求一.13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6[答案] D[解析]由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×4 20=8,40×820=16,40×520=10,40×320=6.14.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,53[答案] A[解析]样本中共有30个数据,中位数为4547462+=;显然样本中数据出现次数最多的为45,故众数为45;极差为68-12=56,故选A.15.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,9[答案] B[解析]各年龄段所选分别为20100×45=9,20100×25=5,20100×30=6.16.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36[答案] B[解析]设该单位老年职工有x人,从中抽取y人.则160+3x=430⇒x=90,即老年职工有90人,则90160=y32⇒y=18.故选B.二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. [答案]30[解析]由题意,知22+3+5×n=6,∴n=30.18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.[答案]760[解析]设该校女生人数为x,则男生人数为(1 600-x).由已知,2001 600×(1 600-x)-2001 600·x=10,解得x=760.故该校的女生人数是760人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.[答案] 5.7%[解析]∵990∶99 000=1∶100,∴普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).又∵100∶1 000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).∴3套或3套以上住房的家庭约有5 000+700=5 700(户).故5 700100 000=5.7%.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.[答案]3720[解析]由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为40200×100=20(人).21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.生活能否自理人数性别男女能178 278不能23 21人.[答案]60[解析]由表知500人中生活不能自理的男性比女性多2人,所以该地区15 000位老人生活不能自理的男性比女性多2×15 000500=60(人).三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 07260人进行更为详细的调查,应当怎样进行抽样?解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000,应取60×2 43512 000≈12(人);“喜爱”占4 56712 000,应取60×4 56712 000≈23(人);“一般”占3 92612 000,应取60×3 92612 000≈20(人);“不喜爱”占1 07212 000,应取60×1 07212 000≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k=62062=10,将总体分成62组,每组含10人.(5)从第一段,即为000到009号随机抽取一个号l.(6)按编号将l,10+l,20+l,…,610+l,共62个号码选出,这62个号码所对应的职工组成样本.24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?解:学生A的方法得到的样本不能够反映不上网的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B 的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )A. 0.4.3ˆ2yx =+ B. 2 2.4ˆy x =- C. 9ˆ2.5yx =-+ D. 0.3 4.4ˆy x =-+ [答案] A[解析] 变量x 与y 正相关,可以排除C,D;样本平均数代入可求这组样本数据的回归直线方程.∵变量x 与y 正相关,∴可以排除C,D;样本平均数3x =, 3.5y =,代入A 符合,B 不符合,故选A.。
诚西郊市崇武区沿街学校第二章统计本章教材分析现代社会是信息化的社会,数字信息随处可见,因此专门研究如何搜集、整理、分析数据的科学——统计学就备受重视.统计学是研究如何搜集、整理、分析数据的科学,它可以为人们制定决策提供根据.在客观世界中,需要认识的现象无穷无尽.要认识某现象的第一步就是通过观察或者者试验获得观测资料,然后通过分析这些资料来认识此现象.如何获得有代表性的观测资料并可以正确地加以分析,是正确地认识未知现象的根底,也是统计所研究的根本问题.本章主要介绍最根本的获取样本数据的方法,以及几种从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容.从义务教育阶段来看,统计知识的教学从小学到初中分为三个阶段,在每个阶段都要学习搜集、整理、描绘和分析数据等处理数据的根本方法,教学目的随着学段的升高逐渐进步.在义务教育阶段的统计与概率知识的根底上,课程标准要求通过实际问题及情境,进一步介绍随机抽样、样本估计总体、线性回归的根本方法,理解用样本估计总体及其特征的思想,体会统计思维与确定性思维的差异;通过实习作业,较为系统地经历数据搜集与处理的全过程,进一步体会统计思维与确定性思维的差异.本章教学时间是是约需7课时,详细分配如下〔仅供参考〕:随机抽样2.1.1简单随机抽样整体设计教学分析教材是以探究一批小包装饼干的卫生是否达标为问题导向,逐步引入简单随机抽样概念.并通过实例介绍了两种简单随机抽样方法:抽签法和随机数法.值得注意的是为了使学生获得简单随机抽样的经历,教学中要注意增加学生理论的时机.例如,用抽签法决定班里参加某项活动的代表人选,用随机数法从全年级同学中抽取样本计算平均身高等等.三维目的1.能从现实生活或者者其他学科中推出具有一定价值的统计问题,进步学生分析问题的才能.2.理解随机抽样的必要性和重要性,进步学生学习数学的兴趣.3.学会用抽签法和随机数法抽取样本,培养学生的应用才能.重点难点教学重点:理解随机抽样的必要性和重要性,用抽签法和随机数法抽取样本.教学难点:抽签法和随机数法的施行步骤.课时安排1课时教学过程导入新课抽样的方法很多,某个抽样方法都有各自的优越性与局限性,针对不同的问题应中选择适当的抽样方法.教师点出课题:简单随机抽样.推进新课新知探究提出问题(1)在1936年美国总统选举前,一份颇有名气的杂志(LiteraryDigest)的工作人员做了一次民意测验.调查兰顿(ndon)(当时任堪萨斯州州长)和罗斯福(F.D.Roosevelt)(当时的总统)中谁将中选下一届总统.为了理解公众意向,调查者通过簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年和汽车只有少数富人拥有).通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜.实际选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:你认为预测结果出错的原因是什么?由此可以总结出什么教训?〔2〕假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进展卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本.那么,应当怎样获取样本呢?〔3〕请总结简单随机抽样的定义.讨论结果:(1)预测结果出错的原因是:在民意测验的过程中,即抽取样本时,抽取的样本不具有代表性.1936年拥有和汽车的美国人只是一小部分,那时大部分人还很穷.其调查的结果只是富人的意见,不能代表穷人的意见.由此可以看出,抽取样本时,要使抽取出的样本具有代表性,否那么调查的结果与实际相差较大.(2)要对这批小包装饼干进展卫生达标检查,只能从中抽取一定数量的饼干作为检验的样本,用样本的卫生情况来估计这批饼干的卫生情况.假设对这批饼干全部检验,那么费时费力,等检查完了,这批饼干可能就超过保质期了,再就是会破坏这批饼干的质量,导致无法出售.获取样本的方法是:将这批小包装饼干,放入一个不透明的袋子中,搅拌均匀,然后不放回地摸取〔这样可以保证每一袋饼干被抽到的可能性相等〕,这样就可以得到一个样本.通过检验样本来估计这批饼干的卫生情况.这种抽样方法称为简单随机抽样.(3)一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),假设每次抽取时总体内的各个个体被抽到的时机都相等,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样方法有两种:抽签法和随机数法.提出问题(1)抽签法是大家最熟悉的,也许同学们在做某种游戏,或者者者选派一部分人参加某项活动时就用过抽签法.例如,高一(2)班有45名学生,现要从中抽出8名学生去参加一个座谈会,每名学生的时机均等.我们可以把45名学生的学号写在小纸片上,揉成小球,放到一个不透明袋子中,充分搅拌后,再从中逐个抽出8个号签,从而抽出8名参加座谈会的学生.请归纳抽签法的定义.总结抽签法的步骤.(2)你认为抽签法有什么优点和缺点?当总体中的个体数很多时,用抽签法方便吗?(3)随机数法是利用随机数表或者者随机骰子或者者计算机产生的随机数进展抽样.我们仅学习随机数表法即利用随机数表产生的随机数进展简单随机抽样的方法.怎样利用随机数表产生样本呢下面通过例子来说明.假设我们要考察某公司消费的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进展检验.利用随机数表抽取样本时,可以按照下面的步骤进展.第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数.例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行.)16227794394954435482173793237887352096438426349164 84421753315724550688770474476721763350258392120676 63016378591695556719981050717512867358074439523879 33211234297864560782524207443815510013429966027954 57608632440947279654491746096290528477270802734328第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉.按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出.这样我们就得到一个容量为60的样本.请归纳随机数表法的步骤.(4)当N=100时,分别以0,3,6为起点对总体编号,再利用随机数表抽取10个号码.你能说出从0开始对总体编号的好处吗?(5)请归纳随机数表法的优点和缺点.讨论结果:(1)一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.抽签法的步骤是:1°将总体中个体从1—N编号;2°将所有编号1—N写在形状、大小一样的号签上;3°将号签放在一个不透明的容器中,搅拌均匀;4°沉着器中每次抽取一个号签,并记录其编号,连续抽取n次;5°从总体中将与抽取到的签的编号相一致的个体取出.(2)抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,假设标号的签搅拌得不均匀,会导致抽样不公平.因此说当总体中的个体数很多时,用抽签法不方便.这时用随机数法.(3)随机数表法的步骤:1°将总体中个体编号;2°在随机数表中任选一个数作为开始;3°规定从选定的数读取数字的方向;4°开始读取数字,假设不在编号中,那么跳过,假设在编号中那么取出,依次取下去,直到取满为止;5°根据选定的号码抽取样本.(4)从0开始编号时,号码是00,01,02,…,99;从3开始编号时,号码是003,004,…,102;从6开始编号时,号码是006,007,…,105.所以以3,6为起点对总体编号时,所编的号码是三位,而从0开始编号时,所编的号码是两位,在随机数表中读数时,读取两位比读取三位要时,所以从0开始对总体编号较好.(5)综上所述可知,简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.但是,假设总体中的个体数很多时,对个体编号的工作量太大,即使用随机数表法操作也并不方便快捷.另外,要想“搅拌均匀〞也非常困难,这就容易导致样本的代表性差.应用例如例1某车间工人加工一种轴一一共100件,为了理解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?分析:简单随机抽样有两种方法:抽签法和随机数表法,所以有两种思路.解法一〔抽签法〕:①将100件轴编号为1,2, (100)②做好大小、形状一样的号签,分别写上这100个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④逐个抽取10个号签;⑤然后测量这10个号签对应的轴的直径的样本.解法二〔随机数表法〕:①将100件轴编号为00,01,…99;②在随机数表中选定一个起始位置,如取第22行第1个数开始(见教材附录1:随机数表);③规定读数的方向,如向右读;④依次选取10个为68,34,30,13,70,55,74,77,40,44,那么这10个号签相应的个体即为所要抽取的样本.点评:此题主要考察简单随机抽样的步骤.抽签法的关键是为了保证每个个体被抽到的可能性相等而必须搅拌均匀,当总体中的个体无差异,并且总体容量较小时,用抽签法;用随机数表法读数时,所编的号码是几位,读数时相应地取连续的几个数字,当总体中的个体无差异,并且总体容量较多时,用抽签法.变式训练1.以下抽样的方式属于简单随机抽样的有____________.〔1〕从无限多个个体中抽取50个个体作为样本.〔2〕从1000个个体中一次性抽取50个个体作为样本.〔3〕将1000个个体编号,把号签放在一个足够大的不透明的容器内搅拌均匀,从中逐个抽取50个个体作为样本.〔4〕箱子里一一共有100个零件,从中选出10个零件进展质量检验,在抽样操作中,从中任意取出一个零件进展质量检验后,再把它放回箱子.〔5〕福利彩票用摇奖机摇奖.解析:〔1〕中,很明显简单随机抽样是从有限多个个体中抽取,所以〔1〕不属于;〔2〕中,简单随机抽样是逐个抽取,不能是一次性抽取,所以〔2〕不属于;很明显〔3〕属于简单随机抽样;〔4〕中,抽样是放回抽样,但是简单随机抽样是不放回抽样,所以〔4〕不属于;很明显〔5〕属于简单随机抽样.答案:〔3〕〔5〕2.要从某厂消费的30台机器中随机抽取3台进展测试,写出用抽签法抽样样本的过程.分析:由于总体容量和样本容量都较小,所以用抽签法.解:抽签法,步骤:第一步,将30台机器编号,号码是01,02, (30)第二步,将号码分别写在一张纸条上,揉成团,制成号签.第三步,将得到的号签放入不透明的袋子中,并充分搅匀.第四步,从袋子中依次抽取3个号签,并记录上面的编号.第五步,所得号码对应的3台机器就是要抽取的样本.例2人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?解:简单随机抽样的本质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样.点评:判断简单随机抽样时,要紧扣简单随机抽样的特征:逐个、不放回抽取且保证每个个体被抽到的可能性相等.变式训练如今有一种“够级〞游戏,其用具为四副扑克,包括大小鬼〔又称为花〕在内一一共216张牌,参与人数为6人并坐成一圈.“够级〞开始时,从这6人中随机指定一人从已经洗好的扑克牌中随机抽取一张牌〔这叫开牌〕,然后按逆时针方向,根据这张牌上的数字来确定谁先抓牌,这6人依次从216张牌中抓取36张牌,问这种抓牌方法是否是简单随机抽样?解:在这里只有抽取的第一张扑克牌是随机抽取的,其他215张牌已经确定,即这215张扑克牌被抽取的可能性与第一张扑克牌可能性不一样,所以不是简单随机抽样.知能训练1.为了理解全校240名学生的身高情况,从中抽取40名学生进展测量,以下说法正确的选项是〔〕A.总体是240B.个体C.样本是40名学生D.样本容量是40答案:D2.为了理解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是〔〕A.总体B.个体C.总体的一个样本D.样本容量答案:C3.一个总体中一一共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,那么某一特定个体被抽到的可能性是____________.1答案:104.为了检验某种产品的质量,决定从40件产品中抽取10件进展检查,如何用简单随机抽样抽取样本?解:方法一〔抽签法〕:①将这40件产品编号为1,2, (40)②做好大小、形状一样的号签,分别写上这40个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④连续抽取10个号签;⑤然后对这10个号签对应的产品检验.方法二〔随机数表法〕:①将40件产品编号,可以编为00,01,02,…,38,39;②在随机数表中任选一个数作为开始,例如从第8行第9列的数5开始,;③从选定的数5开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.拓展提升现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进展质量检验.如何用随机数法设计抽样方案?分析:重新编号,使每个号码的位数一样.解:方法一:第一步,将元件的编号调整为010,011,012,...,099,100, (600)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比方,选第6行第7个数“9〞,向右读.第三步,从数“9”开始,向右读,每次读取三位,凡不在010—600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.第四步,以上这6个号码所对应的6个元件就是所要抽取的对象.方法二:第一步,将每个元件的编号加100,重新编号为110,111,112,...,199,200, (700)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比方,选第8行第1个数“6〞,向右读.第三步,从数“6〞开始,向右读,每次读取三位,凡不在110—700中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到630,163,567,199,507,175.第四步,这6个号码分别对应原来的530,63,467,99,407,75.这些号码对应的6个元件就是要抽取的对象.课堂小结1.简单随机抽样是一种最简单、最根本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2.抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,假设标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法一样,缺点是当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适宜总体容量较小的抽样类型.3.简单随机抽样每个个体入样的可能性都相等,均为N n ,但是这里一定要将每个个体入样的可能性、第n 次每个个体入样的可能性、特定的个体在第n 次被抽到的可能性这三种情况区分开来,防止在解题中出现错误.作业课本本节练习2、3.设计感想本节教学设计以课程标准的要求为指导,重视引导学生参与到教学中,表达了学生的主体地位.同时,根据高考的要求,适当拓展了教材,做到了用教材,而不是教教材.。
第二章第一节简单随机抽样一、重点难点:1.正确理解随机抽样的概念,会描述抽签法、随机数表法的一般步骤.2.能够根据样本的具体情况选择适当的方法进行抽样.二、知识点讲解:一、简单随机抽样的概念:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
思考:简单随机抽样的每个个体入样的可能性为多少?(n/N)二、抽签法和随机数法:1、抽签法一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
抽签法的一般步骤:(1)将总体的个体编号;(2)连续抽签获取样本号码.思考:你认为抽签法有什么优点和缺点;当总体中的个体数很多时,用抽签法方便吗?解析:操作简便易行,当总体个数较多时工作量大,也很难做到“搅拌均匀”2、随机数法利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法.怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。
第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。
16 22 77 94 39 49 54 43 54 82 17 37 93 23 7884 42 17 53 31 57 24 55 06 88 77 04 74 47 6763 01 63 78 59 16 95 55 67 19 98 10 50 71 7533 21 12 34 29 78 64 56 07 82 52 42 07 44 3857 60 86 32 44 09 47 27 96 54 49 17 46 09 6287 35 20 96 43 84 26 34 91 6421 76 33 50 25 83 92 12 06 7612 86 73 58 07 44 39 52 38 7915 51 00 13 42 99 66 02 79 5490 52 84 77 27 08 02 73 43 28第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。
第二章简单随机抽样
§2.1 引言
§2.2 估计量
§2.3 样本量的确定§2.4 其他问题
§2.1 引言
➢简单随机抽样也称为纯随机抽样.从抽样框内的N个抽样单元中随机地、逐个抽取n个单元组成样本,在每次抽选时,总体中每个单元入样的概率都相等,这n个被抽中的单元就构成了简单随机样本。
➢简单随机样本也可以从总体中一次取得全部n 个单元,要求全部可能的样本每种样本被抽得的概率都相等。
➢放回抽样与不放回抽样
⏹抽选方法
➢抽签法
当总体不大时,可以用均匀同质的材料制
作N个签,将其充分混合,然后一次抽取n个签,或一次抽取一个签但不放回,接着抽下一个签直到第n个签为止,则这n个签上所示的号码
表示入样的单元号。
➢随机数法
当总体较大时,抽签法实施起来很困难,这时可以利用随机数表、随机数骰子、计算机产生的伪随机数进行抽样。
※随机数表
随机数表是由数字0,1,…,9组成的表,每个数字都有同样的机会被抽中。
常用的做法:根据总体大小N的位数决定在随机数表中随机抽取几列,如N=678,要取n=5的样本,则在随机数表中随机抽取3列,顺序往下,选出头5个001~678之间互不相同的数,如果这3列随机数字不够,可另选其他3列继续,直到抽满n个单元为止。
※随机数骰子
随机数骰子是由均匀材料制成的正20面体,面上标有0~9的数字各2个。
我国“运筹”牌随机数骰子一盒有6个不同颜色的骰子,使用时,根据总体大小N的位数,如N=327的位数是3,则将3个不同颜色的骰子放入盒中,并规定
每种颜色所代表的位数,如红色代表个位数,蓝色代表十位数,黄色代表百位数等,盖上盒盖,摇动盒子,使骰子充分旋转,然后打开盒盖,读出骰子所表示的数字,重复上述步骤,直到产生n个不同的随机数。
※计算机产生伪随机数
不少统计软件都有现成的产生随机数的程序,利用计算机产生的随机数具有快捷、方便的特点,但需要注意的事,利用计算机产生的随机数是伪随机数,并不能保证其随机性。
例2.5:某超市开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。
该超市与附近几个小区居民委员会取得联系,在总体中按简单随机抽样抽取了一个大小为n = 200人的样本。
调查发现对该超市购物环境表示满意或基本满意的居民有130位,要估计对该超市购物环境持肯定态度居民的比例,并在置信度为95%条件下,给出估计的绝对误差和置信区间。
假定这时的抽样比可以忽略。
§1.3 样本量的确定
样本量的确定在抽样调查中是一个十分重要又比较复杂的问题,它受到调查精度以及调查费用的限制。
费、礼品费等。
费用,如调查费、差旅一个样本单元所需的
的可变费用,即每调查为与样本量有关;些费用都与样本量无关织宣传等费用等,这
人员开支、办公费、组为固定费用,如管理为总费用,式中,,设费用函数为:
在简单随机抽样情况下1
1
0c c C n c c C += 费用函数
➢如果deff<1,则所考虑的抽样设计比简单随机抽样的效率高;
➢如果deff>1,则所考虑的抽样设计比简单随机抽样的效率低。
deff n n deff n deff ⨯'=':
,本量为那么复杂抽样所需的样抽样的到,如果可以估计复杂比较容易得机抽样所需的样本量定精度条件下,简单随量有很大的作用,在一对复杂抽样时确定样本。