抽样主讲老师赵凌云 (1)
- 格式:doc
- 大小:207.00 KB
- 文档页数:10
系统抽样课时:12课型:新授课教学目标:1、知识与技能:(1)正确理解系统抽样的概念;(2)掌握系统抽样的一般步骤;(3)正确理解系统抽样与简单随机抽样的关系;2、过程与方法:通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法,3、情感态度与价值观:通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系。
4、重点与难点:正确理解系统抽样的概念,能够灵活应用系统抽样的方法解决统计问题。
教学设想:【创设情境】:某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?【探究新知】一、系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
【说明】由系统抽样的定义可知系统抽样有以下特证:(1)当总体容量N较大时,采用系统抽样。
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,N].系统抽样又称等距抽样,这时间隔一般为k=[n(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。
思考?(1)你能举几个系统抽样的例子吗?(2)下列抽样中不是系统抽样的是()A、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈点拨:(2)c不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。
江苏省常州市西夏墅中学高中数学 2.1.2 系统抽样教案 新人教版必修3教学目标:1.正确理解系统抽样的概念,掌握系统抽样的一般步骤;2.通过对解决实际问题的过程的研究学会抽取样本的系统抽样方法,体会系统抽样与简单随机抽样的关系.教学重点:系统抽样的应用.教学难点:对系统抽样中的“系统”的思想的理解,并能加以解决.教学方法:能运用所学知识判断、分析和选择抽取样本的方法;能从现实生活或其他学科中提出有价值的数学问题,并能加以解决.教学过程:二、学生活动用简单随机抽样获取样本,但由于样本容量较大,操作起来费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,你能否设计其他抽取样本的方法?三、建构数学1.系统抽样的定义:一般地,要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.说明:由系统抽样的定义可知系统抽样有以下特征:(1)当总体容量N 较大时,采用系统抽样.(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为⎥⎦⎤⎢⎣⎡=n N k (3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.(4)系统抽样与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;(5)简单随机抽样和系统抽样过程中,每个个体被抽取的可能性是相等的.2.系统抽样的一般步骤:(1)采用随机的方式将总体中的个体编号(编号方式可酌情考虑,为方便起见,有时可直接利用个体所带有的号码,如学生的准考证号、街道门牌号等);(2)为将整个的编号分段(即分成几个部分),要确定分段的间隔,当N n (N 为总体个数,n 为样本容量)是整数时,n N k =,当N n不是整数时,通过从总体中删除一些个体(用简单随机抽样的方法)使剩下的总体中个体的个数N '能被n 整除,这时nN k '=; 四、数学运用1.例题:例1 某单位在职职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查,试采用系统抽样方法抽取所需的样本.解:第一步:将624名职工用随机方式进行编号;第二步:从总体中用随机数表法剔除4人,将剩下的620名职工重新编号(分别为000,001,002,…,619),并分成62段;第三步:在第一段000,001,002,…, 009这十个编号中用简单随机抽样确定起始号码l ;第四步:将编号为,10,20,,60l l l l +++的个体抽出,组成样本.例2 从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是(B )(A)5,10,15,20,25 (B)3,13,23,33,43 (C)1,2,3,4,5 (D)2,4,6,16,322.练习:课本第47页第1,3,4题.五、要点归纳与方法小结本节课我们学习了以下内容:系统抽样的概念及步骤.中国书法艺术说课教案今天我要说课的题目是中国书法艺术,下面我将从教材分析、教学方法、教学过程、课堂评价四个方面对这堂课进行设计。
青岛版数学七年级上册《4.2 简单随机抽样》说课稿一. 教材分析青岛版数学七年级上册《4.2 简单随机抽样》这一节,主要介绍了简单随机抽样的概念和方法。
通过这一节的学习,使学生了解简单随机抽样的特点和应用,学会使用简单随机抽样进行数据收集和分析。
教材从实际生活中的实例引入,让学生感受随机抽样的意义,进而引导学生学习简单随机抽样的方法。
在教材的编写中,注重了理论与实际的结合,使学生在学习过程中能够更好地理解和掌握知识。
二. 学情分析七年级的学生已经具备了一定的数学基础,对于一些基本的数学概念和运算规则有所了解。
但是,对于随机抽样这一概念,学生可能比较陌生。
因此,在教学过程中,需要引导学生从实际生活中理解和掌握随机抽样的概念和方法。
同时,七年级的学生正处于青春期,好奇心强,对于新鲜事物感兴趣。
因此,在教学过程中,可以通过实例引入,激发学生的学习兴趣,引导学生主动探索和思考。
三. 说教学目标1.知识与技能目标:使学生了解简单随机抽样的概念和方法,学会使用简单随机抽样进行数据收集和分析。
2.过程与方法目标:通过实例引入,引导学生从实际生活中理解和掌握随机抽样的概念和方法,培养学生的实际操作能力。
3.情感态度与价值观目标:激发学生对数学学习的兴趣,培养学生的探究精神和合作意识。
四. 说教学重难点1.教学重点:简单随机抽样的概念和方法。
2.教学难点:如何引导学生从实际生活中理解和掌握随机抽样的概念和方法。
五. 说教学方法与手段1.教学方法:采用实例引入,引导学生从实际生活中理解和掌握随机抽样的概念和方法。
在教学过程中,采用问题驱动的教学方法,引导学生主动探索和思考。
2.教学手段:利用多媒体课件进行教学,通过图片、动画等形式,生动形象地展示随机抽样的过程,帮助学生理解和掌握知识。
六. 说教学过程1.导入:通过实例引入,让学生感受随机抽样的意义,激发学生的学习兴趣。
2.新课导入:介绍简单随机抽样的概念和方法,引导学生理解和掌握知识。
"吉林省东北师范大学附属中学高中数学 2.1.1 简单随机抽样教案文新人教A版必修3 "教学目标:1、知识与技能:(1)正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;2、过程与方法:(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。
3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。
4、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。
教学设想:假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本。
(为什么?)那么,应当怎样获取样本呢?【探究新知】一、简单随机抽样的概念一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
【说明】简单随机抽样必须具备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。
(2)简单随机样本数n小于等于样本总体的个数N。
(3)简单随机样本是从总体中逐个抽取的。
(4)简单随机抽样是一种不放回的抽样。
(5)简单随机抽样的每个个体入样的可能性均为n/N。
思考?下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本。
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。
二、抽签法和随机数法1、抽签法的定义。
一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
4.2 简单随机抽样学习目标:1、了解简单随机抽样地概念2、知道简单随机抽样地方法3、知道简单随机抽样经常使用地地方。
4、学习重点:理解和把握简单随机抽样地概念5、学习难点:理解简单随机抽样地方法,并能尝试性地进行简单地操作。
学习过程一创设情境,引入新课交流与发现为了了解本校学生暑期参加体育活动地情况,学校准备抽取一部分学生进行问卷调查,现有四个发放调查问卷地方案,你认为按下面地调查方法取得地结果能放映全校学生地一般情况吗?如果不能,应当如何改进调查方法?方案一:发给学校田径队地30名同学方案二:调查每个班地男同学方案三:从每个班随机抽取1名同学方案四:从每个班抽取一半学生进行调查二合作交流,探索新知1.简单随机抽样地含义为了获取能够客观反映问题地结果,通常按照总体内地每个个体被抽到地机会都相等地原则抽取样本,则这种抽样方法叫做简单随机抽样.注:随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观地影响因素.2.讨论P/88实验与探究,思考:根据你地理解,简单随机抽样有哪些主要特点?(1)总体地个体数有限;(2)样本地抽取是逐个进行地,每次只抽取一个个体;(3)抽取地样本不放回,样本中无重复个体;(4)每个个体被抽到地机会都相等,抽样具有公平性.三.例题讲解例1:李大伯为了估计一袋大豆种子中大豆地粒数,先从袋中取出50粒,做上记号,然后放回袋中,将豆粒搅匀,再从袋中取出100粒,,从这100粒中,找出带记号地大豆,如果带记号地大豆有两粒,便可以估计出袋中所有大豆地粒数,你知道他是怎样估计地吗?四实际应用1、某校地黑板报上刊登了一篇题为《大部分学生不吃早餐》地报道,文章说。
“通过对课间学校商品部买小食品地20名同学地调查发现16人是因为没有吃早餐而去买零食,由此判断,我校80%地同学在家不吃早餐”2、在某次篮球赛中,解说员介绍了参加美国职业篮球队地3名中国籍队员地身高,有位观众把这3个人地平均身高与美国人地平均身高进行比较,得出一个结论:“中国人地平均身高比美国人高”。
章末复习课一、抽样方法的选取及应用1.抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数表法;当总体中个体差异较显著时,可采用分层抽样.2.掌握抽样方法,提升数据分析素养.例1(1)假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是__________.(下面摘取了随机数表第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 00 13 4299 66 02 79 54答案068解析由随机数表可以看出前4个样本的个体的编号是331,572,455,068.于是第4个样本个体的编号是068.(2)一个单位有职工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有200人,其他人员有120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( ) A .12,24,15,9 B .9,12,12,7 C .8,15,12,5 D .8,16,10,6答案 D解析 由题意知,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×420=8,40×820=16,40×520=10,40×320=6.反思感悟 (1)随机数法的步骤.①对总体中的个体编号(每个号码位数一致); ②在随机数表中任选一个数;③从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止; ④根据选定的号码抽取样本.(2)分层抽样的特点是“按比例分配”,即每层中抽取的个体数该层的个体数=样本容量总体容量.跟踪训练1 (1)以下抽样方法是简单随机抽样的是( )A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B .某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C .某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D .用抽签法从10件产品中选取3件进行质量检验 答案 D解析 选项A ,B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C 不是简单随机抽样,因为总体的个体有明显的层次;选项D 是简单随机抽样.(2)某校为了了解学生学习的情况,采用分层抽样的方法从高一1 000人,高二1 200人,高三n人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n等于() A.860 B.720C.1 020 D.1 040答案 D解析分层抽样是按比例抽样的,=30,解得n=1 040.所以81× 1 2001 000+1 200+n二、用样本的取值规律估计总体的取值规律1.根据样本容量的大小,我们可以选择利用样本的频率分布表、频率直方图对总体情况作出估计.2.掌握频率直方图的绘制及应用,提升数据分析和数学运算素养.例2为了解高一年级学生的智力水平,某校按1∶10的比例对700名高一学生按性别分别进行“智力评分”抽样检查,测得“智力评分”的频数分布表如表1、表2.表1:男生“智力评分”频数分布表智力评分(分)[160,165)[165,170)[170,175)频数2514智力评分(分)[175,180)[180,185)[185,190]频数134 2表2:女生“智力评分”频数分布表智力评分(分)[150,155)[155,160)[160,165)频数1712智力评分(分)[165,170)[170,175)[175,180]频数63 1(1)求高一年级的男生人数,并完成下面男生“智力评分”的频率直方图;(2)估计该校高一年级学生“智力评分”在[165,175)内的人数.解(1)样本中男生人数是40,由抽样比例是1∶10可得高一年级男生人数是400,男生“智力评分”的频率直方图如图所示.(2)样本中“智力评分”在[165,175)内的频数为28,所以估计该校高一年级学生“智力评分”在[165,175)内的学生人数为28×10=280. 反思感悟 (1)绘制频率直方图时需注意的两点①制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确. ②频率直方图的纵坐标是频率组距,而不是频率.(2)与频率直方图计算有关的两个关系式 ①频率组距×组距=频率. ②频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. 跟踪训练2 某电子商务公司对10 000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 答案 (1)3 (2)6 000解析 (1)由0.1×1.5+0.1×2.5+0.1a +0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3. (2)消费金额在区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故在[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.三、样本的百分位数1.一般地,一组数据的k百分位数是这样一个值p k,它使得这组数据中至少有k%的数据小于或等于p k,且至少有(100-k)%的数据大于或等于p k.可以用样本数据的百分位数估计总体的百分位数.2.掌握百分位数的计算及应用,重点提升数据分析与数学运算的核心素养.例3欧洲联盟委员会和荷兰环境评估署公布了2013年全球主要20个国家和地区的二氧化碳排放总量及人均二氧化碳排放量,结果如下表:则这些国家和地区人均二氧化碳排放量的四分位数是多少.解 把这20个国家和地区的人均二氧化碳排放量按从小到大的顺序排列. 1.7,2.0,2.6,3.9,5.3,5.7,6.2,6.4,7.3,7.4,7.5,8.5,10.2,10.7,12.6,12.7,15.7,16.6,16.6,16.9. 25×20100=5,50×20100=10,75×20100=15,所以这20个数的25百分位数为5.3+5.72=5.5.50百分位数为7.4+7.52=7.45.75百分位数为12.6+12.72=12.65.所以这20个国家和地区的人均二氧化碳排放量的四分位数为反思感悟 计算一组n 个数据的k 百分位数的一般步骤 第1步 将所有数值按从小到大的顺序排列; 第2步 计算k ·n100;第3步 如果结果为整数,那么k 百分位数位于第k ·n100位和下一位数之间,通常取这两个位置上数值的平均数为k 百分位数;第4步 如果k ·n100不是整数,那么将其向上取整(即其整数部分加上1),在该位置上的数值即为k 百分位数.跟踪训练3 某产品售后服务中心随机选取了10个工作日,分别记录了每个工作日接到的客户服务电话的数量(单位:次):63 38 25 42 56 48 53 39 28 47 则上述数据的50百分位数为________. 答案 44.5解析 把这组数据从小到大排序:25,28,38,39,42,47,48,53,56,63,50×10100=5,所以50百分位数为42+472=44.5.四、用样本的集中趋势、离散程度估计总体1.为了从整体上更好地把握总体规律,我们还可以通过样本数据的众数、中位数、平均数估计总体的集中趋势,通过样本数据的方差或标准差估计总体的离散程度.2.掌握样本数据的众数、中位数、平均数及方差的计算方法,提升数据分析和数学运算素养. 例4 某工厂36名工人的年龄数据如下表:利用随机抽样法抽取容量为9的样本,其年龄数据为44,40,36,43,36,37,44,43,37. (1)计算样本的平均数x 和方差s 2;(2)36名工人中年龄在x -s 与x +s 之间有多少人?所占的百分比是多少?(精确到0.01%) 解 (1)由平均数公式知,x =44+40+…+379=40,由方差公式知,s 2=19×[(44-40)2+(40-40)2+…+(37-40)2]=1009.(2)因为s 2=1009,s =103,所以36名工人中年龄在x -s 和x +s 之间的人数等于年龄在区间[37,43]上的人数, 即40,40,41,…,39,共23人.所以36名工人中年龄在x -s 和x +s 之间的人数所占的百分比为2336×100%≈63.89%.反思感悟 通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),呈现样本数据的集中趋势及波动大小,从而实现对总体的估计.(1)一般情况下,需要将平均数和标准差结合,得到更多样本数据的信息,从而对总体作出较好的估计.因为平均数容易掩盖一些极端情况,使我们对总体作出片面的判断,而标准差较好地避免了极端情况.(2)若两组数据的平均数差别很大,也可以只比较平均数,估计总体的平均水平,从而作出判断. 跟踪训练4 某汽车租赁公司为了调查A 型汽车与B 型汽车的出租情况,现随机抽取这两种车各50辆,分别统计每辆车在某个星期内的出租天数,统计数据如下表:A 型汽车出租天数 3 4 5 6 7 车辆数330 575B 型汽车出租天数 3 4 5 6 7 车辆数101015105(1)试根据上面的统计数据,判断这两种车在某个星期内的出租天数的方差的大小关系(只需写出结果);(2)如果A 型汽车与B 型汽车每辆车每天出租获得的利润相同,该公司需要购买一辆汽车,请你根据所学的统计知识,给出建议应该购买哪一种车,并说明你的理由.解 (1)由数据的离散程度,可以看出B 型汽车在某个星期内出租天数的方差较大. (2)50辆A 型汽车出租天数的平均数为x A =3×3+4×30+5×5+6×7+7×550=4.62,50辆B 型汽车出租天数的平均数为x B =3×10+4×10+5×15+6×10+7×550=4.8,答案一:一辆A 型汽车在某个星期内出租天数的平均值为4.62,B 型汽车在某个星期内出租天数的平均值为4.8,选择B 型汽车出租的利润较大,应该购买B 型汽车.答案二:一辆A 型汽车在某个星期内出租天数的平均值为4.62,B 型汽车在某个星期内出租天数的平均值为4.8,而B 型汽车出租天数的方差较大,所以应该购买A 型汽车.1.(2019·全国Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案 A解析记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A. 2.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率直方图,则在被抽取的零件中,直径落在区间[5.43,5.47]内的个数为()A.10 B.18 C.20 D.36答案 B解析因为直径落在区间[5.43,5.47]内的频率为0.02×(6.25+5.00)=0.225,所以个数为0.225×80=18.3.(2019·全国Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6 C.0.7 D.0.8答案 C解析根据题意阅读过《红楼梦》《西游记》的人数用Venn图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70=0.7.100 4.(2020·全国Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n 的方差为()A.0.01 B.0.1 C.1 D.10答案 C解析10x1,10x2,…,10x n的方差为102×0.01=1.5.(2020·江苏)已知一组数据4,2a,3-a,5,6的平均数为4,则a的值是________.答案 2解析由题意,得4+2a+(3-a)+5+6=4×5=20,所以a=2.。
抽样主讲老师赵凌云教学重点:相关术语的含义;概率抽样的基本方法;样本规模与抽样误差教学难点:分层随机抽样与整群随机抽样的异同;样本规模与抽样误差的确定教学内容:第一节几个重要术语的概念1、抽样调查所谓抽样调查,是按照一定的程序,从所研究对象的同质总体中抽取一部分进行调查,并在一定的条件下,运用数理统计的原理和方法,对总体的数量特征进行估计和推断。
2、总体和样本总体(Population)或同质总体,是指提供所需信息的人的全体。
对应的总体指标是根据总体各单位标志值计算,常用的总体指标有总体平均数μ、总体比例π、总体方差σ2。
样本是总体的一部分,它由从总体中按一定程序选取的部分个体或抽样单元组成。
样本是总体的子集,相对较小,但精心选择的样本能够准确的反映出所抽查的总体的特征。
对应的样本指标是根据样本各单位标志值计算,常用的样本指标有样本平均数Χ、样本比例ρ、样本方差S2。
3、随机抽样和非随机抽样抽样可分为随机抽样(也称概率抽样Probability sampling)和非随机抽样(也称非概率抽样Non-probability sampling)两种方式。
随机抽样指在总体中的每个单位都具有同等可能性被抽选的方法。
随机抽样在市场调查中应用的非常广泛,在完成抽样的过程中,调查员必须严格遵守正确的抽样程序,避免武断或有偏见的选择抽样的单位。
使用抽样的样本预测总体时的差异,称为抽样误差。
随机抽样,总体中的每一个体或单位被抽中的概率要相等。
它的优点在于:(1)可以根据抽样数据,利用统计分析方法,对总体的数量特征做出估计。
(2)抽样误差可以事先确定并加以控制。
其难点在于,要有总体完整的名单才能进行随机抽样,而市场调查中有些总体是无法精确界定的;而有些总体的资料是不公开的或很难收集的,此时进行随机抽样必然会无形中增加很大的成本。
非随机抽样是指从总体中非随机的选择特定的要素(单位),根据简便易行、节省开支或根据研究者主观的判断从总体中选取样本的抽样方法。
非随机抽样更多的依赖研究者个人的经验和判断,它的缺点是无法估计和控制抽样误差,也不能用样本的定量数据推断总体,但是非随机抽样实行起来简单方便,所以经常在定性调查研究中使用。
4、抽样框和抽样单元抽样框被定义为总体的数据目录或单位的名单,从中可以抽出样本单位。
抽样框一般可采用现成的名单,如住户登记表、电话号码簿等。
因该注意的是,在利用现有名单作为抽样框时,要先对该名录进行核查,避免有重复、遗漏的情况发生,以提高样本框对总体的代表性。
为了便于抽样,通常将总体划分为有限个互补重叠又穷尽的部分,每一个部分称为抽样单元。
抽样单元可大可小,如在全国性居民生活状况的抽样调查中,可以设置省为一级抽样单元,省下面的不同城市设置为二级单元,城市中街区可以设置为三级单元,家庭户设为四级单元,抽样方案按照不同级别的抽样单元分别进行。
第二节抽样的方法根据是否遵循随机原则进行抽样,抽样方法可以分为两大类:随机抽样(概率抽样)和非随机抽样(非概率抽样)。
一、随机抽样(概率抽样)根据调查对象的性质和研究目的的不同,随机抽样方法主要有:简单随机抽样、分层抽样、整群抽样、多级抽样、系统抽样等方法。
下面针对各抽样技术的概念、特点等内容进行介绍。
1.简单随机抽样简单随机抽样(Simple random sampling)是最完全的概率抽样,针对包含N个单位的总体,选出n个单位作为样本时,每个单位在抽选时有相同被选中的机会的方法。
有的书中定义简单随机抽样时,有两种方式:如果抽样是无放回的(每个样本被抽中的概率是一样的),所得到的样本就叫做简单随机抽样样本;如果抽样是有放回的(每次抽中的签要放回,并再次混合均匀后,再继续抽取),则得到的样本叫做非常简单随机样本。
前一种方法,总体中每个单元被抽中的概率完全相等;后者,总体中每个单元被抽中的概率并不相等。
但是如果总体很大,样本量相对较小时,两者的差别会非常小。
简单随机抽样一般可采用抽签法,或查阅随机数表的方法来得到样本。
(1)抽签法是先将总体中的每个单元都编上号,写在签上,将签充分混合均匀,每次抽取一个签,签上号码所对应的单元即入样,抽中的签不放回,再接着抽取下一个签,直到抽够所需样本量为止。
(2)随机数表法是先将总体中的每一个单元都编上号,要注意的是,所有号码的位数均应相同。
然后从随机数表的任一位置开始,向任何一个方向连续地摘录数字,将得到的数字按上边编号的位数分割为若干组数码,得到的数码所对应的单元即入样,重复的数码和没有对应单元的数码去掉,直至抽足所需样本量为止。
例如,要从一个700人的总体中抽取样本量为15的样本,先将这700人按001~700编号(或000~699,注意一定位数相同),从表中的任一位置,例如从第6行、第7列开始,向右(可以向其他任何方向)连续地以三位数字为一个数码,得到的数码如下:上面有下划线的数码均有相应的单元与之对应,则对应单元入样,依次选够15个为止。
其他超过700的数码没有对应单元,去掉即可。
数码618出现了二次,第二个618也要去掉不算。
这两种方法,以随机数表法实施起来更为便利,特别是总体非常大的情况,用抽签法是几乎不可能的。
简单随机抽样的优越性在于方法简单直观,当总体名单完整时,可直接从中随机选取样本,由于抽取概率相同,计算抽样误差及对总体指标进行推断时比较方便。
但是在实际的调查中,编制和获得完整的总体是非常困难的,也是不可能做到的,而且简单抽样得到的样本较为分散,会消耗比较大的调查成本,因此简单随机抽样适合于总体单位数不是很庞大,而且样本分布比较均匀情况。
2.系统抽样系统抽样(Systematic sampling)也叫等距抽样,先将先将总体的每个单元编号,并按照一定顺序排列,然后按一定间隔选取样本的抽样方法。
等距抽样经常最为简单随机抽样的代替物使用,所得到的样本几乎与简单随机抽样的样本相同。
使用等距抽样的方式,也必须获得一份总体的单位表,这一点与简单随机抽样是一样的。
决定抽样间隔的运算公式如下:例如要从120户居民中选出7户,使用系统(等距)抽样的过程如下:a.先将120户居民从“1”到“120”编号;b.决定间隔数;120/7=17.1,最接近的整数是17,间隔数定为17。
c.抽取第一个编号:等距抽样的方式可以随意使用一个起点,可通过随机表选取,也可按照简单的主观随意决定第一个编号。
d.然后每隔17抽取一个编号,这时可能出现两种情况:第一是开始的号码比较大,按照间隔抽选时,会出现超出编号的可能,即1);第二是选中的样本偏好在总体编号的范围内,即2):1)38,55,72,89,106,123(3),140(20);2)8,25,42,59,76,93,110“1)”中最后两个编号超过了120,则把它们分别减去120,得到最后的编号3,20。
最后这些编号所对应单元入样。
“2)”里由于第一个编号限定在1至17之间,所以没有出现超过120的编号,则所抽中编号不需修正,它们所对应单元入样。
由此可见,在确定第一个编号时,“2)”的方法更为简便。
3.分层抽样分层抽样(Stratified sampling)又称类型抽样,是先将总体的所有单位按某些重要特性分成若干互不重叠的子总体(或层),然后在各个子总体(或层)中采用简单随机抽样或者等距抽样方式抽取样本单位的一种抽样方法。
在分层时可以根据调查的具体要求,按照一个或多个特性来分层。
比如下面的例子是按照教育程度和性别这两个指标来分层的。
为便于计算,假设总体是1,000,000人,从中抽取1,000人的样本。
教育程度作为第一阶段分层的指标,性别作为第二阶段分层的指标,先按教育程度分为四组,每组再按性别分成两组,共分为八层,见下图。
从图中可以看到,整个抽样过程是先按照教育程度和性别将总体分为八层,根据各种教育程度在总体中所占比例和各种教育程度中男女所占比例,计算出每层的人数,再按照“1000/ 1000000=1/1000”的比例从每一层中随机抽取子样本,八个子样本合在一起即为样本。
分层抽样的优点在于:(1)由于总体中常有少数特殊单元,用简单随机抽样得到的样本中,这些特殊单元所占的比例容易过高或过低,而影响估计量的精度,分层抽样可以将这些特殊单元做为一层,从而避免上述情况,使样本更具代表性。
(2)可以根据需要对各层的特性加以比较。
(3)从管理和实施上看,比简单随机抽样便利得多。
4.整群抽样整群抽样(Cluster sampling)是先将总体划分为若干互不重叠的群,然后在所有的群中,随机地抽取一部分,对抽中的这些群内的所有单元进行调查的抽样方法。
要注意的是,分层抽样和整群抽样都是先将总体划分为互不重叠的若干部分(层或群),但是划分的原则是不一样的。
在分层抽样时,是要将在某些特性上比较一致的单元分为一层,而各层之间的差异性则较大(见13-3分层抽样示意图)。
在整群抽样中分群时则恰恰相反,要求各群之间的差异较小,每个群中各单元的差异较大。
例:某高校学生会要调查该校在校生对学校广播站节目的评价,用整群抽样法抽样时,可以把全校每一个班级做为每一群,也可以按宿舍来划分,每一个宿舍做为一个群,因为在这个问题上,一般来说各班之间或各宿舍之间差异不会太大。
假设该校有1500名学生,200个学生宿舍,从中抽取15个宿舍进行调查,抽样过程见图13-4。
从图13-4中看到整群抽样的特点就是对群进行随机抽样,抽到的群的所有单元全部入样。
整体抽样的优点是,组织实施比较方便,确定一组就可以抽出许多单位进行调查;而且只是需要群的名单,而不需要群内单元的名单,这就使得抽样工作大为简化。
5.多级抽样多级抽样(Multistage sampling)又叫多阶段抽样。
在很多情况下,特别是复杂的、大规模的市场调查种,调查单位一般不是一次性直接抽取到的,而是采用两阶段或多阶段抽取的办法,即先抽取大的单元,在大单元中再选取小单元,再在小单元中选取更小的单元,这种抽样方式称为多级抽样。
以二级抽样为例,二级抽样是先将总体分为互不重叠的若干部分(称为一级单元),从中随机抽取一些一级单元,这是抽样的第一阶段;再从这些抽中的一级单元中分别随机抽取子样本,所有的子样本合起来构成样本,这是抽样的第二阶段。
分层抽样和整群抽样是二级抽样的两种特殊形式。
见下图:从图中可以看到,整个过程是先在所有一级单元(100个班)中,抽取10个班,再从每个班中抽取10个人,这10个班抽中的所有人合在一起构成了100人的样本。
如果第一阶段的抽样时,所有一级单元全部被抽中,此时二阶抽样就相当于分层抽样,如果第二阶段抽样时,整个班的人全部入样,此时二阶抽样就相当于整群抽样。
多级抽样适合于大规模调查,它的组织实施的便利程度和抽样精度介于分层抽样和整群抽样之间。