高二数学分层抽样
- 格式:pdf
- 大小:1.25 MB
- 文档页数:8
2.1.3 分层抽样学 习 目 标核 心 素 养1.记住分层抽样的特点和步骤(重点)2.会用分层抽样从总体中抽取样本.(重点、难点) 3.给定实际抽样问题会选择合适的抽样方法进行抽样.(易错易混点)1.通过分层抽样的学习,培养数学运算素养.2.借助多种抽样方法的选择,提升逻辑推理素养.1.分层抽样一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法是一种分层抽样.当总体是由差异明显的几部分组成时,往往选用分层抽样的方法. 2.分层抽样的实施步骤第一步,按某种特征将总体分成若干部分(层). 第二步,计算抽样比.抽样比=样本容量总体容量.第三步,各层抽取的个体数=各层总的个体数×抽样比. 第四步,依各层抽取的个体数,按简单随机抽样从各层抽取样本. 第五步,综合每层抽样,组成样本. 思考:什么情况下适用分层抽样?[提示] 当总体中个体之间差异较大时可使用分层抽样.1.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A .简单随机抽样B .按性别分层抽样C .按学段分层抽样D .系统抽样C [依据题意,了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大,故要了解该地区学生的视力情况,应按学段分层抽样.]2.为了保证分层抽样时每个个体被等可能地抽取,必须要求( ) A .每层等可能抽取 B .每层抽取的个体数相等C .按每层所含个体在总体中所占的比例抽样D .只要抽取的样本容量一定,每层抽取的个体数没有限制 C [分层抽样为等比例抽样.]3.某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人参加军训表演,则一班和二班分别被抽取的人数是( )A .8,8B .10,6C .9,7D .12,4C [抽样比1654+42=16,则一班被抽取人数为54×16=9人,二班被抽取人数为42×16=7人.]4.在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样,那么分层抽样、系统抽样、简单随机抽样三种抽样中,为不放回抽样的有________个.三 [三种抽样方法均为不放回抽样.]分层抽样的概念【例1】 下列问题中,最适合用分层抽样抽取样本的是( ) A .从10名同学中抽取3人参加座谈会B .某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C .从1 000名工人中,抽取100名调查上班途中所用时间D .从生产流水线上,抽取样本检查产品质量B [A 中总体个体无明显差异且个数较少,适合用简单随机抽样;C 中,D 中总体个体无明显差异且个数较多,适合用系统抽样;B 中总体个体差异明显,适合用分层抽样.]分层抽样的特点(1)适用于总体由差异明显的几部分组成的情况. (2)样本能更充分地反映总体的情况.(3)等可能抽样,每个个体被抽到的可能性都相等.1.某校有在校高中生共1 600人,其中高一学生520人,高二学生500人,高三学生580人.如果想通过抽查其中的80人来调查学生的消费情况,考虑到学生的年级高低消费情况有明显差别,而同一年级内消费情况差异较小,问:应采用怎样的抽样方法?高三学生中应抽查多少人?[解] 因为不同年级的学生消费情况有明显差别,所以应采用分层抽样. 因为520∶500∶580=26∶25∶29. 所以将80分成26∶25∶29的三部分. 设三部分各抽取的个体数分别为26x,25x,29x, 由26x +25x +29x =80得x =1, 所以高三学生中应抽查29人.分层抽样的设计及应用1.怎样确定分层抽样中各层入样的个体数? [提示] 在实际操作时,应先计算出抽样比=样本容量总体容量,获得各层入样数的百分比,再按抽样比确定每层需要抽取的个体数:抽样比×该层个体数目=样本容量总体容量×该层个体数目.2.计算各层所抽个体的个数时,如果算出的个数值不是整数怎么办? [提示] 可四舍五入取整,也可先将该层等可能地剔除多余个体. 3.分层抽样公平吗?[提示] 分层抽样中,每个个体被抽到的可能性是相同的,与层数、分层无关.如果总体的个数为N,样本容量为n,N i 为第i 层的个体数,则第i 层抽取的个体数n i =n·N iN ,每个个体被抽到的可能性是n i N i =1N i ·n ·N i N =nN.【例2】 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.思路点拨:观察特征→确定抽样方法→求出比例→确定各层样本数→从各层中抽样→样本 [解] ∵机构改革关系到每个人的不同利益,故采用分层抽样方法较妥. ∵10020=5, ∴105=2,705=14,205=4. ∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.因副处级以上干部与工人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人进行00,01,…,69编号,然后用随机数表法抽取14人.这样便得到了一个容量为20的样本.1.(变条件)某大型工厂有管理人员1 200人,销售人员2 000人,车间工人6 000人,若要了解改革意见,从全厂人员中抽取一个容量为46的样本,试确定用何种方法抽取,请具体实施操作.[解] 改革关系到每个人的利益,采用分层抽样较好.抽样比:461 200+2 000+6 000=1200.∵1 200×1200=6(人),2 000×1200=10(人),6 000×1200=30(人).∴从管理人员中抽取6人,从销售人员中抽取10人,从车间工人中抽取30人. 因为各层中个体数目均较多,可以采用系统抽样的方法获得样本. 2.(变结论)在本例中的抽样方法公平合理吗?请说明理由.[解] 从100人中抽取20人,总体中每一个个体的入样可能性都是20100=15,即抽样比,按此比例在各层中抽取个体;副处级以上干部抽取10×15=2人,一般干部抽70×15=14人,工人抽20×15=4人,以保证每一层中每个个体的入样可能性相同,均为15,故这种抽样是公平合理的.分层抽样的步骤抽样方法的选择14人在120分以上,35人在90~119分,7人不及格,现从中抽出8人研讨进一步改进教与学;③某班春节聚会,要产生两位“幸运者”.就这三件事,合适的抽样方法分别为( )A .分层抽样,分层抽样,简单随机抽样B .系统抽样,系统抽样,简单随机抽样C .分层抽样,简单随机抽样,简单随机抽样D .系统抽样,分层抽样,简单随机抽样思路点拨:根据各抽样方法的特征、适用范围判断.D [①每班各抽两人需用系统抽样.②由于学生分成了差异比较大的几层,应用分层抽样.③由于总体与样本容量较小,应用简单随机抽样.故选D.]抽样方法的选取(1)若总体由差异明显的几个层次组成,则选用分层抽样;(2)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当总体容量较大,样本容量也较大时宜用系统抽样;2.为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查.事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A .简单随机抽样B .按性别分层抽样C .按年龄分层抽样D .系统抽样C [因为不同年龄段人员的“微信健步走”活动情况有较大差异.而男女对此活动差异不大,所以按年龄段分层抽样最合理.]1.对于分层抽样中的比值问题,常利用以下关系式[解] (1)样本容量n 总体容量N =各层抽取的样本数该层的容量; (2)总体中各层容量之比=对应层抽取的样本数之比. 2.选择抽样方法的规律(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法. (2)当总体容量较大,样本容量较小时,可采用随机数法. (3)当总体容量较大,样本容量也较大时,可采用系统抽样法. (4)当总体是由差异明显的几部分组成时,可采用分层抽样法.1.判断下列结论的正误(正确的打“√”,错误的打“×”)(1)当总体由差异明显的几部分组成时,往往采用分层抽样.( )(2)由于分层抽样是在各层中按比例抽取,故每个个体被抽到的可能性不一样.( )(3)分层抽样中不含系统抽样和简单随机抽样.( )[答案](1)√(2)×(3)×2.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取一个容量为90的样本,应在这三校分别抽取学生( )A.30人、30人、30人B.30人、45人、15人C.20人、30人、40人D.30人、50人、10人B[根据各校人数比例有3 600∶5 400∶1 800=2∶3∶1,由于样本容量为90,不难求出甲校应抽取30人、乙校应抽取45人、丙校应抽取15人.]3.某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到的抽样方法有( )①简单随机抽样;②系统抽样;③分层抽样A.②③B.①③C.③D.①②③D[由三种抽样方法的特点知,应先采用分层抽样对农民家庭需用系统抽样得到样本,对工人家庭需用简单随机抽样.]4.一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.[解]因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法.具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层.(2)按照样本容量的比例求得各乡镇应抽取的人数分别为60人、40人、100人、40人、60人.(3)按照各层抽取的人数随机抽取各乡镇应抽取的样本.(4)将300人合到一起,即得到一个样本.W。
2.1. 3分层抽样【教学目标】知识目标:理解分层抽样的概念.掌握分层抽样的使用条件和操作步骤,能力目标:会用分层抽样法进行抽样.思想目标:培养抽象、分析、运算的数学学科素养【教学过程】一.自主学习知识检测1.分层抽样的概念一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的特点(1)适用于总体由差异明显的几部分组成的情况.(2)更充分地反映了总体的情况,使样本具有较强的代表性.(3)等可能抽样,每个个体被抽到的可能性都是n N.1.分层抽样中分层原则(1)层内样本的差异要小,各层之间样本的差异要大.(2)分层后总体中的每个个体互不重叠,也不遗漏.2.抽样比(1)分层抽样也称“按比例抽样”,这里的“按比例”是指:①样本中第n层的个体数总体中第n层的个体数=样本容量总体容量;②总体中第m层的个体数总体中第n层的个体数=样本中第m层的个体数样本中第n层的个体数.(2)分层抽样中,每个个体被抽到的可能性是相等的,与层数、分层情况无关.二.名师引路例1.下列三个抽样:①一个城市有250家百货商店,其中大型商店有30家,中型商店有40家,小型商店有180家.为了掌握各商店的营业情况,要从中抽取一个容量为25的样本;②在某班的50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的10名学生进行作业检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱10件)产品中抽取3件进行质量检查.抽样方法依次为()A.简单随机抽样;分层抽样;系统抽样B.分层抽样;简单随机抽样;系统抽样C.分层抽样;系统抽样;简单随机抽样D.系统抽样;分层抽样;简单随机抽样【解析】①中商店的规模不同,所以应利用分层抽样;②中抽出的学号具有等距性,所以应是系统抽样;③中总体没有差异,容量较小,样本数量也较小,所以应为简单随机抽样,故选C.【答案】 C判断一个抽样方法是不是分层抽样的条件(1)看它是否具有分层抽样的特点,如总体中个体差异是否明显.(2)是否按照相同比例从各层中抽取.至于各层内用什么方法抽样是灵活的,可采用简单随机抽样,也可采用系统抽样.(3)在分层抽样中,无论哪一层的个体,被抽中的机会都是相等的,体现了抽样的公平性.例2. (1)某单位共有老、中、青年职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为________.(2)某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:其中x ∶y ∶z =5∶3∶2,且“泥塑”社团的人数占两个社团总人数的35,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取________人.【解析】 (1)设该单位老年职工人数为x ,由题意得3x =430-160,解得x =90.则样本中的老年职工人数为90×32160=18.(2)法一:因为“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以“剪纸”社团的人数为800×25=320;因为“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310,所以“剪纸”社团中高二年级人数为320×310=96.由题意知,抽样比为50800=116,所以从高二年级“剪纸”社团中抽取的人数为96×116=6.法二:因为“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以抽取的50人的样本中,“剪纸”社团中的人数为50×25=20.又“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310,所以从高二年级“剪纸”社团中抽取的人数为20×310=6.【答案】 (1)18 (2)6分层抽样中有关计算的方法(1)抽样比=样本容量n 总体容量N =该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.例3.为了考察某学校的教学水平,将抽取这个学校高三年级的部分学生本学年的考试成绩进行统计分析,为了全面反映实际情况,采取以下三种方式进行抽查(已知该学校高三年级共有20个教学班,并且每个班内的学生按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班任意抽取20人,考察他们的学习成绩; ②每个班都抽取1人,共计20人,考察这20个学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中共抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种抽样方法?【解】 (1)三种抽取方式中,其总体都是高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.第一种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中,样本为所抽取的100名学生本学年的考试成绩,样本容量为100.(2)三种抽取方式中,第一种方式采用的是简单随机抽样法;第二种方式采用的是系统抽样法和简单随机抽样法;第三种方式采用的是分层抽样法和简单随机抽样法.选择抽样方法的思路(1)判断总体是否由差异明显的几部分组成,若是,则选用分层抽样;否则,考虑用简单随机抽样或系统抽样;(2)判断总体容量和样本容量的大小.当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法;当总体容量较大、样本容量也较大时,采用系统抽样.三.课后练习1.某商场出售三种品牌电脑,现库存量分别是60台、36台和24台,用分层抽样的方法从中抽取10台进行检测,则这三种品牌的电脑依次应抽取的台数是() A.6,3,1 B.5,3,2C.5,4,1 D.4,3,3解析:选B.抽样比为1060+36+24=112,则三种品牌的电脑依次应抽取的台数是60×112=5,36×112=3,24×112=2.故选B.2.采用分层抽样的方法从某学校三个年级的全体学生中抽取一个容量为45的样本,高一年级被抽取20人,高三年级被抽取10人,高二年级共有300人,则这个学校共有高中学生为()A.1 350人B.675人C.900人D.450人解析:选C.高二年级被抽取的人数为45-20-10=15,则抽样比为15∶300=1∶20,所以45÷120=900,即这个学校共有高中学生900人.3.某班有男生36人,女生18人,用分层抽样的方法从该班全体学生中抽取一个容量为9的样本,则抽取的女生人数为()A.6 B.4C.3 D.2解析:选C.据分层抽样,得抽取的女生人数为936+18×18=3,选C.4.某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为() A.100 B.150C.200 D.250解析:选A.抽样比为703 500=150,该校总人数为1 500+3 500=5 000,则n5 000=150,故n=100.5.最新高考改革方案已在上海和浙江实施,某教育机构为了解我省广大师生对新高考现从500名师生中用分层抽样的方法抽取50名进行问卷调查,则应抽取“不赞成改革”的教师和学生人数分别为________.解析:由题意知,抽样比为50500=110,则应抽取“不赞成改革”的教师人数为110×20=2,学生人数为110×40=4.答案:2,46.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作为样本,用系统抽样法将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).(1)若第5组抽出的号码为22,则第8组抽出的号码应是多少?(2)若用分层抽样法,则应从40岁以下年龄段的职工中抽取多少名?解:(1)由分组可知,分段的间隔为5.又第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.(2)由题意知,40岁以下年龄段的职工人数为200×50%=100.若用分层抽样法,则应从40岁以下年龄段的职工中抽取40200×100=20(名).四.课堂小结:1.分层抽样的概念、特征及步骤;2.掌握分层抽样的有关计算;3.能区分三种抽样方法。
高中数学统计抽样方法精选题目(附答案)一、抽样方法1.简单随机抽样(1)特征:①一个一个不放回的抽取;②每个个体被抽到可能性相等.(2)常用方法:①抽签法;②随机数表法.2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.1.(1)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7B.9C.10 D.15(2)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.[解析](1)从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为a n=9+30(n-1)=30n-21,由451≤30n-21≤750,得23615≤n≤25710,所以n=16,17,…,25,共有25-16+1=10人.(2)小学中抽取30×150150+75+25=18所学校;从中学中抽取30×75150+75+25=9所学校.[答案](1)C(2)189注:1.系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样. (4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn . 2.与分层抽样有关问题的常见类型及解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数. 2.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A .抽签法B .系统抽样法C .分层抽样法D .随机数法解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为________.解析:高三年级学生人数为430-160-180=90,设高三年级抽取x 人,由分层抽样可得32180=x90,解得x =16. 答案:164.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为________.解析:因为分层抽样的抽样比应相等,所以420960=14样本容量,样本容量=960×14420=32.答案:32二、用样本的频率分布估计总体的频率分布1.频率分布直方图2.茎叶图5.(1)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.(2)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].①求图中a的值;②根据频率分布直方图,估计这100名学生语文成绩的平均分;③若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y 1∶12∶13∶44∶5 [为50×0.18=9.答案:9(2)解:①由频率分布直方图可知(0.04+0.03+0.02+2a)×10=1.所以a=0.005.②该100名学生的语文成绩的平均分约为x=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.③由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段[50,60)[60,70)[70,80)[80,90)x 5403020x∶y 1∶12∶13∶44∶5y 5204025100-(5+20+40+25)=10.注:与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.6.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2 B.0.4C.0.5 D.0.6解析:选B由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为410=0.4,故选B.7.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为()A .300B .360C .420D .450解析:选B 样本中体重大于70.5公斤的频率为: (0.04+0.034+0.016)×2=0.090×2=0.18.故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 000×0.18=360(人). 8.某商场在庆元宵节促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.解析:总销售额为2.50.1=25(万元),故11时至12时的销售额为0.4×25=10(万元).答案:10三、用样本的数字特征估计总体的数字特征有关数据的数字特征9.(1)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差(3)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[解析] (1)从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56,故选择A.(2)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.故选C.(3)假设这组数据按从小到大的顺序排列为x 1,x 2,x 3,x 4,则⎩⎨⎧x 1+x 2+x 3+x44=2,x 2+x32=2,∴⎩⎪⎨⎪⎧x 1+x 4=4,x 2+x 3=4, 又s = 14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2] =12(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2=122[(x 1-2)2+(x 2-2)2]=1, ∴(x 1-2)2+(x 2-2)2=2. 同理可求得(x 3-2)2+(x 4-2)2=2.由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2+(y -2)2=2上的点,分析知x 1,x 2,x 3,x 4应为1,1,3,3.[答案] (1)A (2)C (3)1,1,3,3 注:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.10.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选B 法一:∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.11.甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是__________,气温波动较大的城市是__________.解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度为9+13+17×2+18+226=16,乙城市上半年的平均温度为12+14+17+20+24+276=19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大.答案:乙 乙12.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1)x 甲=99+100+98+100+100+1036=100(mm),x 乙=99+100+102+99+100+1006=100(mm),s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73(mm 2), s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1(mm 2).(2)因为s 2甲>s 2乙,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.四、线性回归1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关:①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b x .13.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润. 注:(1)线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.(2)回归直线方程恒过点(x ,y ).14.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解:(1)将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}共15个基本事件,设抽到相邻两个月的事件为A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}共5个基本事件,∴P (A )=515=13.(2)由表中数据求得x =11,y =24,∑i =14x i y i =1 092,∑i =14x 2i =498.代入公式可得b ^=187.再由a ^=y -b ^x ,求得a ^=-307,所以y 关于x 的线性回归方程为 y ^=187x -307.(3)当x =10时,y ^=1507,⎪⎪⎪⎪1507-22=47<2; 同样,当x =6时,y ^=787,⎪⎪⎪⎪787-12=67<2. 所以该小组所得线性回归方程是理想的.。
高二数学抽样试题1.某市有大型超市家、中型超市家、小型超市家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为的样本,应抽取中型超市__________家.【答案】16【解析】根据分层抽样的知识,设应抽取中型超市t家,得,解得t=16.【考点】分层抽样.2.某班同学利用五一节进行社会实践,对[25,55]岁的人群随机抽取n人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,则称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:(1)请补全频率分布直方图,并求n、a、p的值;(2)在所得样本中,从[40,50)岁年龄段的“低碳族”中采用分层抽样法抽取18人参加户外低碳体验活动,其中选取3人作为领队,记选取的3名领队中年龄在[40,45)岁的人数为X,求X的分布列和数学期望EX.【答案】(1),a=60,;(2)随机变量X的分布列为X0123∴数学期望.【解析】(1)由已知条件求出第二组的频率,从而补全频率分布直方图,由此能求出n、a、p的值.(2)[35,40)岁年龄段的“环保族”人数与[40,45)年龄段的“环保族”人数的比值为100:60=5:3,由题意,随机变量X的所有可能的取值为0,1,2,3,分别求出P(X=0),P(X=1),P(X=2),P(X=3),由此能求出随机变量X的分布列和数学期望EX.试题解析:(Ⅰ)第二组的频率为1﹣(0.04+0.04+0.03+0.02+0.01)×5=0.3,所以高为.频率直方图如下:3第一组的人数为,频率为0.04×5=0.2,所以.由题可知,第二组的频率为0.3,所以第二组的人数为1000×0.3=300,所以.第四组的频率为0.03×5=0.15,所以第四组的人数为1000×0.15=150,所以a=150×0.4=60.(Ⅱ)因为[40,45)岁年龄段的“低碳族”与[45,50)岁年龄段的“低碳族”的比值为60:30=2:1,所以采用分层抽样法抽取18人,[40,45)岁中有12人,[45,50)岁中有6人.随机变量X服从超几何分布.,,,.所以随机变量X的分布列为∴数学期望.【考点】离散型随机变量的期望与方差;分层抽样方法.3.我校15届高二有名学生, 现采用系统抽样方法, 抽取人做问卷调查, 将人按随机编号, 则抽取的人中, 编号落入区间的人数为().A.11B.12C.13D.14【答案】C【解析】由题意得,从840名学生中按系统抽样方法抽取42名,则应把840名学生分成42段,每段20人,从每段20人中抽取1人;编号落入区间的人数是.【考点】系统抽样.4.某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:.估计该校学生每周平均体育运动时间超过4个小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有的把握认为“该校学生的每周平均体育运动时间与性别有关”.P(K2≥k)0.100.050.0100.005附:K2=【答案】(1)90(2)0.75(3)有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.【解析】(1)由题知,抽样比例为50:1,根据分层抽样是按比例抽样和女生人数即可计算出女生应抽取的人数;(2)观察频率分布直方图,找出每周平均体育运动不超过4小时的所有小矩形高即为频率/组距,这些小矩形的面积和即为每周平均体育运动不超过4小时的频率,1减去这个频率就是每周运动时间超过4小时的概率;(3)根据频率分布直方图计算出这300位男生和女生中每周运动时超过4小时和不超过4小时的人数,列出2×2列联表,代入K2公式,计算出样本观测值,将该值与表中概率为95%值比较即可得出是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.试题解析:(1)300×=90,所以应收集90位女生的样本数据. 3分(2)由频率分布直方图得每周平均体育运动超过4小时的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75. 7分(3)由(2)知,300位学生中有300×0.75=225(位)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:男生女生总计结合列联表可算得K2==≈4.762>3.841.所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”. 12分【考点】分层抽样方法,总体估计,独立性检验5.2013年第三季度,国家电网决定对城镇居民民用电计费标准做出调整,并根据用电情况将居民分为三类: 第一类的用电区间在,第二类在,第三类在(单位:千瓦时).某小区共有1000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示.(1)求该小区居民用电量的中位数与平均数;(2)利用分层抽样的方法从该小区内选出5户居民代表,若从该5户居民代表中任选两户居民,求这两户居民用电资费属于不同类型的概率.【答案】(1)平均数为156.8,中位数为155;(2).【解析】(1)先利用所给的频率分布直方图求出每一组的频率,再利用频率求出平均数,找出中位数;(2)按照所给题目的意思可知第一类 4户,第二类1户,那么两户居民用电资费属于不同类型的概率为.试题解析:解:(1)第一组频率为20×0.005=0.1第二组频率为20×0.015=0.3第三组频率为20×0.02=0.4第四组频率为20×0.005=0.1第五组频率为20×0.003=0.06第六组频率为20×0.002=0.04 -2分平均数为0.1×120+0.3×140+0.4×160+0.1×180+0.06×200+0.04×220=156.8 -4分中位数为150+20×0.25=155 -6分(2)第一类 4户第二类1户 -8分两户居民用电资费属于不同类型的概率为 -----12分考点:频率分布直方图,中位数,分层抽样.6.采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2, (960)分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间的人做问卷,编号落入区间的人做问卷,其余的人做问卷,则抽到的人中,做问卷的人数为()A.7B.9C.10D.15【答案】C【解析】由系统抽样方法可知从从960人中抽取32人,则每组人数为960/32 =30,就是每30人中抽取一人做问卷,那么共用有人,中共有人,故选C.【考点】系统抽样.7.某学校共有师生2400人,现用分层抽样方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是。
§2.1.3分层抽样学习目标1.正确理解分层抽样的概念.2.掌握分层抽样的一般步骤.3.能选择适当正确的方法进行抽样.探索新知新知1:分层抽样的定义新知2:分层抽样的步骤:思考:1.分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行( )A.每层等可能抽样B.每层不等可能抽样C.所有层按同一抽样比等可能抽样2.如果采用分层抽样,从个体数为N 的总体中抽取一个容量为n 样本,那么每个个体被抽到的可能性为( )A .N 1 B.n 1 C.N n D.N n新知3 :简单随机抽样、系统抽样、分层抽样表典型例题例1 某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )A.15,5,25B.15,15,15C.10,5,30 D15,10,20例2 某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是 .若用分层抽样方法,则40岁以下年龄段应抽取 人练习练1.一电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:打算从中抽取60人进行详细调查,如何抽取?练2.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2).则完成(1)、(2)这两项调查宜采用的抽样方法依次是( ) A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法当堂检测1.某单位有老年人45人,中年人55人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是()A.简单随机抽样 B.系统抽样C.分层抽样 D.先从老人中剔除1人,然后再分层抽样2.某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为人,A型血应抽取的人数为人,B型血应抽取的人数为人,AB型血应抽取的人数为人。
人教版高二数学必修三统计知识点:分层抽样(实用版)编制人:__________________审核人:__________________审批人:__________________编制单位:__________________编制时间:____年____月____日序言下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!并且,本店铺为大家提供各种类型的教育资料,如幼儿教案、音乐教案、语文教案、知识梳理、英语教案、物理教案、化学教案、政治教案、历史教案、其他范文等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor.I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!Moreover, this store provides various types of educational materials for everyone, such as preschool lesson plans, music lesson plans, Chinese lesson plans, knowledge review, English lesson plans, physics lesson plans, chemistry lesson plans, political lesson plans, history lesson plans, and other sample texts. If you want to learn about different data formats and writing methods, please stay tuned!人教版高二数学必修三统计知识点:分层抽样本店铺高二频道为正在拼搏的你整理了《人教版高二数学必修三统计知识点:分层抽样》希望你喜欢!(1)分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。