高中数学必修三第二章统计导学案及课后作业加答案
- 格式:doc
- 大小:1.74 MB
- 文档页数:34
第二章 统 计2.1.1 简单随机抽样课时目标 1.理解并掌握简单随机抽样的概念、特点和步骤.2.掌握简单随机抽样的两种方法.1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎪⎨⎪⎧抽签法随机数法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.一、选择题1.为了了解某种花的发芽天数,种植某种花的球根200个,进行调查发芽天数的试验,样本是( )A .200个表示发芽天数的数值B .200个球根C .无数个球根发芽天数的数值集合D .无法确定2.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是( )A .40B .50C .120D .1503.抽签法中确保样本代表性的关键是( )A .制签B .搅拌均匀C .逐一抽取D .抽取不放回4.下列抽样实验中,用抽签法方便的有( )A .从某厂生产的3 000件产品中抽取600件进行质量检验B .从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C .从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D .从某厂生产的3 000件产品中抽取10件进行质量检验5.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )A .1 000名运动员是总体B .每个运动员是个体C .抽取的100名运动员是样本D .样本容量是1006.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( )A .110,110 B .310,15C .15,310D .310,310二、填空题7.要检查一个工厂产品的合格率,从1 000件产品中抽出50件进行检查,检查者在其中随意抽取了50件,这种抽样法可称为________.8.福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.9.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)三、解答题10.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.11.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数表法设计抽样方案?能力提升12.在简单随机抽样中,某一个个体被抽到的可能性( )A .与第几次抽样有关,第一次抽到的可能性大一些B .与第几次抽样无关,每次抽到的可能性相等C .与第几次抽样有关,最后一次抽到的可能性大些D .与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不同13.某车间工人已加工一种轴50件,为了了解这种轴的直径是否符合要求,要从中抽出5件在同一条件下测量,试用两种方法分别取样.1.判断所给的抽样是否为简单随机抽样的依据是随机抽样的特征:简单随机抽样⎩⎪⎨⎪⎧ 个体有限逐个抽取不放回等可能性如果四个特征有一个不满足就不是简单随机抽样.2.利用抽签法抽取样本时应注意以下问题:(1)编号时,如果已有编号(如学号、标号等)可不必重新编号.(2)号签要求大小、形状完全相同.(3)号签要搅拌均匀.(4)要逐一不放回抽取.3.在利用随机数表法抽样的过程中注意:(1)编号要求数位相同.(2)第一个数字的抽取是随机的.(3)读数的方向是任意的,且事先定好的.第二章 统 计 2.1.1 简单随机抽样课时目标 1.理解并掌握简单随机抽样的概念、特点和步骤.2.掌握简单随机抽样的两种方法.1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎪⎨⎪⎧抽签法随机数法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.一、选择题1.为了了解某种花的发芽天数,种植某种花的球根200个,进行调查发芽天数的试验,样本是( )A .200个表示发芽天数的数值B .200个球根C .无数个球根发芽天数的数值集合D .无法确定答案 A2.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是( )A .40B .50C .120D .150答案 C解析 由于样本容量即样本的个数,抽取的样本的个数为40×3=120.3.抽签法中确保样本代表性的关键是( )A .制签B .搅拌均匀C .逐一抽取D .抽取不放回答案 B解析 由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B .4.下列抽样实验中,用抽签法方便的有( )A .从某厂生产的3 000件产品中抽取600件进行质量检验B .从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C .从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D .从某厂生产的3 000件产品中抽取10件进行质量检验答案 B解析 A 总体容量较大,样本容量也较大不适宜用抽签法;B 总体容量较小,样本容量也较小可用抽签法;C 中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D 总体容量较大,不适宜用抽签法.5.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )A .1 000名运动员是总体B .每个运动员是个体C .抽取的100名运动员是样本D .样本容量是100答案 D解析 此问题研究的是运动员的年龄情况,不是运动员,故A 、B 、C 错,故选D .6.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( ) A .110,110 B .310,15C .15,310D .310,310答案 A二、填空题7.要检查一个工厂产品的合格率,从1 000件产品中抽出50件进行检查,检查者在其中随意抽取了50件,这种抽样法可称为________.答案 简单随机抽样解析 由简单随机抽样的特点可知,该抽样方法是简单随机抽样.8.福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.答案 抽签法9.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)答案 ①③②三、解答题10.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.解 利用抽签法,步骤如下:(1)将30辆汽车编号,号码是01,02, (30)(2)将号码分别写在一张纸条上,揉成团,制成号签;(3)将得到的号签放入一个不透明的袋子中,并搅拌均匀;(4)从袋子中依次抽取3个号签,并记录上面的编号;(5)所得号码对应的3辆汽车就是要抽取的对象.11.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数表法设计抽样方案?解(1)将元件的编号调整为010,011,012,…,099,100,…600;(2)在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7列数“9”,向右读;(3)从数“9”开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263;(4)以上号码对应的6个元件就是要抽取的样本.能力提升12.在简单随机抽样中,某一个个体被抽到的可能性()A.与第几次抽样有关,第一次抽到的可能性大一些B.与第几次抽样无关,每次抽到的可能性相等C.与第几次抽样有关,最后一次抽到的可能性大些D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不同答案B解析由简单随机抽样的特点知与第n次抽样无关,每次抽到的可能性相等.13.某车间工人已加工一种轴50件,为了了解这种轴的直径是否符合要求,要从中抽出5件在同一条件下测量,试用两种方法分别取样.解方法一抽签法.(1)将50个轴进行编号01,02, (50)(2)把编号写在大小、形状相同的纸片上作为号签;(3)把纸片揉成团,放在箱子里,并搅拌均匀;(4)依次不放回抽取5个号签,并记下编号;(5)把号签对应的轴组成样本.方法二随机数法(1)将50个轴进行编号为00,01, (49)(2)在随机数表中任意选定一个数并按向右方向读取;(3)每次读两位,并记下在00~49之间的5个数,不能重复;(4)把与读数相对应的编号相同的5个轴取出组成样本1.判断所给的抽样是否为简单随机抽样的依据是随机抽样的特征:简单随机抽样⎩⎪⎨⎪⎧ 个体有限逐个抽取不放回等可能性如果四个特征有一个不满足就不是简单随机抽样.2.利用抽签法抽取样本时应注意以下问题:(1)编号时,如果已有编号(如学号、标号等)可不必重新编号.(2)号签要求大小、形状完全相同.(3)号签要搅拌均匀.(4)要逐一不放回抽取.3.在利用随机数表法抽样的过程中注意:(1)编号要求数位相同.(2)第一个数字的抽取是随机的.(3)读数的方向是任意的,且事先定好的.。
新课程标准数学必修3第二章课后习题解答第二章统计2.1随机抽样练习(P57)1、.之间有误差. 如抽取的部分个体不能很好地代表总体,那么我们分析出的结果就会有偏差.2、(1)抽签法:对高一年级全体学生450人进行编号,将学生的名字和对应的编号分别写在卡片上,并把450张卡片放入一个容器中,搅拌均匀后,每次不放回地从中抽取一张卡片,连续抽取50次,就得到参加这项活动的50名学生的编号.(2)随机数表法:第一步,先将450名学生编号,可以编为000,001, (449)第二步,在随机数表中任选一个数. 例如选出第7行第5列的数1(为了便于说明,下面摘取了附表的第6~10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28第三步,从选定的数1开始向右读,得到一个三位数175,由于175<450,说明号码175在总体内,将它取出;继续向右读,得到331,由于331<450,说明号码331在总体内,将它取出;继续向右读,得到572,由于572>450,将它去掉. 按照这种方法继续向右读,依次下去,直到样本的50个号码全部取出,这样我们就得到了参加这项活动的50名学生.3、用抽签法抽取样本的例子:为检查某班同学的学习情况,可用抽签法取出容量为5的样本. 用随机数表法抽取样本的例子:部分学生的心理调查等.抽签法能够保证总体中任何个体都以相同的机会被选到样本之中,因此保证了样本的代表性.4、与抽签法相比,随机数表法抽取样本的主要优点是节省人力、物力、财力和时间,缺点是所产生的样本不是真正的简单样本.练习(P59)1、系统抽样的优点是:(1)简便易行;(2)当对总体结构有一定了解时,充分利用已有信息对总体中的个体进行排队后再抽样,可提高抽样调查;(3)当总体中的个体存在一种自然编号(如生产线上产品的质量控制)时,便于施行系统抽样法.系统抽样的缺点是:在不了解样本总体的情况下,所抽出的样本可能有一定的偏差.2、(1)对这118名教师进行编号;(2)计算间隔1187.37516k==,由于k不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样. 例如我们随机剔除了3,46,59,57,112,93这6名教师,然后再对剩余的112位教师进行编号,计算间隔7k=;(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.3、由于身份证(18位)的倒数第二位表示性别,后三位是632的观众全部都是男性,所以这样获得的调查结果不能代表女性观众的意见,因此缺乏代表性. 练习(P62) 1、略2、这种说法有道理,因为一个好的抽样方法应该能够保证随着样本容量的增加,抽样调查结果会接近于普查的结果. 因此只要根据误差的要求取相应容量的样本进行调查,就可以节省人力、物力和财力.3、可以用分层抽样的方法进行抽样. 将麦田按照气候、土质、田间管理水平的不同而分成不同的层,然后按照各层麦田的面积比例及样本容量确定各层抽取的面积,再在各层中抽取个体(这里的个体是单位面积的一块地). 习题2.1 A 组(P63)1、产生随机样本的困难:(1)很难确定总体中所有个体的数目,例如调查对象是生产线上生产的产品.(2)成本高,要产生真正的简单随机样本,需要利用类似于抽签法中的抽签试验来产生非负整值随机数.(3)耗时多,产生非负整数值随机数和从总体中挑选出随机数所对的个体都需要时间. 2、调查的总体是所有可能看电视的人群.学生A 的设计方案考虑的人数是:上网而且登录某网址的人群,那些不能上网的人群,或者不登录某网址的人群就被排除在外了. 因此A 方案抽取的样本的代表性差.学生B 的设计方案考虑的人群是小区内的居民,有一定的片面性. 因此B 方案抽取的样本的代表性差.学生C 的设计方案考虑的人群是那些有电话的人群,也有一定的片面性. 因此C 方案抽取的样本的代表性.所以,这三种调查方案都有一定的片面性,不能得到比较准确的收视率. 3、(1)因为各个年级学习任务和学生年龄等因素的不同,影响各年级学生对学生活动的看法,所以按年级分层进行抽样调查,可以得到更有代表性的样本. (2)在抽样的过程中可能遇到的问题如敏感性问题:有些学生担心提出意见对自己不利;又如不响应问题:由于种种原因,有些学生不能发表意见;等等.(3)前面列举的两个问题都可能导致样本的统计推断结果的误差.(4)为解决敏感性问题,可以采用阅读与思考栏目“如何得到敏感性问题的诚实反应”中的方法设计调查问卷;为解决不响应问题,可以事先向全体学生宣传调查的意义,并安排专人负责发放和催收调查问卷,最大程度地回收有效调查问卷.4、将每一天看作一个个体,则总体由365天组成. 假设要抽取50个样本,将一年中的各天按先后次序编号为0~364天用简单随机抽样设计方案:制作365个号签,依次标上0~364. 将号签放到容器内充分搅拌均匀,从容器中任意不放回取出50个号签. 以签上的号码所对应的那些天构成样本,检测样本中所有个体的空气质量.用系统抽样设计抽样方案:先通过简单随机抽样方法从365天中随机抽出15天,再把剩下的350天重新按先后次序编号为0~349. 制作7个分别标有0~7的号签,放在容器中充分搅拌均匀. 从容器中任意取出一个号签,设取出的号签的编号为a ,则编号为7(050)a k k +≤<所对应的那些天构成样本,检测样本中所有个体的空气质量.显然,系统抽样方案抽出的样本中个体在一年中排列的次序更规律,因此更好实施,更受方案的实施者欢迎.5、田径队运动员的总人数是564298+=(人),要得到28人的样本,占总体的比例为27.于是,应该在男运动员中随机抽取256167⨯=(人),在女运动员中随机抽取281612-=(人).这样我们就可以得到一个容量为28的样本.6、以10为分段间隔,首先在1~10的编号中,随机地选取一个编号,如6,那么这个获奖者奖品的编号是:6,16,26,36,46.7、说明:可以按年级分层抽样的方法设计方案. 习题2.1 B 组(P64)1、说明:可以按年级分层抽样的方法设计方案,调查问卷由学生所关心的问题组成. 例如:(1)你最喜欢哪一门课程? (2)你每月的零花钱平均是多少? (3)你最喜欢看《新闻联播》吗? (4)你每天早上几点起床? (5)你每天晚上几点睡觉?要根据统计的结果和具体的情况解释结论,主要从引起结论的可能原因及结论本身含义来解释. 2、说明:这是一个开放性的题目,没有一个标准的答案. 2.2用样本估计总体 练习(P71)1、说明:由于样本的极差为364.41362.51 1.90-=,取组距为0.19,将样本分为10组. 可以按照书上的方法制作频率分布表、频率分布直观图和频率折线图.2、说明:此题目属于应用题,没有标准的答案.3、茎叶图为:由该图可以看出30名工人的日加工零件个数稳定在120件左右. 练习(P74)这里应该采用平均数来表示每一个国家项目的平均金额,因为它能反应所有项目的信息. 但平均数会受到极端数据2000万元的影响,所以大多数项目投资金额都和平均数相差比较大. 练习(P79)1、甲乙两种水稻6年平均产量的平均数都是900,但甲的标准差约等于23.8,乙的标准差约等于41.6,所以甲的产量比较稳定.2、(1)平均重量496.86x ≈,标准差 6.55s ≈.(2)重量位于(,)x s x s -+之间有14袋白糖,所占的百分比约为66.67%.3、(1)略. (2)平均分19.25x ≈,中位数为15.2,标准差12.50s ≈.这些数据表明这些国家男性患该病的平均死亡率约为19.25,有一半国家的死亡率不超过15.2,15.2x >说明存在大的异常数据,值得关注. 这些异常数据使标准差增大. 习题2.2 A 组(P81) 1、(1)茎叶图为:(2)汞含量分布偏向于大于1.00 ppm 的方向,即多数鱼的汞含量分布在大于1.00 ppm 的区域.(3)不一定. 因为我们不知道各批鱼的汞含量分布是否都和这批鱼相同. 即使各批鱼的汞含量分布相同,上面的数据只能为这个分布作出估计,不能保证平均汞含量大于1.00 ppm. (4)样本平均数 1.08x ≈,样本标准差0.45s ≈.(5)有28条鱼的汞含量在平均数与2倍标准差的和(差)的范围内.2较短,所以在这批棉花中混进了一些次品.3、说明:应该查阅一下这所大学的其他招生信息,例如平均数信息、最低录取分数线信息等. 尽管该校友的分数位于中位数之下,而中位数本身并不能提供更多录取分数分布的信息. 在已知最低录取分数线的情况下,很容易做出判断;在已知平均数小于中位数很多,则说明最低录取分数线较低,可以推荐该校友报考这所大学,否则还要获取其他的信息(如标准差的信息)来做出判断.4、说明:(1)对,从平均数的角度考虑; (2)对,从标准差的角度考虑;(3)对,从标准差的角度考虑; (4)对,从平均数和标准差的角度考虑; 5、(1)不能. 因为平均收入和最高收入相差太多,说明高收入的职工只占极少数. 现在已知知道至少有一个人的收入为50100x =万元,那么其他员工的收入之和为4913.55010075ii x==⨯-=∑(万元)每人平均只有1.53. 如果再有几个收入特别高者,那么初进公司的员工的收入将会很低. (2)不能,要看中位数是多少. (3)能,可以确定有75%的员工工资在1万元以上,其中25%的员工工资在3万元以上. (4)收入的中位数大约是2万. 因为有年收入100万这个极端值的影响,使得年平均收入比中位数高许多.6、甲机床的平均数=1.5x 甲,标准差=1.2845s 甲;乙机床的平均数 1.2z y =,标准差0.8718z s =. 比较发现乙机床的平均数小而且标准差也比较小,说明乙机床生产出的次品比甲机床少,而且更为稳定,所以乙机床的性能较好.7、(1)总体平均数为199.75,总体标准差为95.26.(2)可以使用抓阄法进行抽样. 样本平均数和标准差的计算结果和抽取到的样本有关. (3) (4)略习题2.2 B 组(P82)1、(1)由于测试1T 的标准差小,所以测试1T 结果更稳定,所以该测试做得更好一些. (2)由于2T 测出的值偏高,有利于增强队员的信心,所以应该选择测试2T . A B C D E F GH I J 1(20)2T -÷ 0.00 1.50 2.00 -1.00 -1.50 -2.00 2.50 2.000.50-0.502(35)3T -÷ -1.331.331.33-2-2.33 -1.331.67-1.67 -1.33 -1.67G E .2、说明:此题需要在本节开始的时候就布置,先让学生分头收集数据,汇总所收集的数据才能完成题目.2.3变量间的相关关系 练习(P85)1、从已经掌握的知识来看,吸烟会损害身体的健康. 但除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果. 我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题. 但吸烟引起健康问题的可能性大,因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.2、从现在我们掌握的知识来看,没有发现根据说明“天鹅能够带来孩子”,完全可能存在既能吸引天鹅和又使婴儿出生率高的第3个因素(例如独特的环境因素),即天鹅与婴儿出生率之间没有直接的关系,因此“天鹅能够带来孩子”的结论不可靠.而要证实此结论是否可靠,可以通过试验来进行. 相同的环境下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的出生率是否相同. 练习(P92)1、当0x =时,$147.767y =,这个值与实际卖出的热饮杯数150不符,原因是:线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差;即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x ,预报值$y 能够等于实际值y . 事实上:y bx a e =++. (这里e 是随机变量,是引起预报值$y 与真实值y 之间的误差的原因之一,其大小取决于e 的方差.)2、数据的散点图为:从这个散点图中可以看出,鸟的种类数与海拔高度应该为正相关(事实上相关系数为0.793).(1)散点图如下:但是从散点图的分布特点来看,它们之间的线性相关性不强.习题2.3 A组(P94)1、教师的水平与学生的学习成绩呈正相关关系. 又如,“水涨船高”“登高望远”等.2、(3)基本成正相关关系,即食品所含热量越高,口味越好.(4)因为当回归直线上方的食品与下方的食品所含热量相同时,其口味更好.3、(1)散点图如下:(2)回归方程为:$0.66954.933y x=+.(3)加工零件的个数与所花费的时间呈正线性相关关系.4、(1)散点图为:(2)回归直线如下图所示:(2)回归方程为:$0.546876.425y x =+.(3)由回归方程知,城镇居民的消费水平和工资收入之间呈正线性相关关系,即工资收入水平越高,城镇居民的消费水平越高. 习题2.3 B 组(P95) 1、(1)散点图如下:(2)回归方程为:$1.44715.843y x =-.(3)如果这座城市居民的年收入达到40亿元,估计这种商品的销售额为$42.037y ≈(万元). 2、说明:本题是一个讨论题,按照教科书中的方法逐步展开即可.第二章 复习参考题A 组(P100)1、A .2、(1)该组的数据个数,该组的频数除以全体数据总数; (2)nmN. 3、(1)这个结果只能说明A 城市中光顾这家服务连锁店的人比其他人较少倾向于选择咖啡色,因为光顾连锁店的人使一种方便样本,不能代表A 城市其他人群的想法.(2)这两种调查的差异是由样本的代表性所引起的. 因为A 城市的调查结果来自于该市光顾这家服装连锁店的人群,这个样本不能很好地代表全国民众的观点.4、说明:这是一个敏感性问题,可以模仿阅读与思考栏目“如何得到敏感性问题的诚实反应”来设计提问方法.5、表略. 可以估计出句子中所含单词的分布,以及与该分布有关的数字特征,如平均数、标准差等.6、(1)可以用样本标准差来度量每一组成员的相似性,样本标准差越小,相似程度越高. (2)A 组的样本标准差为 3.730A S ≈,B 组的样本标准差为11.789B S ≈. 由于专业裁判给分更符合专业规则,相似程度应该高,因此A 组更像是由专业人士组成的.7、(1)中位数为182.5,平均数为217.1875.(2)这两种数字特征不同的主要原因是,430比其他的数据大得多,应该查找430是否由某种错误而产生的. 如果这个大数据的采集正确,用平均数更合适,因为它利用了所有数据的信息;如果这个大数据的采集不正确,用中位数更合适,因为它不受极端值的影响,稳定性好.8、(1)略. (2)系数0.42是回归直线的斜率,意味着:对于农村考生,每年的入学率平均增长0.42%. (3)城市的大学入学率年增长最快. 说明:(4)可以模仿(1)(2)(3)的方法分析数据.第二章 复习参考题B 组(P101)1、频率分布如下表:从表中看出当把 指标定为17.46千元时,月65%的推销员 经过努力才能完成销售指标.2、(1)数据的散点图如下:(2)用y 表示身高,x 表示年龄,则数据的回归方程为$ 6.31771.984y x =+. (3)在该例中,斜率6.317表示孩子在一年中增加的高度.(4)每年身高的增长数略. 3~16岁的身高年均增长约为6.323 cm. (5)斜率与每年平均增长的身高之间之间近似相等.分组频数 频率 累计频率 [12.34,13.62] 2 0.04 0.04 (13.62,14.9] 4 0.08 0.12 (14.9,16.18] 3 0.06 0.18 (16.18,17.46] 8 0.16 0.34 (17.46,18.74] 13 0.26 0.6 (18.74,20.02] 11 0.22 0.82 (20.02,21.3]3 0.06 0.88 (21.3,22.58]3 0.06 0.94 (22.58,23.86]1 0.02 0.96 (23.86,25.14]20.041。
2.2.1用样本的频率分布估计总体分布课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.3.能够利用图形解决实际问题.1.用样本估计总体的两种情况(1)用样本的____________估计总体的分布.(2)用样本的____________估计总体的数字特征.2.数据分析的基本方法(1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.(2)借助于表格分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.3.频率分布直方图在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.4.频率分布折线图和总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.(2)总体密度曲线随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.5.茎叶图(1)适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.(2)优点:它不但可以____________,而且可以__________,给数据的记录和表示都带来方便.(3)缺点:当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.一、选择题1.下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的A.0.13 B.0.39 C.0.52 D.0.643.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有()A.30辆B.40辆C.60辆D.80辆4.如图是总体密度曲线,下列说法正确的是()A.组距越大,频率分布折线图越接近于它B.样本容量越小,频率分布折线图越接近于它C.阴影部分的面积代表总体在(a,b)内取值的百分比D.阴影部分的平均高度代表总体在(a,b)内取值的百分比5.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A.20% B.69%C.31% D.27%6.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()7.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10.抽查100袋洗衣粉,测得它们的重量如下(单位:g):494498493505496492485483508511495494483485511493505488 501491493509509512484509510 495497498504498483510503497 502511497500493509510493491 497515503515518510514509499 493499509492505489494501509 498502500508491509509499495 493509496509505499486491492 496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升11.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?12.某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.答案:2.2.1用样本的频率分布估计总体分布知识梳理1.(1)频率分布(2)数字特征 2.(1)提取信息传递(2)表格构成形式 3.频率/组距小长方形的面积1 4.(1)上端的中点(2)组数光滑曲线5.(2)保留所有信息随时记录(3)较多作业设计1.A2.C[样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.]3.B[时速在[60,70)的汽车的频率为:0.04×(70-60)=0.4,又因汽车的总辆数为100,所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4.C5.C[由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.]6.A[∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.]7.60解析∵n·2+3+42+3+4+6+4+1=27,∴n=60.8.45,46解析由茎叶图及中位数的概念可知x甲中=45,x乙中=46.9.m h解析频率组距=h,故|a-b|=组距=频率h=mh.10.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下: [482.5,486.5),[486.5,490.5),…,[514.5,518.5). 分组 个数累计 频数 频率 累积频率 [482.5,486.5) 正 8 0.08 0.08 [486.5,490.5) 3 0.03 0.11 [490.5,494.5) 正正正 17 0.17 0.28 [494.5,498.5) 正正正正- 21 0.21 0.49 [498.5,502.5) 正正 14 0.14 0.63 [502.5,506.5) 正 9 0.09 0.72 [506.5,510.5) 正正正 19 0.19 0.91 [510.5,514.5) 正- 6 0.06 0.97 [514.5,518.5]3 0.03 1.00 合计100 1.00(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44. 设重量不足500 g 的频率为b ,根据频率分布表, b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55.11.解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明. 12.解 (1)分组 频数 频率[41,51) 2 230[51,61) 1 130[61,71) 4 430[71,81) 6 630(2)(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.。
必修三第二章统计§2.1.1随机抽样【学习要求】1.正确理解随机抽样的概念;2.掌握简单随机抽样中的抽签法、随机数法的一般步骤; 3.学会用简单随机抽样方法从总体中抽取样本.【学法指导】通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性.【知识要点】1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个 地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都 ,就把这种抽样方法叫做简单随机抽样. 2.简单随机抽样的分类简单随机抽样⎩⎨⎧3.简单随机抽样的优点及适用类型简单随机抽样有操作 的优点,在总体 的情况下是行之有效的.【问题探究】[问题情境] 我们生活在一个数字化时代,时刻都在和数据打交道,例如,产品的合格率,农作物的产量,商品的销售量,电视台的收视率等.这些数据你想知道是怎么获得的吗?从这节课开始我们就学习这方面的知识.探究点一 随机抽样问题1 为了了解高一学生身高的情况,我们找到了某地区高一八千名学生的体检表,从中随机抽取了150张,表中有体重、身高、血压、肺活量等15个数据,那么我们收集的个体数据是什么? 问题2 要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断?问题3 在1936年美国总统选举前,一份颇有名气的杂志的工作人员对兰顿和罗斯福两位候选人做了一次民意测验.调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表.调查结果表明,兰顿当选的可能性大(57%),但实际选举结果正好相反,最后罗斯福当选(62%).你认为预测结果出错的原因是什么? 问题4 要用随机抽样的方法从总体中抽出高质量的样本,应对总体做怎样的处理?小结 为了使样本具有好的代表性,设计抽样方法时,最重要的是要将总体“搅拌均匀”,即使每个个体有同样的机会被抽中.探究点二 简单随机抽样的基本思想问题1 假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?问题2 从9件产品中随机抽取一个容量为3的样本,可以分三次进行,每次从中随机抽取一件,抽取的产品不放回,这叫做逐个不放回抽取.在三次抽取中的每次抽取中,总体内的各个个体被抽到的机会相同吗?为什么?小结 简单随机抽样的含义:一般地,设一个总体有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,则这种抽样方法叫做简单随机抽样. 问题3 根据你的理解,简单随机抽样有哪些主要特点?例1 人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?小结 判断一个抽样方式是不是简单随机抽样,就是看这个抽样符不符合简单随机抽样的4个特点,符合就是,否则就不是.跟踪训练1 下列抽样的方式是否属于简单随机抽样?为什么? (1)从无限多个个体中抽取50个个体作为样本.(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.探究点三 简单随机抽样的方法问题1 假设要在我们班选派5个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选?如何操作?小结 一般地,抽签法就是把总体中的N 个个体编号,把号码写在号签上,然后将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n 的样本. 问题2 一般地,抽签法的操作步骤如何? 问题3 你认为抽签法有哪些优点和缺点?问题4 当总体个数较多时,怎么抽取质量比较高的样本?小结 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数法,我们仅研究随机数表法. 问题5 一般地,利用随机数表法从含有N 个个体的总体中抽取一个容量为n 的样本,其抽样步骤如何? 例2 假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时应如何操作?小结 抽签法和随机数表法对个体的编号是不同的,抽签法可以利用个体已有的编号,如学生的学籍号,产品的记数编号等,也可以重新编号,例如总体个数为100,编号可以为1,2,3,…,100.随机数表法对个体的编号要看总体的个数,总体数为100,通常为00,01,…,99.总体数大于100小于1 000,从000开始编起,然后是001,002,….跟踪训练2 某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?【当堂检测】1.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是 ( )A .总体指的是该市参加升学考试的全体学生B .个体指的是1 000名学生中的每一名学生C .样本容量指的是1 000名学生D .样本是指1 000名学生的数学升学考试成绩 2.在简单随机抽样中,某个个体被抽中的可能性是 ( ) A .与第几次抽样有关,第1次抽中的可能性要大些 B .与第几次抽样无关,每次抽到的可能性都相等 C .与第几次抽样有关,最后一次抽中的可能性大些D .与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一样3.为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是 ( ) A .总体是240 B .个体是每个学生 C .样本是40名学生 D .样本容量是40【课堂小结】1.简单随机抽样是一种简单、基本、不放回的抽样方法,常用的简单随机抽样方法有抽签法和随机数法. 2.抽签法的优点是简单易行,缺点是当总体的容量大时,费时、费力,并且标号的签不易搅拌均匀,这样会导致抽样不公平;随机数法的优点也是简单易行,缺点是当总体容量大时,编号不方便.两种方法只适合总体容量较少的抽样类型.3.简单随机抽样每个个体入样的可能性都相等,均为n /N ,但要将每个个体入样的可能性与第n 次抽取时每个个体入样的可能性区分开,避免在解题中出现错误.【课后作业】§2.1.2 系统抽样【学习要求】1.理解系统抽样的概念;2.掌握系统抽样的一般步骤,会用系统抽样从总体中抽取样本; 3.理解系统抽样与简单随机抽样的关系;4.了解系统抽样在实际生活中的应用,提高学习数学的兴趣.【学法指导】通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法,通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系.【知识要点】1.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中 地抽取一个号码,然后按此间隔依次抽取即得到所求样本. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体 .有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. (2)确定分段间隔k ,对编号进行 .当Nn(n 是样本容量)是整数时,取k = ;(3)在第1段用 抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 得到第2个个体编号 ,再加 得到第3个个体编号 ,依次进行下去,直到获取整个样本.【问题探究】探究点一 系统抽样的基本思想[问题情境] 大家都知道盲人摸象的故事,四个盲人在庞大的大象面前,每人只摸了大象的一个部位,就都有了对大象与众不同的认识.在他们争得面红耳赤,不可开交时,有一智者对他们建议,要他们每个人按一定的间隔从左到右、从上到下去摸大象,结果每个人都得到了大象的正确形象,你知道这是一种什么方法吗? 问题1 某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?(分组讨论) 问题2 你能归纳系统抽样的定义吗? 例1 下列抽样中不是系统抽样的是 ( )A .从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i ,以后为i +5,i +10(超过15则从1再数起)号入样B .工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C .搞某一市场调查,规定在商场新门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D .电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈 小结 解决该类问题的关键是掌握系统抽样的特点及适用范围. 跟踪训练1 系统抽样适用的总体应 ( ) A .容量较小 B .容量较大 C .个体数较多但不均衡 D .任何总体探究点二 系统抽样的一般步骤问题1 用系统抽样从总体中抽取样本时,首先要做的工作是什么?问题2 如果用系统抽样从505件产品中抽取50件进行质量检查,由于505件产品不能均衡分成50部分,对此应如何处理?问题3 用系统抽样从含有N 个个体的总体中抽取一个容量为n 的样本,要平均分成多少段,每段各有多少个号码?问题4 将含有N 个个体的总体抽取容量为n 的样本,平均分成Nn 的整数部分段,每段的号码个数称为分段间隔,那么分段间隔k 的值如何确定?问题5 用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?问题6 一般地,用系统抽样从含有N 个个体的总体中抽取一个容量为n 的样本,其操作步骤如何? 问题7 系统抽样适合在哪种情况下使用?与简单随机抽样比较,哪种抽样方法更使样本具有代表性?例2 某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程. 小结 (1)解决系统抽样问题中两个关键的步骤为:①分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.②起始编号的确定应用随机抽样的方法,一旦起始编号确定,其他编号便随之确定了. (2)当总体中的个体数不能被样本容量整除时,需要在总体中剔除一些个体.跟踪训练2 从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是 ( ) A .5,10,15,20,25 B .3,13,23,33,43 C .1,2,3,4,5 D .2,4,6,16,32例3 为了解参加某种知识竞赛的1 000名学生的成绩,从中抽取一个容量为50的样本,那么采用什么抽样方法比较恰当?简述抽样过程.小结 系统抽样又称等距抽样,要求总体中不能含有一定的周期性,否则其样本的代表性是不可靠的,甚至会导致明显的偏向.跟踪训练3某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.【当堂检测】1.下列抽样问题中最适合用系统抽样法抽样的是()A.从全班48名学生中随机抽取8人参加一项活动B.一个城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本C.从参加模拟考试的1 200名高中生中随机抽取100人分析试题作答情况D.从参加模拟考试的1 200名高中生中随机抽取10人了解某些情况2.为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是() A.2 B.3 C.4 D.53.有20个同学,编号为1~20,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽的编号为() A.5,10,15,20 B.2,6,10,14C.2,4,6,8 D.5,8,11,14【课堂小结】系统抽样的优点是简单易操作,当总体个数较多的时候也能保证样本的代表性;缺点是对存在明显周期性的总体,选出来的个体,往往不具备代表性.从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.【课后作业】§2.1.3分层抽样【学习要求】1.正确理解分层抽样的概念;2.掌握分层抽样的一般步骤;3.区分简单随机抽样、系统抽样和分层抽样,并选择适当的方法进行抽样.【学法指导】通过对现实生活中的实际问题进行分层抽样,感知应用数学知识解决实际问题的方法;通过对统计学知识的研究,感知数学知识中“估计”与“精确”性的矛盾统一,培养辩证唯物主义的世界观与价值观.【知识要点】1.分层抽样的概念在抽样时,将总体分成的层,然后按照,从各层地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持与的一致性,这对提高样本的代表性非常重要.当总体是由的几个部分组成时,往往选用分层抽样的方法.【问题探究】[问题情境]中国共产党第十八次代表大会2 270名代表是从40个单位中产生的,这40个单位分别是:1─31为省(自治区、直辖市)、32中央直属机关、33中央国家机关、34全国台联、35解放军、36武警部队、37中央金融系统、38中央企业系统、39中央香港工委、40中央澳门工委.代表的选举原则上是按各选举单位的党组织数、党员人数进行分配的.这种产生代表的方法与我们今天要学的分层抽样很相似.探究点一分层抽样的基本思想导引某地区有高中生2 400人,初中生10 900人,小学生11 000人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生抽取1%的学生进行调查,你认为应当怎样抽取样本?问题1为了抽样方便,能不能只从小学生或初中生或高中生中抽取中小学生总数的1%?为什么?问题2在高中,初中和小学三部分学生中都按1%的比例抽取,那么各抽取多少人?问题3具体在三类学生中抽取样本时(如在10 800名初中生中抽取108人),可以用哪种抽样方法进行抽样?问题4上述抽样方法保证了抽样的公平性,并且样本具有较好的代表性,从而是一种科学、合理的抽样方法,这种抽样方法称为分层抽样.你能归纳出分层抽样的概念吗?问题5适合用分层抽样的方法抽取样本的问题有什么特点?例1某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4 B.5 C.6 D.7小结如果A、B、C三层含有的个体数目分别是x、y、z,在A、B、C三层应抽取的个体数目分别是m、n、p,那么有x∶y∶z=m∶n∶p.跟踪训练1某校有学生2 000人,其中高三学生500人.为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为________.探究点二分层抽样的一般步骤导引某单位有职工500人,其中35岁以下的有125人,35岁~49岁的有280人,50岁以上的有95人.为了调查职工的身体状况,要从中抽取一个容量为100的样本,如何进行抽取?问题1该项调查应采用哪种抽样方法进行?问题2不同年龄段的职工中,按什么比例抽取人数?问题3按比例,三个年龄层次的职工分别抽取多少人?问题4在分层抽样中,如果总体的个体数为N,样本容量为n,第i层的个体数为k,则在第i层应抽取的个体数如何算?问题5在各年龄段具体如何抽样?怎样获得所需样本?问题6一般地,分层抽样的操作步骤如何?问题7样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理?例2写出导引中的解题步骤.小结如果总体中的个体有差异,那么就用分层抽样抽取样本.用分层抽样抽取样本时,要把性质、结构相同的个体组成一层.跟踪训练2某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况,试写出抽样过程.探究点三三种抽样方法的比较问题 简单随机抽样、系统抽样和分层抽样既有其共性,又有其个性,根据下表,你能对三种抽样方法作一个比例3 某高级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是 ( ) A .②③都不能为系统抽样 B .②④都不能为分层抽样 C .①④都可能为系统抽样 D .①③都可能为分层抽样小结 根据样本的号码判断抽样方法时,要紧扣三类抽样方法的特征.利用简单随机抽样抽取的样本号码没有规律性;利用分层抽样抽取的样本号码有规律性,即在每一层抽取的号码个数m 等于该层所含个体数目与抽样比的积,并且应该恰有m 个号码在该层的号码段内;利用系统抽样取出的样本号码也有规律性,其号码按从小到大的顺序排列,则所抽取的号码是:l ,l +k ,l +2k ,…,l +(n -1)k .其中,l 为第一个样本号码(l ≤k ),n 为样本容量(n =1,2,3,…),l 是第一组中的号码,k 为分段间隔=总体容量/样本容量.跟踪训练3 一个总体中的80个个体编号为0,1,2,…,79,并依次将其分为8个组,组号为0,1,…,7,要用下述抽样方法抽取一个容量为8的样本:即在第0组先随机抽取一个号码i ,则第k 组抽取的号码为10k +j ,其中j =⎩⎪⎨⎪⎧i +ki +k <i +k -i +k ,若先在0组抽取的号码为6,则所抽到的8个号码依次为______________【当堂检测】1.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为 ( ) A .7 B .15 C .25 D .352.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为 ( ) A .30 B .25 C .20 D .153.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________【课堂小结】1.用分层抽样从个体为N 的总体中抽取一个容量为n 的样本时,在整个抽样过程中每个个体被抽到的机会相等.2.分层抽样是建立在简单随机抽样或系统抽样基础上的,由于它充分利用了已知信息,考虑了保持样本结构与总体结构的一致性,因此它获取的样本更具代表性,在实用中更为广泛.3.简单随机抽样是基础,系统抽样与分层抽样是补充和发展,三者相辅相成,对立统一.【课后作业】§2.1习题课【学习要求】1.从总体上把握三种抽样方法的区别和联系;2.学会根据数据的不同情况,选用适合的抽样方法进行抽样.【双基巩固】1.关于简单随机抽样法、系统抽样法、分层抽样法的叙述正确的是( ) A .三种抽样方法适用于对任何总体的抽样B .从同一总体中抽取一个样本,采用的方法不同,每个个体被抽到的概率也不相同C .分层抽样法是三种抽样方法中最好的D .三种抽样方法有各自的特点,根据总体和所抽样本的情况,选择适当的抽样方法更易于操作,效果更好 2.下列问题中,最适合用分层抽样方法抽样的是 ( )A .某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈B .从10台冰箱中抽出3台进行质量检查C .某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,现抽取农田480亩估计全乡农田平均产量D .从50个零件中抽取5个做质量检验3.某大型超市销售的乳类商品有4类:鲜奶、酸奶、婴幼儿奶粉、成人奶粉,且鲜奶、酸奶、婴幼儿奶粉、成人奶粉分别有45种、10种、25种、20种不同的品牌,现从中抽取一个容量为20的样本进行三聚氰胺的安全检测,若采用分层抽样的方法抽取样本,则抽取的酸奶与成人奶粉品牌数之和是 ( ) A .7 B .6 C .5 D .44.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k 为________.【题型解法】题型一 简单随机抽样例1 今用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本.问: (1)总体中的某一个体a 在第一次抽取时被抽到的概率是多少? (2)个体a 不是在第1次被抽到,是在第2次被抽到的概率是多少? (3)在整个抽样过程中,个体a 被抽到的概率是多少?小结 简单随机抽样的特点:(1)抽取的个体数较少;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.抽签法适于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.跟踪训练1 某公司甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 ( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法题型二 系统抽样例2 某学校有3 004名学生,从中抽取30名学生参加问卷调查,试用系统抽样的方法完成对样本的抽取. 小结 当总体容量N 较大时,采用系统抽样.分段的间隔一般为k =N n ,若Nn 不是整数,应随机剔除部分个体.预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.跟踪训练2 在120个零件中,一级品24个,二级品36个,三级品60个,用系统抽样方法从中抽取容量为20的样本,则三级品a 被抽到的可能性为________.题型三 分层抽样例3 某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户,进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.小结 分层抽样遵循的原则:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层抽样为保证每个个体等可能入样需遵循每层抽样的比相同,即为样本容量与总体数目的比值.跟踪训练3 将一个总体分为A 、B 、C 三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C 中抽取________个个体.【课堂小结】1.抽签法的关键是搅拌均匀,才能达到等概率抽样,抽签法的优点是操作简单、易行、方便,缺点是只适用于总体中个体数较少时.2.在系统抽样中,遇到Nn (N 是总体,n 是样本容量)不是整数时,要从总体中剔除多余的个体,使剩余的个体能被样本容量整除,剔除多余个体所用的方法是随机抽样法.3.分层抽样的步骤是将总体按一定的标准分层,按各层个体占总体的比在每一层进行随机抽取;其特点是适用于总体由差异明显的几部分组成.4.几种抽样方法的共同特点是它们在抽样过程中,属不放回抽样,且每次抽取时,总体内的各个个体被抽到的机会是相等的.这体现了这些抽样方法的客观性和公平性.【课后作业】§2. 2.1 用样本的频率分布估计总体分布(一)【学习要求】1.通过实例体会分布的意义和作用;2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图,能通过频率分布表或频率分布直方图对数据做出总体统计.【学法指导】通过对频率分布表、频率分布直方图的学习,探究、感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.【知识要点】1.用样本估计总体的两种情况(1)用样本的 估计总体的分布. (2)用样本的 估计总体的数字特征. 2.数据分析的基本方法 (1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中 信息,二是利用图形 信息. (2)借助于表格分析数据的另一方法是用紧凑的 改变数据的排列方式,此法是通过改变数据的 ,为我们提供解释数据的新方式. 3.频率分布直方图在频率分布直方图中,纵轴表示 ,数据落在各小组内的频率用 来表示,各小长方形的面积的总和等于 .【问题探究】[问题情境] 通过抽样方法收集数据的目的是从中寻找所包含的信息,用样本去估计总体.如何根据样本的情况对总体的情况作出推断是我们将要学习的内容. 探究点一 频率分布表导引1 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a ,用水量不超过a 的部分按平价收费,超出a 的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a 定为多少比较合理呢? 问题1 你认为,为了较为合理地确定出这个标准,需要做哪些工作?问题2 为了了解全市居民日常用水量的整体分布情况,用怎样的方法了解? 导引2 通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t): 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1。
描述:例题:高中数学必修3(人教B版)知识点总结含同步练习题及答案第二章 统计 2.3 变量的相关性一、学习任务1. 能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2. 了解线性回归的方法,了解用最小二乘法研究两个变量的线性相关问题的思想方法,会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式).二、知识清单变量间的相关关系相关关系 线性相关三、知识讲解1.变量间的相关关系2.相关关系变量与变量之间的关系一类是确定性的函数关系,像正方形的边长 和面积 的关系 .另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.例如,人的身高不能确定体重,但一般说来“身高者,体也重”.我们说身高与体重这两个变量具有相关关系.函数关系与相关关系的异同点相同点:是两者均是指两个变量的关系;不同点:①函数关系是一种确定性的关系,相关关系是一种非确定性的关系.②函数关系式一种因果关系,而相关关系不一定是因果关系,其也可能是伴随关系.a S 给出下列关系:①正方形的边长与面积之间的关系;②水稻产量与施肥量之间的关系;③降雪量与交通事故的发生率之间的关系.其中具有相关关系的是______.解:②③两个变量之间的关系有两种:函数关系与相关关系.①正方形的边长和面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③降雪量与交通事故的发生率具有相关关系.下图中的两个变量是相关关系的是( )描述:3.线性相关两个变量的线性关系对具有相关关系的两个变量进行统计分析的方法叫回归分析.将样本中的个数据点(,,,)描在平面直角坐标系中,就得到了散点图.如果两个变量的散点图中的点散步在左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,我们将这种相关称为正相关.如果两个变量的散点图中的点散步的位置是从左上角到右下角的区域,即一个变量的值由小变大是,另一个变量的值由大变小,我们将这种相关称为负相关.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量具有线性相关关系.回归直线方程“最贴近”已知的数据点的直线方程称之为回归直线方程,简称回归方程,方程为,叫做回归系数.刻画了实际观察值与回归直线上相应点纵坐标之间的偏离程度,个离差构成的总离差越小越好,总离差通常是用离差的平方和来表示,即作为总离差,并使之达到最小.回归直线就是所有直线中取最小的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.A.①② B.①③ C.②④ D.②③解:D①属于函数关系,因为每个 值对应一个 值,这是确定性的关系;②中散点图中各点分布的区域大致为从左下角到右上角,没有确定的函数关系,但是具有相关关系;③中散点图分布的区域大致在一条曲线附近,对于每个 ,其对应的 呈现出一定的规律性,因此这两个变量具有相关关系;④ 中各点的分布比较均匀,但对于每个 , 的分布没有规律,因此不属于相关关系.x y x y x y n (,)x i y i i =12⋯n =a +bx y ^b −y i y ^i y i n Q =(−a −b ∑i =1ny i x i )2Q(),得散点图2.由这两个散点图可以判断( )(,)u i v i i =12⋯10高考不提分,赔付1万元,关注快乐学了解详情。
人教版高一数学必修三第二章统计目录简单随机抽样(新讲课)系统抽样(新讲课)分层抽样(新讲课)2用样本的频次散布预计整体散布(2 课时 ) (新讲课)用样本的数字特色预计整体的数字特色(2 课时 ) (新讲课)变量之间的有关关系(新讲课)两个变量的线性有关(第一课时)(新讲课)两个变量的线性有关(第二课时)(新讲课)生活中线性有关实例(第三课时)(新讲课)第二章统计单元检测题(一)第二章统计单元检测题(一)参照答案第二章统计单元检测题(二)第二章统计单元检测题(二)参照答案第二章统计单元检测题(三)第二章统计单元检测题(三)参照答案第二章统计一、课程目标:本章主要介绍最基本的获得样本数据的方法,以及集中从样本数据中提守信息的统计方法,此中包含用样本预计整体散布、数字特色和线性回归等内容。
本章经过实质问题,进一步介绍随机抽样、样本预计整体、线性回归的基本方法。
二、学习目标:1、随机抽样(1)能从现实生活或其余学科中提出拥有一订价值的统计问题。
(2)联合详细的实质问题情境,理解随机抽样的必需性和重要性。
(3)在参加解决统计问题的过程中,学会用简单随机抽样从整体中抽取样本;经过对实例的剖析,认识分层抽样和系统抽样方法。
(4)经过试验、查阅资料、设计检盘问卷等方法采集数据。
2、用样本预计整体(1)经过实例领会散布的意义和作用,在表示样本数据的过程中,学会列频次散布彪、花频次散布直方图、频次折线图、茎叶土,领会它们各自的特色。
(2)经过实例理解样本数据标准差的意义和作用,学会计算数据样本差。
(3)能依据实质问题的需求合理地选用样本,从样本数据中提取基本的数字特色,并做出合理的解说。
(4)进一步领会用样本预计整体的思想。
(5)会用随机抽样的基本方法和样本预计整体的思想,解决一些简单的实质问题。
(6)形成对数据办理过程进行初步评论的意识。
3、变量的有关性(1)经过采集现实问题中两个有关系变量的数据作出散点图,并利用散点图直观认识变量间的有关关系。
2.3变量的相关性学习目标 1.了解变量间的相关关系,会画散点图.2.根据散点图,能判断两个变量是否具有相关关系.3.了解线性回归思想,会求回归直线的方程.知识点一变量间的相关关系思考1粮食产量与施肥量间的相关关系是正相关还是负相关?答案在施肥不过量的情况下,施肥越多,粮食产量越高,所以是正相关.思考2怎样判断一组数据是否具有线性相关关系?答案画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.梳理1.相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.2.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.知识点二两个变量的线性相关思考任何一组数据都可以由最小二乘法得出回归直线方程吗?答案用最小二乘法求回归直线方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的回归直线方程是无意义的.梳理回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程:回归直线对应的方程叫做回归直线方程. (3)最小二乘法:求回归直线方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的离差平方和最小的方法叫做最小二乘法.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y ∑i =1n x 2i-n x 2,a ^=y -b ^x ,其中,b ^是回归直线方程的斜率,a ^是回归直线方程在y 轴上的截距.1.人的身高与年龄之间的关系是相关关系.( × ) 2.农作物的产量与施肥量之间的关系是相关关系.( √ ) 3.回归直线过样本点中心(x ,y ).( √)题型一 变量间相关关系的判断例1 下列两个变量之间是相关关系的是( ) A .圆的面积与半径之间的关系 B .球的体积与半径之间的关系 C .角度与它的正弦值之间的关系D .降雪量与交通事故的发生率之间的关系 答案 D解析 由题意知A 表示圆的面积与半径之间的关系S =πr 2,B 表示球的体积与半径之间的关系V =4πr 33,C 表示角度与它的正弦值之间的关系y =sin α,都是确定的函数关系,只有D是相关关系,故选D.反思与感悟函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.跟踪训练1下列两个变量间的关系不是函数关系的是()A.正方体的棱长与体积B.角的度数与它的正切值C.单产为常数时,土地面积与粮食总产量D.日照时间与水稻的单位产量答案 D解析函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项V=a3,B项y =tan α,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系.题型二散点图的应用例25名学生的数学和物理成绩(单位:分)如下:判断它们是否具有线性相关关系.解以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.反思与感悟(1)判断两个变量x和y间具有哪种相关关系,最简便的方法是绘制散点图.变量之间可能是线性的,也可能是非线性的(如二次函数),还可能不相关.(2)画散点图时应注意合理选择单位长度,避免图形偏大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.跟踪训练2 下列图形中两个变量具有线性相关关系的是( )答案 C解析 A 是一种函数关系;B 也是一种函数关系;C 中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关的. 题型三 回归直线的求解与应用例3 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:(1)画出散点图;(2)如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内? 解 (1)散点图如图所示:(2)近似直线如图所示:(3)由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.引申探究1.本例中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少? 解 因为y =5170x -67,所以当x 增加一个单位时,y 大约增加5170.2.本例中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速. 解 因为y =5170x -67,所以当y =7时,7=5170x -67,解得x ≈11.反思与感悟 求回归直线方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i . (5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1n x i y i-n x y∑i =1n x 2i-n x2,a ^=y -b ^x .(6)写出回归直线方程y ^=b ^x +a ^.跟踪训练3 某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:(1)画出散点图; (2)求回归直线方程. 解 (1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.于是可得,b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=1 380-5×5×50145-5×52=6.5,a ^=y -b ^x =50-6.5×5=17.5.于是所求的回归直线方程是y ^=6.5x +17.5.1.设有一个回归直线方程为y ^=2-1.5x ,则变量x 增加1个单位时,y 平均( ) A .增加1.5个单位 B .增加2个单位 C .减少1.5个单位 D .减少2个单位答案 C2.工人工资y (元)与劳动生产率x (千元)的相关关系的回归直线方程为y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工人工资为130元B .劳动生产率提高1 000元时,工人工资平均提高80元C .劳动生产率提高1 000元时,工人工资平均提高130元D .当月工资为250元时,劳动生产率为2 000元 答案 B解析 因为回归直线的斜率为80,所以x 每增加1,y 平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归直线方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 当x =170时,y ^=0.85×170-85.71=58.79,体重的估计值为58.79 kg.4.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则回归直线方程是________.答案 y ^=1.23x +0.08解析 回归直线的斜率的估计值为1.23,即b ^=1.23,又回归直线过定点(4,5),∴a ^=5-1.23×4=0.08,∴y ^=1.23x +0.08.5.某地区近10年居民的年收入x 与年支出y 之间的关系大致符合y ^=0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元. 答案 12.1解析 将x =15代入y ^=0.8x +0.1,得y ^=12.1.1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求回归直线方程时应注意的问题(1)知道x 与y 成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ^,b ^的值时,要先计算b ^,然后才能算出a ^.3.利用回归直线方程,我们可以进行估计和预测.例如,若回归直线方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.一、选择题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( )A.y ^=-10x +200B.y ^=10x +200C.y ^=-10x -200 D.y ^=10x -200答案 A解析 x 的系数为负数,表示负相关,排除B ,D ,由实际意义可知x >0,y >0,C 中,散点图在第四象限无意义,故选A.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,…,10),得散点图2,由这两个散点图可以断定( )A .x 与y 正相关,u 与v 正相关B .x 与y 正相关,u 与v 负相关C .x 与y 负相关,u 与v 正相关D .x 与y 负相关,u 与v 负相关答案 C解析 由图1可知,点散布在从左上角到右下角的区域,各点整体呈递减趋势,故x 与y 负相关;由图2可知,点散布在从左下角到右上角的区域,各点整体呈递增趋势,故u 与v 正相关. 3.已知x 与y 之间的一组数据:已求得关于y 与x 的回归直线方程为y ^=2.2x +0.7,则m 的值为( ) A .1 B .0.85 C .0.7 D .0.5 答案 D解析 x =0+1+2+34=1.5,y =m +3+5.5+74,将其代入y ^=2.2x +0.7,可得m =0.5,故选D.4.根据如下样本数据得到的回归直线方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0B.a ^>0,b ^<0C.a ^<0,b ^>0 D.a ^<0,b ^<0答案 B解析 画出散点图,知a ^>0,b ^<0.5.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的回归直线方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C ,D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误. 故选A.6.已知x 与y 之间的一组数据:若y 与x 线性相关,则y 与x 的回归直线y ^=b ^x +a ^必过( ) A .点(2,2) B .点(1.5,0) C .点(1,2) D .点(1.5,4) 答案 D解析 ∵x =0+1+2+34=1.5,y =1+3+5+74=4,∴回归直线必过点(1.5,4).故选D. 7.已知x ,y 的取值如表所示:如果y 与x 线性相关,且回归直线方程为y ^=b ^x +132,则b ^等于( )A .-12 B.12 C .-110 D.110答案 A 解析 ∵x =2+3+43=3,y =6+4+53=5, ∴回归直线过点(3,5), ∴5=3b ^+132,∴b ^=-12,故选A.8.某产品的广告费用x (单位:万元)与销售额y (单位:万元)的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( ) A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元答案 B解析 x =4+2+3+54=3.5,y =49+26+39+544=42.因为回归直线过点(x ,y ),所以42=9.4×3.5+a ^,解得a ^=9.1.故回归方程为y ^=9.4x +9.1.所以当x =6时,y ^=6×9.4+9.1=65.5. 二、填空题9.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归直线方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6 解析x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入回归直线方程中得14+c5=0.85×5-0.25,解得c =6.10.如图所示的五组数据(x ,y )中,去掉________后,剩下的四组数据相关性增强.答案 (4,10)解析 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强. 11.在一次试验中测得(x ,y )的四组数据如下:根据上表可得回归直线方程y ^=-5x +a ^,据此模型预报当x =20时,y 的值为________. 答案 26.5 解析x =16+17+18+194=17.5,y =50+34+41+314=39,∴回归直线过点(17.5,39),∴39=-5×17.5+a ^,∴a ^=126.5, ∴当x =20时,y =-5×20+126.5=26.5.12.某工厂对某产品的产量与成本的资料分析后有如下数据:由表中数据得到的回归直线方程y ^=b ^x +a ^中b ^=1.1,预测当产量为9千件时,成本约为________万元. 答案 14.5解析 由表中数据得x =4,y =9,代入回归直线方程得a ^=4.6,∴当x =9时,y ^=1.1×9+4.6=14.5. 三、解答题13.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求两变量之间的回归直线方程y =b x +a ;(2)利用(1)中所求出的回归直线方程预测该地第6年的粮食需求量. 解 (1)由所给数据得x =3,y =5.8,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1.1,a ^=y -b ^x =2.5,∴y ^=1.1x +2.5.故所求的回归直线方程为y ^=1.1x +2.5.(2)第6年的粮食需求量约为y ^=1.1×6+2.5=9.1(万吨).14.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭月储蓄y (千元)关于月收入x (千元)的回归直线方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =110x i =110×80=8,y =1n ∑i =110y i =110×20=2,又∑i =110x 2i -n x 2=720-10×82=80, ∑i =110x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4,故所求回归直线方程为y ^=0.3x -0.4.(2)将x =7代入回归直线方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元).。
章末复习课知识概览对点讲练知识点一三种抽样方法的选择例1选择合适的抽样方法抽样,写出抽样过程.(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个.(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个.(3)有甲厂生产的300个篮球,抽取10个.(4)有甲厂生产的300个篮球,抽取30个.点评弄清三种抽样方法的实质和适用范围,是灵活选用抽样方法的前提和基础.若用分层抽样,应先确定各层的抽取个数,然后在各层中用系统抽样或简单随机抽样进行抽取.变式迁移1某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是() A.4 B.5 C.6 D.7知识点二用样本估计总体例2有1个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计小于30的数据约占多大百分比.点评频率分布直方图可直观看出在各个区间内机会的差异,可对总体情况作出估计.变式迁移2为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83 C.2.7,78 D.2.7,83例3甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):变式迁移3随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.知识点三回归直线方程及应用例4在7块并排、形状大小相同的实验田上进行施化肥量对水稻产量影响的试验,得数据列表(1)(2)求水稻产量y与施化肥量x之间的回归直线方程;(3)当施化肥50 kg时,对水稻的产量予以估计.点评(1)回归分析是寻找相关关系中非确定性关系的某种确定性;(2)求回归直线方程,关键在于正确地求出系数a ^,b ^,由于a ^,b ^的计算量大,计算时要仔细,避免计算失误.变式迁移4 某个服装店经营某种服装,在某周内获纯利y (元)与该周每天销售这种服装件数x已知:∑7i =1x 2i =280,∑i =1y 2i =45 309,∑i =1x i y i =3 487,且y 与x 有线性相关关系.(1)求x ,y ;(2)求纯利y 与每天销售件数x 之间的回归直线方程.课时作业一、选择题1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,7,13,17,23,27,…,93,97的产品进行检验,则这样的抽样方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .以上都不对2.下列说法:①一组数据不可能有两个众数;②一组数据的方差不可能是负数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率,其中错误的个数有( )A .0B .1C .2D .33.现有60瓶牛奶制品,编号从1至60,若从中抽取6瓶进行检验,用系统抽样方法确定所抽的编号为( )A .3,13,23,33,43,53B .2,14,26,38,42,56C .5,8,31,36,48,54D .5,10,15,20,25,304.数学老师对某同学在参加高考前的5次数学模拟考试成绩进行统计分析,判断该同学的数学成绩是否稳定,于是老师需要知道该同学这5次成绩的( )A .平均数或中位数B .方差或标准差C .众数或频率D .频数或众数5.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程为y ^=b ^x +a ^,那么下列说法不正确的是( )A .直线y ^ =b ^ x +a ^ 必经过点(x ,y )B .直线y ^=b ^x +a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点 C .直线y ^=b ^x +a ^的斜率为∑ni =1x i y i -n x y∑n i =1x 2i -n x 2D .直线y ^=b ^x +a ^和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑ni =1[y i -(bx i +a )]2是该坐标平面上所有直线与这些点的偏差中最小的 二、填空题6.某校有教师200人,男学生1 200人,女学生1 000人,现用分层抽样的方法从所有师生中抽取一个容量为n 的样本,已知从女学生中抽取的人数为80人,则n 的值为________.7.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图所示,则平均分数较高的是________,成绩较为稳定的是________.8.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:三、解答题9.对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:甲 27,38,30,37,35,31; 乙 33,29,38,34,28,36.根据以上数据,试判断他们谁更优秀. 10.随机选取15家销售公司,由营业报告中查出其上年度的广告费(占总费用的百分比)及盈利额(1)画出散点图;(2)如果变量x 与y 之间具有线性相关关系,求出回归直线方程; (3)已知某销售公司的广告费为其总费用的1.7%,试估计其盈利额占销售总额的百分比.章末复习课对点讲练例1 解 (1)总体容量较小,用抽签法. ①将30个篮球编号,号码为00,01, (29)②将以上30个编号分别写在一张小纸条上,揉成小球,制成号签; ③把号签放入一个不透明的袋子中,充分搅拌;④从袋子中逐个抽取3个号签,并记录上面的号码; ⑤找出和所得号码对应的篮球.(2)总体由差异明显的两个层次组成,需选用分层抽样法. ①确定抽取个数. 3010=3,所以甲厂生产的应抽取213=7(个), 乙厂生产的应抽取93=3(个);②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.(3)总体容量较大,样本容量较小,宜用随机数表法.①将300个篮球用随机方式编号,编号为000,001,…,299; ②在随机数表中随机的确定一个数作为开始,如第8行第11列的数“2”开始.任选一个方向作为读数方向,比如向右读;③从数“2”开始向右读,每次读三位,凡不在000~299中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.(4)总体容量较大,样本容量也较大宜用系统抽样法.①将300个篮球用随机方式编号,编号为001,002,003,…,300,并分成30段,其中每一段包含30030=10(个)个体;②在第一段001,002,003,…,010这十个编号中用简单随机抽样抽出一个(如002)作为起始号码;③将编号为002,012,022,…,292的个体抽出,组成样本. 变式迁移1 C [抽取的植物油类种数:1040+10+30+20×20=2,抽取的果蔬类食品种数:2040+10+30+20×20=4,故抽取的植物油类与果蔬类食品种数之和是6.] 例2 解 (1)(2)(3)小于30的数据约占90%.变式迁移2 A [100人分为10组,第1组1人,第2组3人,第三组9人,第四组27人,故a =0.27;后六组共87人,故b =78.]例3 甲解析 方法一 x 甲=15×(9.8+9.9+10.1+10+10.2)=10,x 乙=15×(9.4+10.3+10.8+9.7+9.8)=10,即甲、乙两种冬小麦的平均单位面积产量的均值都等于10,其方差分别为s 2甲=15×(0.04+0.01+0.01+0+0.04)=0.02,s 2乙=15×(0.36+0.09+0.64+0.09+0.04) =0.244,即s 2甲<s 2乙,表明甲种小麦的产量比较稳定.方法二 (通过特殊的数据作出合理的推测)表中乙品种在第一年的产量为9.4,在第三年的产量为10.8,其波动比甲品种大得多,所以甲种冬小麦的产量比较稳定.变式迁移3 解 (1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间,因此乙班平均身高高于甲班.(2)x =158+162+163+168+168+170+171+179+179+18210=170.甲班的样本方差s 2=110×[(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.例4 解 (1)画出散点图如下图:由图可见是线性相关的.x =30,y ≈399.3,∑i =17x i y i =87 175.∑i =17x 2i =7 000.计算得:b ^=87 175-7×30×399.37 000-7×302≈4.75,a ^ =399.3-4.75×30=256.8.即得回归直线方程y ^=256.8+4.75x.(3)施化肥50 kg 时,可以估计水稻产量约为494.3 kg .变式迁移4 解 (1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917=5597≈79.86.(2)设回归直线方程为y ^=b ^x +a ^,因为∑7i =1x 2i =280,∑7i =1y 2i =45 309,∑7i =1x i y i =3 487,x =6,y =5597,所以b ^=3 487-7×6×5597280-7×36=13328=4.75,a ^=5597-6×4.75≈51.36.所以回归直线方程为y ^=4.75x +51.36. 课时作业 1.B 2.B 3.A 4.B 5.B 6.192解析 801 000=n2 400,n =192.7.甲 甲解析 甲的平均分为x =68+69+70+71+725=70,乙的平均分为y =68;甲的方差为s 21=(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)25=2.乙的方差为s 22=7.2,故甲的平均分高于乙,甲的成绩比乙稳定.8.y ^=14.7+0.132x9.解 x 甲=16×(27+38+30+37+35+31)=1986=33.s 2甲=16×[(27-33)2+(38-33)2+…+(31-33)2] =16×94≈15.7. x 乙=16×(33+29+38+34+28+36)=1986=33,s 2乙=16×[(33-33)2+(29-33)2+…+(36-33)2] =16×76≈12.7 ∴x 甲=x 乙,s 2甲>s 2乙,说明甲乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.10.解 (1)散点图如图所示.(2)回归直线方程是y ^=1.414 68x +0.821 23.(3)当x =1.7时,由回归直线方程得y =3.23,即可估算其盈利额占销售总额的3.23%.。
用样本的频率分布估计总体分布课时目标.理解用样本的频率分布估计总体分布的方法.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.能够利用图形解决实际问题..用样本估计总体的两种情况()用样本的估计总体的分布.()用样本的估计总体的数字特征..数据分析的基本方法()借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中,二是利用图形信息.()借助于表格分析数据的另一方法是用紧凑的改变数据的排列方式,此法是通过改变数据的,为我们提供解释数据的新方式..频率分布直方图在频率分布直方图中,纵轴表示,数据落在各小组内的频率用来表示,各小长方形的面积的总和等于..频率分布折线图和总体密度曲线()频率分布折线图连接频率分布直方图中各小长方形,就得到了频率分布折线图.()总体密度曲线随着样本容量的增加,作图时所分的增加,组距减小,相应的频率分布折线图就会越来越接近于一条,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比..茎叶图()适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.()优点:它不但可以,而且可以,给数据的记录和表示都带来方便.()缺点:当样本数据时,枝叶就会很长,茎叶图就显得不太方便.一、选择题.下列说法不正确的是().频率分布直方图中每个小矩形的高就是该组的频率.频率分布直方图中各个小矩形的面积之和等于.频率分布直方图中各个小矩形的宽一样大.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的.一个容量为的样本,其数据的分组与各组的频数如下:组别(] (] (] (] (] (] (]频数则样本数据落在(]上的频率为().....辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[)的汽车大约有().辆.辆.辆.辆.如图是总体密度曲线,下列说法正确的是().组距越大,频率分布折线图越接近于它.样本容量越小,频率分布折线图越接近于它。
2.2.1 用样本的频率分布估计总体分布第1课时用样本的频率分布估计总体分布(1)课时目标1.会列频率分布表、画频率分布直方图、频率分布折线图.2.能用频率分布直方图对总体分布规律进行估计.识记强化1.频率分布样本中所有数据(或者数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或者数据组)的频率的分布,可以用频率分布表、频率分布直方图、频率分布折线图、茎叶图等来表示.2.频率分布直方图在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形面积的总和等于1.3.频率分布折线图与总体密度曲线连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数也在增加,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.课时作业一、选择题1.下列说法不正确的是( )最高一组矩形的高为( )A .0.01B .0.02C .0.03D .0.04 答案:B解析:由图可计算出第一、二、四、五小组频率分别为0.1,0.16,0.24,0.1,所以最高一组频率为1-0.1-0.16-0.24-0.1=0.4,其矩形的高为0.420=0.02.6.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60]元的同学有30人,则n 的值为( )A .100B .1000C .90D .900 答案:A解析:支出在[50,60]元的同学的概率为0.03×10=0.3,因此n =300.3=100.二、填空题7.某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.答案:6008.为了了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出样本的频率分布直方图(如下),那么在这100株树木中,底部周长小于110cm的株数是________.答案:70解析:可由图先求出小于110cm的频率之和,即(0.01+0.02+0.04)×10=0.7,故所求株数为100×0.7=70(株).9.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18),得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是________.答案:54解析:成绩在[16,18]的学生的人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54.三、解答题10.某班英语考试得分情况如下:考试成绩/分[50,60)[60,70)[70,80)[80,90)[9,100)合计人数5111711650(1)试列出频率分布表;(2)画出频率分布直方图.解:(1)(2)11.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m) 1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数21423427 6身高(m) 1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数87432121 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m 的约占多少?不低于1.63m的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生身高在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?解:(1)计算各个身高数据的频率,不低于1.65m且不高于1.71m的占56.7%,不低于1.63m的占85%.(2)样本频率分布直方图略.(3)在不低于1.66m且不高于1.70m范围内的男生人数所占比例最大,全校在这个范围内的人数估计有168人.能力提升12.下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为________,数据落在[2,10)内的频率约为________.答案:64 0.4解析:频数为200×(0.08×4)=64,数据落在区间[2,10)内的频率约为0.02×4+0.08×4=0.4.13.为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组及频率如下表:分组频数频率[10.75,10.85) 3[10.85,10.95)9[10.95,11.05)13[11.05,11.15)16[11.15,11.25)26[11.25,11.35)20[11.35,11.45)7[11.45,11.55) 4[11.55,11.65) 2合计100(1)完成上面的频率分布表;(2)根据上表画出频率分布直方图;(3)根据上表和图,估计数据落在[10.95,11.35)范围内的概率约是多少?(4)数据小于11.20的概率约是多少?解:(1)分组频数频率[10.75,10.85)30.03。
必修三第二章统计§2.1.1随机抽样【学习要求】1.正确理解随机抽样的概念;2.掌握简单随机抽样中的抽签法、随机数法的一般步骤; 3.学会用简单随机抽样方法从总体中抽取样本.【学法指导】通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性.【知识要点】1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个 地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都 ,就把这种抽样方法叫做简单随机抽样. 2.简单随机抽样的分类简单随机抽样⎩⎨⎧3.简单随机抽样的优点及适用类型简单随机抽样有操作 的优点,在总体 的情况下是行之有效的.【问题探究】[问题情境] 我们生活在一个数字化时代,时刻都在和数据打交道,例如,产品的合格率,农作物的产量,商品的销售量,电视台的收视率等.这些数据你想知道是怎么获得的吗?从这节课开始我们就学习这方面的知识.探究点一 随机抽样问题1 为了了解高一学生身高的情况,我们找到了某地区高一八千名学生的体检表,从中随机抽取了150张,表中有体重、身高、血压、肺活量等15个数据,那么我们收集的个体数据是什么? 问题2 要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断?问题3 在1936年美国总统选举前,一份颇有名气的杂志的工作人员对兰顿和罗斯福两位候选人做了一次民意测验.调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表.调查结果表明,兰顿当选的可能性大(57%),但实际选举结果正好相反,最后罗斯福当选(62%).你认为预测结果出错的原因是什么? 问题4 要用随机抽样的方法从总体中抽出高质量的样本,应对总体做怎样的处理?小结 为了使样本具有好的代表性,设计抽样方法时,最重要的是要将总体“搅拌均匀”,即使每个个体有同样的机会被抽中.探究点二 简单随机抽样的基本思想问题1 假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?问题2 从9件产品中随机抽取一个容量为3的样本,可以分三次进行,每次从中随机抽取一件,抽取的产品不放回,这叫做逐个不放回抽取.在三次抽取中的每次抽取中,总体内的各个个体被抽到的机会相同吗?为什么?小结 简单随机抽样的含义:一般地,设一个总体有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,则这种抽样方法叫做简单随机抽样. 问题3 根据你的理解,简单随机抽样有哪些主要特点?例1 人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?小结 判断一个抽样方式是不是简单随机抽样,就是看这个抽样符不符合简单随机抽样的4个特点,符合就是,否则就不是.跟踪训练1 下列抽样的方式是否属于简单随机抽样?为什么? (1)从无限多个个体中抽取50个个体作为样本.(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.探究点三 简单随机抽样的方法问题1 假设要在我们班选派5个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选?如何操作?小结 一般地,抽签法就是把总体中的N 个个体编号,把号码写在号签上,然后将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n 的样本. 问题2 一般地,抽签法的操作步骤如何? 问题3 你认为抽签法有哪些优点和缺点?问题4 当总体个数较多时,怎么抽取质量比较高的样本?小结 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数法,我们仅研究随机数表法. 问题5 一般地,利用随机数表法从含有N 个个体的总体中抽取一个容量为n 的样本,其抽样步骤如何? 例2 假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时应如何操作?小结 抽签法和随机数表法对个体的编号是不同的,抽签法可以利用个体已有的编号,如学生的学籍号,产品的记数编号等,也可以重新编号,例如总体个数为100,编号可以为1,2,3,…,100.随机数表法对个体的编号要看总体的个数,总体数为100,通常为00,01,…,99.总体数大于100小于1 000,从000开始编起,然后是001,002,….跟踪训练2 某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?【当堂检测】1.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是 ( )A .总体指的是该市参加升学考试的全体学生B .个体指的是1 000名学生中的每一名学生C .样本容量指的是1 000名学生D .样本是指1 000名学生的数学升学考试成绩 2.在简单随机抽样中,某个个体被抽中的可能性是 ( ) A .与第几次抽样有关,第1次抽中的可能性要大些 B .与第几次抽样无关,每次抽到的可能性都相等 C .与第几次抽样有关,最后一次抽中的可能性大些D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一样3.为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是()A.总体是240 B.个体是每个学生C.样本是40名学生D.样本容量是40【课堂小结】1.简单随机抽样是一种简单、基本、不放回的抽样方法,常用的简单随机抽样方法有抽签法和随机数法.2.抽签法的优点是简单易行,缺点是当总体的容量大时,费时、费力,并且标号的签不易搅拌均匀,这样会导致抽样不公平;随机数法的优点也是简单易行,缺点是当总体容量大时,编号不方便.两种方法只适合总体容量较少的抽样类型.3.简单随机抽样每个个体入样的可能性都相等,均为n/N,但要将每个个体入样的可能性与第n次抽取时每个个体入样的可能性区分开,避免在解题中出现错误.【课后作业】一、基础过关1.为了了解某种花的发芽天数,种植某种花的球根200个,进行调查发芽天数的试验,样本是() A.200个表示发芽天数的数值B.200个球根C.无数个球根发芽天数的数值集合D.无法确定2.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是() A.40 B.50 C.120 D.1503.抽签法中确保样本代表性的关键是() A.制签B.搅拌均匀C.逐一抽取D.抽取不放回4.下列抽样实验中,用抽签法方便的是() A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验5.要检查一个工厂产品的合格率,从1 000件产品中抽出50件进行检查,检查者在其中随意抽取了50件,这种抽样法可称为________.6.福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.7.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.8.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数表法设计抽样方案?二、能力提升9.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是()A.1 000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是10010.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是()A.110,110B.310,15C.15,310D.310,31011.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)12.学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目,某班有男生32名,女生28名,试用抽签法确定该班参加合唱的同学.三、探究与拓展13.某电视台举行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机选出10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.§2.1.2系统抽样【学习要求】1.理解系统抽样的概念;2.掌握系统抽样的一般步骤,会用系统抽样从总体中抽取样本;3.理解系统抽样与简单随机抽样的关系;4.了解系统抽样在实际生活中的应用,提高学习数学的兴趣.【学法指导】通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法,通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系.【知识要点】1.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k进行抽取,先从第一个间隔中地抽取一个号码,然后按此间隔依次抽取即得到所求样本.2.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本,步骤为:(1)先将总体的N个个体 .有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k,对编号进行.当Nn(n是样本容量)是整数时,取k=;(3)在第1段用 抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 得到第2个个体编号 ,再加 得到第3个个体编号 ,依次进行下去,直到获取整个样本.【问题探究】探究点一 系统抽样的基本思想[问题情境] 大家都知道盲人摸象的故事,四个盲人在庞大的大象面前,每人只摸了大象的一个部位,就都有了对大象与众不同的认识.在他们争得面红耳赤,不可开交时,有一智者对他们建议,要他们每个人按一定的间隔从左到右、从上到下去摸大象,结果每个人都得到了大象的正确形象,你知道这是一种什么方法吗? 问题1 某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?(分组讨论) 问题2 你能归纳系统抽样的定义吗? 例1 下列抽样中不是系统抽样的是 ( )A .从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i ,以后为i +5,i +10(超过15则从1再数起)号入样B .工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C .搞某一市场调查,规定在商场新门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D .电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈 小结 解决该类问题的关键是掌握系统抽样的特点及适用范围. 跟踪训练1 系统抽样适用的总体应 ( ) A .容量较小 B .容量较大 C .个体数较多但不均衡 D .任何总体探究点二 系统抽样的一般步骤问题1 用系统抽样从总体中抽取样本时,首先要做的工作是什么?问题2 如果用系统抽样从505件产品中抽取50件进行质量检查,由于505件产品不能均衡分成50部分,对此应如何处理?问题3 用系统抽样从含有N 个个体的总体中抽取一个容量为n 的样本,要平均分成多少段,每段各有多少个号码?问题4 将含有N 个个体的总体抽取容量为n 的样本,平均分成Nn 的整数部分段,每段的号码个数称为分段间隔,那么分段间隔k 的值如何确定?问题5 用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?问题6 一般地,用系统抽样从含有N 个个体的总体中抽取一个容量为n 的样本,其操作步骤如何? 问题7 系统抽样适合在哪种情况下使用?与简单随机抽样比较,哪种抽样方法更使样本具有代表性?例2 某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程. 小结 (1)解决系统抽样问题中两个关键的步骤为:①分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.②起始编号的确定应用随机抽样的方法,一旦起始编号确定,其他编号便随之确定了. (2)当总体中的个体数不能被样本容量整除时,需要在总体中剔除一些个体.跟踪训练2 从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是 ( )A .5,10,15,20,25B .3,13,23,33,43C .1,2,3,4,5D .2,4,6,16,32例3 为了解参加某种知识竞赛的1 000名学生的成绩,从中抽取一个容量为50的样本,那么采用什么抽样方法比较恰当?简述抽样过程.小结 系统抽样又称等距抽样,要求总体中不能含有一定的周期性,否则其样本的代表性是不可靠的,甚至会导致明显的偏向.跟踪训练3 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.【当堂检测】1.下列抽样问题中最适合用系统抽样法抽样的是 ( ) A .从全班48名学生中随机抽取8人参加一项活动B .一个城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本C .从参加模拟考试的1 200名高中生中随机抽取100人分析试题作答情况D .从参加模拟考试的1 200名高中生中随机抽取10人了解某些情况2.为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是 ( ) A .2 B .3 C .4 D .5 3.有20个同学,编号为1~20,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽的编号为( ) A .5,10,15,20 B .2,6,10,14 C .2,4,6,8 D .5,8,11,14【课堂小结】系统抽样的优点是简单易操作,当总体个数较多的时候也能保证样本的代表性;缺点是对存在明显周期性的总体,选出来的个体,往往不具备代表性.从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.【课后作业】一、基础过关1.要从160名学生中抽取容量为20的样本,用系统抽样法将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为125,则第一组中按此抽签方法确定的号码是( )A .7B .5C .4D .32.为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为( ) A .3,2B .2,3C .2,30D .30,23.某会议室有50排座位,每排有30个座位.一次报告会坐满了听众.会后留下座号为15的所有听众50人进行座谈.这是运用了( ) A .抽签法B .随机数法C .系统抽样D .有放回抽样4.为了解1 202名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为()A.40 B.30 C.20 D.125.某班级共有学生52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号为________.6.采用系统抽样的方法,从个体数为1 003的总体中抽取一个容量为50的样本,则在抽样过程中,被剔除的个体数为________,抽样间隔为________.7.某学校有30个班级,每班50名学生,上级要到学校进行体育达标验收.需要抽取10%的学生进行体育项目的测验.请你制定一个简便易行的抽样方案(写出实施步骤).8.某学校有8 000名学生,需从中抽取100个进行健康检查,采用何种抽样方法较好,并写出过程.二、能力提升9.总体容量为524,若采用系统抽样,当抽样的间距为下列哪一个数时,不需要剔除个体() A.3 B.4 C.5 D.610.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7 B.9 C.10 D.1511.采用系统抽样从含有8 000个个体的总体(编号为0000,0001,…,7999)中抽取一个容量为50的样本,则最后一段的编号为____________,已知最后一个入样编号是7894,则开头5个入样编号是__________________.12.某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检验其质量状况,请你设计一个抽样方案.三、探究与拓展13.下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:本村人口:1 200人,户数300,每户平均人口数4人;应抽户数:30户;抽样间隔:1 20030=40;确定随机数字:取一张人民币,编码的后两位数为12;确定第一样本户:编码的后两位数为12的户为第一样本户;确定第二样本户:12+40=52,52号为第二样本户;……(1)该村委采用了何种抽样方法?(2)抽样过程中存在哪些问题,并修改.(3)何处是用简单随机抽样.§2.1.3分层抽样【学习要求】1.正确理解分层抽样的概念;2.掌握分层抽样的一般步骤;3.区分简单随机抽样、系统抽样和分层抽样,并选择适当的方法进行抽样.【学法指导】通过对现实生活中的实际问题进行分层抽样,感知应用数学知识解决实际问题的方法;通过对统计学知识的研究,感知数学知识中“估计”与“精确”性的矛盾统一,培养辩证唯物主义的世界观与价值观.【知识要点】1.分层抽样的概念在抽样时,将总体分成的层,然后按照,从各层地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持与的一致性,这对提高样本的代表性非常重要.当总体是由的几个部分组成时,往往选用分层抽样的方法.【问题探究】[问题情境]中国共产党第十八次代表大会2 270名代表是从40个单位中产生的,这40个单位分别是:1─31为省(自治区、直辖市)、32中央直属机关、33中央国家机关、34全国台联、35解放军、36武警部队、37中央金融系统、38中央企业系统、39中央香港工委、40中央澳门工委.代表的选举原则上是按各选举单位的党组织数、党员人数进行分配的.这种产生代表的方法与我们今天要学的分层抽样很相似.探究点一分层抽样的基本思想导引某地区有高中生2 400人,初中生10 900人,小学生11 000人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生抽取1%的学生进行调查,你认为应当怎样抽取样本?问题1为了抽样方便,能不能只从小学生或初中生或高中生中抽取中小学生总数的1%?为什么?问题2在高中,初中和小学三部分学生中都按1%的比例抽取,那么各抽取多少人?问题3具体在三类学生中抽取样本时(如在10 800名初中生中抽取108人),可以用哪种抽样方法进行抽样?问题4上述抽样方法保证了抽样的公平性,并且样本具有较好的代表性,从而是一种科学、合理的抽样方法,这种抽样方法称为分层抽样.你能归纳出分层抽样的概念吗?问题5适合用分层抽样的方法抽取样本的问题有什么特点?例1某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4 B.5 C.6 D.7小结如果A、B、C三层含有的个体数目分别是x、y、z,在A、B、C三层应抽取的个体数目分别是m、n、p,那么有x∶y∶z=m∶n∶p.跟踪训练1某校有学生2 000人,其中高三学生500人.为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为________.探究点二分层抽样的一般步骤导引某单位有职工500人,其中35岁以下的有125人,35岁~49岁的有280人,50岁以上的有95人.为了调查职工的身体状况,要从中抽取一个容量为100的样本,如何进行抽取?问题1该项调查应采用哪种抽样方法进行?问题2不同年龄段的职工中,按什么比例抽取人数?问题3按比例,三个年龄层次的职工分别抽取多少人?问题4在分层抽样中,如果总体的个体数为N,样本容量为n,第i层的个体数为k,则在第i层应抽取的个体数如何算?问题5在各年龄段具体如何抽样?怎样获得所需样本?问题6一般地,分层抽样的操作步骤如何?问题7样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理?例2写出导引中的解题步骤.小结如果总体中的个体有差异,那么就用分层抽样抽取样本.用分层抽样抽取样本时,要把性质、结构相同的个体组成一层.跟踪训练2某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况,试写出抽样过程.探究点三三种抽样方法的比较问题简单随机抽样、系统抽样和分层抽样既有其共性,又有其个性,根据下表,你能对三种抽样方法作一个比例3某高级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样小结根据样本的号码判断抽样方法时,要紧扣三类抽样方法的特征.利用简单随机抽样抽取的样本号码没有规律性;利用分层抽样抽取的样本号码有规律性,即在每一层抽取的号码个数m等于该层所含个体数目与抽样比的积,并且应该恰有m个号码在该层的号码段内;利用系统抽样取出的样本号码也有规律性,其号码按从小到大的顺序排列,则所抽取的号码是:l,l+k,l+2k,…,l+(n-1)k.其中,l为第一个样本号码(l≤k),n为样本容量(n=1,2,3,…),l是第一组中的号码,k为分段间隔=总体容量/样本容量.跟踪训练3一个总体中的80个个体编号为0,1,2,…,79,并依次将其分为8个组,组号为0,1,…,7,要用下述抽样方法抽取一个容量为8的样本:即在第0组先随机抽取一个号码i,则第k组抽取的号码为10k+j,其中j=⎩⎪⎨⎪⎧i+ki+k<i+k-i+k,若先在0组抽取的号码为6,则所抽到的8个号码依次为______________【当堂检测】1.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为()A.7 B.15 C.25 D.352.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为()A.30 B.25 C.20 D.153.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________【课堂小结】1.用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的机会相等.2.分层抽样是建立在简单随机抽样或系统抽样基础上的,由于它充分利用了已知信息,考虑了保持样本结构与总体结构的一致性,因此它获取的样本更具代表性,在实用中更为广泛.3.简单随机抽样是基础,系统抽样与分层抽样是补充和发展,三者相辅相成,对立统一.【课后作业】一、基础过关1.某城市有学校700所,其中大学20所,中学200所,小学480所.现用分层抽样方法从中抽取一个容量为70的样本,进行某项调查,则应抽取中学数为()。