全面调查与抽样调查例析
- 格式:doc
- 大小:46.50 KB
- 文档页数:3
《普查和抽样调查》典型例题例题01为了了解全校学生的身高情况,小明、小华、小宸三个同学分别设计了三个方案:(1)小明:测量出全班每个同学的身高,以此推算出全校学生的身高.(2)小华:在校医室发现了1900年全校各班的体检表,从中摘录了全校的身高情况.(3)小宸:在全校每个年级的一班中,抽取了学号为5的倍数的10名学生,记录他们的身高,从而估计全校学生身高情况.这三种做法哪一种比较好?为什么?例题02在下面两个事件中,你如何完成收集数据的任务:(1)学校为全校同学制了校服,要了解每位学生的衣服及裤子的型号.(2)要了解各家每周丢弃的塑料袋数量,准确地在全班同学中调查丢弃塑料袋的情况.例题03下列调查中,分别采取了哪种调查方式?A.某商场为了了解“五一”黄金周的销售量,对5月1号到7号的销售量进行调查;B.要了解甲、乙两种安眠药的药效,对10只动物在相同条件下服用两种药物后延长的睡眠时间进行调查;C.为了解全校初二学生平均每周上网时间,对初二(3)班学生上网时间进行调查统计;D.中国为有效控制禽流感的蔓延,对所有发病区域进行监控;E.为了检查一批零件的质量,从中抽查10件进行称量;F.为尽快确定出“非典”的传播途径,北京市对全市所有的“非典”患者和疑似病人进行隔离调查.例题04(北京西城区,2002年)在北京市“危旧房改造”中,小强一家搬进了回龙观小区.这个小区冬季用家庭燃气炉取暖.为了估算冬季取暖第一月使用天然气的开支情况,从11月15日起,小强连续八天晚上记录了天然气表显示的读数,如下表[注:天然气表上先后两次显示的读数之差就是这段时间内使用天然气的数量(单位:3m):小强妈妈11月15日买了一张600元的天然气使用卡,已知每3m天然气1.70元,请你估算这张卡够小强家用一个月(按30天计算)吗?为什么?参考答案例题01 解答 小宸的方案比较好,因为小明的方案只代表这个年级学生的身高情况,不代表其他年级的身高情况,小华的方案调查的是15年前学生身高的情况,用以说明目前的情况误差比较大,小宸的方案从全校中广泛地抽取了各年级的学生,随机地抽取部分学生,这样的调查有代表性.例题02 解答 (1)要采取普查的方法,量出每一个同学衣服及裤子的型号,这样才能保证每个同学穿上合体的服装.(2)可以用抽样的方法了解每周丢弃塑料袋的情况,如确定星期二、星期六两天,全班同学都记录下自己家这两天内丢弃的塑料袋情况,利用这些数据统计出一周内每家丢弃塑料袋的情况.也可以在班级中确定一个小组的同学,记录下这一周内各家丢弃的塑料袋的情况,利用这些数据统计出一周内每家丢弃塑料袋的情况.例题03 分析 全面调查与抽样调查是调查的两种方式,其各有自己的特点。
导语:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。
显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。
抽样调查是建立在随机原则基础上,从总体中抽取部分单位进行调查,并概率估计原理,应用所的资料对总体的数量特征进行推断的一种调查方法。
例如,从某地区全部职工当中随机抽取部分职工,以家庭为单位按月调查取得有关收入、支出等方面的资料,并依据这些资料推断出全区职工的收支情况,这就是一种抽样调查。
从调查方法上来看,它是属于一种非全面调查。
但又与一般调查不同,它不只停留于搜集资料和整理资料,而且还要对资料进行分析,并据以推断总体的数量特征,从而提高统计的认识能力。
因此,抽样调查的理论和方法在统计中占有很重要的地位。
下面介绍一下常用的抽样方法:一. 简单随机抽样一般,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样。
简单随机抽样的具体作法有:直接抽选法,抽签法,随机数法。
直接抽选法例如某项调查采用抽样调查的方法对某市职工收入状况进行研究,该市有职工56,000名,抽取5,000名职工进行调查,他们的年平均收入为10,000元,据此推断全市职工年收入为8,000--12,000元之间。
抽签法又称“抓阄法”。
它是先将调查总体的每个单位编号,然后采用随机的方法任意抽取号码,直到抽足样本。
在这里选取一个案例说明,如要在10个人中选取3个人作为代表,先把总体中的10个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取3次,就得到一个容量为3的样本。
这就是抽签法,与直接抽样法类似。
另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算当然,随机抽样也有不足之处,它只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能利用总体的已知信息等。
抽样调查和普查的应用范围例析一、全面调查和抽样调查区别:全面调查是为一特定目的对所有考查对象所作的调查;抽样调查为一特定目的对部分考查对象所作的调查.全面调查和抽样调查是统计调查的常用方法,它们所考察的对象不同,优缺点也不相同,利用全面调查能得到比较准确地数据,但需要花费大量的人力物力,利用抽样调查可以省时、省力,但是得到的数据不够准确,尤其是如果样本选不好时,就缺乏代表性.那么什么时候选用全面调查,又什么时候选用抽样调查呢?例1.下列调查中,适合用全面调查方式的是()A.了解某班学生“50米跑”的成绩B.了解一批灯泡的使用寿命C.了解一批炮弹的杀伤半径D.了解一批袋装食品是否含有防腐剂例2.我们扬州的旅游宣传口号是“诗画瘦西湖,人文古扬州.给你宁静,还你活力”.为了了解广大市民对这一旅游宣传口号的知晓率,应采用的合适的调查方式为___________.(选填“普查”或“抽样调查”).解析:一般来说当调查的对象很多又不是每个数据都有很大的意义(如例1(B)中的灯泡),或着调查的对象虽然不多,但是带有破坏性(如例1(C)中的炮弹),应采用抽查方式;如果调查对象不需要花费太多的时间又不据有破坏性(如例1(A)中的学生“50米跑”的成绩)或者生产生活中有关安全隐患的问题就必须采用普查的调查方式进行所以:例1应选A;例2应填抽样调查;跟踪练习:1.下列调查方式中适合的是()A.要了解一批节能灯的使用寿命,采用普查方式B.调查你所在班级同学的身高,采用抽样方式C.环保部门调查沱江某段水域的水质情况,采用抽样调查方式D.调查全市中学生每天的就寝时间,采用普查方式二、理解抽样调查的含义:例3.小华学习小组为了解本地区大约有多少成年人吸烟,随机调查了100个成年人,结果其中有15个成年人吸烟.对于这个数据收集与处理的问题,下列说法正确的是()A.调查的方式是普查B.本地区只有85个成年人不吸烟C.样本是15个吸烟的成年人D.本地区约有15℅的成年人吸烟解析:在这采取的是抽样调查,总体是:“本地区成年人吸烟的情况”;样本是“100个成年人吸烟情况”;样本容量是:“100”(注意样本容量没有单位);个体是:“每个成年人吸烟的情况”.抽样调查的目的是用样本来估计整体的情况,反映出整体的变化趋势,这样估计可能有的一些误差.应选D例4.为了解“限塑令”实施情况,当天某环保小组对3600户购物家庭随机抽取600户进行调查,发现其中有156户使用了环保购物袋购物,据此可估计该3600户购物家庭当日使用环保购物袋约有()A.936户B.388户C.1661户D.1111户解析:通过对600户的调查估计总体的情况.对600户购物家庭进行调查得出使用了环保购物袋购物的情况得出比例,则按此比例求得3600户购物家庭的使用环保购物袋的家庭数.在调查时往往通过抽查样本,利用样本估计总体的方法进行抽样调查.答案为A 跟踪练习:下列说法正确的是A.频数是表示所有对象出现的次数B.频率是表示每个对象出现的次数C.所有频率之和等于1D.频数和频率都不能够反映每个对象出现的频繁程度三、抽样调查应注意的事项:(1)样本抽取要具有随机性:即在抽取样本时总体中的每个个体都具有相同被抽到的可能性,不能带有感情色彩,和有意性.例5.为了估计池塘里有多少条鱼,从池塘里随机捕捞了1000条鱼做上标记,然后放回池塘里,经过一段时间,等有标记的鱼完全混合于鱼群中以后,再在不同的地方捕捞200条,若其中有标记的鱼有10条,则估计池塘里有鱼______________条.解析:本题中有个关键点,随机捕捞、标记的鱼完全混和于鱼群、不同的地方捕捞具有了随机性:答案:20000条(2)样本抽取要具有代表性:当总体中的个体数目较大,且又有明显的差异时一定要注意抽取的样本要有代表性:例6.请指出下列抽样中,样本缺乏代表性的是()①在大城市调查我国的扫盲情况;②在十个城市十所中学里调查我国城市学生的视力情况③在鱼塘里随机的捕捞100了解鱼塘里鱼的生长情况④在某农村小学里抽查100名学生,调查我国小学生的健康情况A、①②;B、①④;C、②④;D、②③解析:大城市的文化情况不能代表全国的实际水平,农村的小学生健康情况会低于全国实际水平的;答案:D(3)样本的抽取要适量:应根据总体中个体的数目来决定样本的容量,样本过少不能正确的估计总体的,样本过多就造成会浪费.跟踪练习答案:1.C;2.C。
第十章数据的收集、整理与描述1.全面调查与抽样调查(1)全面调查和抽样调查是按调查对象范围不同划分的调查方式.全面调查是对调查对象中的所有单位全部加以调查,抽样调查是一种非全面调查,它是从研究的总体中按随机原则抽取部分样本单位进行调查,并根据样本单位的调查结果来推断总体,以达到认识总体的一种统计调查方式.(2)抽样调查与全面调查有着相辅相成的关系:在实际运用中,没有必要进行全面调查和不可能进行全面调查时宜采用抽样调查.(3)抽样调查的优点:一是由于只从总体中抽取一部分样本进行调查,工作量小,所以比全面调查节省人力、物力、财力,比较经济;二是可以及时取得调查资料,提高数据的时效性;三是数据质量有保证,可以减少人为因素干扰,只要取样、推断方法科学,均有利于提高数据的质量;四是调查方法灵活,如实际工作中使用较多的问卷调查、入户调查、电话调查等,适应面广,特别适于对范围大的总体作调查.【例】电视剧《铁血将军》在我市拍摄,该剧展示了抗日民族英雄范筑先的光辉形象.某校为了了解学生对“民族英雄范筑先”的知晓情况,从全校2 400名学生中随机抽取了100名学生进行调查.在这次调查中,样本是( )A.2400名学生B.100名学生C.所抽取的100名学生对“民族英雄范筑先”的知晓情况D.每一名学生对“民族英雄范筑先”的知晓情况【标准解答】选C.根据总体、样本的含义,可得在这次调查中,总体是:2 400名学生对“民族英雄范筑先”的知晓情况,样本是:所抽取的100名学生对“民族英雄范筑先”的知晓情况.1.下列调查中,最适合用普查方式的是( )A.调查一批电视机的使用寿命情况B.调查某中学九年级一班学生视力情况C.调查重庆市初中学生锻炼所用的时间情况D.调查重庆市初中学生利用网络媒体自主学习的情况2.要估计鱼塘中的鱼数,养鱼者首先从鱼塘中打捞了50条鱼,在每条鱼身上做好记号后把这些鱼放归鱼塘,一段时间后,再从鱼塘中打捞出100条鱼,发现只有两条鱼是做了记号的鱼,假设鱼在鱼塘内均匀分布,那么估计这个鱼塘的鱼数约为( ) A.5 000条 B.2 500条C.1 750条D.1 250条3.在下列调查中,适宜采用全面调查的是( )A.了解我省中学生的视力情况B.了解九(1)班学生校服的尺码情况C.检测一批电灯泡的使用寿命D.调查台州《600全名新闻》栏目的收视率4.2016年我市有1.6万名初中毕业生参加升学考试,为了了解这1.6万名考生的数学成绩,从中抽取2 000名考生的数学成绩进行统计,在这个问题中样本是( )A.1.6万名考生B.2 000名考生C.1.6万名考生的数学成绩D.2 000名考生的数学成绩5.下列调查适合抽样调查的是( )A.审核书稿中的错别字B.对某社区的卫生死角进行调查C.对八名同学的身高情况进行调查D.对中学生目前的睡眠情况进行调查6.下列调查,样本具有代表性的是( )A.了解全校同学对课程的喜欢情况,对某班男同学进行调查B.了解某小区居民的防火意识,对你们班同学进行调查C.了解商场的平均日营业额,选在周末进行调查D.了解观众对所看电影的评价情况,对座号是奇数号的观众进行调查2.统计图的转化解决与统计有关的信息题转换的方法:解题的关键是根据统计图的信息求出所抽取的样本的总数.(1)结合各类统计图的特点,认真分析各个统计图之间的已知与未知.(2)综合考虑相同的元素在不同的统计图中的表示形式,找到它们之间的对应关系.(3)根据条形图、折线图所提供的部分元素的具体数据,结合扇形统计图所反映的百分比,求出样本总数,或根据频率与频数的关系求出样本总数.(4)根据样本总数求出相关数据及信息.【例】某市“希望”中学为了了解学生“大间操”的活动情况,在七、八、九年级的学生中,分别抽取相同数量的学生对“你最喜欢的运动项目”进行调查(每人只能选一项).调查结果的部分数据如表(图)所示,其中七年级最喜欢跳绳的人数比八年级多5人,九年级最喜欢排球的人数为10人.七年级学生最喜欢的运动项目人数统计表项目排球篮球跳绳踢毽其他人数(人) 7 8 14 6请根据统计表(图)解答下列问题:(1)本次调查抽取了多少名学生?(2)补全统计表和统计图,并求出“最喜欢跳绳”的学生占抽样总人数的百分比.(3)该校共有学生1 800人,学校想对“最喜欢踢毽”的学生每4人提供一个毽,那么学校在“大间操”时至少应提供多少个毽?【标准解答】(1)从九年级最喜欢运动的项目统计图中得知,九年级最喜欢排球的人数占总数的百分比为:1-30%-16%-24%-10%=20%,又知九年级最喜欢排球的人数为10人,所以九年级抽取的学生人数有10÷20%=50(人),所以本次调查抽取的学生数为:50×3=150(人).(2)根据(1)得七年级最喜欢跳绳的人数有50-7-8-6-14=15人,那么八年级最喜欢跳绳的人数有15-5=10人,最喜欢跳绳的学生有15+10+50×16%=33人,所以“最喜欢跳绳”的学生占抽样总人数的百分比为22%.七年级学生最喜欢的运动项目人数统计表项目排球篮球跳绳踢毽其他人数(人) 7 8 15 14 6(3)由图可知,八年级最喜欢踢毽的人数有13人,所以学校在“大间操”时至少应提供的毽数为×1 800÷4=126(个).学校为了解全校1 600名学生到校上学的方式,在全校随机抽取了若干名学生进行问卷调查,问卷给出了五种上学方式供学生选择,每人只能选一项,且不能不选,将调查得到的结果绘制如图所示的频数分布直方图和扇形统计图(均不完整).(1)问:在这次调查中,一共抽取了多少名学生?(2)补全频数分布直方图.(3)估计全校所有学生中有多少人乘坐公交车上学.3.数据的整理与描述(1)扇形统计图直接反映部分占总体的百分比大小.用扇形统计图描述数据,读懂统计图,从不同的统计图中得到必要的信息是解决问题的关键.【例】某校为鼓励学生课外阅读,制定了“阅读奖励方案”.方案公布后,随机征求了100名学生的意见,并对持“赞成”、“反对”、“弃权”三种意见的人数进行统计,绘制成如图所示的扇形统计图.若该校有1 000名学生,则赞成该方案的学生约有人.【标准解答】由扇形统计图可知赞成的百分比为:1-20%-10%=70%,∴1 000名学生中赞成该方案的学生约有1 000×70%=700人.答案:7001.如图是某校参加各兴趣小组的学生人数分布扇形统计图,则参加人数最多的兴趣小组是( )A.棋类B.书画C.球类D.演艺1题图2题图2.为了了解某校学生对篮球、足球、羽毛球、乒乓球、网球等五类球的喜爱,小李采用了抽样调查,在绘制扇形图时,由于时间仓促,还有足球、网球等信息还没有绘制完成,如图所示,根据图中的信息,这批被抽样调查的学生最喜欢足球的人数不可能是( )A.100人B.200人C.260人D.400人3.某学校在“你最喜爱的球类运动”调查中,随机调查了若干名学生(每名学生分别选了一项球类运动),并根据调查结果绘制了如图所示的扇形统计图.已知其中最喜欢羽毛球的人数比最喜欢乒乓球的人数少6人,则该校被调查的学生总人数为人.3题图4题图5题图4.为了解学生课外阅读的喜好,某校从八年级1 200名学生中随机抽取50名学生进行问卷调查,整理数据后绘制如图所示的统计图.由此可估计该年级喜爱“科普常识”的学生约有人.5.某校对学生上学方式进行了一次抽样调查,并根据此次调查结果绘制了一个不完整的扇形统计图,其中“其他”部分所对应的圆心角是36°,则“步行”部分所占百分比是.(2)用条形图描述数据【例】下列材料来自2006年5月衢州有关媒体的真实报道:有关部门进行民众安全感满意度调查,方法是:在全市内采用等距抽样,抽取32个小区,共960户,每户抽一名年满16周岁并能清楚表达意见的人,同时,对比前一年的调查结果,得到统计图如下:写出2005年民众安全感满意度的众数选项是;该统计图存在一个明显的错误是.【标准解答】∵安全选项小组小长方形的高最高,∴众数为安全选项;统计图存在一个明显的错误是 2004年满意度统计选项总和不到100%.答案:安全2004年满意度统计选项总和不到100%.某学校计划开设A,B,C,D四门校本课程供学生选修,规定每个学生必须并且只能选修其中一门,为了了解学生的选修意向,现随机抽取了部分学生进行调查,并将调查结果绘制成如图所示的条形统计图,已知该校学生人数为2 000人,由此估计选修A课程的学生有人.(3)用折线统计图描述数据【例】多多班长统计去年1~8月“书香校园”活动中全班同学的课外阅读数量(单位:本),绘制了如图折线统计图,下列说法正确的是( )A.最大值与最小值的差是47B.众数是42C.中位数是58D.每月阅读数量超过40的有4个月【标准解答】选C.A.最大值与最小值的差为:83-28=55,故本选项错误;B.众数为:58,故本选项错误;C.中位数为:(58+58)÷2=58,故本选项正确;D.每月阅读数量超过40本的有2月,3月,4月,5月,7月,8月,共六个月,故本选项错误;故选C.1.下面的折线图描述了某地某日的气温变化情况,根据图中信息,下列说法错误的是( )A.4:00气温最低B.6:00气温为24 ℃C.14:00气温最高D.气温是30 ℃的为16:002.北京市2009~2014年轨道交通日均客运量统计如图所示.根据统计图中提供的信息,预估2015年北京市轨道交通日均客运量约万人次,你的预估理由是.(4)综合运用条形统计图和扇形统计图获取信息【例】漳州市某中学对全校学生进行文明礼仪知识测试,为了解测试结果,随机抽取部分学生的成绩进行分析,将成绩分为三个等级:不合格、一般、优秀,并绘制成如下两幅统计图(不完整).请你根据图中所给的信息解答下列问题:(1)请将以上两幅统计图补充完整.(2)若“一般”和“优秀”均被视为达标成绩,则该校被抽取的学生中有人达标.(3)若该校学生有1 200人,请你估计此次测试中,全校达标的学生有多少人?【标准解答】(1)成绩一般的学生占的百分比=1-20%-50%=30%,测试的学生总数=24÷20%=120人,成绩优秀的人数=120×50%=60人,所补充图形如下所示:(2)该校被抽取的学生中达标的人数=36+60=96.(3)1 200×(50%+30%)=960(人).答:估计全校达标的学生有960人.1.夷昌中学开展“阳光体育活动”,九年级一班全体同学在2016年4月18日16时分别参加了巴山舞、乒乓球、篮球三个项目的活动,陈老师在此时统计了该班正在参加这三项活动的人数,并绘制了如图所示的频数分布直方图和扇形统计图.根据这两个统计图,可以知道此时该班正在参加乒乓球活动的人数是( )A.50B.25C.15D.102.为了了解2016年某地区10万名大、中、小学生50米跑成绩情况,教育部门从这三类学生群体中各抽取了10%的学生进行检测,整理样本数据,并结合2012年抽样结果,得到下列统计图.(1)本次检测抽取了大、中、小学生共名,其中小学生名.(2)根据抽样的结果,估计2016年该地区10万名大、中、小学生中,50米跑成绩合格的中学生人数为名.(3)比较2012年与2016年抽样学生50米跑成绩合格率情况,写出一条正确的结论.(5)综合运用折线统计图和条形统计图获取信息解题【例】以下是根据北京市国民经济和社会发展统计公报中的相关数据,绘制统计图的一部分.请根据以上信息解答下列问题:(1)2008年北京市私人轿车拥有量是多少万辆(结果保留三个有效数字)?(2)补全条形统计图.(3)汽车数量增多除造成交通拥堵外,还增加了碳排放量,为了了解汽车碳排放量的情况,小明同学通过网络了解到汽车的碳排放量与汽车排量有关.如:一辆排量为1.6 L的轿车,如果一年行驶1万千米,这一年,它碳排放量约为2.7吨.于是他调查了他所居住小区的150辆私人轿车,不同排量的轿车数量如下表所示.排量(L) 小于1.6 1.6 1.8 大于1.8数量(辆) 29 75 31 15如果按照小明的统计数据,请你通过计算估计,2010年北京市仅排量为1.6 L的这类私人轿车(假设每辆车平均一年行驶1万千米)的碳排放总量约为多少万吨?【标准解答】(1)146×(1+19%)=173.74≈174(万辆),所以2008年北京市私人轿车拥有量约是174万辆.(2)如图(3)276××2.7=372.6(万吨).所以估计2010年北京市仅排量为1.6 L的这类私人轿车的碳排放总量约为372.6万吨.1.为广泛开展阳光健身活动,2010年红星中学投入维修场地、安装设施、购置器材及其他项目的资金共38万元,图1、图2分别反映的是2010年投入资金分配和2008年以来购置器材投入资金的年增长率的具体数据.根据以上信息,下列判断:①在2010年总投入中购置器材的资金最多;②2009年购置器材投入资金比2010年购置器材投入资金多8%;③若2011年购置器材投入资金的年增长率与2010年购置器材投入资金的年增长率相同,则2011年购置器材的投入是38×38%×(1+32%)万元.其中正确判断的个数是( )A.0B.1C.2D.32.某市团委在2015年3月初组成了300个学雷锋小组,现从中随机抽取6个小组在3月份做好事件数的统计情况如图所示:(1)这6个学雷锋小组在2015年3月份共做好事多少件?(2)补全条形统计图.(3)请估计该市300个学雷锋小组在2015年3月份共做好事多少件?4.直方图直方图与条形图的区别:(1)条形图是用条形的高度表示频数的大小,而直方图实际上是用长方形的面积表示频数,当长方形的宽相等的时候,把组距看成“1”,用矩形的高表示频数.(2)条形图中,横轴上的数据是孤立的,是一个具体的数据,而直方图中,横轴上的数据是连续的,是一个范围.(3)条形图中,各长方形之间有空隙,而直方图中,各长方形是靠在一起的,中间无空隙.【例】4月23日是“世界读书日”,学校开展“让书香溢满校园”读书活动,以提升青少年的阅读兴趣,九年(1)班数学活动小组对本年级600名学生每天阅读时间进行了统计,根据所得数据绘制了两幅不完整统计图(每组包括最小值不包括最大值).九年(1)班每天阅读时间在0.5小时以内的学生占全班人数的8%.根据统计图解答下列问题:(1)九年(1)班有名学生.(2)补全直方图.(3)除九年(1)班外,九年级其他班级每天阅读时间在1~1.5小时的学生有165人,请你补全扇形统计图.(4)求该年级每天阅读时间不少于1小时的学生有多少人?【标准解答】(1)由题意可得:4÷8%=50(人).(2)由(1)得:0.5~1小时的为:50-4-18-8=20(人),如图所示:(3)∵除九年(1)班外,九年级其他班级每天阅读时间在1~1.5小时的学生有165人,∴1~1.5小时在扇形统计图中所占比例为:165÷(600-50)×100%=30%,故0.5~1小时在扇形统计图中所占比例为:1-30%-10%-12%=48%,如图所示:(4)该年级每天阅读时间不少于1小时的学生有:(600-50)×(30%+10%)+18+8=246(人).为了提高学生书写汉字的能力.增强保护汉字的意识,我区举办了“汉字听写大赛”,经选拔后有50名学生参加决赛,这50名学生同时听写50个汉字,若每正确听写出一个汉字得1分,根据测试成绩绘制出部分频数分布表和部分频数分布直方图,如图表:组别成绩x分频数(人数)第1组25≤x<30 4第2组30≤x<35 6第3组35≤x<40 14第4组40≤x<45 a第5组45≤x<50 10请结合图表完成下列各题:(1)求表中a的值.(2)请把频数分布直方图补充完整.(3)若测试成绩不低于40分为优秀,则本次测试的优秀率是多少?答案解析1.全面调查与抽样调查【跟踪训练】1.【解析】选B.调查一批电视机的使用寿命情况、调查重庆市初中学生锻炼所用的时间情况、调查重庆市初中学生利用网络媒体自主学习的情况适合抽样调查;调查某中学九年级一班学生视力情况适合用普查.2.【解析】选B. 标记的鱼有50条,放入后捞起来有标记的鱼占捞出来鱼的比例为 ,则共有的鱼为:50÷=2 500(条).3.【解析】选B.A选项我省中学生样本容量过大,不适合全面调查;B选项样本容量适合全面调查,且不具有破坏性;C选项具有破坏性,不适宜全面调查;D选项台州范围较大,样本容量过大不适合全面调查.4.【解析】选D.根据样本的概念可知样本为2 000名考生的数学成绩.5.【解析】选D.A、审核书稿中的错别字,必须准确,故必须普查;B、此种情况数量不是很大,故必须普查;C、人数不多,容易调查,适合普查;D、中学生的人数比较多,适合采取抽样调查.6.【解析】选D.A、了解全校同学对课程的喜欢情况,对某班男同学进行调查,不具代表性、广泛性,故A错误;B、了解某小区居民的防火意识,对你们班同学进行调查,调查不具代表性、广泛性,故B错误;C、了解商场的平均日营业额,选在周末进行调查,调查不具有代表性,故C错误;D、了解观众对所看电影的评价情况,对座号是奇数号的观众进行调查,调查具有代表性、广泛性,故D正确.2.统计图的转化【跟踪训练】【解析】(1)被抽到的学生中,骑自行车上学的学生有24人,占整个被抽到学生总数的30%,∴抽取学生的总数为24÷30%=80(人).(2)被抽到的学生中,步行的人数为80×20%=16(人),直方图略.(3)被抽到的学生中,乘公交车的人数为80-(24+16+10+4)=26(人),∴全校所有学生中乘坐公交车上学的人数约为×1 600=520(人).3.数据的整理与描述【跟踪训练】1.【解析】选C.在各兴趣小组中,球类的学生占总人数的35%最大,所以球类兴趣小组的人数最多.2.【解析】选D.根据题意得:320÷32%=1 000(人),喜欢羽毛球的人数为1 000×15%=150(人),喜欢篮球的人数为1 000×25%=250(人),∴喜欢足球、网球的总人数为1 000-320-250-150=280(人),这批被抽样调查的学生最喜欢足球的人数不可能是400人.3.【解析】总人数为:6÷(40%-30%)=60(人).答案:604.【解析】喜爱科普常识的学生所占的百分比为:1-40%-20%-10%=30%,1 200×30%=360.答案:3605.【解析】∵“其他”部分所对应的圆心角是36°,∴“其他”部分所对应的百分比为:×100%=10%, ∴“步行”部分所占百分比为:100%-10%-15%-35%=40%.答案:40%【跟踪训练】【解析】选修A课程的学生所占的比例:=,选修A课程的学生有:2 000×=800(人),答案:800【跟踪训练】1.【解析】选D.A、由纵坐标看出4:00气温最低是22 ℃,故A正确;B、由纵坐标看出6:00气温为24 ℃,故B正确;C、由纵坐标看出14:00气温最高31 ℃;D、由横坐标看出气温是30 ℃的时刻是12:00,16:00,故D错误.2.【解析】预估2015年北京市轨道交通日均客运量约980万人次,根据2009~2011年呈直线上升,故2013~2015年也呈直线上升.答案:980 根据2009~2011年呈直线上升,故2013~2015年也呈直线上升【跟踪训练】1.【解析】选C.25÷50%=50(人),50-25-10=15(人).参加乒乓球的人数为15人.2.【解析】(1)100 000×10%=10 000(名),10 000×45%=4 500(名).(2)100 000×40%×90%=36 000(名).(3)例如:与2012年相比,2016年该市大学生50米跑成绩合格率下降了5%(答案不唯一).答案:(1)10 000 4 500(2)36 000(3)答案不唯一【跟踪训练】1.【解析】选C.①因为购置器材所占的面积最大,所以是资金最多的,故①正确.②2009年资金的增长是相对于2008年来说的,2010年的资金是相对于2009年来说的,故②是错误的.③若2011年购置器材投入资金的年增长率与2010年购置器材投入资金的年增长率相同也是增长了32%,所以2011年购置器材的投入是38×38%×(1+32%),故③正确.故选C.2.【解析】(1)13+16+25+22+20+18=114(件),这6个学雷锋小组在2015年3月份共做好事114件.(2)如图所示:(3)300×=5 700(件).估计该市300个学雷锋小组在2015年3月份共做好事5 700件.4.直方图【跟踪训练】【解析】(1)a=50-4-6-14-10=16.(2)如图所示:(3)本次测试的优秀率是:×100%=52%.。
专题32 统计考点一:数据的收集与整理1. 调查数据的方法与过程:①问卷调查法-----收集数据;②列统计表-----整理数据;③画统计图-----描述数据。
2. 全面调查与抽样调查:①全面调查:调查全体对象。
②抽样调查:调查部分对象。
3. 总体、个体、样本以及样本容量:①总体:我们把所要考察的对象的全体叫做总体;②个体:把组成总体的每一个考察对象叫做个体;③样本:从总体中取出的一部分个体叫做这个总体的一个样本;④样本容量:一个样本包括的个体数量叫做样本容量。
4. 用样本估计总体:①样本平均数:即抽出的样本中所有个体的平均数。
②总体平均数:总体中所有个体的平均数。
通常情况下用一个具有代表性的样本的平均数估算总体平均数。
5. 数据描述的方法:条形统计图,折线统计图,扇形统计图以及直方图。
6. 频数与频率:①频数:落在每一个小组的数据个数叫做每一组的频数。
②频率:频数与总数的比值叫做频率。
7. 相关计算:①各部分具体数量等于总体数量乘以各部分所占百分比。
②各部分在扇形中所占圆心角度数等于360°乘以百分比。
8. 画直方图的步骤:第一步:计算数据的极差。
即一组数据中的最大值减去最小值。
第二步:决定组数与组距。
①组数:通常自己决定,合理组数即可。
②组距:组距≥组数总数。
第三步:决定分组分点。
第四步:画频数分布表。
第五步:画频数分布直方图。
1.(2022•柳州)以下调查中,最适合采用抽样调查的是( )A .了解全国中学生的视力和用眼卫生情况B .了解全班50名同学每天体育锻炼的时间C .学校招聘教师,对应聘人员进行面试D .为保证神舟十四号载人飞船成功发射,对其零部件进行检查【分析】根据全面调查与抽样调查的特点,逐一判断即可解答.【解答】解:A 、了解全国中学生的视力和用眼卫生情况,最适合采用抽样调查,故A 符合题意;B 、了解全班50名同学每天体育锻炼的时间,最适合采用全面调查,故B 不符合题意;C C 不符合题意;D 、为保证神舟十四号载人飞船成功发射,对其零部件进行检查,最适合采用全面调查,故D 不符合题意;故选:A .2.(2022•盘锦)下列调查中,适合采用抽样调查的是( )A .了解神舟飞船的设备零件的质量情况B .了解一批袋装食品是否含有防腐剂C .全国人口普查D .企业招聘,对应聘人员进行面试【分析】根据全面调查与抽样调查的定义,逐一判断即可解答.【解答】解:A 、了解神舟飞船的设备零件的质量情况,适合普查,故A 不符合题意;B 、了解一批袋装食品是否含有防腐剂,适合抽样调查,故B 符合题意;C、全国人口普查,适合普查,故C不符合题意;D、企业招聘,对应聘人员进行面试,适合普查,故D不符合题意;故选:B.3.(2022•桂林)下列调查中,最适合采用全面调查的是( )A.了解全国中学生的睡眠时间B.了解某河流的水质情况C.调查全班同学的视力情况D.了解一批灯泡的使用寿命【分析】根据普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似解答.【解答】解:A.了解全国中学生的睡眠时间,适合进行抽样调查,故本选项不合题意;B.了解某河流的水质情况,适合进行抽样调查,故本选项不合题意;C.调查全班同学的视力情况,适合进行全面调查,故本选项符合题意;D.了解一批灯泡的使用寿命,适合进行抽样调查,故本选项不合题意;故选:C.4.(2022•宁夏)某学习小组做摸球试验,在一个不透明的袋子里装有红、黄两种颜色的小球共20个,除颜色外都相同.将球搅匀后,随机摸出5个球,发现3个是红球,估计袋中红球的个数是( )A.12B.9C.8D.6【分析】先求摸到红球的频率,再用20乘以摸到红球的频率即可.【解答】解:摸到红球的频率为3÷5=0.6,估计袋中红球的个数是20×0.6=12(个),故选:A.5.(2022•锦州)在一个不透明的口袋中装有红球和白球共8个,这些球除颜色外都相同,将口袋中的球搅匀后,从中随机摸出一个球,记下它的颜色后再放回口袋中,不断重复这一过程,共摸了100次球,发现有75次摸到红球,则口袋中红球的个数约为 .【分析】用球的总个数乘以摸到红球的频率即可.【解答】解:估计这个口袋中红球的数量为8×=6(个).故答案为:6.6.(2022•深圳)某工厂一共有1200人,为选拔人才,提出了一些选拔的条件,并进行了抽样调查.从中抽出400人,发现有300人是符合条件的,那么该工厂1200人中符合选拔条件的人数为 .【分析】符合选拔条件的人数=该工厂总共人数×符合条件的人数所占的分率,列出算式计算即可求解.【解答】解:1200×=900.答:该工厂1200人中符合选拔条件的人数为900.故答案为:900.7.(2022•北京)某商场准备进400双滑冰鞋,了解了某段时间内销售的40双滑冰鞋的鞋号,数据如下:鞋号353637383940414243销售量/双2455126321根据以上数据,估计该商场进鞋号需求最多的滑冰鞋的数量为 双.【分析】应用用样本估计总体的方法进行计算即可得出答案.【解答】解:根据统计表可得,39号的鞋卖的最多,则估计该商场进鞋号需求最多的滑冰鞋的数量为(双).故答案为:120.8.(2022•长沙)为了解某校学生对湖南省“强省会战略”的知晓情况,从该校全体1000名学生中,随机抽取了100名学生进行调查.结果显示有95名学生知晓.由此,估计该校全体学生中知晓湖南省“强省会战略”的学生有 名.【分析】用总人数乘以样本中知晓“强省会战略”的人数所占比例即可得.【解答】解:估计该校全体学生中知晓湖南省“强省会战略”的学生有:1000×=950(名).故答案为:950.9.(2022•自贡)为了比较甲、乙两鱼池中的鱼苗数目,小明从两鱼池中各捞出100条鱼苗,每条做好记号,然后放回原鱼池.一段时间后,在同样的地方,小明再从甲、乙两鱼池中各捞出100条鱼苗,发现其中有记号的鱼苗分别是5条、10条,可以初步估计鱼苗数目较多的是 鱼池.(填甲或乙)【分析】根据题意和题目中的数据可以计算出甲鱼池和乙鱼池中鱼苗的数量,然后比较大小即可.【解答】解:由题意可得,甲鱼池中的鱼苗数量约为:100÷=2000(条),乙鱼池中的鱼苗数量约为:100÷=1000(条),∵2000>1000,∴初步估计鱼苗数目较多的是甲鱼池,故答案为:甲.10.(2022•黑龙江)王老师对本班40名学生的血型作了统计,列出如下的统计表,则本班A 型血的人数是( )组别A 型B 型AB 型O 型频率0.40.350.10.15A .16人B .14人C .4人D .6人【分析】根据频数和频率的定义求解即可.【解答】解:本班A 型血的人数为:40×0.4=16.故选:A .11.(2022•聊城)“俭以养德”是中华民族的优秀传统,时代中学为了对全校学生零花钱的使用进行正确引导,随机抽取50名学生,对他们一周的零花钱数额进行了统计,并根据调查结果绘制了不完整的频数分布表和扇形统计图,如图所示:关于这次调查,下列说法正确的是( )A .总体为50名学生一周的零花钱数额B .五组对应扇形的圆心角度数为36°C .在这次调查中,四组的频数为6D .若该校共有学生1500人,则估计该校零花钱数额不超过20元的人数约为1200人【分析】选项A 根据“总体”的定义判定即可;选项B 用360°乘“五组”所占的百分比,即可求出对应的扇形圆心角的度数;选项C 根据“频率=频数÷总数”可得答案;选项D 利用样本估计总体即可.【解答】解:总体为全校学生一周的零花钱数额,故选项A 不合题意;五组对应扇形的圆心角度数为:360°×=36°,故选项B符合题意;在这次调查中,四组的频数为:50×16%=8,故选项C不合题意;若该校共有学生1500人,则估计该校零花钱数额不超过20元的人数约为:1500×=1110(人),故选项D不合题意,故选:B.12.(2022•台湾)某国主计处调查2017年该国所有受雇员工的年薪资料,并公布调查结果如图的直方图所示.已知总调查人数为750万人,根据图中信息计算,该国受雇员工年薪低于平均数的人数占总调查人数的百分率为下列何者?( )A.6%B.50%C.68%D.73%【分析】由受雇员工年薪低于平均数的人数除以总人数.再乘以100%,即可求得.【解答】解:该国受雇员工年薪低于平均数的人数占总调查人数的百分率为:×100%=68%,故选:C.13.(2022•金华)观察如图所示的频数分布直方图,其中组界为99.5~124.5这一组的频数为( )A.5B.6C.7D.8【分析】根据直方图中的数据,可以得到组界为99.5~124.5这一组的频数.【解答】解:由直方图可得,组界为99.5~124.5这一组的频数是20﹣3﹣5﹣4=8,故选:D.14.(2022•镇江)某班40名学生体重的频数分布直方图(不完整)如图所示,组距为 kg.【分析】根据频数分布直方图计算即可.【解答】解:组距为=5(kg).故答案为:5.15.(2022•衢州)某班环保小组收集废旧电池,数据统计如下表.问1节5号电池和1节7号电池的质量分别是多少?设1节5号电池的质量为x克,1节7号电池的质量为y克,列方程组,由消元法可得x的值为( )5号电池(节)7号电池(节)总质量(克)第一天2272第二天3296A .12B .16C .24D .26【分析】根据题意可得2x +2y =72,3x +2y =96.,联立成二元一次方程组求解即可.【解答】解:由题意得:,解得,故选:C .16.(2022•株洲)A 市安排若干名医护工作人员援助某地新冠疫情防控工作,人员结构统计如下表:人员领队心理医生专业医生专业护士占总人数的百分比4%★56%则该批医护工作人员中“专业医生”占总人数的百分比为 .【分析】根据各种人员占总人数的百分比之和为1计算即可得出答案.【解答】解:1﹣4%﹣56%=40%,故答案为:40%.17.(2022•衢州)如图是某品牌运动服的S 号,M 号,L 号,XL 号的销售情况统计图,则厂家应生产最多的型号为( )A .S 号B .M 号C .L 号D .XL 号【分析】利用四个型号的数量所占百分比解答即可【解答】解:∵32%>26%>24%>18%,∴厂家应生产最多的型号为M 号.故选:B .18.(2022•六盘水)从调查消费者购买汽车能源类型的扇形统计图中可看出,人们更倾向购买的是( )A .纯电动车B .混动车C .轻混车D .燃油车【分析】根据扇形图即可观察出纯电动车占的最多.【解答】解:根据扇形图即可观察出纯电动车占的最多.故答案为:A .19.(2022•遵义)2021年7月,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,明确要求初中生每天的书面作业时间不得超过90分钟.某校随机抽取部分学生进行问卷调查,并将调查结果制成如下不完整的统计图表.则下列说法不正确的是( )作业时间频数分布表A .调查的样本容量为50B .频数分布表中m 的值为20C .若该校有1000名学生,作业完成的时间超过90分钟的约100人D .在扇形统计图中B 组所对的圆心角是144°【分析】分别求出样本容量,m 的值,该校有1000名学生,作业完成的时间超过90分钟的人数,B 组所对的圆心角,即可求解.【解答】解:A 、调查的样本容量=5÷10%=50,故选项A 不符合题意;B 、m =50﹣8﹣17﹣5=20,故选项B 不符合题意;C 、该校有1000名学生,作业完成的时间超过90分钟的人数≈1000×10%=100人,故选项C 不符合题意;D、在扇形统计图中B组所对的圆心角=360°××100%=122.4°,故选项D符合题意;故选:D.20.(2022•赤峰)某中学对学生最喜欢的课外活动进行了随机抽样调查,要求每人只能选择其中的一项.根据得到的数据,绘制的不完整统计图如下,则下列说法中不正确的是( )A.这次调查的样本容量是200B.全校1600名学生中,估计最喜欢体育课外活动的大约有500人C.扇形统计图中,科技部分所对应的圆心角是36°D.被调查的学生中,最喜欢艺术课外活动的有50人【分析】根据统计图分别判断各个选项即可.【解答】解:∵10÷5%=200,∴这次调查的样本容量为200故A选项结论正确,不符合题意;∵1600×=400(人),∴全校1600名学生中,估计最喜欢体育课外活动的大约有400人,故B选项结论不正确,符合题意;∵200×25%=50(人),∴被调查的学生中,最喜欢艺术课外活动的有50人,故D选项结论正确,不符合题意;∵360°×=36°,∴扇形统计图中,科技部分所对应的圆心角是36°,故C选项结论正确,不符合题意;故选:B.21.(2022•岳阳)聚焦“双减”政策落地,凸显寒假作业特色.某学校评选出的寒假优质特色作业共分为四类:A(节日文化篇),B(安全防疫篇),C(劳动实践篇),D(冬奥运动篇).下面是根据统计结果绘制的两幅不完整的统计图,则B类作业有 份.【分析】由条形统计图可得A,C,D类作业分别有25份,30份,25份,由扇形统计图可得C类作业份数占总份数的30%,可得总份数为100份,减去A,C,D类作业的份数即可求解.【解答】解:∵C类作业有30份,且C类作业份数占总份数的30%,∴总份数为:30÷30%=100(份),∵A,D类作业分别有25份,25份,∴B类作业的份数为:100﹣25﹣30﹣25=20(份),故答案为:20.22.(2022•徐州)我国近十年的人口出生率及人口死亡率如图所示.已知人口自然增长率=人口出生率﹣人口死亡率,下列判断错误的是( )A.与2012年相比,2021年的人口出生率下降了近一半B.近十年的人口死亡率基本稳定C.近五年的人口总数持续下降D.近五年的人口自然增长率持续下降【分析】根据折线统计图的信息解答即可.【解答】解:由折线统计图可知,A.与2012年相比,2021年的人口出生率下降了近一半,说法正确,故本选项不合题意;B.近十年的人口死亡率基本稳定,说法正确,故本选项不合题意;C.近五年的人口总数持续下降,说法错误,五年的人口总数增长速度变缓,故本选项符合题意;D.近五年的人口自然增长率持续下降,说法正确,故本选项不合题意;故选:C.23.(2022•菏泽)射击比赛中,某队员的10次射击成绩如图所示,则下列结论错误的是( )A.平均数是9环B.中位数是9环C.众数是9环D.方差是0.8【分析】分别根据平均数,中位数,众数以及方差的定义解答即可.【解答】解:这10次射击成绩从小到大排列为:8.4、8.6、8.8、9、9、9、9.2、9.2、9.4、9.4,故平均数为:(8.4+8.6+8.8+9+9+9+9.2+9.2+9.4+9.4)=9(环),故选项A不合题意;中位数为:=9(环),故选项B不合题意;众数是9环,故选项C不合题意;方差为:[(8.4﹣9)2+(8.6﹣9)2+(8.8﹣9)2+3×(9﹣9)2+2×(9.2﹣9)2+2×(9.4﹣9)2]=0.096,故选项D符合题意.故选:D.24.(2022•广西)空气由多种气体混合而成,为了直观介绍空气中各成分的百分比,最适合使用的统计图是( )A.条形图B.折线图C.扇形图D.直方图【分析】扇形统计图表示的是部分在总体中所占的百分比,但一般不能直接从图中得到具体的数据;折线统计图表示的是事物的变化情况;条形统计图能清楚地表示出每个项目的具体数目;频数分布直方图,清楚显示在各个不同区间内取值,各组频数分布情况,易于显示各组之间频数的差别.【解答】解:根据题意,得要求直观反映空气的组成情况,即各部分在总体中所占的百分比,结合统计图各自的特点,应选择扇形统计图.故选:C.25.(2022•福建)2021年福建省的环境空气质量达标天数位居全国前列.如图是福建省10个地区环境空气质量综合指数统计图.综合指数越小,表示环境空气质量越好.依据综合指数,从图中可知环境空气质量最好的地区是( )A.F1B.F6C.F7D.F10【分析】根据散点统计图的信息进行判定即可得出答案.【解答】解:根据题意可得,F10地区环境空气质量综合指数约为1.9,是10个地区中最小值.故选:D.考点二:数据的分析1. 平均数:①算术平均数:对于n 个数n x x x x ,,,...321,则()n x x x x nx ++++=-...1321表示这一组数据的平均数。
第九章统计9.1 随机抽样1. 全面调查与抽样调查( 1 )对每一个调查对象都进行调查的方法,称为全面调查,又称普查W .( 2 )在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为个体W .( 3 )根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查W .( 4 )把从总体中抽取的那部分个体称为样本W .( 5 )样本中包含的个体数称为样本量W .( 6 )调查样本获得的变量值称为样本的观测数据,简称样本数据 .2. 简单随机抽样( 1 )有放回简单随机抽样一般地,设一个总体含有 N ( N 为正整数)个个体,从中逐个抽取 n (1 ≤ n < N )个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样 .( 2 )不放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样 .( 3 )简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样 .( 4 )简单随机样本通过简单随机抽样获得的样本称为简单随机样本 .( 5 )简单随机抽样的常用方法实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法 .■名师点拨( 1 )从总体中,逐个不放回地随机抽取 n 个个体作为样本,一次性批量随机抽取 n 个个体作为样本,两种方法是等价的 .( 2 )简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样的公平性 .3. 总体平均数与样本平均数( 1 )总体平均数① 一般地,总体中有 N 个个体,它们的变量值分别为 Y 1 , Y 2 ,… , Y N ,则称== Y i 为总体均值,又称总体平均数 .② 如果总体的 N 个变量值中,不同的值共有 k (k ≤ N )个,不妨记为 Y 1 , Y2 ,… , Y k ,其中 Y i 出现的频数 f i ( i = 1 , 2 ,… , k ),则总体均值还可以写成加权平均数的形式= f i Y i W .( 2 )样本平均数如果从总体中抽取一个容量为 n 的样本,它们的变量值分别为 y 1 , y 2 ,… , yn ,则称== y i 为样本均值,又称样本平均数 . 在简单随机抽样中,我们常用样本平均数去估计总体平均数 .4. 分层随机抽样( 1 )分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层W .( 2 )比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配 .5. 分层随机抽样中的总体平均数与样本平均数( 1 )在分层随机抽样中,如果层数分为 2 层,第 1 层和第 2 层包含的个体数分别为 M 和 N ,抽取的样本量分别为 m 和 n . 我们用 X 1 , X 2 ,… , X M 表示第 1 层各个个体的变量值,用 x 1 , x 2 ,… , x m 表示第 1 层样本的各个个体的变量值;用 Y 1 , Y 2 ,… , Y N 表示第 2 层各个个体的变量值,用 y 1 , y 2 ,… ,y n 表示第 2 层样本的各个个体的变量值,则:① 第 1 层的总体平均数和样本平均数分别为== X i ,== x i .② 第 2 层的总体平均数和样本平均数分别为==Y i ,== y i .③ 总体平均数和样本平均数分别为=,=W .( 2 )由于用第 1 层的样本平均数可以估计第 1 层的总体平均数,用第 2 层的样本平均数可以估计第 2 层的总体平均数 . 因此我们可以用=+估计总体平均数 .( 3 )在比例分配的分层随机抽样中,==,可得+=+= . 因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数 .6. 获取数据的途径获取数据的基本途径有:( 1 )通过调查获取数据;( 2 )通过试验获取数据;( 3 )通过观察获取数据;( 4 )通过查询获取数据典型应用 1总体、样本等概念辨析题为了调查参加运动会的 1 000 名运动员的平均年龄,从中抽取了 100 名运动员进行调查,下面说法正确的是()A.1 000 名运动员是总体B. 每个运动员是个体C. 抽取的 100 名运动员是样本D. 样本量是 100【解析】根据调查的目的可知,总体是这 1 000 名运动员的年龄,个体是每个运动员的年龄,样本是抽取的 100 名运动员的年龄,样本量为 100. 故答案为D.【答案】 D此类题目要正确理解总体与个体的概念,要弄明白概念的实质,并注意样本与样本容量的不同,其中样本量为数目,无单位 .典型应用 2简单随机抽样的概念下面的抽样方法是简单随机抽样吗?为什么?( 1 )从无数个个体中抽取 50 个个体作为样本;( 2 )仓库中有 1 万支奥运火炬,从中一次抽取 100 支火炬进行质量检查;( 3 )某连队从 200 名党员官兵中,挑选出 50 名最优秀的官兵赶赴灾区开展救灾工作 .【解】( 1 )不是简单随机抽样 . 因为简单随机抽样要求被抽取的样本总体的个数是有限的 . ( 2 )不是简单随机抽样 . 虽然“ 一次性抽取” 和“ 逐个抽取” 不影响个体被抽到的可能性,但简单随机抽样要求的是“ 逐个抽取” . ( 3 )不是简单随机抽样 . 因为这 50 名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“ 等可能抽样” 的要求 .要判断所给的抽样方法是否为简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点 .典型应用 3抽签法及随机数法的应用某班有 50 名学生,要从中随机地抽出 6 人参加一项活动,请分别写出利用抽签法和随机数法抽取该样本的过程 .【解】( 1 )利用抽签法步骤如下:第一步:将这 50 名学生编号,编号为 01 , 02 , 03 ,… , 50.第二步:将 50 个号码分别写在纸条上,并揉成团,制成号签 .第三步:将得到的号签放在一个不透明的容器中,搅拌均匀 .第四步:从容器中逐一抽取 6 个号签,并记录上面的号码 .对应上面 6 个号码的学生就是参加该项活动的学生 .( 2 )利用随机数法步骤如下:第一步:将这 50 名学生编号,编号为 1 , 2 , 3 ,… , 50.第二步:用随机数工具产生 1 ~ 50 范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本 .第三步:重复第二步的过程,直到抽足样本所需人数 .对应上面 6 个号码的学生就是参加该项活动的学生 .( 1 )利用抽签法抽取样本时应注意以下问题:① 编号时,如果已有编号(如学号、标号等)可不必重新编号 . (例如该题中 50 名同学,可以直接利用学号)② 号签要求大小、形状完全相同 .③ 号签要搅拌均匀 .④ 抽取号签时要逐一、不放回抽取 .( 2 )利用随机数法抽取样本时应注意的问题:如果生成的随机数有重复,即同一编号被多次抽到,应剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需的人数 .典型应用 4分层随机抽样中的有关计算( 1 )某单位共有老、中、青年职工 430 人,其中有青年职工 160 人,中年职工人数是老年职工人数的 2 倍,为了解职工身体状况,现采用分层随机抽样方法进行调查,在抽取的样本中有青年职工 32 人,则该样本中的老年职工的人数为W .( 2 )某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“ 泥塑” 与“ 剪纸” 两个社团,已知报名参加这两个社团的学生共有800 人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:高一年级高二年级高三年级泥塑 a b c剪纸x y z其中 x ∶ y ∶ z = 5 ∶ 3 ∶ 2 ,且“ 泥塑” 社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满意程度,从中抽取一个 50 人的样本进行调查,则从高二年级“ 剪纸” 社团的学生中应抽取人 .【解析】( 1 )设该单位老年职工人数为 x ,由题意得 3 x = 430 - 160 ,解得 x = 90. 则样本中的老年职工人数为 90 × = 18.( 2 )法一:因为“ 泥塑” 社团的人数占总人数的,故“ 剪纸” 社团的人数占总人数的,所以“ 剪纸” 社团的人数为 800 × = 320 ;因为“ 剪纸” 社团中高二年级人数比例为==,所以“ 剪纸” 社团中高二年级人数为 320 × = 96.由题意知,抽样比为=,所以从高二年级“ 剪纸” 社团中抽取的人数为 96 × = 6.法二:因为“ 泥塑” 社团的人数占总人数的,故“ 剪纸” 社团的人数占总人数的,所以抽取的 50 人的样本中,“ 剪纸” 社团中的人数为 50 × = 20.又“ 剪纸” 社团中高二年级人数比例为==,所以从高二年级“ 剪纸” 社团中抽取的人数为 20 × = 6.【答案】( 1 ) 18 ( 2 ) 6分层随机抽样中有关计算的方法( 1 )抽样比== .( 2 )总体中某两层的个体数之比=样本中这两层抽取的个体数之比 .对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解 .典型应用 5样本平均数的求法( 1 )甲在本次飞镖游戏中的成绩为 8 , 6 , 7 , 7 , 8 , 10 , 9 , 8 ,7 , 8. 求甲在本次游戏中的平均成绩 .( 2 )在了解全校学生每年平均阅读多少本文学经典名著时,甲同学抽取了一个容量为 10 的样本,并算得样本的平均数为 5 ;乙同学抽取了一个容量为 8 的样本,并算得样本的平均数为 6. 已知甲、乙两同学抽取的样本合在一起组成一个容量为 18 的样本,求合在一起后的样本均值 .【解】( 1 )甲在本次游戏中的平均成绩为= 7.8. ( 2 )合在一起后的样本均值为== .在分层随机抽样中,如果第一层的样本量为 m ,平均值为 x ;第二层的样本量为n ,平均值为 y ,则样本的平均值为 .9 . 2 用样本估计总体1 .频率分布表、频率分布直方图的制作步骤及意义2 .百分位数(1) 定义:一般地,一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p % 的数据小于或等于这个值,且至少有 ( 100 - p ) % 的数据大于或等于这个值.(2) 计算步骤:计算一组 n 个数据的第 p 百分位数的步骤:第 1 步,按从小到大排列原始数据.第 2 步,计算 i = n × p % .第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j ,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百分位数为第 i 项与第 ( i + 1) 项数据的平均数.典型应用 1频率分布表、频率分布直方图、频率分布折线图的绘制角度一频率分布表、频率分布直方图的绘制为考查某校高二男生的体重,随机抽取 44 名高二男生,实测体重数据( 单位: kg ) 如下:57 , 61 , 57 , 57 , 58 , 57 , 61 , 54 , 68 , 51 , 49 , 64 , 50 , 48 ,65 , 52 , 56 , 46 , 54 , 49 , 51 , 47 , 55 , 55 , 54 , 42 , 51 , 56 ,55 , 51 , 54 , 51 , 60 , 62 , 43 , 55 , 56 , 61 , 52 , 69 , 64 , 46 ,54 , 48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.【解】以 4 为组距,列表如下:分组频率累计频数频率[41.5 , 45.5 ) 2 0.045 5[45.5 , 49.5 ) 7 0.159 1[49.5 , 53.5 ) 8 0.18 1 8[53.5 , 57.5 ) 16 0.363 6[57.5 , 61.5 ) 5 0.113 6[61.5 , 65.5 ) 4 0.090 9[65.5 , 69.5 ) 2 0.045 5频率分布直方图和频率分布折线图如图所示.(1) 在列频率分布表时,极差、组距、组数有如下关系:① 若为整数,则=组数;② 若不为整数,则的整数部分+ 1 =组数.(2) 组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过 100 ,按照数据的多少常分为 5 ~ 12 组,一般样本量越大,所分组数越多.角度二频率分布直方图的应用为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图 ( 如图所示 ) ,图中从左到右各小长方形面积之比为 2 ∶ 4 ∶ 17 ∶ 15 ∶ 9 ∶ 3 ,第二小组的频数为 12.(1) 第二小组的频率是多少?样本量是多少?(2) 若次数在 110 以上 ( 含 110 次 ) 为达标,则该校全体高一年级学生的达标率是多少?(3) 样本中不达标的学生人数是多少?(4) 第三组的频数是多少?【解】 (1) 频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为= 0.08.又因为第二小组的频率=,所以样本容量=== 150.(2) 由直方图可估计该校高一年级学生的达标率为 × 100% = 88 %.(3) 由 (1)(2) 知达标率为 88 % ,样本量为 150 ,不达标的学生频率为 1 - 0.88= 0.12.所以样本中不达标的学生人数为 150 × 0.12 = 18( 人 ) .(4) 第三小组的频率为= 0.34.又因为样本量为 150 ,所以第三组的频数为 150 × 0.34 = 51.频率分布直方图的应用中的计算问题(1) 小长方形的面积=组距 × =频率;(2) 各小长方形的面积之和等于 1 ;(3) =频率,此关系式的变形为=样本量,样本量 × 频率=频数.典型应用 2条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“ 百家讲坛” 的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查 ( 每人只选一项内容 ) ,整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题:(1) 求抽取的学生数;(2) 若该校有 3 000 名学生,估计喜欢收听易中天《品三国》的学生人数;(3) 估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比.【解】 (1) 从统计图上可以看出,喜欢收听于丹析《庄子》的男生有 20 人,女生有 10 人;喜欢收听《故宫博物院》的男生有 30 人,女生有 15 人;喜欢收听于丹析《论语》的男生有 30 人,女生有 38 人;喜欢收听易中天《品三国》的男生有 64 人,女生有 42 人;喜欢收听刘心武评《红楼梦》的男生有 6 人,女生有 45 人.所以抽取的学生数为 20 + 10 + 30 + 15 + 30 + 38 + 64 + 42 + 6 + 45 =300( 人 ) .(2) 喜欢收听易中天《品三国》的男生有 64 人,女生有 42 人,共有 106 人,占所抽取总人数的比例为,由于该校有 3 000 名学生,因此可以估计喜欢收听易中天《品三国》的学生有× 3 000 = 1 060( 人 ) .(3) 该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为× 100% = 15 %.(1) 绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.(2) 在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.典型应用 3折线统计图小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.根据图中的信息,回答以下问题:(1) 护士每隔几小时给小明测量一次体温?( 2) 近三天来,小明的最高体温、最低体温分别是多少?(3) 从体温看,小明的病情是在恶化还是在好转?(4) 如果连续 36 小时体温不超过 37.2 摄氏度的话,可认为基本康复,那么小明最快什么出院?【解】 (1) 根据横轴表示的意义,可知护士每隔 6 小时给小明测量一次体温.(2) 从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是 39.5 摄氏度,最低体温是 36.8 摄氏度.(3) 从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.(4)9 月 8 日 18 时小明的体温是 37 摄氏度.其后的体温未超过 37.2 摄氏度,自 9 月 8 日 18 时起计算,连续 36 小时后对应的时间为 9 月 10 日凌晨 6 时.因此小明最快可以在 9 月 10 凌晨 6 时出院.(1) 绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.(2) 在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.典型应用 4扇形统计图下图是 A , B 两所学校艺术节期间收到的各类艺术作品的情况的统计图:(1) 从图中能否看出哪所学校收到的水粉画作品数量多?为什么?(2) 已知 A 学校收到的剪纸作品比 B 学校的多 20 件,收到的书法作品比 B 学校的少 100 件,请问这两所学校收到艺术作品的总数分别是多少件?【解】 (1) 不能.因为两所学校收到艺术作品的总数不知道.(2) 设 A 学校收到艺术作品的总数为 x 件, B 学校收到艺术作品的总数为 y 件,则解得即 A 学校收到艺术作品的总数为 500 件,B 学校收到艺术作品的总数为 600 件.(1) 绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.(2) 扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.典型应用 5百分位数的计算现有甲、乙两组数据如下表所示.序号1 2 3 4 5 6 7 8 9 11112131415161718192甲组1 2 2 2 2 3 3 3 5 5 6 6 8 8 9 11121313乙组0 0 0 0 1 1 2 3 4 5 6 6 7 7 11414141415试求甲、乙两组数的 25 % 分位数与 75 % 分位数.【解】因为数据个数为 20 ,而且 20 × 25 % = 5 , 20 × 75% = 15.因此,甲组数的 25 % 分位数为== 2.5 ;甲组数的 75 % 分位数为== 9.5.乙组数的 25 % 分位数为== 1 ,乙组的 75 % 分位数为== 12.求百分位数时,一定要将数据按照从小到大的顺序排列.9 . 3 统计案例公司员工的肥胖情况调查分析1 .平均数和中位数的特点(1) 样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.(2) 中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.(3) 与中位数相比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.2 .中位数、平均数与频率分布直方图的关系一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的 ( 图(1)) ,那么平均数和中位数应该大体上差不多;如果直方图在右边“ 拖尾” ( 图(2)) ,那么平均数大于中位数;如果直方图在左边“ 拖尾” ( 图 (3)) ,那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“ 长尾巴” 那边.3 .众数的特点众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.■名师点拨一般地,对数值型数据 ( 如用水量、身高、收入、产量等 ) 集中趋势的描述,可以用平均数、中位数;而对分类型数据 ( 如校服规格、性别、产品质量等级等 ) 集中趋势的描述,可以用众数.4 .总体方差与总体标准差如果总体中所有个体的变量值分别为 Y 1 , Y 2 ,… , Y N ,总体平均数为,则称 S 2 = __ ( Y i - ) 2 为总体方差, S =为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的 N 个变量值中,不同的值共有k ( k ≤ N ) 个,不妨记为 Y 1 , Y 2 ,… , Y k ,其中 Y i 出现的频数为 f i ( i = 1 , 2 ,… , k ) ,则总体方差为 S 2 = f i ( Y i - ) 2 .5 .样本方差与样本标准差如果一个样本中个体的变量值分别为 y 1 , y 2 ,… y n ,样本平均数为,则称 s 2 = ( y i - ) 2 为样本方差, s =为样本标准差.■名师点拨(1) 若 x 1 , x 2 , x 3 ,… , x n 的平均数为,方差为 s 2 那么 ax 1 + b ,ax 2 + b , ax 3 + b ,… , ax n + b 的平均数为′ = a + b ;方差s ′ 2 =a 2 s 2 .(2) 标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.典型应用 1众数、中位数、平均数的计算及应用某工厂人员及月工资构成如下:人员经理管理人员高级技工工人学徒合计月工资 ( 元 )22 000 2 500 2 200 2 000 1 000 29 700人数 1 6 5 10 1 23合计22 000 15 000 11 000 20 000 1 000 69 000(1) 指出这个表格中的众数、中位数、平均数;(2) 这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?【解】 (1) 由表格可知,众数为 2 000 元.把 23 个数据按从小到大 ( 或从大到小 ) 的顺序排列,排在中间的数应是第 12 个数,其值为 2 200 ,故中位数为 2 200 元.平均数为 (22 000 + 15 000 + 11 000 + 20 000 + 1 000)÷23 = 69 000÷23 = 3 000( 元 ) .(2) 虽然平均数为 3 000 元 / 月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.(1) 如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2) 众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.典型应用 2利用频率分布直方图求众数、中位数、平均数从高三抽出 50 名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:(1) 这 50 名学生成绩的众数与中位数;(2) 这 50 名学生的平均成绩.【解】 (1) 由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为 75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.因为 0.004 × 10 + 0.006 × 10 + 0.02 × 10= 0.04 + 0.06 + 0.2 = 0.3 ,所以前三个小矩形面积的和为 0.3. 而第四个小矩形面积为 0.03 × 10 = 0.3 , 0.3 +0.3 > 0.5 ,所以中位数应位于第四个小矩形内.设其底边为 x ,高为 0.03 ,所以令 0.03 x = 0.2 ,得x ≈ 6.7 ,故中位数应约为 70 + 6.7 = 76.7.(2) 样本平均值应是频率分布直方图的“ 重心” ,即所有数据的平均值,即每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.所以平均成绩为 45 × (0.004 × 10) + 55 × (0.006 × 10) + 65 × (0.02 × 10) + 75 × (0.03 × 10) + 85 × (0.024 × 10) + 95 × (0.016 × 10) = 76.2.频率分布直方图的数字特征(1) 众数:众数一般用频率分布表中频率最高的一组的组中值来显示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标;(2) 中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;(3) 平均数:平均数在频率分布表中等于组中值与对应频率之积的和.典型应用 3标准差、方差的计算及应用甲、乙两机床同时加工直径为 100 cm 的零件,为检验质量,从中抽取 6件测量数据为:甲: 99 100 98 100 100 103乙: 99 100 102 99 100 100(1) 分别计算两组数据的平均数及方差;(2) 根据计算说明哪台机床加工零件的质量更稳定.【解】 (1) 甲= × (99 + 100 + 98 + 100 + 100 + 103) = 100 ,乙= × (99 + 100 + 102 + 99 + 100 + 100) = 100 ,s = × [(99 - 100) 2 + (100 - 100) 2 + (98 - 100) 2 + (100 - 100) 2 +(100 - 100) 2 + (103 - 100) 2 ] =,s = × [(99 - 100) 2 + (100 - 100) 2 + (102 - 100) 2 + (99 - 100) 2 +(100 - 100) 2 + (100 - 100) 2 ] = 1.(2) 由 (1) 知甲=乙,比较它们的方差,因为 s > s ,故乙机床加工零件的质量更稳定.用样本的标准差、方差估计总体的方法(1) 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差 ( 方差 ) 分析稳定情况.(2) 标准差、方差的取值范围是 [0 ,+∞ ) .(3) 因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.。
谈谈普查与抽样调查普查与抽样调查是两种不同类型的调查方式,有的情况下需要普查,而有的情况下则只能采用抽样调查,下面我们一起来认识这两种调查方式。
一、普查普查就是为了一定的目的,面对考察对象而进行的调查。
其优点是:通过普查可以得到全面可靠的信息;其缺点是:投入的时间长,耗费的人力,物力比较大.二、抽样调查抽样调查就是从总体抽出部分个体进行调查。
其优点是:省时、省力、减少破坏性.可以解决普查所不能解决的问题;其缺点是:所调查的结果不如普查得到的结果准确.抽取的样本不当,则与总体的真实情况误差较大.三、选择恰当的调查方式由于普查和抽样调查都有一定的优点和缺点,所以在收据数据时应根据不同的情况灵活选择调查方式,使调查结果尽量准确.(1)当调查的对象不需要花费太多的时间,而且不具有破坏性时,可采用普查;有的问题必须采用普查,如对神州八号载人飞船的零部件的检查必须采用普查。
一般采用普查的方式.(2)当总体中个体数目较多,普查的工作量大,或受客观条件的限制,不适用普查时,可采用抽样调查的方式.在抽样调查时,所选择的调查结果能够代表总体的情况,应注意样本的代表性和广泛性,这就要求被调查的对象不能太少,被调查的对象是随机抽取的.四、典型例析例1 下列调查中,哪些是用普查方式,哪些是用抽样调查方式?(1)为了解你班所在学生的视力情况,查阅班级体检表;(2)为了了解本校七年级400名学生在家承担家务劳动的情况;(3)为了解一箱(100只装)灯泡的寿命;(4)某校为了解全校学生的心理健康状况,请一位心理专家对全校学生进行问卷调查.析解:(1)因为调查的是一个班的视力表,数据少,所以应用普查;(2)由于全校人数较多,所以适合采用抽样调查;(3)由于测试是有破坏性,所以适合用抽样调查;(4)由于了解的是全校学生的心理问卷,所以用普查.例2 下列抽样调查中抽查的样本合适吗?(1)张老师为了解全班50名学生对英语单词的掌握情况,抽查了5名进行检查. (2)为了解全校26个班课外活动情况,从七年级中抽查了两个班进行分析. (3)为调查全市中学生上网情况,在全市的300中学中随意抽查50所学校的学生的上网情况.(4)为了解我国中学多媒体的普及情况,在北京市作了抽样调查.析解:进行抽样调查时,所抽取的“样本”要具有代表性,即所抽查的样本的结果能比较接近反映总体的情况.所以抽查的范围、数量要适中.(1)中的抽样较少,不能反映出全班学生的单词的掌握情况,所以样本不合适;(2)中的抽查,数量较少,不具有代表性,所以样本不合适;(3)中由于抽样是随机的,且数量适中,所以样本较适合;(4)中的样本具有片面性,不能具有代表性,所以样本不合适.。
全面调查与抽样调查例析
安徽 李庆社
[例1] 下列调查中,哪些是用全面调查方式,哪些是用抽样调查方式来收集数据的? (1)为了了解你所在班级学生的体重情况,查阅班级体检表;
(2)为了了解本地区彩电在居民家庭中的普及率,向全班同学作调查; (3)为了解本校七年级学生每天做作业所花的时间,向全年级同学作调查;
(4)为了解你校学生每人每天的零花钱数量,选取每个班学号为10的整数倍的同学作调查; (5)为了解某国道每天的汽车流量,调查了上午9时至10时经过某收费站的汽车总量; (6)为了解参加运动会的全体运动员的年龄情况,从中抽取了一个代表队运动员的年龄; 答案:(1)、(3)是全面调查;(2)、(4)、(5)、(6)是抽样调查
解析:要分清所进行的调查是全面调查还是抽样调查,主要看两个方面:要调查的范围与实际调查的范围是否一致;调查的对象是部分还是全体。
[例2] 为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃塑料袋的数量如下(单位:个):33,25,28,26,25,31,如果该班有45名学生,那么根据提供的数据估计一周全班同学各家总共丢弃塑料袋的数量约为多少? 答案:1260个
解析:根据题中提供数据先计算出平均每个同学家中丢弃塑料袋的个数:
6
31
2526282533+++++=28(个),再乘以全班人数,即为全班同学各家总共丢弃塑料袋的数量:28451260⨯=(个)。
[例3] 李强同学为了了解自己家里的用电情况,他在一周内连续在同一时刻记录了电表的示数,记录结果如下表:
答案:140度
解析:此题采用的是抽样调查,用样本来估计总体,但在计算时应注意,李强观察的实际是6天的用电量,而不是一周七天的用电量,所以计算的结果应是
306
2117
2145⨯-=140(度)。
[例4] 下列抽样调查中抽取的样本合适吗?为什么?
(1)数学老师为了了解全班同学数学学习中存在的困难和问题,请数学成绩优秀的10名同学开座谈会;
(2)在北京市调查我国公民的受教育程度; (3)在初一学生中调查青少年对网络的态度;
(4)调查每个班学号为5的倍数的学生,以了解全校学生的身高和体重;
答案:(1)中抽取的样本不合适,抽样时,应该让成绩好、中、差的同学都有代表参加;(2)中北京市的经济发达,公民受教育程度高,不具有代表性;(3)中青少年不仅仅是初一学生,初一学生对网络的态度不能代表青少年对网络的态度;(4)中由于抽样调查是随机的,因此可以认为抽样合适。
解析:进行抽样调查时,所抽取的样本要具有代表性,要代表总体中不同的人群,不同的地域,不同的层次,不同的时间等。
[例5] 下表中的数据背景,适合选用什么样的统计图来表示?并画出统计图
答案:适合用条形统计图
解析:数据是具体的数据,并且各部分之间是相互独立的,所以适合用条形统计图
[例6]如图所示是某晚报“百姓热线”一周内接到的热线电话的统计图,其中有关环境保护问题的电话最多,共70个,请回答下列问题:
(1)本周“百姓热线”共接到电话多少个?
(2)有关道路交通问题的电话有多少个?
答案:(1)200个;(2)40个
解析:因为某方面电话的百分数=某方面电话数÷电话总数,所以电话总数用环境保护接到的70个电话除以环境保护电话所占的百分比35%,得到总共电话有200个;有关道路交通问题的电话所占的百分比为20%,所以200×20%=40(个)电话。
[例7]如图所示是根据某市1999年至2003年工业生产总值绘制的折线统计图,观察统计图可得:增长幅度最大的年份是哪一年?比前一年增加多少亿元?
答案:2004年;40亿元
解析:由图中可以看出增长幅度分别为10亿元、20亿元、20亿元、40亿元,所以增长幅度最大的年份应该是2004年,比前一年增加40亿元。
[例8]以下资料来源于2003年《南宁统计年鉴》:(1)分别指出南宁市农民人均纯收入和城市居民人均可支配收入相对于上一年哪一年增长最快(如图)(2)据统计2000~2002年南宁市农民年人均纯收入的平均增长率为7.5%,城市居民年人均可支配收入的平均增长率为8.7%,假设年平均增长率不变,请你分别预计2004年南宁市农民人均纯收入和城市居民人均可支配收入各是多少?(精确到1元)(3)从城乡年人均收入增长率看,你有哪些积极的建议(写一条建议即可)
答案:(1)2002年增长最快;(2)2917元;10393元;(3)从城乡年人均收入增长率看,城市人均可支配收入的平均增长率高于农民年人均纯收入的平均增长率,因此建议国家加大对农业的投入,积极发展高效农业,尽快使农民脱贫致富。
解析:在预计2004年南宁市农民人均纯收入和城市农民人均可支配收入时要注意增长率不变,因此2004年农民人均纯收入为2524×(1+7.5%)2=2917(元),城市居民人均可支配收入为8796×(1+8.7%)2=10393(元)。