5、用样本估计总体 (提高)
- 格式:docx
- 大小:196.66 KB
- 文档页数:18
9.2 用样本估计总体(精讲)考法一总体取值规律的估计【例1】(2021·全国高一课时练习)某市2020年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空间质量为良;在101~150之间时,空间质量为轻微污染;在151~200之间时,空间质量为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【答案】(1)频率分布表见解析;(2)频率分布直方图见解析;(3)该市空气质量有待进一步改善.【解析】(1)频率分布表(2)频率分布直方图(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的1 15;有26天处于良的水平,占当月天数的13 15;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【一隅三反】1.(2020·全国高一单元测试)某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:用户用水量频数直方图用户用水量扇形统计图(1)此次抽样调查的样本容量是________;(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.【答案】(1)答案见解析;(2)答案见解析,79.2°;(3)4.08万户.【解析】(1)1010%100÷=;(2)用水15~20吨的户数为100-10-36-24-8=22(户),“15~20吨”部分的圆心角的度数为22 36079.2100︒⨯=︒(3)1022366 4.08100++⨯=(万户)所以该地区6万用户中约有4.08万户的用水全部享受基本价格.2.(2020·全国高一单元测试)对某校高一年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M,p及图中a的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)内的人数. 【答案】(1)M =40,0.075p =,0.125a =;(2)90人. 【解析】(1)由[10,15)内的频数是10,频率是0.25知,100.25M=,所以M =40. 因为频数之和为40,所以10+25+m +2=40,m =3.330.07540p M ===. 因为a 是对应分组[15,20)的频率与组距的商,所以250.125405a ==⨯. (2)因为该校高一学生有360人,分组[10,15)内的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为3600.25⨯=90人.3.(2021·北京丰台区)为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW ·h 至350kW ·h 之间,进行适当分组后,画出频率分布直方图如图所示.(I )求a 的值;(Ⅱ)求被调查用户中,用电量大于250kW ·h 的户数;(III )为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW ·h )的建议,并简要说明理由. 【答案】(I )0.006;(Ⅱ)18;(III )245.5 kW ·h.【解析】(1)因为()0.00240.00360.00440.00240.0012501a +++++⨯=,所以0.006a =; (2)根据频率分布直方图可知:“用电量大于250kW ·h ”的频率为()0.00240.0012500.18+⨯=, 所以用电量大于250kW ·h 的户数为:1000.1818⨯=, 故用电量大于250kW ·h 有18户;(3)因为前三组的频率和为:()0.00240.00360.006500.60.8++⨯=<,前四组的频率之和为()0.00240.00360.0060.0044500.820.8+++⨯=>, 所以频率为0.8时对应的数据在第四组, 所以第一档用电标准为:0.80.620050245.50.22-+⨯≈kW ·h.故第一档用电标准为245.5 kW ·h.4.(2021·陕西咸阳市)某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.【答案】(Ⅰ)0.02;(Ⅱ)10800元. 【解析】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天), 一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.考法二 总体百分数的估计【例2】(2020·天津和平区)已知一组数据为4,5,67,8,8,,第40百分位数是( ) A .8 B .7C .6D .5【答案】C【解析】因为有6位数,所以640 2.4⨯=%,所以第40百分位数是第三个数6.故选:C 【一隅三反】1.(2020·山东菏泽市·高一期末)数据1,2,3,4,5,6的60%分位数为( ) A .3 B .3.5C .3.6D .4【答案】D【解析】由6⨯60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选:D2.(2021·山东高一期末)已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm ),把这20名同学的身高数据从小到大排序:148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0 158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0 则这组数据的第75百分位数是( ) A .163.0 B .164.0C .163.5D .164.5【答案】A【解析】因为这组数据从小到大已排序,所以这组数据的第75百分位数为第200.7515⨯=个数,即为163.0故选:A3.(2020·山东滨州市·高一期末)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[]0,10内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居号,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是( ) A .7 B .7.5C .8D .9【答案】C【解析】该组数据从小到大排列为:5,5,6,7,8,9,且680% 4.8⨯=,故选:C.考法三 总体集中趋势的估计【例3】(2021·湖北荆州市)因受新冠疫情的影响,某企业的产品销售面临困难.为了改变现状,该企业欲借助电商和“网红”直播带货扩大销售.受网红效应的影响,产品销售取得了较好的效果.现将该企业一段时间内网上销售的日销售额统计整理后绘制成如下图所示的频率分布直方图:请根据图中所给数据,求: (1)实数a 的值;(2)该企业网上销售日销售额的众数和中位数; (3)该企业在统计时间段内网上销售日销售额的平均数. 【答案】(1)0.012;(2)55万元,57万元;(3)57.4万元. 【解析】(1)由频率分布直方图知:(0.0080.0160.0200.0180.0100.0042)101a ++++++⨯=,解得:0.012a =;(2)用频率分布直方图中最高矩形所在区间的中点值作为众数的近似值,得众数为55万元;因为第一个小矩形的面积为0.08,第二个小矩形的面积为0.12, 第三个小矩形的面积为0.16,0.080.120.160.36++=,设第四个小矩形中底边的一部分长为x ,则0.0200.50.36x ⨯=-,解得7x =, 所以中位数为50757+=万元; (3)依题意,日销售额的平均值为:250.08350.12450.16550.20650.18750.12850.10950.0457.4⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以该企业在统计时间段内网上销售日销售额的平均数为57.4万元. 【一隅三反】1.(2020·定边县第四中学高一期末)如图,从参加数学竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图,观察图形,回答下列问题:(Ⅰ)79.5-89.5这一组的频数、频率分别是多少? (Ⅱ)估计这次数学竞赛的平均成绩是多少?(Ⅲ)估计这次数学竞赛的及格率(60分及以上为及格). 【答案】(Ⅰ)15;0.25;(Ⅱ)70.5;(Ⅲ)75%. 【解析】(Ⅰ)79.589.5这一组的频率为0.025100.25⨯=,79.589.5这一组的频数为600.2515⨯=;(Ⅱ)估计这次数学竞赛的平均成绩是:44.50.154.50.1564.50.1574.50.384.50.2594.50.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.故估计这次数学竞赛的平均成绩是70.5.(Ⅲ)估计这次环保知识竞赛的及格率(60分及以上为及格)()10.010.0151075%P =-+⨯=. 2.(2021·河北唐山市·开滦第一中学高一期末)某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[)[)[]40,50,50,60,,90,100⋯后画出如下频率分布直方图.观察图形的信息,回答下列问题:(1)估计这次考试的众数m 与中位数n (结果保留一位小数); (2)估计这次考试的优秀率(80分及以上为及格)和平均分. 【答案】(1)75m =,73.3n =;(2)优秀率30%,平均分71分. 【解析】(1)众数是最高小矩形中点的横坐标,所以众数为75m =(分)前三个小矩形面积为0.01100.015100.015100.4⨯+⨯+⨯=, ∵中位数要平分直方图的面积, ∴0.50.47073.30.03n -=+=.(2)依题意,80及以上的分数所在的第五、六组, 频率和为 ()0.0250.005100.3+⨯=, 所以,抽样学生成绩的合格率是30%, 利用组中值估算抽样学生的平均分:450.1550.15650.15750.3850.25950.0571⨯+⨯+⨯+⨯+⨯+⨯=,估计这次考试的平均分是71分.3.(2021·吉林市)某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x 的值;并估计出月平均用水量的众数. (2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?【答案】(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【解析】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为(0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5,解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯=(3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++, ∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况,其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 考点四 总体离散程度的估计【例4】(2021·山东威海市·高一期末)如图所示的四组数据,标准差最小的是( )A .B .C .D .【答案】A【解析】对A ,()12106206302402516x =⨯+⨯+⨯+⨯=,s == 对B ,()16102202306402516x =⨯+⨯+⨯+⨯=,s == 对C ,()13105205303402516x =⨯+⨯+⨯+⨯=,10s ==, 对D ,()15103203305402516x =⨯+⨯+⨯+⨯=,s == 所以标准差最小的是A.故选:A.【一隅三反】1.(2020·全国高一)已知数据12,,,n x x x 的平均数为x ,方差为2s ,则123x +,223x +,…,23n x +的平均数和方差分别为( )A .x 和2sB .23x +和24sC .23x +和2sD .23x +和24129s s ++ 【答案】B【解析】因为数据12,,,n x x x 的平均数为x ,方差为2s ,所以123x +,223x +,…,23n x +的平均数和方差分别为23x +和24s故选:B2.(2020·安徽蚌埠市·蚌埠二中高一月考)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是( )A .17.2,3.6B .54.8,3.6C .17.2,0.4D .54.8,0.4 【答案】C【解析】设一组数据为i x (1,2,3,,)i n =,平均数为x ,方差为21s ,所得一组新数据为i y (1,2,3,,)i n =,平均数为y ,方差为22s ,则350i i y x =-(1,2,3,,)i n =,12 1.6n y y y y n +++==, 所以123503503501.6n x x x n -+-++-=, 所以350 1.6x -=,所以51.617.23x ==, 由题意得22222121()()() 3.6n s y y y y y y n ⎡⎤=-+-++-=⎣⎦, 所以222121(350 1.6)(350 1.6)(350 1.6) 3.6n x x x n⎡⎤--+--++--=⎣⎦, 所以2221219(17.2)(17.2)(17.2) 3.6n x x x n ⎡⎤⨯-+-++-=⎣⎦ 所以2221219()()() 3.6n x x x x x x n⎡⎤⨯-+-++-=⎣⎦, 所以219 3.6s =,所以210.4s =.故选:C.3.(2020·唐山市第十一中学)已知样本数据由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a ,b 的值分别为( ).A .10,11B .10.5,9.5C .10.4,10.6D .10.5,10.5 【答案】D【解析】由于样本共有10个值,且中间两个数为a ,b ,依题意,得10.52a b +=,即21b a =-. 因为平均数为23371213.718.320101()0a b +++++++++÷=,所以要使该样本的方差最小,只需()()221010a b -+-最小.又()()()()222221010102110242221a b a a a a -+-=-+--=-+, 所以当4210.522a -=-=⨯时,()()221010a b -+-最小,此时10.5b =. 故选:D4.(2021·合肥市第六中学=)为了测试小班教学的实践效果,刘老师对A 、B 两班的学生进行了阶段测试,并将所得成绩统计如图所示;记本次测试中,A 、B 两班学生的平均成绩分别为A x ,B x ,A 、B 两班学生成绩的方差分别为2A s ,2B s ,则观察茎叶图可知( )A .AB x x <,22A B s s < B .A B x x >,22A B s s <C .A B x x <,22A B s s >D .A B x x >,22A B s s >【答案】B【解析】根据茎叶图中数据的分布可得,A 班学生的分数多集中在[]70,80之间, B 班学生的分数集中在[]50,70 之间,所以A B x x >.相对两个班级的成绩分布来说,A 班学生的分数更加集中,B 班学生的分数更加离散,所以22A B s s <.故选:B。
第五章用样本推断总体(总14页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--编写日期:2015年11月29日课时教案章节第四章课题总体平均数与方差的估计课型新授课教法讲练结合教学目标【知识与技能】1.掌握用样本平均数估计总体平均数2.掌握用样本方差估计总体方差.【过程与方法】通过对具体事例的分析、探讨,掌握简单随机样本在大多数情况下,当样本容量足够大时,样本的平均数和方差能反应总体相应的情况.【情感态度】感受数学在生活中的应用.教学重点样本平均数、方差估计总体平均数、方差的综合应用.教学难点体会统计思想,并会用样本平均数和方差估计总体平均数和方差.教学方法投影仪教学媒体一、情景导入,初步认知一所学校要从两名短跑速度较快的同学中选拔一名去参加市里的比赛,为了使选拔公平,每名同学都进行10次测试,结果两名同学测试的结果的平均数是相同的,那么,派谁去参加比赛更好呢?【教学说明】:二、思考探究,获取新知1.我们在研究某个总体时,一般用数据表示总体中每个个体的某种数量特性,所有这些数据组成一个总体,而样本则是从总体中抽取的部分数据,因此,样本蕴含着总体的许多信息,这使我们有可能通过样本的某些特性去推断总体的相应特性.2.从总体中抽取样本,然后通过对样本的分析,去推断总体的情况,这是统计的基本思想,用样本平均数,样本方差分别去估计总体平均数,总体方差就是这一思想的体现,实践和理论都表明:对于简单的随机样本,在大多数情况下,当样本容量足够大时,这种估计是合理的.3.思考:(1)如何估计某城市所有家庭一年内平均丢弃的塑料袋个数?(2)在检查甲、乙两种棉花的纤维长度时,如何估计哪种棉花的纤维长度比较整齐?【归纳结论】:4.探究:某农科院在某地区选择了自然条件相同的两个试验区,用相同的管理技术试种甲、乙两个品种的水稻各100亩.如何确定哪个品种的水稻在该地区更有推广价值呢?为了选择合适的稻种,我们需要关心这两种水稻的平均产量及产量的稳定性(即方差),于是,待水稻成熟后,各自从这100亩水稻随机抽取10亩水稻,记录它们的亩产量(样本),数据如下表所示:我们可以求出这10亩甲、乙品种的水稻的平均产量.因此,我们可以用这个产量来估计这两种水稻大面积种植后的平均产量.我们还可以计算出这10亩甲、乙品种的水稻的方差,从而利用这两个方差来估计.这两种水稻大面积种植后的稳定性(即方差),从而得出哪种水稻值得推广.5.通过上面的探究,怎样用样本去估计总体,才能使估计更加合理?【归纳结论】:6.如何用样本方差估计总体方差?【归纳结论】【教学说明】三、运用新知,深化理解1.见教材P143例题.年宁波市初中毕业生升学体育集中测试项目包括体能(耐力)类项目和速度(跳跃、力量、技能)类项目.体能类项目从游泳和中长跑中任选一项,速度类项目从立定跳远、50米跑等6项中任选一项.某校九年级共有200名女生在速度类项目中选择了立定跳远,现从这200名女生中随机抽取10名女生进行测试,下面是她们测试结果的条形图.(另附:九年级女生立定跳远的计分标准)九年级女生立定跳远计分标准:(注:不到上限,则按下限计分,满分10分)(1)求这10名女生在本次测试中,立定跳远距离的极差,立定跳远得分的众数和平均数;(2)请你估计该校选择立定跳远的200名女生得满分的人数.(2)因为10名女生中有6名得满分,所以估计200名女生中得满分的人数是200×610=120(人).3.某校要从甲、乙两名跳远运动员中挑选一人参加一项校际比赛,抽查了两人在最近10次选拔赛中的表现,他们的成绩(单位:cm)如下:你认为该派谁参加?4.如图所示,为了了解A、B两个旅游点的游客人数变化情况,抽取了从2002年至2006年“五一”的旅游人数变化情况,制成下图.根据图中所示解答以下问题:(1)B旅游点的旅游人数相对上一年,增长最快的是哪一年?(2)从平均数和方差的角度,用一句话对这两个旅游点的情况进行评价;编写日期:2015年11月30日课时教案教学目标【知识与技能】用样本中的“率”估计总体中的“率”.【过程与方法】经历数据的收集、整理、描述与分析的过程,进一步发展统计的意识和数据处理能力.【情感态度】体会统计在生活中的应用.教学重点用样本中的“率”估计总体中的“率”教学难点用样本中的“率”估计总体中的“率”.教学方法投影仪教学媒体一、情景导入,初步认知在实践中,我们常常通过简单的随机抽样,用样本的“率”去估计总体相应的“率”,例如工厂为了估计一批产品的合格率,常常从产品中随机抽取一部分进行检查,通过对样本进行分析,推断出这批产品的合格率.那么有什么方法来对“率”作出合理的估计呢?【教学说明】:二、思考探究,获取新知1.某工厂生产了一批产品,从中抽取1000件来检查,发现有10件次品,试估计这批产品的次品率.解:由于是随机抽取,即总体中每一件产品都有相同的机会被抽取,因此,随机抽取的1000件产品组成了一个简单随机样本,因而可以用这个样本的次品率作为对这批产品的次品率的估计,从而这批产品的次品率为1%.2.某地为提倡节约用水,准备实行“阶梯水价计费”方式,用户月用水量不超出基本月用水量的部分享受基本价格,超出基本月用水量的部分实行加价收费,为更好地决策,自来水公司随机抽取了部分用户的月用水量数据.并将这些数据绘制成了如下的图形:如果自来水公司将基本月用水量定为每户12吨,那么该地区20万用户中约有多少用户能够全部享受基本价格?【教学说明】:三、运用新知,深化理解1.见教材P147例2.2.某灯具厂从1万件同批次产品中随机抽取了100件进行质检,发现其中有5件不合格,估计该厂这一万件产品中不合格品约为多少件?3.为了了解我市某县参加2008年初中毕业会考的6000名考生的数学成绩,从中抽查了200名学生的数学成绩(成绩为整数,满分120分)进行统计分析,并根据抽查结果绘制了如下的统计表和扇形统计图:(1)请将以上统计表和扇形统计图补充完整;(2)若规定60分以下(不含60分)为“不合格”,60分以上(含60分)为“合格”,80分以上(含80分)为“优秀”,试求该样本的合格率、优秀率;(3)在(2)的规定下,请用上述样本的有关信息估计该县本次毕业会考中数学成绩优秀的人数和不合格的人数.年我市体卫站对某校九年级学生体育测试情况进行调研,从该校360名九年级学生中抽取了部分学生的成绩(成绩分为A、B、C三个层次)进行分析,绘制了频数分布表(如下),请根据图表信息解答下列问题:(1)补全频数分布表;(2)如果成绩为A等级的同学属于优秀,请你估计该校九年级约有多少人达到优秀水平.编写日期:2015年11月31日课时教案教学重点借助统计图表、统计量作出正确决策.教学难点能够利用统计的有关知识解决相关实际问题.教学方法投影仪教学媒体一、情景导入,初步认知我们知道能够用样本的量来估计总体中的量,那么,我们能不能利用样本来推算将来的情况呢?【教学说明】:二、思考探究,获取新知1.李奶奶在小区开了一家便利店,供应A,B,C,D,E5个品种的食物,由于不同品种的食物的保质期不同,因此,有些品种因滞销而变质,造成浪费,有些品种因脱销而给居民带来不便.面对这种情况,李奶奶很着急.请你想办法帮助李奶奶解决这一问题.分析:随机抽取几天中这5个品种的食物的销售情况,再根据结果提出合理的建议.(1)收集数据;(2)分析数据和统计结果;(3)估计结果确定进货方案.2.利用样本来推断总体的过程是怎样的呢?【归纳结论】:【教学说明】三、运用新知,深化理解1.见教材P151“做一做”.2.小红的奶奶开了一个牛奶销售店,主要经营“学生奶”“酸牛奶”“原味奶”,可奶奶经营不善,经常有些品种的牛奶滞销(没卖完)或脱销(量不够),造成了浪费或亏损,细心的小红结合所学的统计知识帮奶奶统计了一个星期牛奶的销售情况,并绘制了下表:(1)计算各品种牛奶的日平均销售量,并说明哪种牛奶销量最高;(2)计算各品种牛奶的方差(保留两位小数),并比较哪种牛奶销量最稳定;(3)假如你是小红,你会对奶奶有哪些好的建议?3.第九届中国国际园林博览会(园博会)已于2013年5月18日在北京开幕,以下是根据近几届园博会的相关数据绘制的统计图的一部分:(1)第九届园博会的植物花园区由五个花园组成,其中月季园面积为平方千米,牡丹园面积为平方千米;(2)第九届园博会园区陆地面积是植物花园区总面积的18倍,水面面积是第七、八两届园博会的水面面积之和,请根据上述信息补全条形统计图,并标明相应数据;(3)小娜收集了几届园博会的相关信息(如下表),发现园博会园区周边设置的停车位数量与日接待游客量和单日最多接待游客量中的某个量近似成正比例关系,根据小娜的发现,请估计将于2015年举办的第十届园博会大约需要设置的停车位数量(直接写出结果,精确到百位).第七届至第十届园博会游客量与停车位数量统计表解:(1)(2)陆地面积平分千米水面面积平方千米图略(3)3700【教学说明】:四、师生互动、课堂小结布置作业教材“习题”中第3 题.教学后记编写日期:2015年12月1日课时教案章节第四章课题章末复习课型新授课教法讲练结合教学目标【知识与技能】整合初中阶段所学统计知识,梳理形成知识网络.【过程与方法】加深对统计知识的理解,增强主动应用数学的意识和综合运用所学知识解决问题的能力.【情感态度】进一步理解用样本去估计总体的统计思想,培养从一般到特殊,再从特殊到一般的认知规律.教学重点统计知识的灵活应用.教学难点统计知识的灵活应用.教学方法投影仪教学媒体一、知识结构【教学说明】二、释疑解惑,加深理解1.由于简单随机样本客观地反映了实际情况,能够代表总体,因此我们可以用简单随机样本的平均数与方差分别去估计总体的平均数与方差.2.怎样用样本去估计总体,才能使估计更加合理?①抽取的样本要具有随机性;②样本容量要足够大.3.如何用样本方差估计总体方差?①计算样本平均数;②计算样本方差;③用样本方差估计总体方差.方差能够反映一组数据与其平均值的离散程度的大小.方差越大,离散程度越大,稳定性越差.4.在实践中,我们常常通过简单的随机抽样,用样本的“率”去估计总体相应的“率”.5.我们可以利用已有的统计数据来对事物在未来一段时间内的发展趋势做出判断和预测,为正确的决策提供服务.【教学说明】三、典例精析,复习新知1.如图所示是甲、乙两地某十天的日平均气温统计图,则甲、乙两地这10天的日平均气温的方差大小关系为:s2甲______s2乙(用>,=,<填空).2.某果园有果树200棵,从中随机抽取5棵,每棵果树的产量分别为(单位:千克):98,102,97,103,105,那么这5棵果树的平均产量为多少千克极差是多少这200棵果树的总产量约为多少千克3.某初中为了迎接初三学生体育中考,特地进行了一次考前模拟测试.如图是女生800米跑的成绩中抽取的10个同学的成绩.(1)求出这10名女生成绩的中位数、众数和极差;(2)按《萧山教育局中考体育》规定,女生800米跑成绩不超过3′25″就可以得满分.现该校初三学生有636人,其中男生比女生少74人.请你根据上面抽样的结果,估算该校初三学生中有多少名女生该项考试得满分?4.为了了解市场上甲、乙两种手表日走时误差的情况,从这两种手表中各随机抽取10块进行测试,两种手表日走时误差的数据如下(单位:秒):(1)计算甲、乙两种手表日走时误差的平均数;(2)你认为甲、乙两种手表中哪种手表走时稳定性好?说说你的理由.【教学说明】:四、复习训练,巩固提高1.下面是某地区2001~2004年初中生在校人数和全国初中学校数统计图(如图),由图可知从2001~2004年,该地区初中生在校人数()A.逐年增加,学校数也逐年增加B.逐年增加,学校数却逐年减少C.逐年减少,学校数也逐年减少D.逐年减少,学校数却逐年增加2.某环保小组为了解世博园的游客在园区内购买瓶装饮料数量的情况,一天,他们在某出口处,对离开园区的游客进行调查,并将在此出口调查所得的数据整理后绘成图.(1)在此出口的被调查游客中,购买2瓶及2瓶以上饮料的游客人数占此出口的被调查游客人数的()%.(2)试问此出口的被调查游客在园区内人均购买了多少瓶饮料?3.某市对九年级学生进行了一次学业水平测试,成绩评定分A、B、C、D四个等级.为了解这次数学测试成绩情况,相关部门从该市的农村、县镇、城市三类群体的学生中共抽取2 000名学生的数学成绩进行统计分析,相应数据的统计图表如下:(注:等级A、B、C、D分别代表优秀、良好、合格、不合格)(1)请将上面表格中缺少的三个数据补充完整;(2)若该市九年级共有60 000名学生参加测试,试估计该市学生成绩合格以上(含合格)的人数.4.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?”,共有4个选项:A.小时以上B.1~小时C.~1小时D.小时以下图1、2是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息,解答以下问题:(1)本次一共调查了多少名学生?(2)在图1中将选项B的部分补充完整;(3)若该校有3000名学生,你估计全校可能有多少名学生平均每天参加体育活动的时间在小时以下?【教学说明】:五、师生互动,课堂小结布置教材“复习题5”中第2、5、6、8、10题.作业。
用样本估计总体【第一课时】【教学目标】1.会画一组数据的频率分布表、频率分布直方图.2.会用频率分布表、频率分布直方图、条形图、扇形图、折线图等对总体进行估计.3.掌握求n个数据的第p百分位数的方法.【教学重难点】1.频率分布表、频率分布直方图.2.用样本估计总体.3.总体百分位数的估计.【教学过程】一、问题导入预习教材内容,思考以下问题:1.绘制频率分布表和频率分布直方图有哪些步骤?2.频率分布直方图有哪些特征?3.如何求n个数据的第p百分位数?二、基础知识1.频率分布表、频率分布直方图的制作步骤及意义2.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算步骤:计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.三、合作探究1.频率分布表、频率分布直方图、频率分布折线图的绘制角度一:频率分布表、频率分布直方图的绘制为考查某校高二男生的体重,随机抽取44名高二男生,实测体重数据(单位:kg)如下:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.【解】以4频率累计频率分布直方图和频率分布折线图如图所示.(1)在列频率分布表时,极差、组距、组数有如下关系: ①若极差组距为整数,则极差组距=组数;②若极差组距不为整数,则极差组距的整数部分+1=组数.(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本量越大,所分组数越多.角度二:频率分布直方图的应用为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少? (3)样本中不达标的学生人数是多少? (4)第三组的频数是多少?【解】(1)频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校高一年级学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%.(3)由(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12. 所以样本中不达标的学生人数为150×0.12=18(人).(4)第三小组的频率为172+4+17+15+9+3=0.34.又因为样本量为150,所以第三组的频数为150×0.34=51.频率分布直方图的应用中的计算问题 (1)小长方形的面积=组距×频率组距=频率;(2)各小长方形的面积之和等于1;(3)频数样本量=频率,此关系式的变形为频数频率=样本量,样本量×频率=频数.2.条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“百家讲坛”的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内容),整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题: (1)求抽取的学生数;(2)若该校有3 000名学生,估计喜欢收听易中天《品三国》的学生人数;(3)估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比. 【解】(1)从统计图上可以看出,喜欢收听于丹析《庄子》的男生有20人,女生有10人; 喜欢收听《故宫博物院》的男生有30人,女生有15人; 喜欢收听于丹析《论语》的男生有30人,女生有38人; 喜欢收听易中天《品三国》的男生有64人,女生有42人;喜欢收听刘心武评《红楼梦》的男生有6人,女生有45人.所以抽取的学生数为20+10+30+15+30+38+64+42+6+45=300(人).(2)喜欢收听易中天《品三国》的男生有64人,女生有42人,共有106人,占所抽取总人数的比例为106 300,由于该校有3 000名学生,因此可以估计喜欢收听易中天《品三国》的学生有106300×3 000=1 060(人).(3)该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为45300×100%=15%.(1)绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.(2)在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.3.折线统计图小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.根据图中的信息,回答以下问题:(1)护士每隔几小时给小明测量一次体温?(2)近三天来,小明的最高体温、最低体温分别是多少?(3)从体温看,小明的病情是在恶化还是在好转?(4)如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那么小明最快什么出院?【解】(1)根据横轴表示的意义,可知护士每隔6小时给小明测量一次体温.(2)从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是39.5摄氏度,最低体温是36.8摄氏度.(3)从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.(4)9月8日18时小明的体温是37摄氏度.其后的体温未超过37.2摄氏度,自9月8日18时起计算,连续36小时后对应的时间为9月10日凌晨6时.因此小明最快可以在9月10凌晨6时出院.(1)绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.4.扇形统计图下图是A ,B 两所学校艺术节期间收到的各类艺术作品的情况的统计图: (1)从图中能否看出哪所学校收到的水粉画作品数量多?为什么?(2)已知A 学校收到的剪纸作品比B 学校的多20件,收到的书法作品比B 学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?【解】(1)不能.因为两所学校收到艺术作品的总数不知道.(2)设A 学校收到艺术作品的总数为x 件,B 学校收到艺术作品的总数为y 件,则⎩⎨⎧10%x -5%y =20,50%y -40%x =100,解得⎩⎨⎧x =500,y =600,即A 学校收到艺术作品的总数为500件,B 学校收到艺术作品的总数为600件.(1)绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.(2)扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.5.百分位数的计算试求甲、乙两组数的25%分位数与75%分位数.【解】因为数据个数为20,而且20×25%=5,20×75%=15.因此,甲组数的25%分位数为x5+x62=2+32=2.5;甲组数的75%分位数为x15+x162=9+102=9.5.乙组数的25%分位数为x5+x62=1+12=1,乙组的75%分位数为x15+x162=10+142=12.求百分位数时,一定要将数据按照从小到大的顺序排列.【课堂检测】1.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是()解析:选D.用统计图表示不同品种的奶牛的平均产奶量,即从图中可以比较各种数量的多少,因此“最为合适”的统计图是条形统计图.注意B选项中的图不能称为统计图.2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)g的频率为()A.0.1B.0.2C.0.3 D.0.4解析:选C.由题图可得,新生儿体重在[2 700,3 000)g的频率为0.001×300=0.3,故选C.3.观察下图所示的统计图,下列结论正确的是()A.甲校女生比乙校女生多B.乙校男生比甲校男生少C.乙校女生比甲校男生少D.甲、乙两校女生人数无法比较解析:选D.图中数据只是百分比,甲、乙两个学校的学生总数不知道,因此男生与女生的具体人数也无法得知.【第二课时】 【教学目标】1.理解样本数据标众数、中位数、平均数的意义和作用,学会计算数据的众数、中位数、平均数.2.理解样本数据方差、标准差的意义和作用,学会计算数据的方差、标准差.【教学重难点】会用样本的基本数字特征来估计总体的基本数字特征.【教学过程】一、基础知识1.众数、中位数、平均数 众数、中位数、平均数定义(1)众数:一组数据中出现次数最多的数.(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.(3)平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n (x 1+x 2+…+x n )叫做这n 个数的平均数.思考:平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点? 答案:平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.2.方差、标准差标准差、方差的概念及计算公式(1)标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].(2)标准差的平方s 2叫做方差.s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).(3)标准差(或方差)越小,数据越稳定在平均数附近.s =0时,每一组样本数据均为x .二、合作探究1.众数、中位数、平均数的计算(1)某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为()A.85,85,85B.87,85,86C.87,85,85D.87,85,90(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为() A.2,5B.5,5C.5,8D.8,8答案(1)C(2)C解析(1)平均数为100+95+90×2+85×4+80+7510=87,众数为85,中位数为85.(2)结合茎叶图上的原始数据,根据中位数和平均数的概念列出方程进行求解.由于甲组数据的中位数为15=10+x,所以x=5.又乙组数据的平均数为9+15+10+y+18+245=16.8,所以y=8,所以x,y的值分别为5,8.【教师小结】平均数、众数、中位数的计算方法:平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.2.标准差、方差的计算及应用甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?解(1)x甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x 乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3,s 2乙=1.2.(3)x 甲=x 乙,说明甲、乙两战士的平均水平相当.又s 2甲>s 2乙说明甲战士射击情况波动比乙大.因此,乙战士比甲战士射击情况稳定,从成绩的稳定性考虑,应选择乙参加比赛.【教师小结】(1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数据分布情况,而样本数据的离散程度是由标准差来衡量的.三、课堂总结1.标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.【课堂检测】1.某市2017年各月的平均气温(℃)数据的茎叶图如图:则这组数据的中位数是( )A .19B .20C .21.5D .23答案 B解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B .2.下列关于平均数、中位数、众数的说法中正确的一个是( )A .中位数可以准确地反映出总体的情况B .平均数可以准确地反映出总体的情况C .众数可以准确地反映出总体的情况D .平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况答案 D3.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得的数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差答案 D4.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关答案 B解析 由茎叶图知,a 1=80+1+5+5+4+55=84, a 2=80+4+4+6+4+75=85,故选B . 5.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.答案 16解析 设样本数据x 1,x 2,…,x 10的标准差为s ,则s =8,可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.。
用样本估计总体教案一、课程名称:(适用大部分课程教案)二、授课对象初中二年级学生三、授课时间每课时45分钟四、授课教师张某某五、教学目标1、知识与技能目标(1)掌握用样本估计总体的基本概念和方法;(2)能够运用样本数据对总体进行估计,并计算估计的误差;(3)能够运用统计学软件进行样本估计总体的操作。
2、过程与方法目标(1)通过小组合作探究,培养学生运用统计学方法解决问题的能力;(2)通过实际案例的分析,培养学生将理论知识与实际应用相结合的能力;(3)通过课堂讲解和练习,培养学生自主学习、思考总结的能力。
3、情感态度价值观目标(1)培养学生对统计学产生兴趣,认识到统计学在生活中的重要性;(2)培养学生具备客观、严谨的科学态度;(3)培养学生团结协作、共同探究的精神。
六、教学重占和难点1、教学重点(1)用样本估计总体的基本方法和步骤;(2)样本估计总体的误差分析;(3)统计学软件在样本估计总体中的应用。
2、教学难点(1)样本估计总体误差的计算;(2)统计学软件的操作使用;(3)将理论知识与实际案例相结合,解决实际问题。
七、教学过程1、导入新课(5分钟)授课教师通过展示与学生生活密切相关的总体数据问题,例如:“假设我们要了解全校学生的平均身高,我们是否需要测量每一个学生?有没有更高效的方法?”引发学生对用样本估计总体概念的思考,从而导入新课。
2、新知讲授(20分钟)(1)介绍用样本估计总体的基本概念,包括总体、样本、参数、统计量等;(2)讲解如何从样本数据推断总体数据,包括点估计和区间估计;(3)详细解释样本估计的误差来源及如何计算误差;(4)展示统计学软件(如SPSS、Excel等)在样本估计总体中的应用实例。
3、合作探究(15分钟)将学生分成小组,每组给予一个实际案例,如调查班级学生的平均成绩,要求小组讨论并设计出合理的样本调查方案,包括样本的大小、选择方法等,并尝试使用统计学软件进行数据处理和分析。
2.2 用样本估计总体教案 A第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1. 通过实例体会分布的意义和作用.2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.二、探究新知探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,第 1 页为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值及最小值的差,即求极差;2.决定组距及组数;3.将数据分组;4.列频率分布表;5.画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.探究2:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图的不同看法进行交流……)接下来请同学们思考下面这个问题:思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见教材P67)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)(二)频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.思考:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把第 3 页这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.三、例题精析例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.cm )例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593=+++++, 又因为频率=.第二小组频数样本容量所以,12150.0.08===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、课堂小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、评价设计1.P81习题2.2 A组1、2.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征(板出课题).二、探究新知(一)众数、中位数、平均数探究(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供第 5 页关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图见教材第72页)它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.(图略见教材73页图2.2-6)思考:2.02这个中位数的估计值,及样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)图2.2-6显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)(二)标准差、方差1.标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176cm ,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲,.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?(观察P74图2.2-7)直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据.考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.样本数据1,2,,n x x x 的标准差的算法:第 7 页(1) 算出样本数据的平均数x .(2) 算出每个样本数据及样本数据平均数的差:(1,2,)i x x i n -= (3) 算出(2)中(1,2,)i x x i n -=的平方.(4) 算出(3)中n 个平方数的平均数,即为样本方差.(5) 算出(4)中平均数的算术平方根,即为样本标准差.其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.提问:标准差的取值范围是什么?标准差为0的样本数据有什么特点?从标准差的定义和计算公式都可以得出:s ≥0.当0s =时,意味着所有的样本数据都等于样本平均数.2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.三、例题精析例1 画出下列四组样本数据的直方图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:(图见教材P76)四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83.他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的.例2 甲乙两人同时生产内径为25.40mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm ):甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.3825.42 25.39 25.43 25.39 25.40 25.44 25.40 25.4225.45 25.35 25.41 25.39乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.3625.34 25.49 25.33 25.43 25.43 25.32 25.47 25.3125.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数及标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值.解:四、课堂小结1. 用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确.2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.五、评价设计P81 习题 2.2 A组 3、4.教案 B第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境,导入新课我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.二、新课探知(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1. 计算一组数据中最大值及最小值的差,即求极差;2. 决定组距及组数;第 9 页cm ) 3. 将数据分组;4. 列频率分布表;5. 画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134C m的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图:(3134cm 的男孩出现的,所以我们估计身高小 (1趋势. (2把数据抹掉了.曲线 1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(见教材P69)(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.例2某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.用茎叶图表示,你能通过该图说明哪个运动员的发挥更稳定吗?解:“茎”指的是中间的一列数,表示得分的十位数;“叶”指的是从茎的旁边生长出来的数,分别表示两人得分的个位数.画这组数据的茎叶图的步骤如下第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,茎是中间的一列数,按从小到大的顺序排列;第三步,将各个数据的叶按大小次序写在茎右(左)侧.甲乙8 04 6 3 1 2 53 6 8 2 5 43 8 9 3 1 6 1 6 7 94 4 91 5 0从图中可以看出,乙运动员的得分基本上是对称的,页的分布是“单峰”的,有的叶集中在茎2,3,4上,中位数为36;甲运动员的得分除一个特殊得分(51分)外,也大致对称,叶的分布也是“单峰”的,有的叶主要集中在茎1,2,3上,中位数是26.由此可以看出,乙运动员的成绩更好. 另外i,从叶在茎上的分布情况看,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.练习:在NBA的2010赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33学生画出茎叶图(略)三、巩固练习为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(见下页图示),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第 11 页(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.08 24171593=+++++,又因为频率=第二小组频数样本容量,所以,121500.08===第二小组频数样本容量第二小组频率.(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、布置作业P71练习1、2、3.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境导入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征.二、新课探究(一)众数、中位数、平均数初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见教材第72页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,第 13 页。
湘教版九年级数学上册第五章用样本推断总体单元评估检测试卷一、单选题(共10题;共30分)1.某班同学参加植树,第一组植树15棵,第二组植树18棵,第三组树数14棵,第四组植树19棵.为了把这个班的植树情况清楚地反映出来,应该制作的统计图为()A. 条形统计图B. 折线统计图C. 扇形统计图D. 条形统计图、扇形统计图均可2.(•德州)某专卖店专营某品牌的衬衫,店主对上一周中不同尺码的衬衫销售情况统计如下:尺码39 40 41 42 43平均每天销售数量/件 10 12 20 12 12该店主决定本周进货时,增加了一些41码的衬衫,影响该店主决策的统计量是()A. 平均数B. 方差C. 众数D. 中位数3.小宁同学根据全班同学的血型绘制了如图所示的扇形统计图,该班血型为A型的有20人,那么该班血型为AB型的人数为()A. 2人B. 5人C. 8人D. 10人4.母亲节快到了,某校团委随机抽取本校部分同学,进行母亲生日日期了解情况调查,分“知道、不知道、记不清”三种情况。
下面图①、图②是根据采集到的数据,绘制的扇形和条形统计图。
请你根据图中提供的信息,若全校共有990名学生,估计这所学校有知道母亲的生日的学生有()名。
A. 440B. 495C. 550D. 6605.下列说法中,正确的是()A. —个游戏中奖的概率是1,则做10次这样的游戏一定会中奖 B. 为了了解一批炮弹的杀伤半径,10应采用全面调查的方式C. 一组数据8,8,7,10,6,8,9的众数是8D. 若甲组数据的方差是0.1,乙组数据的方差是0.2,则乙组数据比甲组数据波动小6.为了鼓励学生课外阅读,学校公布了“阅读奖励”方案,并设置了“赞成、反对、无所谓”三种意见.现从学校所有2400名学生中随机征求了100名学生的意见,其中持“反对”和“无所谓”意见的共有30名学生,估计全校持“赞成”意见的学生人数约为()A. 70B. 720C. 1680D. 23707.某校为举办“庆祝建90周年”的活动,从全校1400名学生中随机调查了280名学生,其中有80人希望举办文艺演出,据此估计该学校希望举办文艺演出的学生人数为()A. 1120B. 400C. 280D. 808.为了估计不透明的袋子里装有多少白球,先从袋中摸出10个球都做上标记,然后放回袋中去,充分摇匀后再摸出10个球,发现其中有一个球有标记,那么你估计袋中大约有()个白球.A. 10B. 20C. 100D. 1219.某市社会调查队对城区内一个社区居民的家庭经济状况进行调查。
第五章 用样本推断总体(考点讲义)1.样本容量:样本中个体的数目叫做样本容量。
2.在用样本特性估计总体特性时,要注意一是样本要有代表性,二是样本容量要足够大。
3.求平均数的公式:123nx x x x x n++++=L【类型一】利用样本平均数估算总体数量【例1】为了创设全新的校园文化氛围,进一步组织学生开展课外阅读,让学生在丰富多彩的书海中,扩大知识源,亲近母语,提高文学素养.某校准备开展“与经典为友、与名著为伴”的阅读活动,活动前对本校学生进行了“你最喜欢的图书类型(只写一项)”的随机抽样调查,相关数据统计如下:请根据以上信息解答下列问题:(1)该校对_____名学生进行了抽样调查,m = _____n =_____(2)请将图1和图2补充完整,并求出扇形统计图中小说所对应的圆心角度数;(3)已知该校共有学生800人,利用样本数据估计全校学生中最喜欢科幻人数约为多少人?【解析】(1)用其它初一它的百分比即可;(2)用360∘乘以所占得百分比;(3)用样本估计总体.解:(1)20÷10%=200(名).由图1,得n=40,m=100-20-10-40=30答:该校对200名学生进行了抽样调查;m=30,n=40(2)如图:小说对应的圆心角度数为360∘×20%=72∘;(3)800×30%=240.答:全校学生中最喜欢小说的人数约为240名.【对应训练1】为了估计湖里有多少条鱼,小刚先从湖里捞出了100条鱼做上标记,然后放回湖里去.经过一段时间,带有标记的鱼完全混合于鱼群后,小刚又从湖里捞出200条鱼,如果其中15条有标记,那么估计湖里有鱼()A.1333条B.3000条C.300条D.1500条【答案】A【解析】在样本中“捕捞200条鱼,发现其中15条有标记”,即可求得有标记的所占比例,而这一比例也适用于整体,据此即可解答.【对应训练2】我国古代数学名著《九章算术》有“米谷粒分”.粮仓开仓收粮,有人送来谷米1608石,验得其中夹有谷粒.现从中抽取谷米一把,共数得256粒,其中夹有谷粒32粒,则这批谷米内夹有谷粒约是________石.【答案】201【解析】根据256粒内夹谷32粒,可得比例,再乘以1608石,即可得出答案.【解答】解:根据题意,得1608×32=201(石),256∴这批谷米内夹有谷粒约201石.【对应训练3】某山区中学280名学生参加植树节活动,要求每人植3至6棵,活动结束后随机抽查了若干名学生每人的植树量,并分为四种类型,A:3棵;B:4棵;C:5棵;D:6棵,将各类的人数绘制成扇形图(如图1)和条形图(如图2).回答下列问题:(1)这次调查一共抽查了________名学生的植树量;请将条形图补充完整;(2)被调查学生每人植树量的众数是________棵、中位数是________棵;(3)求被调查学生每人植树量的平均数,并估计这280名学生共植树多少棵?【解析】(1)由B类型的人数及其所占百分比可得总人数,总人数乘以D类型的对应的百分比即可求出其人数,据此可补全图形;(2)根据众数和中位数的概念可得答案;(3)先求出样本的平均数,再乘以总人数即可.【解答】(1)这次调查一共抽查植树的学生人数为8÷40%=20(人),D类人数=20×10%=2(人);条形图补充如图:(2)植树4棵的人数最多,则众数是4,共有20人植树,其中位数是第10、11人植树数量的平均数,则中位数是4,(3)x=4×48×562×7=5.3(棵),205.3×280=148(棵).答:估计这3280名学生共植树1484棵.【类型二】用样本估计总体【例2】为了提高学生的综合素养,某校开设了五门第二课堂活动课,按照类别分为:A“剪纸”、B“绘画”、C“雕刻”、D“泥塑”、E“插花”.为了了解学生对每种活动课的喜爱情况,随机抽取了部分同学进行调查,将调查结果绘制成如下两幅不完整的统计图.根据信息,回答下列问题:(1)本次调查的样本容量为________,统计图中的a=________,b=________;(2)通过计算补全条形统计图;(3)该校共有3000名学生,请你估计全校喜爱“雕刻”的学生人数.解:(1)样本容量为1815%=120,a=120×10%=12,b=120×30%=36.故答案为:120;12;36.(2)组频数:120―18―12―30―36=24(人),补全条形统计图如图所示:(3)3000×30120=750(人),答:该校喜爱“雕刻”约有750人.【跟踪训练1】在一个不透明的盒子中装有20个黄、白两种颜色的乒乓球,除颜色外其它都相同,小明进行了多次摸球试验,发现摸到白色乒乓球的频率稳定在0.2左右,由此可知盒子中黄色乒乓球约有…()A.2个B.4个C.18个D.16个【答案】D【跟踪训练2】质检部门从1000件电子元件中随机抽取100件进行检测,其中有2件是次品.试据此估计这批电子元件中大约有________件次品.【答案】20【解析】根据随机抽取100件进行检测,其中有2件是次品,可以计算出这批电子元件中大约有多少件次品.【跟踪训练3】书籍是人类进步的阶梯.为了解学生的课外阅读情况,某校随机抽查了部分学生本学期阅读课外书的册数,并绘制出如下统计图.(1)共抽查了多少名学生?(2)请补全条形统计图,并写出被抽查学生本学期阅读课外书册数的众数、中位数;(3)根据抽查结果,请估计该校1200名学生中本学期课外阅读5册书的学生人数.解:(1)12÷30%=40(名).(2)如图所示,由图知,众数为5,中位数为5.(3)∵抽查的样本中,课外阅读5册书的学生人数占14×100%=35%,40∴估计该校学生课外阅读5册书的学生人数约占35%,∴该校1200名学生中课外阅读5册书的学生人数约为1200×35%=420(人).【类型三】用样本频率估计总体频率【例3】中长跑(男生1000m,女生800m)是河南省某市中招体育考试的必考项目.甲、乙两校为了解本校九年级学生的训练情况,各随机抽取了20名九年级学生的中长跑模拟测试成绩(满分:30分),将成绩进行统计、整理与分析,过程如下:【收集数据】【整理数据】整理以上数据,得到模拟测试成绩x(分)的频数分布表.【分析数据】根据以上数据,得到以下统计量.根据以上信息,回答下列问题:(1)填空:a= ________,b=_________, m=________, n=________;(2)综合上表中的统计量,推断________校学生中长跑成绩更好,理由为________(写出一条即可)(3)若甲、乙两校各有800名学生,请估计两校中长跑模拟测试成绩不低于25分的学生一共有多少名?解:(1)由数据可得,a=7,b=8,m=24.75,n=23.4. 故答案为:7;8;24.75;23.4.(2)甲校学生成绩的平均数比乙校学生成绩的平均数高,且甲校学生成绩的方差比乙校学生成绩的方差小,成绩较稳定.(答案不唯一,合理即可)故答案为:甲.=720(名),(3)(800+800)×1082020答:估计两校中长跑模拟测试成绩不低于25分的学生一共有720名.【跟踪训练】今年是建党100周年,为了让全校学生牢固树立爱国爱党的崇高信念,某校开展了形式多样的党史学习教育活动,八、九年级(各有500名学生)举行了一次党史知识竞答(满分为100分),然后随机各抽取20名同学的成绩进行了收集、统计与分析,过程如下:【收集数据】两个年级抽取的20名同学的成绩如下表:八年级:7968878985598997898998938586899077898379九年级:8688979194625194877194789255979294948598【整理数据】将两个年级的抽样成绩进行分组整理:成绩x(分)50≤x<6060≤x<7070≤x<8080≤x<9090≤x<100八年级113114九年级2a b411【分析数据】抽样的平均数、众数、中位数、方差和优秀率(90分及以上为优秀)如下表:年级统计量平均数众数中位数方差优秀率八年级8589c80.420%九年级859491.5192d请根据以下信息,回答下列问题:(1)填空:a=________,b= ________,c=________,d=________;(2)请估计此次知识竞答中,八年级成绩优秀的学生人数;(3)小李同学认为九年级的整体成绩更好,请从至少两个方面分析其合理性.解:(1)由表中数据可知,九年级落在60≤x<70内的只有62,故a=1;九年级落在70≤x<80内的有71,78,故b=2;八年级成绩按照从小到大的顺序排列后,落在第10,11的数为87,89,∴中位数为88,故c=88;九年级90分及以上的学生有11人,∴九年级的优秀率为1120×100%=55%.故答案为:1;2;88;55%.(2)∵500×20%=100,∴估计此次知识竞答中,八年级成绩优秀的学生人数为100人.(3)九年级抽样成绩的众数,中位数和优秀率均高于八年级,说明九年级平均成绩更高,高分更多,因此九年级整体成绩更好.【类型四】用样本推断总体的实际应用【例4】某运动鞋经销商随机调查某校40名女生的运动鞋号码,结果如下表:鞋的号码35.53636.53737.5人数4616122现在该经销商要进200双上述五种运动鞋,你认为应该怎样进货比较合理?解析:先求出各鞋码所占比例,再乘200,即可得到所需进货数.解:由表中数据可知各鞋码的女生的比例,根据比例进货.需要进35.5码运动鞋:200×440=20(双),需要进36码运动鞋:200×640=30(双)需要进36.5码运动鞋:200×1640=80(双),需要进37码运动鞋:200×1240=60(双)需要进37.5码运动鞋:200×240=10(双)。
§11.2 统计图表、数据的数字特征、用样本估计总体会这样考 1.考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要以选择题、填空题为主;2.考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数).1.统计数据(1)众数、中位数、平均数、极差、众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.(可以没有或者多个). 中位数:将一组数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数).平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ).(2)方差、标准差 方差()()()[]2222121x x x x x x nS n -++-+-=标准差S =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. 2.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图、频率分布直方图等.(1)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便. (2)在频率分布直方图中:①纵轴表示频率组距,②每小长方形的面积表示该组数据的频率或比例, ③各小长方形的面积之和等于1.3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.(2)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.4.利用频率分布直方图估计样本的数字特征(1)众数:最高那组的组中值.(2)平均数:每个小长方形的面积与每个组中值的乘积之和. (3)中位数:等分面积那条线的横坐标. [难点正本 疑点清源] 1.作频率分布直方图的步骤(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图. 频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状.1.一个容量为20的样本,数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),x ;[40,50),5;[50,60),4;[60,70),2;则x =________;根据样本的频率分布估计,数据落在[10,50)的概率约为________. 答案 4 0.72.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是____.答案 6003.如上图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)答案 6.84.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从上图中可以看出被处罚的汽车大约有的辆数为________. 答案 40题型一 频率分布直方图的绘制与应用例1 (1)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图; (2)据此估计本次考试中的平均分和中位数(保留整数).思维启迪:利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率分布直方图. 解 (1)设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x =0.3,所以频率分布直方图如图所示.(2)平均分为x =45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).中位数为73 探究提高 频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.(2)从某小学随机抽取l00名同学,将他们的身高(单位:厘米)数据绘制成频率分布图(如上图).若要从身高在[120,130),[130,140),[l40,150]三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[120,130)的学生中选取的人数应为 .答案:15题型二 茎叶图的应用例2 (1)甲、乙两名同学在5次数学考试中,成绩统计用茎叶图表示如图所示,若甲、乙两人的平均成绩分别用x 甲、x 乙表示,则下列结论正确的是( )A 、x x <甲乙;乙比甲成绩稳定B 、x x >甲乙;乙比甲成绩稳定C 、x x <甲乙;甲比乙成绩稳定D 、x x >甲乙;甲比乙成绩稳定答案及解析:D(2)某学校从高二甲、乙两个班中各选6名同掌参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如上图,其中甲班学生成绩的中位数数是81,乙班学生成绩的平均分为81,则成绩更稳定的班级为______.答案及解析:乙。
一、选择题1、在用样本的估计量估计总体参数时,评价估计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为(B)A、无偏性B、有效性C、一致性D、充分性2、根据一个具体的样本求出的总体均值95%的置信区间(D)A、以95%的概率包含总体均值B、有5%的可能性包含总体均值C、绝对包含总体均值D、绝对包含总体均值或绝对不包含总体均值3、估计量的无偏性是指(B)A、样本估计量的值恰好等于待估的总体参数B、所有可能样本估计值的期望值等于待估总体参数C、估计量与总体参数之间的误差最小D、样本量足够大时估计量等于总体参数4、下面的陈述中正确的是(C)A、95%的置信区间将以95%的概率包含总体参数B、当样本量不变时,置信水平越大得到的置信区间就越窄C、当置信水平不变时,样本量越大得到的置信区间就越窄D、当置信水平不变时,样本量越大得到的置信区间就越宽5、总体均值的置信区间等于样本均值加减估计误差,其中的估计误差等于所求置信水平的临界值乘以(A)A、样本均值的标准误差B、样本标准差C、样本方差D、总体标准差6、95%的置信水平是指(B)A、总体参数落在一个特定的样本所构造的区间内的概率为95%B、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为95%C、总体参数落在一个特定的样本所构造的区间内的概率为5%D、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为5%7、一个估计量的有效性是指(D)A、该估计量的期望值等于被估计的总体参数B、该估计量的一个具体数值等于被估计的总体参数C、该估计量的方差比其他估计量大D、该估计量的方差比其他估计量小8、一个估计量的一致性是指(C)A、该估计量的期望指等于被估计的总体参数B、该估计量的方差比其他估计量小C、随着样本量的增大该估计量的值越来越接近被估计的总体参数D、该估计量的方差比其他估计量大9、支出下面的说法哪一个是正确的(A)A、一个大样本给出的估计量比一个小样本给出的估计量更接近总体参数B、一个小样本给出的估计量比一个大样本给出的估计量更接近总体参数C 、一个大样本给出的总体参数的估计区间一定包含总体参数D 、一个小样本给出的总体参数的估计区间一定不包含总体参数10、用样本估计量的值直接作为总体参数的估计值,这一估计方法称为(A )A 、点估计B 、区间估计C 、无偏估计D 、有效估计11、将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比例称为(C )A 、置信区间B 、显著性水平C 、置信水平D 、临界值12、在总体均值和总体比例的区间估计中,估计误差由(C )A 、置信水平确定B 、统计量的抽样标准差确定C 、置信水平和统计量的抽样标准差确定D 、统计量的抽样方差确定13、在置信水平不变的条件下,要缩小置信区间,则(A )A 、需要增加样本量B 、需要减少样本量C 、需要保持样本量不变D 、需要改变统计量的抽样标准差14、估计一个正态总体的方差使用的分布是(C )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布15、当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是(B )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布16、当正态总体的方差未知,在大样本条件下,估计总体均值使用的分布是(A )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布17、在其他条件不变的条件下,要使估计时所需的样本量小,则应该(A )A 、提高置信水平B 、降低置信水平C 、使置信水平不变D 、使置信水平等于118、使用t 分布估计一个总体均值时,要求(D )A 、总体为正态分布且方差已知B 、总体为非正态分布C 、总体为非正态分布但方差已知D 、正态总体方差未知,且为小样本19、在大样本条件下,总体均值在(1-α)置信水平下的置信区间可以些为(C )A 、n t x σα2±B 、n s t x 2α±C 、n s z x 2α±D 、n s z x 22α±20、正态总体方差已知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(C )A 、n z x 22σα±B 、n s t x 2α±C 、n z x σα2±D 、n t x σα2±21、正态总体方差未知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(B )A 、n s z x 2α±B 、n s t x 2α±C 、n z x σα2±D 、n s z x 22α±22、指出下面的说法哪一个是正确的(A )A 、样本量越大,样本均值的抽样标准差就越小B 、样本量越大,样本均值的抽样标准差就越大C 、样本量越小,样本均值的抽样标准差就越小D 、样本均值的抽样标准差与样本量无关23、抽取一个样本量为100的随机样本,其均值为81=x ,标准差12=s 。
人教版七年级数学下册第十章数据的收集、整理与描述第一节统计调查考试用题(含答案)某学校在暑假期间开展“心怀感恩、孝敬父母”的实践活动,倡导学生在假期中帮助父母干家务,开学以后,校学生会随机抽取了部分学生,就暑假“平均每天帮助父母干家务所用时长”进行了调查,以下是根据相关数据绘制的统计图.根据上述信息,回答下列问题:(1)在本次随机抽取的样本中,调查的学生人数为______________.(2)补全频数分布直方图;(3)如果该校共有学生1000人,表你估计“平均每天帮助父母干家务所用时长不少于30分钟”的学生有多少人.【答案】(1)200;(2)补图见解析;(3)300人【解析】【分析】(1)用0~10分钟的人数除以0~10分钟的百分比即可得出答案;(2)用总人数减去其余时间的人数即可得出20~30分钟的人数;(3)先求出不少于30分钟的百分比,再乘以1000即可得出答案.【详解】解:(1)在本次随机抽取的样本中,调查的学生人数为:60÷30%=200(2)20~30分钟的人数为:200-(60+40+50+10)=40补全频数分布直方图如下(3)1000×5010200=300(人) 答:估计“平均每天帮助父母干家务所用时长不少于30分钟”的学生有300人.【点睛】本题考查的是数据统计,中考必考题型,解题关键是找出扇形图和条形图之间的转换关系.52.随着社会经济的发展,汽车逐渐走入平常百姓家.某数学兴趣小组随机抽取了我市某单位部分职工进行调查,对职工购车情况分4类(A :车价40万元以上;B :车价在20﹣40万元;C :车价在20万元以下;D :暂时未购车)进行了统计,并将统计结果绘制成以下条形统计图和扇形统计图.请结合图中信息解答下列问题:(1)调查样本人数为 ,样本中B 类人数百分比是 ,其所在扇形统计图中的圆心角度数是;(2)把条形统计图补充完整;(3)该单位甲、乙两个科室中未购车人数分别为2人和3人,现从这5个人中选2人去参观车展,用列表或画树状图的方法,求选出的2人来自不同科室的概率.【答案】(1)50,20%,72°.(2)B类人数10人,画图见解析(3)35【解析】【分析】(1)根据调查样本人数=A类的人数除以对应的百分比.样本中B类人数百分比=B类人数除以总人数,B类人数所在扇形统计图中的圆心角度数=B类人数的百分比×360°.(2)先求出样本中B类人数,再画图.(3)画树状图并求出选出的2人来自不同科室的概率.【详解】解:(1)调查样本人数为4÷8%=50(人),样本中B类人数百分比(50﹣4﹣28﹣8)÷50=20%,B类人数所在扇形统计图中的圆心角度数是20%×360°=72°故答案为:50,20%,72°.(2)如图,样本中B类人数=50﹣4﹣28﹣8=10(人)(3)画树状图为:共有20种可能的结果数,其中选出选出的2人来自不同科室占12种,所以选出的2人来自不同科室的概率=1220=35.【点睛】此题主要考查了条形统计图,扇形统计图及树状图求概率,根据题意了解统计表中的数据是解决问题的关键.53.央视热播节目“朗读者”激发了学生的阅读兴趣,某校为满足学生的阅读需求,欲购进一批学生喜欢的图书,学校组织学生会成员随机抽取部分学生进行问卷调查,被调查学生须从“文史类、社科类、小说类、生活类”中选择自己喜欢的一类,根据调查结果绘制了统计图(未完成),请根据图中信息,解答下列问题(1)此次共调查了名学生;(2)将条形统计图1补充完整;(3)图2中“社科类”所在扇形的圆心角为度;(4)若该校共有学生2000人,估计该校喜欢“社科类”书籍的学生人数.【答案】(1)200;(2)见解析;(3)43.2;(4)240人【解析】【分析】(1)文史类的人数除以文史类所占的百分比即可求出调查总人数;(2)根据总人数以及生活类的百分比即可求出生活类的人数以及小说类的人数;(3)根据小说类的百分比即可求出圆心角的度数;(4)利用样本中喜欢社科类书籍的百分比来估计总体中的百分比,从而求出喜欢社科类书籍的学生人数.【详解】(1)喜欢文史类的人数为76人,占总人数的38%÷=(名)∴此次调查的总人数为7638%200(2)喜欢生活类书籍的人数占总人数的15%⨯=(名)∴喜欢生活类书籍的人数为:20015%30---=(名)∴喜欢小说类书籍的人数为:20024763070补全条形统计图为:()3喜欢社科类书籍的人数为:24人∴喜欢社科类书籍的人数所在扇形圆心角为:24︒⨯=︒36043.2200()4喜欢社科类书籍的人数为:24人∴喜欢社科类书籍的人数占总人数的百分比为:24100%12%⨯=200⨯=人.∴估计该校喜欢“社科类”书籍的学生人数:200012%240【点睛】本题考查了统计的问题,掌握饼状图和条形图的性质、圆心角公式是解题的关键.54.某市教育局组织全市中小学教师开展“访千家”活动.活动过程中,教育局随机抽取了近两周家访的教师人数及家访次数,将采集到的全部数据按家访次数分成五类,由甲、乙两人分别绘制了下面的两幅统计图(图都不完整).请根据以上信息,解答下列问题:(1)请把这福条形统计图补充完整(画图后请标注相应的数据).(2)在采集到的数据中,近两周平均每位教师家访___________次.(3)若该市有12000名教师,求近两周家访不少于3次的教师约有多少人?【答案】(1)详见解析;(2)3.24;(3)9120【解析】【分析】(1)由3次的人数及其所占百分比可得总人数,再用总人数减去其它次数的人数求得4次的人数即可得;(2)根据加权平均数的公式计算可得;(3)用总人数乘以样本中3次、4次及5次人数和占被调查人数的比例即可得.【详解】解:(1)∵被调查的总人数为5436%150÷=人,所以4次家访的有15028%42⨯=人,如图;(2)在采集到的数据中,近两周平均每位教师家访()61302543424185150 3.24⨯+⨯+⨯+⨯+⨯÷=;(3)()544218150120009120++÷⨯= (人),∴近两周家访不少于3次的教师约有9120人.【点睛】本题主要考查了条形统计图和扇形统计图,解题时注意:条形统计图能清楚地表示出每个项目的数据,扇形统计图直接反映部分占总体的百分比大小.55.某中学围绕“哈尔滨市周边五大名山,即:香炉山、凤凰山、金龙山、帽儿山、二龙山,你最喜欢那一座山?(每名学生必选且只选一座山)的问题在全校范围内随机抽取了部分学生进行问卷调查,根据调查结果绘制了如图的不完整的统计图:(1)求本次调查的样本容量;(2)求本次调查中,最喜欢凤凰山的学生人数,并补全条形统计图;(3)若该中学共有学生1200人,请你估计该中学最喜欢香炉山的学生约有多少人?【答案】(1)本次抽样调查共抽取了80名学生;(2)本次调查中,有20名学生最想参加动漫社团.补全条形统计图见解析;(3)由样本估计总体得该中学最喜欢香炉山的学生约有360名.【解析】【分析】(1)根据帽儿山的人数除以占的百分比可得到总人数(2)求出凤凰山的人数是80-24-8-20-12=16,再画即可(3)先列出算式,再求出可,【详解】÷%=80(名)(1)2025∴本次抽样调查共抽取了80名学生.(2)80-24-8-20-12=16(名)∴本次调查中,有20名学生最想参加动漫社团.补全条形统计图(3)1200×24=360(名)80x由样本估计总体得该中学最喜欢香炉山的学生约有360名.【点睛】本题考查了条形统计图、扇形统计图,总体、个体、样本、样本容量,用样本估计总体等知识点,两图结合是解题的关键56.为了增强学生体质,某校对学生设置了体操、球类、跑步、游泳等课外体育活动,为了了解学生对这些项目的喜爱情况,在全校范围内随机抽取了若干名学生,对他们最喜爱的体育项目(每人只选一项)进行了问卷调查,将数据进行了统计并绘制成了如图所示的频数分布直方图和扇形统计图(均不完整).(1)在这次问卷调查中,一共抽查了多少名学生?(2)补全频数分布直方图,求出扇形统计图中“体操”所对应的圆心角度数;(3)估计该校1200名学生中有多少人喜爱跑步项目.【答案】(1)80;(2)45︒;(3)150.【解析】【分析】(1)用其他的人数除以所占百分比;(2)用总人数乘以游泳所占百分比;求出喜爱体操的人数,用体操所占百分比乘以360°;(3)用1200乘以喜爱跑步的百分比.【详解】÷=(名);解:(1)45%80⨯=,(2)8025%20----=,8036201041010⨯︒=︒;3604580(3)10⨯=(人)120015080【点睛】本题考查的是条形统计图和扇形统计图的综合运用,读懂统计图,从不同的统计图中得到必要的信息是解决问题的关键.条形统计图能清楚地表示出每个项目的数据;扇形统计图直接反映部分占总体的百分比大小.57.课外阅读是提高学生素养的重要途径.某中学为了了解全校学生课外阅读情况,随机抽查了200名学生,统计他们平均每天课外阅读时间(小时).根据每天课外阅读时间的长短分为A,B,C.D四类,下面是根据所抽查的人数绘制的两幅不完整的统计图表,请根据图中提供的信息,解答下面的问题:200名学生平均每天课外阅读时间统计表(1)求表格中a的值,并在图中补全条形统计图:(2)该校现有1800名学生,请你估计该校共有多少名学生课外阅读时间不少于1小时?(3)请你根据上述信息对该校提出相应的建议【答案】(1)a的值为20,见解析;(2)720;(3)课外活动应该多增加阅读量和多运动.【解析】【分析】(1)用抽查的学生的总人数减去A,B,C三类的人数即为D类的人数也就是a的值,并补全统计图;(2)先求出课外阅读时间不少于1小时的学生占的比例,再乘以1800即可.(3)结合图上信息,符合实际意义即可.【详解】(1)200﹣40﹣80﹣60=20(名),故a的值为20,补全条形统计图如下:=720(名),(2)1800×60+20200答:该校共有720名学生课外阅读时间不少于1小时;(3)合理即可.如:课外活动应该多增加阅读量和多运动.【点睛】本题主要考查样本的条形图的知识和分析问题以及解决问题的能力.58.某省对部分学校的八年级学生对待学习的态度进行了一次抽样调查(把学习态度分为三个层级,A级:对学习很感兴趣;B级:对学习较感兴趣;C级:对学习不感兴趣),并将调查结果绘制成图①和图②不完整的统计图.请根据图中提供的信息,解答下列问题:(1)此次抽样调查中,共调查了______名学生;(2)将图①补充完整;(3)求出图②中C级所占的圆心角的度数;(4)根据抽样调查结果,请你估计该省近40000名八年级学生中大约有多少名学生学习态度达标(达标包括A级和B级)?【答案】(1)200;(2)补图见解析;(3)54°;(4)该省八年级学生中约有36000名学生学习态度达标.【解析】【分析】(1)根据A级的人数是50人,所占的百分比是25%,根据百分比的意义即可求得总人数;(2)利用总人数减去其它组的人数,即可求得C级的人数,进而补全直方图;(3)C级所占的圆心角的度数用360°乘以对应的百分比即可求得;(4)利用总数40000乘以对应的比例即可求解.【详解】(1)抽查的总人数是:50÷25%=200(人);(2)C级的人数是:2001205030(人).如图(3)C所占圆心角度数360(125%60%)54︒︒=⨯--=;(4)40000(25%65%)36000⨯+=.∴该省八年级学生中约有36000名学生学习态度达标.【点睛】本题考查的是条形统计图和扇形统计图的综合运用,读懂统计图,从不同的统计图中得到必要的信息是解决问题的关键.条形统计图能清楚地表示出每个项目的数据;扇形统计图直接反映部分占总体的百分比大小.59.某班开展安全知识竞赛活动,班长将所有同学的成绩(得分为整数,满分为100分)分成四类,并制作了如下的统计图表:根据图表信息,回答下列问题:(1)该班共有学生________人;表中a=________;(2)将丁类的五名学生分别记为A、B、C、D、E,现从中随机挑选两名学生参加学校的决赛,请借助树状图、列表或其他方式求B一定能参加决赛的概率.【答案】(1)40,20;(2).【解析】试题分析:(1)10÷25%=40,所以全班的学生数为40人,a=50%×40=20(人);故答案为40,20;(2)画树状图为:共有20种等可能的结果数,其中B一定能参加决赛的结果数为8,所以B 一定能参加决赛的概率==.考点:①列表法与树状图法;②频数(率)分布表.60.受非洲猪瘟疫情影响,2019年我国猪肉价格有较大幅度的上升.为了解某地区养殖户的受灾情况,现从该地区建档的养殖户中随机抽取了部分养殖户进行调查(把调查结果分为四个等级:A级-非常严重,B级-严重,C级-一般,D级-没有感染),并将调查结果绘制成如下两幅不完整的统计图.请根据统计图中的信息解答下列问题:(1)填空:本次抽样调查的养殖户的总户数是______;在扇形统计图中A级所对应的圆心角为______度;(2)请补全条形统计图;(3)若该地区建档的养殖户有1500户,估计非常严重与严重的养殖户一共有多少户?【答案】(1)50户;50.4°.(2)见解析.(3)510户.【解析】 【分析】(1)从两个统计图可得,“C 级”的有20户,占调查总数的40%,可求出调查总数;求出A 级户数占总数的百分比,即可求得圆心角度数.(2)根据调查总数求出“B 级”户数,即可补全条形统计图.(3)首先求得随机抽取的部分养殖户中非常严重与严重的养殖户的数量,即可求得全部养殖户中的数量.【详解】解:(1)总户数:20÷40%=50(户)A 级所对应的圆心角:736050.450⨯︒=︒ (2)50-7-20-13=10(户)(3)710150050+⨯=510(户) 故答案为:(1)50户;50.4° (2)如上图. (3)510户. 【点睛】本题考查了扇形统计图、条形统计图的意义和制作方法,从统计图中获取数量及数量之间的关系是解决问题的关键,从样本估计总体是统计中常用的方法。
用样本估计总体(填空题:较易)1、在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1,那么这组数据的方差可能的最大值是__________.2、从某高校的高一学生中采用系统抽样法选出30人测量其身高,数据的茎叶图如图所示(单位:cm),若高一年级共有600人,估算身高在1.70m以上的有_______人.3、如图是甲,乙两名同学次综合测评成绩的茎叶图,则乙的成绩的中位数是,甲乙两人中成绩较为稳定的是 .4、为了普及环保知识,增强环保意识,某高中随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为,众数为,平均值为,则这三个数的大小关系为_______________.5、甲,乙两人在相同条件下练习射击,每人打发子弹,命中环数如下则两人射击成绩的稳定程度是6、下图是甲、乙两市领导干部年龄的茎叶图,对于这两市领导干部的平均年龄给出的以下说法正确的是________.①甲市领导干部的年龄的分布主要集中在40~60之间;②乙市领导干部的年龄分布大致对称;③甲市领导干部的平均年龄比乙市领导干部的平均年龄大;④平均年龄都是50.7、从某高校的高一学生中采用系统抽样法选出30人测量其身高,数据的茎叶图如图所示(单位:cm),若高一年级共有600人,估算身高在1.70m以上的有_______人.8、某市为了了解居民家庭网购消费情况,调查了10000户家庭的月消费金额(单位:元),所有数据均有区间上,其频率分布直方图如图所示,则被调查的10000户家庭中,月消费金额在1000元以下的有__________户.9、一所中学共有4 000名学生,为了引导学生树立正确的消费观,需抽样调查学生每天使用零花钱的数量(取整数元)情况,分层抽取容量为300的样本,作出频率分布直方图如图所示,请估计在全校所有学生中,一天使用零花钱在6元~14元的学生大约有________人.10、某人连续五周内收到的包裹数分别为3,2,5,1,4,则这5个数据的标准差为________.11、下列四个命题①样本方差反映的是所有样本数据与样本平均值的偏离程度;②从含有2008个个体的总体中抽取一个容量为100的样本,现采用系统抽样方法应先剔除8人,则每个个体被抽到的概率均为;③从总体中抽取的样本数据共有m个a,n个b,p个c,则总体的平均数的估计值为;④某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查,现将800名学生从001到800进行编号,已知从497--512这16个数中取得的学生编号是503,则初始在第1小组00l~016中随机抽到的学生编号是007.其中真命题的个数是_____个12、某校在市统测后,从高三年级的1000名学生中随机抽出100名学生的数学成绩作为样本进行分析,得到样本频率分布直方图,如图所示,则估计该校高三学生中数学成绩在之间的人数为__________.13、某植树小组测量了一批新采购的树苗的高度,所得数据如茎叶图所示(单位:),则这批树苗高度的中位数为__________.14、某人5次上班途中所花的时间(单位:分钟)分别为.已知这组数据的平均数为10,方差为2,则的值为___.15、若1,2,3,4,这五个数的平均数为3,则这五个数的方差为__________.16、某学院的三个专业共有1200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的专业有380名学生,专业有420名学生,则在该学院的专业应抽取____________名学生.17、在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示,则该35名运动员成绩的中位数为__________.18、为了解学生答卷情况,某市教育部门在高三某次测试后抽取了名同学的试卷进行调查,并根据所得数据画出了样本的频率分布直方图(如图),该样本的中位数是__________.19、已知一组数据,,,,,则该组数据的方差是____.20、气象意义上从春季进入夏季的标志为:“连续5天的日平均温度均不低于22℃.”现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:℃):①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.2.则肯定进入夏季的地区有____个.21、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为,其中甲社区有驾驶员人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为,,,,则这四个社区驾驶员的总人数为.22、已知一组数据的方差是S,那么另一组数据的方差是。
用样本的数字特征估计总体的数字特征【知识点的知识】1.样本的数字特征:众数、中位数、平均数众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;(3)平均数:一组数据的算术平均数,即.2、三种数字特征的优缺点::(1)样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.(2)中位数不受少数几个极端值的影响,容易计算,它仅利用了数据排在中间的数据的信息.(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.(4)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.(5)使用者根据自己的利益去选择使用中位数或平均数来描述数据的中心,从而产生一些误导作用.3、如何从频率分布直方图中估计众数、中位数、平均数?利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.4、样本平均数、标准差对总体平均数、标准差的估计现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道(或不可求)的.如何求得总体的平均数与标准差呢?通常的做法是用样本的平均数与标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.如要考查一批灯泡的质量,我们可从中随机抽取一部分作为样本,要分析一批钢筋的强度,可以随机抽取一定数目的钢筋作为样本,只要样本的代表性强就可以用来对总体作出客观的判断.但需要注意的是,同一个总体,抽取的样本可以是不同的.如一个总体包含6个个体,现在要从中抽取3个作为样本,所有可能的样本会有20种不同的结果,若总体与样本容量较大,可能性就更多,而只要其中的个体是不完全相同的,这些相应的样本频率分布与平均数、标准差都会有差异.这就会影响到我们对总体情况的估计.。
用样本估计总体(提高)学习目标1. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.2. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.3. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.4. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.5. 会用样本的基本数字特征估计总体的基本数字特征.要点梳理要点一、频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值与最小值的差,即求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图要点诠释:频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.要点二、频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.要点诠释:总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律.<要点三、茎叶图当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.要点诠释:茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.要点四、众数、中位数与平均数1.众数一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出一项决定,考察全班同学对它赞成与否就可以用众数.2.中位数将一组数据从小到大依次排列,把中间数据(或中间两数据的平均数)叫做中位数.中位数把样本数据分成了相同数目的两部分.3.平均数样本数据的算术平均数,即.要点诠释:由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.要点五、标准差与方差1.标准差样本数据的标准差的算法:(1)算出样本数据的平均数.(2)算出每个样本数据与样本数据平均数的差:(3)算出(2)中的平方.(4)算出(3)中n个平方数的平均数,即为样本方差.(5)算出(4)中平均数的算术平方根,,即为样本标准差.其计算公式为:2.方差从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样本数据分散程度的工具:要点诠释:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.数据的离散值程度可以用极差、方差或标准差来描述.极差反映了一组数据变化的幅度;样本方差描述了一组数据围绕平均数波动的大小;样本方差的算术根表示样本的标准差,它也描述了数据对平均数的离散程度.典型例题类型一:频率分布表、频率分布直方图1.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如下图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?【答案】(1)60 (2)四组18(3)六组【解析】(1)依题意知第三组的频率为.∵第三组的频数为12,∴本次活动的参评作品数为件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有(件).(3)第四组的获奖率是,第六组上交的作品数量为(件),∴第六组的获奖率为.显然第六组的获奖率较高.【总结升华】弄清所求问题是什么,并正确地运算是做对题的关键.本题主要考查同学们对频率分布直方图的理解,只有熟悉它的特征,才能清楚数据分布的总体趋势,根据直方图反映的信息正确解题.【变式1】某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如下图所示).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.【答案】6002.阅高考试卷有一个环节叫“试批”.某省为了了解和掌握考生的实际答卷情况,随机地抽取了100名考生的数学成绩,数据如下(单位:分):135******** 99121110 96100103125 97117113110 92102 109 104 112105124 87 13197102123104 104128(5)根据折线图估计该省考生的数学成绩在哪一个分数段的人数将会最多.【思路点拨】理解频率分布直方图的具体含义.【解析】100个数据中,最大值为135,最小值为80,极差为135-80=55.把100个数据分成11组,这时组距.(1)频率分布表如下:注:表中加上“”一列,这是为画频率直方图准备的,因为它是频率直方图的纵坐标.(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,见下图.(3)从频率分布表中可知,这100名考生的数学成绩在100~120分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在100~120分之间的比例为60%(0.60=60%).(4)100名考生中,数学成绩不及格的频率为0.01+0.02=0.03.比例为3%.200000×3%=6 000(人).估计该省考生数学成绩不及格的有6000人.(5)折线图的最高点位于100~105之间据此估计该省考生的数学成绩在100~105分这个分数段的人数将会最多【总结升华】本例中,决定分点时,直接使用了最小值加组距,即80+5k(k=1,2,…,11),而没有把最小值减去某一个数(例如80-0.5=79.5)作为第1个分点,这是因为100个分数是明确的,即它们都在80~135之间.凡事都要具体问题具体分析,不可教条化.本例是把5分看成一个分数段,统计各段的情况.【变式1】一个容量为20的样本,分组后,组距与频数如下[10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本在(-∞,50]上的频率为()A.B.C.D.【答案】D【解析】根据频率的计算公式频率求解.频率.(2)频率分布直方图如下图所示;(3)估计该电子元件寿命在100~400 h以内占总体的比例为65%;(4)估计该电子元件寿命在400 h以上的在总体中占的比例为35%.(1)求该公司人员月工资的平均数、中位数、众数;(精确到元)(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司人员的工资水平?结合此问题谈一谈你的看法.【思路点拨】理解平均数、中位数、众数的概念.【答案】(1)209115001500 (2)3288 (3)中位数和众数【解析】(1)平均数是(元),中位数是1500元,众数是1500元.(2)平均数是(元)中位数是1500元,众数是1500元.(3)在这个问题中,中位数和众数均能反映该公司人员的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司人员的工资水平.【总结升华】(1)深刻理解和把握平均数、中位数、众数在反映样本数据上的特点,结合实际情况,灵活运用.(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各数据的重心.【变式1】为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.【答案】(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:又因为频率=所以(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.类型三:方差、标准差已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.【解析】(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)[2(50-80)2+5(60-80)2+10(70-80)2+13(80-80)2+14(90-80)2+6(100-80)2]=(2×900+5×400+10×100+13×0+14×100+6×400)=172,(4×900+4×400+16-100+2×0+12×100+12×400)=256.∴,∴甲组成绩较乙组成绩稳定,故甲组成绩好些.(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上的有33人,乙组成绩在80分以上的有26人,从这一角度看,甲组的成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的人数为14+6=20(人),乙组成绩大于或等于90分的人数为12+12=24(人),∴乙组成绩集中在高分段的人数较多,同时,乙组得满分的人数比甲组得满分的人数多6人,从这一角度看,乙组的成绩较好【总结升华】要正确解答这道题,首先要抓住问题中的关键词语.全方位地进行必要的计算,而不能习惯地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.变式1】甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸分别如下(单位:mm)甲机床:10.210.110.09.89.910.39.710.09.910.1乙机床:10.310.49.69.910.110.98.99.710.210.0分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10 mm,从计算的结果来看哪台机床加工这种零件较合适?【解析】,.∴=0.03=0.06.∴<∴用甲机床比乙机床稳定,即用甲机床加工较合适.类型四:茎叶图5.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107;乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【思路点拨】茎叶图便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据.【答案】乙同学的成绩比较稳定【解析】甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.【变式1】在某高中篮球联赛中,甲、乙两名运动员的得分如下:甲:14,17,25,26,30,31,35,37,38,39,44,48,51,53,54;乙:6,15,17,18,21,27,28,33,35,38,40,44,56.(1)用茎叶图表示上面的样本数据,并求出样本数据的中位数;(2)根据(1)中所求的数据分析甲、乙两名运动员中哪一位发挥得更加稳定.【解析】(1)茎叶图如图所示.甲运动员的中位数是37,乙运动员的中位数是28.(2)从茎叶图上可以看出甲运动员的得分大致对称,中位数是37,乙运动员的得分也大致对称,中位数是28,因此,甲运动员发挥得比较稳定,总体得分比乙运动员高.【变式2】随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.【答案】(1)乙班(2)57【解析】(1)由茎叶图可知:甲班身高集中于之间,而乙班身高集中于之间.因此乙班平均身高高于甲班;(2)甲班的样本方差为:巩固练习1.下列关于“样本数据的频率分布表、频率分布直方图”的叙述中正确的是()A. 从频率分布表可以看出样本数据的平均数B. 频数是指落在各个小组内的数据C. 每小组的频数与样本容量之比是这个小组的频率D. 组数是样本平均数除以组距2.一个容量为80的样本中,数据的最大值时140,最小值是50,组距是10,则应将样本数据分为()A.10组 B.9组 C. 8组 D.7组3.有一个容量为200的样本,其频率分布直方图如右图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为().A.18 B.36 C.54 D.724.某同学使用计算器求个数据的平均数时,错将其中一个数据输入为,那么由此求出的平均数与实际平均数的差是( )A. B.C. D.5.两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2.那么样本甲和样本乙的波动大小情况是()A.甲、乙波动大小一样B.甲的波动比乙的波动大C.乙的波动比甲的波动大D.甲、乙的波动大小无法比较6.对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是()A.频率分布直方图与总体密度曲线无关B.频率分布直方图就是总体密度曲线C.样本容量很大的频率分布直方图就是总体密度曲线D.如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近总体密度曲线7.下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上同一个常数后,方差不变;④在频率分布直方图中,每个小矩形的面积等于相应小组的频率.其中错误的个数是()A.0 B.1 C. 2 D.38.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为和,样本标准差分别为和,则()A.,B.,C.,D.,9.数据的方差为,平均数为,则(1)数据的标准差为_________,平均数为_________.(2)数据的标准差为_________,平均数为_________.10.“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误;则数字x应该是________.11.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知______.若要从身高在,,三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高内的学生中选取的人数应为______.12.甲、乙两名高一年级男生,在参加投篮比赛时,各做了5组投篮,每组10次,投中次数如下:甲:7,6,8,6,8 乙:6,7,8,7,7则=______;______;=______;______.他们中______的成绩更稳定.13.下图是总体的一样本频率分布直方图,且在[15,18)内的频数为8.(1)求样本容量;(2)若在[12,15)内小矩形面积为0.06,求在[12,15)内的频数;(3)求样本在[18,33)内的频率.14.某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,抽查记录如下(单位:千克):甲:102 101 99 98 103 98 99乙:110 115 90 85 75 115 110(1)这种抽样方法是哪一种?(2)估计甲、乙两车间的平均值与方差,并说明哪个车间产品较稳定.15.某高级中学有高三毕业生2000人,今年高考前学校组织了若干次模拟考试,其中最后一次考试中,从中抽取的100名学生的总成绩如下(单位:分):494 498 493 505 496 492 487 483 508 511495 494 483 485 511 493 505 485 501 503493 509 509 512 484 509 510 495 497 498504 498 483 510 503 497 502 511 497 500493 509 510 493 491 497 515 503 515 518510 514 509 499 493 499 509 492 505 489494 501 509 498 502 500 508 491 509 509499 495 493 509 496 509 505 499 486 491492 496 499 508 485 498 496 495 496 505499 505 493 501 510 496 487 511 501 496(1)列出样本的频率分布表;(2)画出频率分布直方图及频率分布折线图;(3)预测该校所在的省份今年的最低投档线为490.5分以此预测该校今年将有多少名学生可能升入高等院校?(4)高考中,该校某学生的总成绩在680分及以上的可能性存在吗?【答案与解析】1.【答案】C【解析】A数据的频率分布表一般不能反映原有数据的全部信息.B频数是指落在各个小组内的数据的个数.D组数是极差除以组距.2.【答案】B【解析】组数=3.【答案】B【解析】易得样本数据在区间[10,12]内的频率为0.18则样本数据在区间[10,12]内的频数为36,故选B.4.【答案】B【解析】少输入平均数少,求出的平均数减去实际的平均数等于.5.【答案】C【解析】如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小.频率分布直方图与总体密度曲线是有关系的,故选项A不正确,频率分布直方图不是总体密度曲线,故选项B不正确,样本容量很大的频率分布直方图就越接近与总体密度曲线,故选项C不正确.设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线y=f(x)来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.选项D正确.7.【答案】C【解析】由众数及方差的定义知,C正确.8.【答案】B9.【答案】(1),(2),【解析】(1)(2)10.【答案】1【解析】假设x<4,则.11.【答案】0.030,312.【答案】7,0.8,7,0.4乙(1)由题图可知[15,18)对应的y轴数字为,且组距为3,∴[15,18)对应频率为:.又已知[15,18)内频数为8,∴样本容量.(2)[12,15)内小矩形面积为0.06,即[12,15)内频率为0.06,且样本容量为50,∴[12,15)内频数为:50×0.06=3.(3)由(1)(2)知[12,15)内频数为3,[15,18)内频数为8,样本容量为50,∴[18,33)内频数为:50-3-8=39,∴[18,33)内频率为:.14.【解析】(1)运用的是系统抽样法.(2)分别计算甲、乙两个车间的平均数和方差.即甲、乙两车间产品的平均值都是100.下面在考虑它们的方差:即,表明甲车间的产品比较稳定.15.【解析】(1)极差为518-483=35.人为取组距为4,这时,,取组数为9.使分点比数据多一位小数,并把第1个分点确定为最小值减去0.5.即483-0.5=482.5.列出频率分布表为(2)频率分布直方图及频率分布折线图如下图所示.(3)从频率分布表中可知,总分在490.5以下的累计频率为0.11,这样总分在490.5及以上的频率就是1-0.11=0.89,比例为89%,以此估计或者说预测,该校今年可能升入高等院校的学生数为2000×89%=1780(人).(4)统计是相对的,不是绝对的.高考中,该校某学生的总成绩在680分及以上的可能性仍然是存在的.。