9.3 统计案例 公司员工的肥胖情况调查分析
- 格式:doc
- 大小:522.50 KB
- 文档页数:9
19.3 统计案例 公司员工的肥胖情况调查分析课标要求素养要求进一步学习数据收集和整理的方法、数据直观图表的表示方法、数据统计特征的刻画方法,通过具体实例,感悟在实际生活中进行科学决策的必要性和可能性,体会统计思维与确定性思维的差异,积累数据分析的经验.通过生活中具体的统计案例模型,进行提出问题、分析数据、建立模型、检验模型来发展数据分析、数学抽象及数学建模素养.教材知识探究大数据配合乔布斯癌症治疗苹果手机创始人乔布斯是世界上第一个对自身所有DNA 和肿瘤DNA 进行排序的人.为此,他支付了高达几十万美元的费用.他得到的不是样本,而是包括整个基因的数据文档.医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命.这是一个著名的数据分析案例.问题你知道什么是统计数据分析吗?提示数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程.这一过程也是质量管理体系的支持过程.在实用中,数据分析可帮助人们作出判断,以便采取适当行动.统计分析报告的主要组成部分1.标题2.前言:简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.3.主体:展示数据分析的全过程:(1)首先明确所关心的问题是什么,说明数据蕴含的信息;(2)根据数据分析的需要,说明如何选择合适的图表描述和表达数据;(3)从样本数据中提取能刻画其特征的量,用于分析比较;2(4)通过样本估计总体的统计规律,分析总体的情况.4.结尾:对主体部分的内容进行概括,给出解决问题的方法和对策.教材拓展补遗[微判断]1.用于样本数据分析的统计图表主要有条形图、扇形图、折线图、频率分布直方图等.(√)2.反映样本数据的集中趋势的特征量有平均数、中位数、众数等.(√)3.反映样本数据的离散程度的特征量有方差和标准差.(√)[微思考]进行数据分析的过程是什么?提示(1)明确主题,说明数据信息;(2)选择图表描述和表达数据;(3)计算样本数据的特征量;(4)估计统计规律.题型一数据分析过程的探究【例1】[明确问题] 为了实施“精准扶贫”战略,农科院试种了甲、乙两个34西红柿新品种,从这两个品种中各任选5株,测量其产量(单位:kg),得到如下数据:甲 60 80 70 90 70乙 80 60 70 80 75[描述数据] 使用折线图描述数据如下:从折线图上可以看出甲品种的平均产量稍高,但其产量不稳定;乙品种的产量稍低,但其产量较稳定.[计算特征量] 甲品种的平均产量为x -甲=74(kg),乙品种的平均产量为x -乙=73(kg),所以甲品种的平均产量稍高;甲品种的方差是s 2甲=15(142+62+42+162+42)=104,乙品种的方差是s2乙=15(72+132+32+72+22)=56,由于s2甲>s2乙,所以乙品种的产量较稳定.[解决问题] 从以上分析可以看出甲品种的平均产量稍高,比乙品种单株平均高1 kg,相差不大,但其产量远不如乙品种稳定.因为是推荐给需要扶助的贫困地区的农民种植,其抗风险能力较弱,所以推荐乙品种.【例2】[明确问题] 为了备战下届奥运会,甲、乙两名运动员在相同条件下各射击10次,得到如下数据:甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.乙射击10次中靶环数分别为:2,4,6,8,7,7,8,9,9,10.射击队教练希望利用此次射击成绩为依据,挑选一名运动员参加奥运会,请你帮助教练分析两个运动员的成绩,并作出判断.[描述数据] 用折线图描述数据如下图所示:5由折线图可以看出甲运动员的成绩较稳定.[计算特征量] 甲射击10次中靶环数由小到大排列为5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数由小到大排列为2,4,6,7,7,8,8,9,9,10.运动员甲的平均成绩x-甲=110×(5+6×2+7×4+8×2+9)=7(环),运动员乙的平均成绩x-乙=110×(2+4+6+7×2+8×2+9×2+10)=7(环),运动员甲的方差s2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,运动员乙的方差s2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+9)=5.4.比较如下:6。
统计案例公司员工的肥胖情况调查分析【教学过程】一、预习导学近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(Body Mass Index,缩写BMT)来衡量人体胖瘦程度以及是否健康,其计算公式是______________________________________________________________________ 中国成人的BMI数值标准为:BMI<18.5为______;18.5≤BMI<23.9为______;24≤BMI<27.9为______;BMI≥28为______。
二、数据调查为了解某公司员工的身体肥胖情况,研究人员从公司员工体检数据中,采用比例分配的分层随机抽样方法抽取了90名男员工、50名女员工的身高和体重数据,计算得到他们的BMI值如下:三、合作探究根据上面的数据,写一份该公司员工肥胖情况的统计分析报告.要求:1.选择合适的图表展示数据;2.比较男、女员工在肥胖状况上的差异;3.分析公司员工胖瘦程度的整体情况;4.提出控制体重的建议.公司员工的肥胖情况调查分析[前言]______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ [主体]______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ [结尾]______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________。
第九章 统计9.3 统计案例 公司员工的肥胖情况调查分析(基础练)一、单选题(共5小题,满分25分,每小题5分)1.甲、乙两名射击运动员分别进行了5次射击训练,成绩(单位:环)如下: 甲:7,8,8,8,9 乙:6,6,7,7,10;若甲、乙两名运动员的平均成绩分别用21,x x 表示,方差分别为 2221,s s 表示,则( )A.21x x >, 2221s s > B.21x x >, 2221s s < C.21x x <, 2221s s < D.21x x <, 2221s s >【答案】 B【解析】85988871=++++=x , 2.751077661=++++=x ,故 21x x > .s 21;s22, 故s s 2221< , 故选:B.2.已知数据x 1,x 2,x 3,…,x n 是上海普通职工n(n ≥3,n ∈N *)个人的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入x n +1,则在这n +1个数据中,下列说法不正确的是( ) A .年收入平均数大大增大 B .中位数可能不变 C .方差变大 D .方差可能不变【答案】D【解析】插入大的极端值,平均数增加,中位数可能不变,方差也因为加入此数据更加分散而变大.故选:D3.一组数据的方差为2s ,平均数为x ,将这组数据中的每一个数都乘以2,所得的一组新数据的方差和平均数分别为( ) A .212s ,12x B .22s ,2x C .24s ,2x D .2s ,x【答案】C【解析】设该组数据为123,,,,n x x x x ,将这组数据中的每一个数都乘以2,则有1232,22,,2,n x x x x ⋯,平均数为2x .又()()()2222121n s x x x x x x n ⎡⎤=⨯-+-++-⎢⎥⎣⎦,则新数据的方差为()()()22221212222224n x x x x x x s n ⎡⎤⨯-+-++-=⎣⎦, 故选:C.4.如图是某公司2020年1月到10月的销售额(单位:万元)的折线图,销售额在35万元以下为亏损,超过35万元为盈利,则下列说法错误的是( )A .这10个月中销售额最低的是1月份B .从1月到6月销售额逐渐增加C .这10个月中有3个月是亏损的D .这10个月销售额的中位数是43万元 【答案】B【解析】根据折线图知,这10个月中销售额最低的是1月份,为30万元,所以A 正确; 从1月到6月销售额是先增加后减少,再增加,所以B 错误;1月,3月和4月的销售额低于35万元,其它月份都高于35万元,所以C 正确; 这10个月的销售额从小到大排列为30,32,34,40,41,45,48,60,78,80万元, 其中位数是()14145432⨯+=万元,所以D 正确. 故选:B 5.某校从参加高一年级期末考试的学生中抽取60名学生的成绩(均为整数),其成绩的频率分布直方图如图所示,由此估计此次考试成绩的中位数,众数和平均数分别是( )A.73.3,75,72 B.73.3,80,73C.70,70,76 D.70,75,75【答案】A【解析】由频率分布直方图知,小于70的有24人,大于80的有18人,则在[70,80]之间18人,所以中位数为70103+≈73.3;众数就是分布图里最高的小矩形底边的中点,即[70,80]的中点横坐标,是75;平均数为45×0.05+55×0.15+65×0.20+75×0.30+85×0.25+95×0.05=72.故选: A.二、多选题(共3小题,满分15分,每小题5分,少选得3分,多选不得分)6.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是()A.甲的化学成绩领先年级平均分最多.B.甲有2个科目的成绩低于年级平均分.C.甲的成绩最好的前两个科目是化学和地理.D .对甲而言,物理、化学、地理是比较理想的一种选科结果. 【答案】A【解析】根据雷达图,可知物理成绩领先年级平均分最多,即A 错误; 甲的政治、历史两个科目的成绩低于年级平均分,即B 正确; 甲的成绩最好的前两个科目是化学和地理,即C 正确;对甲而言,物理成绩比年级平均分高,历史成绩比年级平均分低,而化学、生物、地理、政治中优势最明显的两科为化学和地理,故物理、化学、地理的成绩是比较理想的一种选科结果,即D 正确. 故选:A.7.某地区城乡居民储蓄存款年底余额(单位:亿元)变化情况如图所示,下列判断一定正确的是( )A .该地区城乡居民储蓄存款年底余额总数逐年上升B .到2019年农村居民存款年底总余额已超过了城镇居民存款年底总余额C .城镇居民存款年底余额逐年下降D .2017年城乡居民存款年底余额增长率大约为225% 【答案】AD【解析】由条形图可知,余额总数逐年上升,故A 项正确;由城乡储蓄构成百分比可知,2019年农村居民存款年底总余额占36.1%,城镇居民存款年底总余额占63.9%,没有超过,故B 项错误;城镇居民存款年底余额所占的比重逐年下降,但城镇居民存款年底余额2014年,2017年,2019年分别为6.8198(亿元),155.085(亿元),973.197(亿元),总体不是逐年下降的,故C 项错误,2017年城乡居民存款年底余额增长率大约为21165225%65-≈,故D 项正确.故选:AD. 8.如图是某公司2018年1月至12月空调销售任务及完成情况的统计图,如10月份销售任务是400台,完成率为90%,下列叙述正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年总销售量为4870台D .2018年月销售量最大的是6月份 【答案】ABC【解析】由题图可知选项A 正确; 2018年月销售任务的平均值为10020033003400500700800100045060012++⨯+⨯++++=<,故选项B 正确;2018年总销售量为1000.82001300(0.5 1.50.6)400(1.20.90.9)500 1.17000.8⨯+⨯+⨯+++⨯+++⨯+⨯800110000.74870+⨯+⨯=,故选项C 正确;2018年月销售量最大的是5月份,为800台,故选项D 不正确. 故选:ABC 三、填空题(共3小题,满分15分,每小题5分,一题两空,第一空2分)9.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为_________ 【答案】0.7【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7. 故答案为:0.710.为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的认为作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互相不相同,则样本数据中的最大值为 . 【答案】10【解析】设样本数据为:12345,,,,x x x x x ()1234557x x x x x ∴++++÷=()()222157754s x x ⎡⎤=-++-÷=⎣⎦()()22151********,35x x x x x x x ∴-++-=++++=若样本数据中的最大值为11,不妨设511x =,由于样本数据互不相同,与()()22157720x x -++-=这是不可能成立的,若样本数据为4,6,7,8,10,代入验证知两式均成立,此时样本数据中的最大值为 10, 故答案为:1011.为实现国民经济新“三步走”的发展战略目标,国家加大了扶贫攻坚的力度.某地区在2015 年以前的年均脱贫率(脱离贫困的户数占当年贫困户总数的比)为.2015年开始,全面实施“精准扶贫”政策后,扶贫效果明显提高,其中2019年度实施的扶贫项目,各项目参加户数占比(参加该项目户数占 2019 年贫困户总数的比)及该项目的脱贫率见下表:实施项目 种植业 养殖业 工厂就业 服务业 参加用户比脱贫率那么2019年的年脱贫率是实施“精准扶贫”政策前的年均脱贫率的______倍 【答案】 【解析】设贫困户总数为a,脱贫率,所以 .故 2019年的年脱贫率是实施“精准扶贫”政策前的年均脱贫率的 倍. 故答案为:四、解答题:(本题共3小题,共45分。
《9.3 统计案例公司员工的肥胖情况调查分析》教案【教材分析】本节通过公司员工的肥胖情况调查分析,让学生了解统计案例的一些信息,让学生了解统计学与现实生活是息息相关的.【教学目标与核心素养】课程目标1.了解统计报告的组成部分.2.可对统计案例进行初步分析.数学学科素养1.数学抽象:统计报告的组成部分;2.数学运算:对统计案例进行初步分析.【教学重点和难点】重点:①了解统计报告的组成部分;②对统计案例进行初步分析.难点:对统计案例进行初步分析.【教学过程】一、情景导入近年来,我国肥胖人数的规模急速增长,肥胖人群有很大的心血管安全隐患,为了了解某公司员工的身体肥胖情况,我们该如何根据数据表写一份该公司员工肥胖情况的统计分析报告?该如何分析公司员工的整体情况并提出控制体重的建议?要求:让学生自由发言,教师不做判断。
而是引导学生进一步观察.研探.二、预习课本,引入新课阅读课本218-219页,思考并完成以下问题1.统计报告的组成部分是什么要求:学生独立完成,以小组为单位,组内可商量,最终选出代表回答问题。
三、新知探究1.统计报告的主要组成部分(1)标题.(2)前言.简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.(3)主题展示数据分析的全过程;首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图标描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体.(4)结尾对主题部分的内容进行概括,结合控制体重的一般方法,提出控制公司员工体重的建议.四、典例分析、举一反三题型一由统计信息解决实际问题例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据统计学估计哪一种水稻品种的产量比较稳定.【答案】甲种水稻的产量比较稳定【解析】甲品种的样本平均数为10,样本方差为[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.24.因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例2为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200 ,A B A B只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.(1)求乙离子残留百分比直方图中的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1) ,;(2) ,.【解析】 (1)由题得,解得,由,解得.(2)由甲离子的直方图可得,甲离子残留百分比的平均值为,乙离子残留百分比的平均值为解题技巧(用样本的标准差、方差估计总体的方法)(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.(2)标准差、方差的取值范围是[0,+∞).(3)因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.C 5.5()P C 0.70,a b 0.35a =0.10b = 4.0560.200.150.70a ++=0.35a =0.050.151()10.70b P C ++=-=-0.10b =0.1520.2030.3040.2050.1060.057 4.05⨯+⨯+⨯+⨯+⨯+⨯=0.0530.1040.1550.3560.2070.1586⨯+⨯+⨯+⨯+⨯+⨯=跟踪训练一1.样本数为9的四组数据,它们的平均数都是5,条形图如图所示,则标准差最大的一组是( )A.第一组B.第二组C.第三组D.第四组【答案】D.【解析】选D.法一:第一组中,样本数据都为5,标准差为0;第二组中,样本数据为4,4,4,5,5,5,6,6,6,标准差为63;第三组中,样本数据为3,3,4,4,5,6,6,7,7,标准差为253;第四组中,样本数据为2,2,2,2,5,8,8,8,8,标准差为22,故标准差最大的一组是第四组.法二:从四个图形可以直观看出第一组数据没有波动性,第二、三组数据的波动性都比较小,而第四组数据的波动性相对较大,利用标准差的意义可以直观得到答案.2.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01.【答案】(1) 增长率超过的企业比例为,产值负增长的企业比例为;(2)平均数;标准差.【解析】 (1)由题意可知,随机调查的个企业中增长率超过40%的企业有个,产值负增长的企业有个,所以增长率超过40%的企业比例为21100,产值负增长的企业比例为2100=150. (2)由题意可知,平均值y ̅=2×(−0.1)+24×0.1+53×0.3+14×0.5+7×0.7100=0.3,标准差的平方:s 2=1100[2×(−0.1−0.3)2+24×(0.1−0.3)2+53×(0.3−0.3)2+14×(0.5−0.3)2+7×(0.7−0.3)2]=1100[0.32+0.96+0.56+1.12]=0.0296,所以标准差s =√0.0296=√0.0004×74≈0.02×8.602≈0.17. 五、课堂小结让学生总结本节课所学主要知识及解题技巧 六、板书设计七、作业课本222页,复习参考题9. 【教学反思】8.602 00402110021100500.30.17100147212统计的学习,本质上是统计活动的学习,而不是概念和公式的学习.因此在本节教学中所采用的数据和问题情境尽可能来源于实际,充分挖掘学生生活中与数据有关的素材,使他们体会所学内容与现实世界的密切联系.《9.3 统计案例公司员工的肥胖情况调查分析》导学案【学习目标】知识目标1.了解统计报告的组成部分.2.可对统计案例进行初步分析.核心素养1.数学抽象:统计报告的组成部分;2.数学运算:对统计案例进行初步分析.【学习重点】:①了解统计报告的组成部分;②对统计案例进行初步分析.【学习难点】:对统计案例进行初步分析.【学习过程】一、预习导入阅读课本218-219页,填写。
【新教材】9.3 统计案例公司员工的肥胖情况调查分析(人教A版)1.了解统计报告的组成部分.2.可对统计案例进行初步分析.1.数学抽象:统计报告的组成部分;2.数学运算:对统计案例进行初步分析.重点:①了解统计报告的组成部分;②对统计案例进行初步分析.难点:对统计案例进行初步分析.一、预习导入阅读课本218-219页,填写。
1.统计报告的主要组成部分(1)标题.(2)前言.简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.(3)主题展示数据分析的全过程;首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图标描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体.(4)结尾对主题部分的内容进行概括,结合控制体重的一般方法,提出控制公司员工体重的建议.1.一组数据的方差一定是( )A .正数B .复数C .任意实数D .非负数2.对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:这组数据的众数是3;这组数据的众数与中位数的数值不相等;这组数据的中位数与平均数的数值相等;这组数据的平均数与众数的数值相等.其中正确的结论的个数为( )A .1B .2C .3D .43.已知样本数据x 1,x 2,…,x 10,其中x 1,x 2,x 3的平均数为a,x 4,x 5,x 6,…,x 10的平均数为b,则样本数据的平均数为 ( ) A .2a b+ B .3710a b+ C .7310a b+ D .10a b+ 4.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a ,中位数为b ,众数为c ,则a 、b 、c 从小到大的关系依次是________.题型一 由统计信息解决实际问题例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2), 试根据统计学估计哪一种水稻品种的产量比较稳定.例2为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成,A B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:P C的估计值为0.70.记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到()(1)求乙离子残留百分比直方图中,a b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).跟踪训练一1.样本数为9的四组数据,它们的平均数都是5,条形图如图所示,则标准差最大的一组是()A.第一组B.第二组C.第三组D.第四组2.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).≈.(精确到0.018.6021.已知一组数据125,,,x x x 的平均数是2,方差是13,那么数据12532,32,,32x x x ---的平均数和方差分别是( ) A .2,13B .2, 3C .4,13D .4, 32.某学校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .140D .1203.如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( )A .12.5;12.5B .13;13C .13;12.5D .12.5;134.样本中共有五个个体,其值分别为a ,0,1,2,3,若该样本平均数为1,则样本方差为________. 5.对某校高三年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.(1)求出表中M,p及图中a的值;(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;(3)估计这次学生参加社区服务人数的众数、中位数以及平均数.答案小试牛刀 1. D. 2.A. 3.B. 4. a b c << 自主探究例1【答案】甲种水稻的产量比较稳定【解析】 甲品种的样本平均数为10,样本方差为[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02. 乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.24. 因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定. 例2【答案】(1) 0.35a =,0.10b =;(2) 4.05,6.【解析】 (1)由题得0.200.150.70a ++=,解得0.35a =,由0.050.151()10.70b P C ++=-=-,解得0.10b =.(2)由甲离子的直方图可得,甲离子残留百分比的平均值为0.1520.2030.3040.2050.1060.057 4.05⨯+⨯+⨯+⨯+⨯+⨯=,乙离子残留百分比的平均值为0.0530.1040.1550.3560.2070.1586⨯+⨯+⨯+⨯+⨯+⨯= 跟踪训练一 1.【答案】D.【解析】选D.法一:第一组中,样本数据都为5,标准差为0;第二组中,样本数据为4,4,4,5,5,5,6,6,6,标准差为63;第三组中,样本数据为3,3,4,4,5,6,6,7,7,标准差为253;第四组中,样本数据为2,2,2,2,5,8,8,8,8,标准差为22,故标准差最大的一组是第四组.法二:从四个图形可以直观看出第一组数据没有波动性,第二、三组数据的波动性都比较小,而第四组数据的波动性相对较大,利用标准差的意义可以直观得到答案.2.【答案】(1) 增长率超过0040的企业比例为21100,产值负增长的企业比例为2110050;(2)平均数0.3;标准差0.17.【解析】 (1)由题意可知,随机调查的100个企业中增长率超过40%的企业有14721个,产值负增长的企业有2个,所以增长率超过40%的企业比例为21100,产值负增长的企业比例为2100=150. (2)由题意可知,平均值y ̅=2×(−0.1)+24×0.1+53×0.3+14×0.5+7×0.7100=0.3,标准差的平方:s 2=1100[2×(−0.1−0.3)2+24×(0.1−0.3)2+53×(0.3−0.3)2+14×(0.5−0.3)2+7×(0.7−0.3)2]=1100[0.32+0.96+0.56+1.12]=0.0296,所以标准差s =√0.0296=√0.0004×74≈0.02×8.602≈0.17. 当堂检测1-3. DCD 4. 2.5.【答案】见解析【解析】(1)由分组[10,15)内的频数是10,频率是0.25,知10M=0.25,所以 M =40.因为频数之和为40,所以10+24+m +2=40,解得m =4,p =440m M ==0.10.因为a 是对应分组[15,20)的频率与组距的商,所以a =24405⨯=0.12.(2)因为该校高三学生有240人,在[10,15)内的频率是0.25, 所以估计该校高三学生参加社区服务的次数在此区间内的人数为60. (3)估计这次学生参加社区服务人数的众数是15202+=17.5.因为n =2440= 0.6,所以样本中位数是15+0.50.25a-≈17.1,估计这次学生参加社区服务人 数的中位数是17.1.样本平均人数是12.5×0.25+17.5×0.6+22.5×0.1+ 27.5×0.05=17.25,估计这次学生参加社区服务人数的平均数是17.25.。
9.3统计案例公司员工的肥胖情况调查分析考点学习目标核心素养众数、中位数、平均数、标准差、方差会求样本的众数、中位数、平均数、标准差、方差数学抽象总体集中趋势的估计会用众数、中位数、平均数估计总体集中趋势数据分析总体离散程度的估计会用标准差、方差估计总体离散程度数据分析问题导学预习教材P203-P213的内容,思考以下问题:1.平均数、中位数、众数各有什么应用?有什么优缺点?2.平均数、中位数与频率分布直方图有什么关系?3.方差和标准差有什么区别和联系?其作用是什么?1.平均数和中位数的特点(1)样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.(2)中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.(3)与中位数相比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.2.中位数、平均数与频率分布直方图的关系一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图(1)),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图(2)),那么平均数大于中位数;如果直方图在左边“拖尾”(图(3)),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.3.众数的特点众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.■名师点拨 一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.4.总体方差与总体标准差如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体平均数为Y -,则称S 2=1N ∑Ni =1__(Y i -Y -)2为总体方差,S =S 2为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的N 个变量值中,不同的值共有k (k ≤N )个,不妨记为Y 1,Y 2,…,Y k ,其中Y i 出现的频数为f i (i =1,2,…,k ),则总体方差为S 2=1N ∑ki =1f i (Y i-Y -)2.5.样本方差与样本标准差如果一个样本中个体的变量值分别为y 1,y 2,…y n ,样本平均数为y -,则称s 2=1n ∑n i =1 (y i-y -)2为样本方差,s =s 2为样本标准差.■名师点拨 (1)若x 1,x 2,x 3,…,x n 的平均数为x -,方差为s 2那么ax 1+b ,ax 2+b ,ax 3+b ,…,ax n +b 的平均数为x -′=a x -+b ;方差s ′2=a 2s 2.(2)标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.判断(正确的打“√”,错误的打“×”) (1)数据5,4,4,3,5,2的众数为4.( )(2)数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半.( ) (3)方差与标准差具有相同的单位.( )(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( ) 解析:(1)中的众数应为4和5;(2)正确;(3)二者单位不一致;(4)正确,平均数也应减去该常数,方差不变.答案:(1)× (2)√ (3)× (4)√为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数解析:选B.标准差能反映一组数据的稳定程度.故选B. 下列说法中正确的个数为( )①数据的极差越小,样本数据分布越集中、稳定; ②数据的平均数越小,样本数据分布越集中、稳定; ③数据的标准差越小,样本数据分布越集中、稳定; ④数据的方差越小,样本数据分布越集中、稳定. A .1 B .2 C .3D .4解析:选 C.由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关,故②不正确,①③④正确.已知五个数据3,5,7,4,6,则该样本的标准差为________. 解析:因为x -=15×(3+5+7+4+6)=5,所以s=15×[(3-5)2+…+(6-5)2]= 2.答案: 2众数、中位数、平均数的计算及应用某工厂人员及月工资构成如下:人员经理管理人员高级技工工人学徒合计月工资(元)22 000 2 500 2 200 2 000 1 00029 700人数16510123 合计22 00015 00011 00020 000 1 00069 000(2)这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?【解】(1)由表格可知,众数为2 000元.把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.平均数为(22 000+15 000+11 000+20 000+1 000)÷23=69 000÷23=3 000(元).(2)虽然平均数为3 000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.(1)如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.(2019·四川省宜宾市教学质量监测)某校高二年级学生身体素质考核成绩(单位:分)的频率分布直方图如图所示:。
1、了解平均数、中位数、和众数的应用2、掌握统计的实际应用3、理解频率分布表与频率分布图一、统计案例公司员工的肥胖情况调查分析背景与数据近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数来衡量人体胖瘦程度以及是否健康,其计算公式是BMI=()()2mkg单位:身高单位:体重中国成人的BMI数值标准为:BM1<18.5为偏瘦;18.5≤BMI<23.9为正常;24≤BMI<27.9为偏胖;BMI≥28为肥胖.二、对方差、标准差的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.三、标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.1.低密度脂蛋白是一种运载胆固醇进入外周组织细胞的脂蛋白颗粒,可被氧化成氧化低密度脂蛋白,当低密度脂蛋白,尤其是氧化修饰的低密度脂蛋白过量时,它携带的胆固醇便积存在动脉壁上,久了容易引起动脉硬化,因此低密度脂蛋白被称为“坏的胆固醇”.为了调查某地中年人的低密度脂蛋白浓度是否与肥胖有关,随机调查该地100名中年人,得到2×2列联表如下:肥胖不肥胖总计低密度脂蛋白不高于3.1mmol/L126375低密度脂蛋白高于3.1mmol/L81725总计2080100由此得出的正确结论是()A.有10%的把握认为“该地中年人的低密度脂蛋白浓度与肥胖有关”B.有10%的把握认为“该地中年人的低密度脂蛋白浓度与肥胖无关”C.有90%的把握认为“该地中年人的低密度脂蛋白浓度与肥胖有关”D.有90%的把握认为“该地中年人的低密度脂蛋白浓度与肥胖无关”【答案】C【考点】独立性检验的基本思想≈8.4435>6.635,由临界值表知C符合题意.【解析】【解答】由已知K2=100×(12×17−8×63)275×25×20×80故答案为:C.【分析】根据列联表计算出K2,然后借助于临界值表可得结论.2.为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对100名五年级学生进行了问卷调查,得到如下2×2列联表,平均每天喝500 ml以上为常喝,体重超过50 kg为肥胖.不常喝常喝合计肥胖x y50不肥胖401050合计A B100.现从这100名儿童中随机抽取1人,抽到不常喝碳酸饮料的学生的概率为35,其中n=a+b+c+d.附:参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)临界值表:P( K2≥k)0.050.0250.0100.0050.001k 3.8415.0246.6357.87910.828(1)求2×2列联表中的数据x,y,A,B的值;(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.=60,【答案】(1)解:根据题意,不常喝碳酸饮料的学生为A=100×35∴ x=60−40=20,y=50−20=30,B=30+10=40;(2)解:有99.5%的把握认为肥胖与常喝碳酸饮料有关,理由如下:≈16.667>7.879,由已知数据可求得:K2=100×(20×10−40×30)250×50×60×40因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.【考点】独立性检验的应用【解析】(1)利用实际问题中的已知条件求出并填写出2×2列联表中的数据x,y,A,B的值。
9.2.4 总体离散程度的估计9.3统计案例公司员工的肥胖情况调查分析知识点1一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为__1n∑i=1n(x i-x-)2__=__1n∑i=1nx2i-x-2__,标准差为知识点2总体方差和标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体的平均数为Y-,则称S2=__1N∑i=1N(Y i-Y-)2__为总体方差,S=为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2=__1N∑i=1kf i(Y i-Y-)2__.知识点3样本方差和标准差如果一个样本中个体的变量值分别为y1,y2,…,y n,样本平均数为y-,则称s2=__1n∑i=1n(y i -y-)2__为样本方差.s=为样本标准差.知识点4标准差的意义标准差刻画了数据的__离散程度__或__波动幅度__,标准差越大,数据的离散程度越__大__;标准差越小,数据的离散程度越__小__.知识点5分层随机抽样的方差设样本容量为n,平均数为x-,其中两层的个体数量分别为n1,n2,两层的平均数分别为x-1,x-2,方差分别为s21,s22,则这个样本的方差为s2=__n1n[s21+(x-1-x-)2]+n2n[s22+(x-2-x-)2]__.[知识解读] 对方差、标准差的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性. (3)标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.(4)标准差的单位与样本数据一致. (5)方差s 2=1n i =1n x 2i -x -2.题型一 标准差、方差的计算与应用典例1 从甲、乙两种玉米苗中各抽10株,分别测它们的株高如下:(单位:cm) 甲:25,41,40,37,22,14,19,39,21,42; 乙:27,16,44,27,44,16,40,40,16,40. 问:(1)哪种玉米苗长得高? (2)哪种玉米苗长得齐?[归纳提升] 用样本的标准差、方差估计总体的方法用样本估计总体时,样本的平均数、标准差只是总体平均数、标准差的近似.在实际应用中,常常把平均数与方差结合起来进行决策.在平均值相等的情况下,比较标准差以确定稳定性.【对点练习】❶ (1)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A .x -=4,s 2<2 B .x -=4,s 2>2 C .x ->4,s 2<2D .x ->4,s 2>2(2)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:典例2 在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,求合在一起后的样本平均数与方差.(精确到0.1)[归纳提升] 两层及以上的分层随机抽样的平均数及方差 1.分层随机抽样的平均数的求法设样本中不同层的平均数和相应权重分别为x -1,x -2,…,x -n 和w 1,w 2,…,w n ,则这个样本的平均数:x -=w 1x -1+w 2x -2+…+w n x -n .2.方差计算公式设样本中不同层的平均数分别为x -1,x -2,…,x -n ,方差分别为s 21,s 22,…,s 2n ,相应的权重分别为w 1,w 2,…,w n ,则这个样本的方差为s 2=i =1nw i [s 2i +(x -i -x -)2],x -为总样本数据的平均数.此处,某层的权重=该层被抽中的个体数样本容量.【对点练习】❷ 甲、乙两支田径队的体检结果为:甲队体重的平均数为60 kg ,方差为200,乙队体重的平均数为70 kg ,方差为300,又已知甲、乙两队的队员人数之比为1︰4,那么甲、乙两队全部队员的平均体重和方差分别是多少?题型三 其他统计图表中反映的集中趋势与离散程度典例3 (2020·浙江省宁波市期末)甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示.(1)请填写下表:平均数方差 中位数 命中9环及9环以上的次数甲 乙(2)①从平均数和方差相结合看,谁的成绩更稳定; ②从平均数和中位数相结合看,谁的成绩好些;③从平均数和命中9环及9环以上的次数相结合看,谁的成绩好些; ④从折线图上两人射击命中环数的走势看,谁更有潜力.【对点练习】❸ (陕西高考题)如图所示,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A .x -A >x -B ,s A >s B B .x -A <x -B ,s A >s BC .x -A >x -B ,s A <s BD .x -A <x -B ,s A <s B典例4 甲、乙两种冬小麦实验品种连续5年平均单位面积产量如下(单位:t/km 2):第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8【对点练习】❹(2019·河南高一期中)在去年的足球甲A联赛上,一队每场比赛平均失球数是1.6,全年比赛失球个数的标准差为1.2;二队每场比赛平均失球数是2.2,全年比赛失球个数的标准差是0.5.下列说法正确的有()①平均来说一队比二队防守技术好;②二队比一队技术水平更稳定;③一队有时表现很差,有时表现又非常好;④二队很少不失球.A.1个B.2个C.3个D.4个9.2.4 总体离散程度的估计9.3统计案例公司员工的肥胖情况调查分析知识点1一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为__1n∑i=1n(x i-x-)2__=__1n∑i=1nx2i-x-2__,标准差为__1n ∑i =1n (x i -x -)2__.知识点2 总体方差和标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体的平均数为Y -,则称S 2=__1N ∑i =1N (Y i -Y -)2__为总体方差,S =__S 2__为总体标准差.(2)总体方差的加权形式:如果总体的N 个变量值中,不同的值共有k (k ≤N )个,不妨记为Y 1,Y 2,…,Y k ,其中Y i 出现的频数为f i (i =1,2,…,k ),则总体方差为S 2=__1N ∑i =1k f i (Y i -Y -)2__.知识点3 样本方差和标准差如果一个样本中个体的变量值分别为y 1,y 2,…,y n ,样本平均数为y -,则称s 2=__1n ∑i =1n (y i -y -)2__为样本方差.s =__s 2__为样本标准差.知识点4 标准差的意义标准差刻画了数据的__离散程度__或__波动幅度__,标准差越大,数据的离散程度越__大__;标准差越小,数据的离散程度越__小__.知识点5 分层随机抽样的方差设样本容量为n ,平均数为x -,其中两层的个体数量分别为n 1,n 2,两层的平均数分别为x -1,x -2,方差分别为s 21,s 22,则这个样本的方差为s 2=__n 1n [s 21+(x -1-x -)2]+n 2n[s 22+(x -2-x -)2]__. [知识解读] 对方差、标准差的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性. (3)标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.(4)标准差的单位与样本数据一致. (5)方差s 2=1n ∑i =1n x 2i -x -2.题型一 标准差、方差的计算与应用典例1 从甲、乙两种玉米苗中各抽10株,分别测它们的株高如下:(单位:cm) 甲:25,41,40,37,22,14,19,39,21,42; 乙:27,16,44,27,44,16,40,40,16,40. 问:(1)哪种玉米苗长得高? (2)哪种玉米苗长得齐?[解析] (1)x -甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x -乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm). 所以x -甲<x -乙. 即乙种玉米苗长得高.(2)s 2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1 042=104.2(cm 2), s 2乙=110[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×(40-31)2]=110×1 288=128.8(cm 2). 所以s 2甲<s 2乙.即甲种玉米苗长得齐.[归纳提升] 用样本的标准差、方差估计总体的方法用样本估计总体时,样本的平均数、标准差只是总体平均数、标准差的近似.在实际应用中,常常把平均数与方差结合起来进行决策.在平均值相等的情况下,比较标准差以确定稳定性.【对点练习】❶ (1)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( A )A .x -=4,s 2<2 B .x -=4,s 2>2 C .x ->4,s 2<2D .x ->4,s 2>2(2)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:__2__. [解析] (1)∵某7个数的平均数为4, ∴这7个数的和为4×7=28,∵加入一个新数据4,∴x -=28+48=4.又∵这7个数的方差为2,且加入一个新数据4, ∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A .(2)∵x -甲=15(87+91+90+89+93)=90,x -乙=15(89+90+91+88+92)=90,∴s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4, s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2. 题型二 分层随机抽样的方差典例2 在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,求合在一起后的样本平均数与方差.(精确到0.1)[解析] 把甲同学抽取的样本的平均数记为x -,方差记为s 2x ;把乙同学抽取的样本的平均数记为y -,方差记为s 2y ;把合在一起后的样本的平均数记为a -,方差记为s 2.则a -=10×5+8×610+8≈5.4,s 2=10×[s 2x +(x --a -)2]+8×[s 2y+(y --a -)2]10+8=10×[9+(5-5.4)2]+8×[16+(6-5.4)2]18≈12.4.即样本的平均数为5.4,方差为12.4.[归纳提升] 两层及以上的分层随机抽样的平均数及方差 1.分层随机抽样的平均数的求法设样本中不同层的平均数和相应权重分别为x -1,x -2,…,x -n 和w 1,w 2,…,w n ,则这个样本的平均数:x -=w 1x -1+w 2x -2+…+w n x -n .2.方差计算公式设样本中不同层的平均数分别为x -1,x -2,…,x -n ,方差分别为s 21,s 22,…,s 2n ,相应的权重分别为w 1,w 2,…,w n ,则这个样本的方差为s 2=∑i =1nw i [s 2i +(x -i -x -)2],x -为总样本数据的平均数.此处,某层的权重=该层被抽中的个体数样本容量.【对点练习】❷ 甲、乙两支田径队的体检结果为:甲队体重的平均数为60 kg ,方差为200,乙队体重的平均数为70 kg ,方差为300,又已知甲、乙两队的队员人数之比为1︰4,那么甲、乙两队全部队员的平均体重和方差分别是多少?[解析] 由题意可知x -甲=60,甲队队员在所有队员中所占权重为11+4=15,x -乙=70,乙队队员在所有队员中所占权重为41+4=45,则甲、乙两队全部队员的平均体重为x -=15×60+45×70=68(kg),甲、乙两队全部队员的体重的方差为s 2=15[200+(60-68)2]+45[300+(70-68)2]=296.题型三 其他统计图表中反映的集中趋势与离散程度典例3 (2020·浙江省宁波市期末)甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示.(1)请填写下表:平均数方差 中位数 命中9环及9环以上的次数甲 乙(2)①从平均数和方差相结合看,谁的成绩更稳定; ②从平均数和中位数相结合看,谁的成绩好些;③从平均数和命中9环及9环以上的次数相结合看,谁的成绩好些; ④从折线图上两人射击命中环数的走势看,谁更有潜力.[解析] (1)由图可知,甲打靶的成绩为9,5,7,8,7,6,8,6,7,7,乙打靶的成绩为2,4,6,8,7,7,8,9,9,10.则可求得,甲的成绩的平均数为7,方差为1.2,中位数是7,命中9环及9环以上的次数为1;乙的成绩的平均数为7,方差为5.4,中位数是7.5,命中9环及9环以上的次数为3.如下表:平均数方差中位数命中9环及9环以上的次数甲 7 1.2 7 1 乙75.47.53(2)②甲、乙的平均数相同,乙的中位数较大,所以乙的成绩好些.③甲、乙的平均数相同,乙命中9环及9环以上的次数比甲多,所以乙的成绩好些. ④从折线图上看,乙基本上呈上升趋势,而甲趋于稳定,故乙更有潜力.【对点练习】❸ (陕西高考题)如图所示,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( B )A .x -A >x -B ,s A >s B B .x -A <x -B ,s A >s BC .x -A >x -B ,s A <s BD .x -A <x -B ,s A <s B[解析] 观察图形可得:样本A 的数据均小于或等于10,样本B 的数据均大于或等于10,故x -A <x -B ,又样本B 的数据波动范围较小,故s A >s B .典例4 甲、乙两种冬小麦实验品种连续5年平均单位面积产量如下(单位:t/km 2):第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8[错解] 由题意得x -甲=15×(9.8+9.9+10.1+10+10.2)=10,x -乙=15×(9.4+10.3+10.8+9.7+9.8)=10,甲、乙两种冬小麦的平均产量都等于10,所以引进两种冬小麦中的任意一种都可以. [错因分析] 造成错解的原因是只比较了两种冬小麦的平均产量,而忽略了对冬小麦产量稳定性的讨论.[正解] 由题意得x -甲=15×(9.8+9.9+10.1+10+10.2)=10,x -乙=15×(9.4+10.3+10.8+9.7+9.8)=10,s 2甲=15×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02, s 2乙=15×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244.甲、乙两种冬小麦的平均产量都等于10,且s2甲<s2乙,所以产量比较稳定的是甲种冬小麦,故推荐引进甲种冬小麦大量种植.[误区警示]平均数反映的是样本的平均水平,方差和标准差反映了样本的波动、离散程度.对于形如“谁发挥更好”“谁更优秀”的题目,除比较数据的平均值外,还应该比较方差或标准差的大小,以作出更为公正、合理的判断.【对点练习】❹(2019·河南高一期中)在去年的足球甲A联赛上,一队每场比赛平均失球数是1.6,全年比赛失球个数的标准差为1.2;二队每场比赛平均失球数是2.2,全年比赛失球个数的标准差是0.5.下列说法正确的有(D)①平均来说一队比二队防守技术好;②二队比一队技术水平更稳定;③一队有时表现很差,有时表现又非常好;④二队很少不失球.A.1个B.2个C.3个D.4个[解析]对于①,一队每场比赛平均失球数是1.6,二队每场比赛平均失球数是2.2,所以平均来说一队比二队防守技术好,故①正确;对于②,一队全年比赛失球个数的标准差为1.2,二队全年比赛失球个数的标准差是0.5,所以二队比一队技术水平更稳定,故②正确;对于③,一队全年比赛失球个数的标准差为1.2,二队全年比赛失球个数的标准差是0.5,所以一队有时表现很差,有时表现又非常好,故③正确;对于④,二队每场比赛平均失球数是2.2,全年比赛失球个数的标准差是0.5,所以二队很少不失球,故④正确.故选D.。
9.3统计案例公司员工的肥胖情况调查分析课标要求素养要求进一步学习数据收集和整理的方法、数据直观图表的表示方法、数据统计特征的刻画方法,通过具体实例,感悟在实际生活中进行科学决策的必要性和可能性,体会统计思维与确定性思维的差异,积累数据分析的经验.通过生活中具体的统计案例模型,进行提出问题、分析数据、建立模型、检验模型来发展数据分析、数学抽象及数学建模素养.教材知识探究大数据配合乔布斯癌症治疗苹果手机创始人乔布斯是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人.为此,他支付了高达几十万美元的费用.他得到的不是样本,而是包括整个基因的数据文档.医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命.这是一个著名的数据分析案例.问题你知道什么是统计数据分析吗?提示数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程.这一过程也是质量管理体系的支持过程.在实用中,数据分析可帮助人们作出判断,以便采取适当行动.统计分析报告的主要组成部分1.标题2.前言:简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.3.主体:展示数据分析的全过程:(1)首先明确所关心的问题是什么,说明数据蕴含的信息;(2)根据数据分析的需要,说明如何选择合适的图表描述和表达数据;(3)从样本数据中提取能刻画其特征的量,用于分析比较;(4)通过样本估计总体的统计规律,分析总体的情况.4.结尾:对主体部分的内容进行概括,给出解决问题的方法和对策.教材拓展补遗[微判断]1.用于样本数据分析的统计图表主要有条形图、扇形图、折线图、频率分布直方图等.(√)2.反映样本数据的集中趋势的特征量有平均数、中位数、众数等.(√)3.反映样本数据的离散程度的特征量有方差和标准差.(√)[微思考]进行数据分析的过程是什么?提示(1)明确主题,说明数据信息;(2)选择图表描述和表达数据;(3)计算样本数据的特征量;(4)估计统计规律.题型一数据分析过程的探究【例1】[明确问题]为了实施“精准扶贫”战略,农科院试种了甲、乙两个西红柿新品种,从这两个品种中各任选5株,测量其产量(单位:kg),得到如下数据:甲 60 80 70 90 70 乙8060708075利用上述数据,现从中选出一个品种推荐给农民种植,应该推荐哪个品种呢? [描述数据] 使用折线图描述数据如下:从折线图上可以看出甲品种的平均产量稍高,但其产量不稳定;乙品种的产量稍低,但其产量较稳定.[计算特征量] 甲品种的平均产量为x -甲=74(kg),乙品种的平均产量为x -乙=73(kg),所以甲品种的平均产量稍高;甲品种的方差是s 2甲=15(142+62+42+162+42)=104, 乙品种的方差是s 2乙=15(72+132+32+72+22)=56, 由于s 2甲>s 2乙,所以乙品种的产量较稳定.[解决问题] 从以上分析可以看出甲品种的平均产量稍高,比乙品种单株平均高1 kg ,相差不大,但其产量远不如乙品种稳定.因为是推荐给需要扶助的贫困地区的农民种植,其抗风险能力较弱,所以推荐乙品种.【例2】 [明确问题] 为了备战下届奥运会,甲、乙两名运动员在相同条件下各射击10次,得到如下数据:甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7. 乙射击10次中靶环数分别为:2,4,6,8,7,7,8,9,9,10.射击队教练希望利用此次射击成绩为依据,挑选一名运动员参加奥运会,请你帮助教练分析两个运动员的成绩,并作出判断.[描述数据] 用折线图描述数据如下图所示:由折线图可以看出甲运动员的成绩较稳定.[计算特征量] 甲射击10次中靶环数由小到大排列为5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数由小到大排列为2,4,6,7,7,8,8,9,9,10. 运动员甲的平均成绩x -甲=110×(5+6×2+7×4+8×2+9)=7(环),运动员乙的平均成绩x -乙=110×(2+4+6+7×2+8×2+9×2+10)=7(环),运动员甲的方差s 2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,运动员乙的方差s 2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+9)=5.4.比较如下:平均数 方差 命中9环及9环以上的次数甲 7 1.2 1 乙75.43①∵平均数相同,s 2甲<s 2乙,∴甲成绩比乙稳定.②∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.③甲成绩在平均数上下波动;而乙处于上升势头,从第三次以后就没有比甲少的情况发生,乙更有潜力.[解决问题]参考比赛的历史经验,如果对手的成绩不如甲、乙两个运动员,想确保赢得比赛,选派甲运动员参加比赛;如果对手的成绩远超过甲、乙两个运动员,因为乙更有潜力,成绩的方差较大,有可能超常发挥,则选派乙运动员参加比赛.题型二统计案例分析活动的探究和统计分析报告的撰写【例3】阶梯电价的设计一、背景与数据为了实现绿色发展,践行“绿水青山就是金山银山”的发展理念,避免浪费能源,某市政府计划对居民用电采用阶梯收费的方法.为此,相关部门在该市随机调查了200户居民六月份的用电量(单位:kW·h),以了解这个城市家庭用电量的情况.数据如下:10710178992081277422331131 214135896660115189135146127 20397966265111561511068 1629167932121596163178194 194216101981397811019210596 22501382511201121002019884 137203260134156617010072164 17413193100163807695152182 882471917013049114110163202 265189414614914717733957109 10718210114827428982213165224 142611081379025420183253113 130821701101086325023712084 15428817012317231962133130127 107719614077106132106135132167822585425110769987248 10913425042320113180144116530 200174135160462139133304191283 121132118134124178206626120274 14180187883241364981697757二、任务与要求根据以上数据,应当如何确定阶梯电价中的电量临界值,才能使得电价更为合理?三、问题的解决[问题分析]选取六月份调查,是因为这个城市六月份的部分时间需要使用空调,因此六月份的用电量在一年12个月中处于中等偏上水平.如果阶梯电价临界值的确定依赖于居民月用电量的分布,例如计划实施3阶的阶梯电价,有人给出一个分布如下:75%用户在第一档(最低一档),20%用户在第二档,5%用户在第三档(最高一档).这样,需要通过样本数据估计第一档与第二档、第二档与第三档的两个电量临界值,即75%和95%这两个电量临界值.利用电子表格软件,对上面的样本数据进行排序,可以得到下面的结果:81822314248495051565757606161616262636365666769707071727274767777787880808282828384848888899091939394959696969798989899 100100100101101101105106106106 107107107107108108109109110110 110111112113113114115116118120 120120121123124127127127130130 130131131132132132133133134134 134135135135135136137137138139 139140141142144416146147148149 151152154156159160162163163164165167169170170172174174177178 178180182182187189191191192194 194200201201202203203206208212 213214216223224237247250250251 253254258260265274274283288289 304319320324339462498530542626[特征量分析](1)样本数据总共有200个,最小值是8,最大值是626,说明200户居民六月份的最小用电量为8 kW·h,最大用电量为626 kW·h,极差为618.(2)因为数据量是200,那么这组数据的样本中位数就是有序样本第100个数130和第101个数130的平均数,即130,说明这个城市六月份居民用电量的中间水平大约在130 kW·h左右.(3)因为200×75%=150,所以第一个临界值为有序样本中第150个数178和第151个数178的平均数,仍然是178.因为200×95%=190,所以第二个临界值为有序样本中第190个数289和第191个数304的平均数,这个平均数为296.5(因为是对第百分位数的估计,估计值可以是289和304之间任何一个数,为了便于操作可以取值为297).[解决问题]依据确定了的电量临界值,阶梯电价可以规定如下:(1)用户每月用电量不超过178 kW·h(或每年用电量不超过2 136 kW·h),按第一档电价标准缴费;(2)每月用电量(单位:kW·h)在区间(178,297]内(或每年用电量在区间(2 136,3 564]内),其中的178 kW·h按第一档电价标准缴费,超过178 kW·h的部分按第二档电价标准缴费;(3)每月用量超过297 kW·h(或每年用电量超过3 564 kW·h),其中的178 kW·h按第一档电价标准缴费,119 kW·h按第二档电价标准缴费,超过297 kW·h的部分按第三档电价标准缴费.社会上对这种制定阶梯电价的原则和方法存在不同意见,可以讨论制定合理阶梯电价的原则和方法.[统计案例]对大学毕业生工薪的抽样估计很多测评机构在比较各个高校的实力或比较不同高校培养的大学生受社会欢迎的程度时,不仅使用到就业率等指标,还经常用大学毕业生的工薪高低来衡量.要反映一个学校所培养学生的工薪水平显然不宜用该校全部学生工薪的最高水平或最低水平,否则容易受个别极端值(统计上也称为异常值)的影响,通常应采用该校全部学生工薪的平均水平、工薪达到一定水平的毕业生比重等统计指标来衡量.但要对毕业生进行全面调查既不太可能也不必要,为此可进行抽样推断,即随机抽取一定数量的大学毕业生构成样本.从我国某高校2019年毕业且在某地区就业的学生中随机抽取36名进行调查,所得的样本数据如表所示.表中的工薪是指大学毕业生工作第一个月的工薪.大学毕业生工薪的抽样调查数据序号工薪/元序号工薪/元序号工薪/元1 5 80013 5 68025 6 2182 6 60014 6 66026 6 30037 10015 5 76027 5 8804 6 500165 88028 5 7505 5 200176 20029 6 5606 6 00018 6 50030 6 1007 5 60019 6 00031 6 7608 6 400207 50032 6 1209 6 70021 6 20033 6 85010 6 400227 30034 6 25011 5 75023 6 80035 6 18012 6 30024 6 40036 6 580案例分析与思考要求:1.以[5 000,5 500),[5 500,6 000),[6 000,6 500),[6 500,7 000),[7 000,7 500),将样本数据进行分组,绘制出频率分布直方图,观察样本数据分布特征.2.根据频率分布直方图,计算样本的中位数、众数和平均数.3.分析样本中工薪在6 500元以上的毕业生占多大比重,计算所得的数据和实际数据相差多少?。