频数直方图
- 格式:ppt
- 大小:1.18 MB
- 文档页数:24
1. 什么是直方图直方图(Histogram),是频数直方图的简称,又称质量分布图,由卡尔·皮尔逊(Karl Pearson,1857—1936,英国数学家、数理统计学家、生物统计学家,现代统计学科创立者与奠基者)提出,它是用一系列宽度相等、高度不等的长方形表示数据的统计报告图,它亦是一个连续变量(定量变量)的概率分布的估计。
直方图一般用横轴表示数据类型,纵轴表示数据分布情况,长方形的宽度表示数据范围的间隔,长方形的高度表示在给定间隔内的数据分布。
在质量管理中,如何监控并预测产品质量状况?如何对质量波动进行分析?直方图就是把这些问题图表化处理的工具之一。
它通过对收集到的貌似无序的数据进行处理,可以精确表示数据的分布状况,可以解析出数据的规则性,对于数据分布状况一目了然,进而直观地判断产品质量特性波动的分布状态。
2.直方图的作用从质量管理的角度,直方图用于过程质量管控,常见作用有以下三点:a.显示质量波动分布的状态,常与检查表、因果图、过程能力分析等一起使用;b.较直观地传递有关过程质量状况的信息;c.通过研究质量波动状况之后,就能掌握过程的状况,从而确定在什么地方集中力量进行质量改进工作。
对于过程质量数据,我们使用直方图,可以得到以下方面的结果:a.了解分布的型态并判断过程能力;b.判断是否有假数据;c.与规范比较,预测产品不良率或ppm;d.通过规格或标准值,预测平均值和标准偏差,设定控制界限;e.调查是否混入两个以上不同群体;f.了解过程规范是否符合设计规范;从PDCA的角度,直方图的应用总结如下:3.直方图的类型将直方图用于质量管理中,可以按照数据图形的分布将其分为多种。
在正常生产条件下,如果所得到的直方图不是标准形状,或者虽是标准形状,但其分布范围不合理,就要分析其原因,采取相应措施。
所以我们在用软件绘出直方图后要进一步对它进行观察和分析。
如果过程处于稳定的状态,常见的直方图图形分布类型及其形成的原因如下面所示。
频数直方图——知识讲解责编:康红梅【学习目标】1. 理解组距、频数、频率、频数统计表的概念;2. 会制作频数统计表,理解频数统计表的意义和作用;3. 体会样本和总体的关系,会用样本的频数分布估计总体的频数分布;4. 掌握画频数直方图的一般步骤,会画频数直方图,理解频数分布直方图的意义和作用. 【要点梳理】要点一、组距、频数、频率与频数统计表1.组距:将数据按从小到大适当地分组,并绘制成统计表,其中每一组的后一个边界值与前一个边界值的差叫做组距.2. 频数:数据分组后落在各小组内的数据个数称为频数.3. 频率:每一组数据频数与数据总数的比叫做这一组数据的频率.4.频数统计表:把各个组别中相应的频数分布用表格的形式表示出来,这种反映数据分布情况的统计表叫做频数统计表,也称频数表.列频数统计表的一般步骤如下:1.选取组距,确定组数.组数通常取大于最大值-最小值组距的最小整数. 当数据在100个以内时,通常可按照数据的多少分成5~12组.2.确定各组的边界值.第一组的起始边界值通常取得比最小数据要小一些.为了使数据不落在边界上,边界值可以比实际数据多取一位小数.取定起始边界值后,就可以根据组距写出各组的边界值.3.列表,填写组别和统计各组频数.要点诠释:(1)各组频数总和等于样本容量,各组数据的频率之和等于1;(2)频数统计表能清楚地反映一组数据的大小分布情况.将一批数据分组,一般数据越多,分的组也越多.要点二、频数直方图1.频数直方图由若干个宽等于组距,面积表示每一组频数的长方形组成的统计图,叫做频数直方图.简称直方图.它直观地呈现了频数的分布特征和变化规律.2.频数直方图的画法(1)列出频数表;(2)画具有相同原点,横、纵两条互相垂直的数轴,分别表示各组别和相应的频数.然后分别以横轴上每一组的两边界点为端点的线段为底边,作高为相应频数的长方形,就得到所求的频数直方图.3. 频数直方图与条形图的联系与区别(1)联系:它们都是用矩形来表示数据分布情况的;当矩形的宽度相等时,都是用矩形的高来表示数据分布情况的;频数直方图是特殊的条形统计图.(2)区别:①由于分组数据具有连续性,频数直方图中各“条形”之间通常是连续排列,中间没有间隙,而条形图中各“条形”是分开排列的,中间有一定的间隙;②条形统计图用横向指标表示考察对象的类别,用纵向指标表示不同对象的数量. 频数直方图横向指标表示考察对象数据的变化范围,用纵向指标表示相应范围内数据的频数.要点诠释:(1)频数直方图是条形统计图的一种;(2)注意直方图与条形图、扇形图、折线图在表示数据方面的优缺点.【典型例题】类型一、组距、组数、频数、频率1. (1)对某班50名学生的数学成绩进行统计,90~99分的人数有10名,这一分数段的频数为_________.(2)有60个数据,其中最小值为140,最大值为186,若取组距为5,则应该分的组数是________.【答案】(1)10; (2)10.【解析】解:(1)利用频数的定义进行解答;(2)利用组数的计算方法求解.【总结升华】组数的确定方法:设数据总数目为n,一般地,当n≤50时,则分为5~8组;的整数部分+1.当50≤n<100.则分为8~12组较为合适,组数等于最大值-最小值组距举一反三:【变式】一个样本中有80个数据,最大值是141,最小值是50,取组距为10,则样本可分成()A.10组 B.9组 C.8组 D.7组【答案】A.2. 我校八年级学生在生物实验中抽出50粒种籽进行研究,数据落在37~40之间的频率是0.2,则这50个数据在37~40之间的个数是()A.1 B.2 C.10 D.5【思路点拨】根据频率、频数的关系:频率=频数÷数据总和,可得频数=频率×数据总和.【答案】C.【解析】解:∵在生物实验中抽出50粒种籽进行研究,数据落在37~40之间的频率是0.2,∴这50个数据在37~40之间的个数=50×0.2=10.故选C.【总结升华】本题考查频率、频数、总数的关系:频率=频数÷数据总和.举一反三:【变式】(2016•黄浦区三模)将样本容量为100的样本编制成组号①~⑧的八个组,简况如表所示:组号①②③④⑤⑥⑦⑧频数14 11 12 13 13 12 10那么第⑤组的频率为()A.14 B.15 C.0.14 D.0.15【答案】D.解:根据表格中的数据,得第⑤组的频数为100﹣(14+11+12+13+13+12+10)=15, 其频率为15:100=0.15. 类型二、频数统计表3.某中学为了解学生的课外阅读情况,就“我最喜爱的课外读物”从文学、艺术、科普和其他四个类别进行了抽样调查(每位同学仅选一类),并根据调查结果制作了尚不完整的频数统计表:(1)表中m=______,n=______;(2)在这次抽样调查中,最喜爱阅读哪类读物的学生最多?最喜爱阅读哪类读物的学生最少?(3)根据以上调查,试估计该校1200名学生中最喜爱阅读科普类读物的学生有多少人? 【思路点拨】(1)由频率统计表可看出艺术类的频数22,频率是0.11,由频率=频数÷数据总数计算,可得到总数;根据频数的总和为200,可求出m 的值; (2)频数统计表中可以直接看出答案;(3)用样本估计整体:用整体×样本的百分比即可. 【答案与解析】 解:(1)学生总数:22÷0.11=200,m=200-22-66-28=84, n=66÷200=0.33,(2)从频数统计表中可以看出:最喜爱阅读文学类读物的学生最多84人,最喜爱阅读艺术类读物的学生最少22人. (3)1200×0.33=396(人). 【总结升华】此题主要考查了读频数统计表的能力,利用图表得出正确的信息是解决问题的关键.类型三、频数直方图4.某地区对八年级的英语教学情况进行期末质量调查,从中抽出的20个班级的英语期末平均成绩如下(单位:分):80 81 83 79 64 76 80 66 70 72 71 68 69 78 67 80 68 72 70 65试列出频数统计表并绘出频数直方图.【思路点拨】按照画频数直方图的步骤进行解答.解答时,应注意每个步骤中需要注意的事项.【答案与解析】解:(1)计算最大值与最小值的差.类别 频数(人数) 频率 文学 m 0.42 艺术 22 0.11 科普 66 n 其它 28 合计 183-64=19.(2)决定组距与组数.若取组距为4,则有194≈5,所以组数为5.(3)列频数统计表.(4)画频数直方图.【总结升华】按步骤进行操作.因选取的组距不同,所列的频数统计表及所画的频数直方图也不一样.在统计时,数据不能出现重复或遗漏的现象.【高清课堂:数据的描述369923 例1】举一反三:【变式】如图是某校九年级部分男生做俯卧撑的成绩(次数)进行整理后,分成五组,画出的频率分布直方图.已知从左到右前4个小组的频率分别是0.05,0.15,0.25,0.30,第五小组的频数为25,若合格成绩为20,那么此次统计的样本容量和本次测试的合格率分别是().A.100,55% B.100,80% C.75,55% D.75,80%【答案】B.5. (2016•安徽模拟)我校为了迎接体育中考,了解学生的体育成绩,从全校500名九年级学生中随机抽取了部分学生进行体育测试,其中“跳绳”成绩制作图如下:成绩段频数频率160≤x<170 5 0.1170≤x<180 10 a180≤x<190 b 0.14190≤x<200 16 c200≤x<210 12 0.24表(1)根据图表解决下列问题:(1)本次共抽取了名学生进行体育测试,表(1)中,a=,b=c=;(2)补全图(2),所抽取学生成绩中中位数在哪个分数段;(3)“跳绳”数在180以上,则此项成绩可得满分.那么,你估计全校九年级有多少学生在此项成绩中获满分?【思路点拨】(1)根据第一组的频数是5,对应的频率是0.1据此即可求得总人数;(2)根据中位数的定义即可求解;(3)利用总人数500乘以对应的比例即可求解.【答案与解析】解:(1)抽测的人数是:5÷0.1=50(人),a==0.2,b=50×0.14=7,c==0.32.故答案是:50,0.2,7,0.32.(2)所抽取学生成绩中中位数在190~200分数段;(3)全校九年级有多少学生在此项成绩中获满分的人数是×500=350(人).答:全校九年级有多少学生在此项成绩中获满分的人数是350人.【总结升华】本题考查读频数分布直方图的能力和利用统计图获取信息的能力;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的判断和解决问题.举一反三:【变式】随着车辆的增加,交通违规的现象越来越严重,交警对某雷达测速区检测到的一组汽车的时速数据进行整理,得到其频数及频率如表(未完成):(1)请你把表中的数据填写完整;(2)补全频数直方图;(3)如果汽车时速不低于60千米即为违章,则违章车辆共有多少辆?【答案】解:(1)36÷200=0.18,200×0.39=78,200-10-36-78-20=56,56÷200=0.28;(2)如图所示:(3)违章车辆数:56+20=76(辆).答:违章车辆有76辆.。
频数直方图——知识讲解责编:康红梅【学习目标】1. 理解组距、频数、频率、频数统计表的概念;2. 会制作频数统计表,理解频数统计表的意义和作用;3. 体会样本和总体的关系,会用样本的频数分布估计总体的频数分布;4. 掌握画频数直方图的一般步骤,会画频数直方图,理解频数分布直方图的意义和作用. 【要点梳理】要点一、组距、频数、频率与频数统计表1.组距:将数据按从小到大适当地分组,并绘制成统计表,其中每一组的后一个边界值与前一个边界值的差叫做组距.2. 频数:数据分组后落在各小组内的数据个数称为频数.3. 频率:每一组数据频数与数据总数的比叫做这一组数据的频率.4.频数统计表:把各个组别中相应的频数分布用表格的形式表示出来,这种反映数据分布情况的统计表叫做频数统计表,也称频数表.列频数统计表的一般步骤如下:1.选取组距,确定组数.组数通常取大于最大值-最小值组距的最小整数. 当数据在100个以内时,通常可按照数据的多少分成5~12组.2.确定各组的边界值.第一组的起始边界值通常取得比最小数据要小一些.为了使数据不落在边界上,边界值可以比实际数据多取一位小数.取定起始边界值后,就可以根据组距写出各组的边界值.3.列表,填写组别和统计各组频数.要点诠释:(1)各组频数总和等于样本容量,各组数据的频率之和等于1;(2)频数统计表能清楚地反映一组数据的大小分布情况.将一批数据分组,一般数据越多,分的组也越多.要点二、频数直方图1.频数直方图由若干个宽等于组距,面积表示每一组频数的长方形组成的统计图,叫做频数直方图.简称直方图.它直观地呈现了频数的分布特征和变化规律.2.频数直方图的画法(1)列出频数表;(2)画具有相同原点,横、纵两条互相垂直的数轴,分别表示各组别和相应的频数.然后分别以横轴上每一组的两边界点为端点的线段为底边,作高为相应频数的长方形,就得到所求的频数直方图.3. 频数直方图与条形图的联系与区别(1)联系:它们都是用矩形来表示数据分布情况的;当矩形的宽度相等时,都是用矩形的高来表示数据分布情况的;频数直方图是特殊的条形统计图.(2)区别:①由于分组数据具有连续性,频数直方图中各“条形”之间通常是连续排列,中间没有间隙,而条形图中各“条形”是分开排列的,中间有一定的间隙;②条形统计图用横向指标表示考察对象的类别,用纵向指标表示不同对象的数量. 频数直方图横向指标表示考察对象数据的变化范围,用纵向指标表示相应范围内数据的频数.要点诠释:(1)频数直方图是条形统计图的一种;(2)注意直方图与条形图、扇形图、折线图在表示数据方面的优缺点.【典型例题】类型一、组距、组数、频数、频率1. (1)对某班50名学生的数学成绩进行统计,90~99分的人数有10名,这一分数段的频数为_________.(2)有60个数据,其中最小值为140,最大值为186,若取组距为5,则应该分的组数是________.【答案】(1)10; (2)10.【解析】解:(1)利用频数的定义进行解答;(2)利用组数的计算方法求解.【总结升华】组数的确定方法:设数据总数目为n,一般地,当n≤50时,则分为5~8组;的整数部分+1.当50≤n<100.则分为8~12组较为合适,组数等于最大值-最小值组距举一反三:【变式】一个样本中有80个数据,最大值是141,最小值是50,取组距为10,则样本可分成()A.10组 B.9组 C.8组 D.7组【答案】A.2. 我校八年级学生在生物实验中抽出50粒种籽进行研究,数据落在37~40之间的频率是0.2,则这50个数据在37~40之间的个数是()A.1 B.2 C.10 D.5【思路点拨】根据频率、频数的关系:频率=频数÷数据总和,可得频数=频率×数据总和.【答案】C.【解析】解:∵在生物实验中抽出50粒种籽进行研究,数据落在37~40之间的频率是0.2,∴这50个数据在37~40之间的个数=50×0.2=10.故选C.【总结升华】本题考查频率、频数、总数的关系:频率=频数÷数据总和.举一反三:【变式】(2016•黄浦区三模)将样本容量为100的样本编制成组号①~⑧的八个组,简况如表所示:组号①②③④⑤⑥⑦⑧频数14 11 12 13 13 12 10那么第⑤组的频率为()A.14 B.15 C.0.14 D.0.15【答案】D.解:根据表格中的数据,得第⑤组的频数为100﹣(14+11+12+13+13+12+10)=15,其频率为15:100=0.15.类型二、频数统计表3.某中学为了解学生的课外阅读情况,就“我最喜爱的课外读物”从文学、艺术、科普和其他四个类别进行了抽样调查(每位同学仅选一类),并根据调查结果制作了尚不完整的频数统计表:类别频数(人数)频率文学m 0.42艺术22 0.11科普66 n其它28合计 1(1)表中m=______,n=______;(2)在这次抽样调查中,最喜爱阅读哪类读物的学生最多?最喜爱阅读哪类读物的学生最少?(3)根据以上调查,试估计该校1200名学生中最喜爱阅读科普类读物的学生有多少人?【思路点拨】(1)由频率统计表可看出艺术类的频数22,频率是0.11,由频率=频数÷数据总数计算,可得到总数;根据频数的总和为200,可求出m的值;(2)频数统计表中可以直接看出答案;(3)用样本估计整体:用整体×样本的百分比即可.【答案与解析】解:(1)学生总数:22÷0.11=200,m=200-22-66-28=84,n=66÷200=0.33,(2)从频数统计表中可以看出:最喜爱阅读文学类读物的学生最多84人,最喜爱阅读艺术类读物的学生最少22人.(3)1200×0.33=396(人).【总结升华】此题主要考查了读频数统计表的能力,利用图表得出正确的信息是解决问题的关键.类型三、频数直方图4.某地区对八年级的英语教学情况进行期末质量调查,从中抽出的20个班级的英语期末平均成绩如下(单位:分):80 81 83 79 64 76 80 66 70 7271 68 69 78 67 80 68 72 70 65试列出频数统计表并绘出频数直方图.【思路点拨】按照画频数直方图的步骤进行解答.解答时,应注意每个步骤中需要注意的事项.【答案与解析】解:(1)计算最大值与最小值的差.83-64=19.(2)决定组距与组数.若取组距为4,则有194≈5,所以组数为5.(3)列频数统计表.(4)画频数直方图.【总结升华】按步骤进行操作.因选取的组距不同,所列的频数统计表及所画的频数直方图也不一样.在统计时,数据不能出现重复或遗漏的现象.【高清课堂:数据的描述369923 例1】举一反三:【变式】如图是某校九年级部分男生做俯卧撑的成绩(次数)进行整理后,分成五组,画出的频率分布直方图.已知从左到右前4个小组的频率分别是0.05,0.15,0.25,0.30,第五小组的频数为25,若合格成绩为20,那么此次统计的样本容量和本次测试的合格率分别是().A.100,55% B.100,80% C.75,55% D.75,80%【答案】B.5. (2016•安徽模拟)我校为了迎接体育中考,了解学生的体育成绩,从全校500名九年级学生中随机抽取了部分学生进行体育测试,其中“跳绳”成绩制作图如下:成绩段频数频率160≤x<170 5 0.1170≤x<180 10 a180≤x<190 b 0.14190≤x<200 16 c200≤x<210 12 0.24表(1)根据图表解决下列问题:(1)本次共抽取了名学生进行体育测试,表(1)中,a=,b=c=;(2)补全图(2),所抽取学生成绩中中位数在哪个分数段;(3)“跳绳”数在180以上,则此项成绩可得满分.那么,你估计全校九年级有多少学生在此项成绩中获满分?【思路点拨】(1)根据第一组的频数是5,对应的频率是0.1据此即可求得总人数;(2)根据中位数的定义即可求解;(3)利用总人数500乘以对应的比例即可求解.【答案与解析】解:(1)抽测的人数是:5÷0.1=50(人),a==0.2,b=50×0.14=7,c==0.32.故答案是:50,0.2,7,0.32.(2)所抽取学生成绩中中位数在190~200分数段;(3)全校九年级有多少学生在此项成绩中获满分的人数是×500=350(人).答:全校九年级有多少学生在此项成绩中获满分的人数是350人.【总结升华】本题考查读频数分布直方图的能力和利用统计图获取信息的能力;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的判断和解决问题.举一反三:【变式】随着车辆的增加,交通违规的现象越来越严重,交警对某雷达测速区检测到的一组汽车的时速数据进行整理,得到其频数及频率如表(未完成):(1)请你把表中的数据填写完整;(2)补全频数直方图;(3)如果汽车时速不低于60千米即为违章,则违章车辆共有多少辆?【答案】解:(1)36÷200=0.18,200×0.39=78,200-10-36-78-20=56,56÷200=0.28;(2)如图所示:(3)违章车辆数:56+20=76(辆).答:违章车辆有76辆.。
教你绘制频数分布直方图与折线图频数分布直方图和频数分布折线统计图是描述数据的两种重要统计图,用这两种统计图把数据描述出来,就以直观地了解数据的分布情况及变化规律下面谈谈这两种统计图的画法:一、频数分布直方图画频数分布直方图一般按下列步骤:1计算极差(最大值与最小值的差)2决定组数3列出频数分布表4画出频数分布直方图例小明调查了他们班54名学生的身高,结果(单位:cm)如下:4555请将数据适当分组,并绘制相应的频数分布直方图分析:要绘制频数分布直方图,需要把数据适当分组,数出每一组的频数,得出频数分布表,在此基础上绘制频数分布直方图解:通过观察得到上面数据的最大值是172cm,最小值是141cm,它们的差是(172-141)=31cm将该组数据按身高的范围分为141≤<145,145≤<149,≤…分成7组整理可得下列统计表:身高/cm频数统计学生数(频数)141≤<1453145≤<149正5149≤<153正8153≤<157正9157≤<161正正14161≤<165正7165≤<169正5169≤<1733用横轴表示身高,用纵轴表示频数,并在纵轴上等距离标出5,10,15,以各组学生人数为高画出与此组对应的长方形,得到频数分布直方图(如图1)图1二、频数折线图频数折线图画法如下:1在频数分布直方图的基础上画频数折线图(1)取频数分布直方图中每个长方形上边的中点;(2)在横轴上取两个频数为0的点,在直方图横轴的左边取点(139,0),在直方图横轴的右边取点(175,0);(3)将这些点用线段依次连接起来就得到了频数折线图(如图2)图22根据已有的数据直接画频数折线图(1)把数据分组,求出每个小组两端点的平均数,这些平均数称为组中值,如图141≤<145这个小组的组中值为(141145)÷2=143(2)用横轴表示身高,用纵轴表示频数,以各小组的组中值为横坐标,各小组对应的频数为纵坐标描点,另取两个点(139,0)和(175,0)(3)依次连接这些点就得到了频数折线图(如图3)图3。