第二单元 直方图
- 格式:doc
- 大小:130.50 KB
- 文档页数:6
直方图有关知识点总结高中一、直方图的定义直方图是一种用于展示数据分布的图形,通常用矩形条形表示不同类别的频数或频率。
在直方图中,横轴代表数据的类别或范围,纵轴代表频数或频率。
每个矩形条的高度代表相应类别的频数或频率,宽度表示类别的间距。
二、直方图的特点1. 表示数据分布:直方图常用来展示数据的分布情况,能够直观地显示数据的集中程度、偏态和离散程度。
2. 用于连续变量:直方图适合表示连续型数据的分布情况,比如身高、体重等数据。
3. 可以比较不同类别:直方图可以用来比较不同类别的数据分布情况,从而进行对比分析。
4. 易于理解:直方图是一种直观的图形表示方法,能够让人们快速理解数据的分布情况。
三、直方图的绘制步骤1. 确定类别:根据数据的特点,确定合适的类别范围。
2. 计算频数或频率:根据类别范围,统计每个类别内的数据个数或频率。
3. 绘制直方图:将每个类别的频数或频率用矩形条表示在坐标系中,横轴表示类别范围,纵轴表示频数或频率。
4. 添加标题和标签:为直方图添加标题和坐标标签,以说明图表的含义。
四、直方图的应用1. 数据分析:直方图是一种常用的数据分析工具,可以用来发现数据的分布特点,如集中程度、偏态和离散程度。
2. 决策支持:直方图能够直观地展示数据的分布情况,帮助决策者做出合理的决策。
3. 教学辅助:直方图可以用于教学中的数据可视化和统计学习,帮助学生更好地理解数据分布的特点。
五、直方图的注意事项1. 类别选择:类别的选择应适当,过多或过少的类别都会影响直方图的解读。
2. 纵轴标尺:纵轴的标尺必须清晰明了,避免模糊或不准确的标示。
3. 图形比例:直方图的比例必须合适,避免过大或过小的矩形条影响图形的解读。
4. 数据真实性:直方图所展示的数据必须真实可靠,不能出现造假或误导性的数据。
六、直方图的衍生类型1. 累积频数直方图:将每个类别的频数依次叠加得到的直方图,用于展示数据的累积分布情况。
2. 相对频率直方图:将每个类别的频数除以总频数得到的直方图,用于展示数据的相对分布情况。
10.2 直方图教学过程设计活动1我们学习了条形图、折线图、扇形图等描述数据的方法,本节学习另一种常用来描述数据的统计图——直方图.问题1为了参加全校各年级之间的广播操比赛,七年级准备从63名同学中挑出身高相差不多的40名同学师生活动:教师提出问题,学生独立思考。
在独立思考的基础上,学生分组交流,并汇总解决问题的不同方法。
问题2:已知63名学生的身高数据,为了使选取的参赛选手身高比较整齐,你知道怎样做才能知道数据(身高)的分布情况?(即在哪些身高范围的学生比较多?哪些身高范围内的学生比较少.)师生活动:学生先独立思考每个问题再分组活动。
教师深入小组,并参与小组活动,及时了解学生思维变化情况。
活动2问题:用频数分布描述数据的一般步骤是什么?师生活动:在活动1的基础上,教师和学生共同总结。
1.计算最大值和最小值的差在上面的数据中,最小值是149,最大值是172,它们的差是23,说明身高的变化范围是23 cm.2.决定组距和组数把所有数据分成若干组,每个小组的两个端点之间的距离称为组距.根据问题的需要,各组的组距可以相同或不同.本问题中我们作等距分组,即令各组的组距相同.如果从最小值起每隔3 cm 作为一个组,那么由于(最大值-最小值)÷组距2327,33=所以要将数据分成8组:149≤x<152,152≤x<155,…,170≤x<173.这里组数和组距分别是8和3.注:组数和组距没有固定的标准,要凭借经验和所研究的具体问题来决定.将一批数据进行分组,一般数据越多分的组数也越多.当数据在100个以内时,按照数据的多少,常分为5~12组.3.列频数分布表对落在各个小组内的数据进行累计,得到各个小组内的数据的个数(叫做频数).整理可以得到频数分布表,见教材164页表10-4.从表中可以看出,身高在155≤x<158,158≤x<161,161≤x<164三个组的人数最多,一共有41人,因此可以从身高在155~164 cm(不含164 cm)的学生中选队员.4.画频数分布直方图为了更直观形象地看出频数分布的情况,可以根据表10-4中的数据画出频数分布直方图,见教材第165页图10.2-2.在图中,横轴表示身高,纵轴表示频数与组距的比值.容易看出小长方形的面积=组距×(频数÷组距)=频数.可见,频数分布直方图是以小长方形的面积来反映数据落在各个小组内的频数的大小.小长方形的高是频数与组距的比值.等距分组时,各个小长方形的面积(频数)与高的比值是常数(组距),因此画等距分组的频数分布直方图时,为画图与看图的方便,通常直接用小长方形的高作为频数.例如上述直方图可以用教材第165页的图10.2-3表示.在频数分布直方图的基础上,我们还可以用频数折线图来描述频数的分布情况.方法:(1)取直方图中每一个长方形上边的中点;(2)在横轴上直方图的左右取两个频数为0的点,它们分别与直方图左右相距半个组距;(3)将所选取的点用线段以此连接起来,就得到频数折线图.活动3:探究:对上面的数据进行分组时,组距取3,把数据分成8组。
直方图有关知识点总结归纳一、直方图的基本概念1. 直方图的定义直方图是一种以长方形条表示数据频数分布的图形,它将数据按照不同的取值范围分组,并用矩形的高度来表示每个组别的频数,通常横轴表示数据取值范围,纵轴表示频数或频率。
2. 直方图的用途直方图主要用于展示数据的分布情况和频数分布,可以直观地反映出数据的特征。
通过观察直方图,可以了解数据的中心趋势、离散程度等重要信息,对数据的分析和解释具有重要意义。
3. 直方图与柱状图的区别直方图和柱状图都是用长方形条表示数据,但它们之间有一些明显的区别。
直方图用于展示连续变量的频数分布,通常没有间隔,而柱状图则用于展示分类变量的数据,通常有间隔。
二、直方图的绘制方法1. 数据分组绘制直方图之前,首先需要对数据进行分组处理。
一般来说,直方图的分组方式有简单随意分组、等宽分组和等频分组等方法,根据不同数据的分布情况选择合适的分组方式。
2. 绘制坐标轴在绘制直方图时,需要绘制横轴和纵轴,横轴通常表示数据的取值范围,纵轴表示频数或频率。
在绘制时需注意选择合适的刻度和轴标签,使得图形清晰易懂。
3. 绘制长方形条根据数据分组的结果,按照每个组别的频数或频率,在对应的位置上绘制长方形条,长方形条的高度代表了该组别的频数或频率。
4. 添加标题和标签最后,需要添加标题和标签,说明直方图的含义和数据的来源,使得图形更加完整和明了。
三、直方图的特点1. 易于理解直方图通过直观的图形展示了数据的分布情况,能够直观地反映出数据的特征,便于人们理解和分析数据。
2. 反映数据分布直方图能够清晰地展示数据的分布情况,包括数据的中心趋势、离散程度等重要信息,有助于人们对数据的特征有更深入的了解。
3. 对比不同组别直方图可以直接对比不同组别的频数或频率,帮助人们了解不同组别之间的差异和相似之处。
4. 难以变换直方图通常用于展示分布情况,不易对数据进行变换,因此在选择分组方式和绘制时需谨慎考虑。
七年级的直方图知识点总结直方图是我们在数学学习中经常接触到的一个图形。
它可以用来表示数据的分布情况,让我们更直观地了解数据背后的信息。
在七年级的数学学习中,就已经开始涉及到直方图的知识。
本文就来总结一下七年级的直方图知识点。
一、直方图的定义和构成要素首先,我们要了解直方图的定义和构成要素。
直方图是一种用矩形表示数据频数分布状况的图形。
具体而言,它由若干个矩形组成,每一个矩形的高度表示数据的频数,宽度表示数据对应的区间。
在构建直方图之前,需要先确定区间宽度,并将数据按照一定的区间划分好。
二、绘制直方图的步骤在了解了直方图的定义和构成要素后,我们就可以开始学习如何绘制直方图了。
以下是绘制直方图的步骤:1. 确定区间宽度,并按照一定的区间划分数据。
2. 统计每个区间内的数据频数。
3. 绘制纵轴,一般是频数,横轴则是各区间的端点,但是要注意第一条和最后一条数据的区间分别超出左边和右边界。
4. 将每个区间对应的频数用矩形表示出来,并将矩形排列在纵轴上。
5. 在每个矩形上方标注出对应的频数。
三、解读直方图了解了直方图的绘制步骤后,我们还需要学习如何解读直方图。
下面是一些需要掌握的技巧:1. 直方图的高度越高,说明对应的数据区间内数据的数量越多。
2. 相邻两个矩形之间的间隔表示对应的数据区间之间的间隔。
3. 直方图的峰值所对应的区间,可以认为是数据中的众数。
4. 直方图所对应的数据应该是有限且离散的。
四、与折线图的区别最后,我们需要了解直方图与折线图的区别。
虽然两者都是用来表示数据分布情况的图形,但是它们的构成要素和绘制方法是不同的。
折线图由若干个点组成,每个点表示一个数据,而直方图由若干个矩形组成,每个矩形表示一个区间内的数据频数。
因此,绘制折线图需要将数据点描绘出来,而绘制直方图需要先将数据分组,并计算出每个区间内的频数。
总结在七年级的数学学习中,直方图是一个重要的知识点。
通过学习本文中介绍的直方图的定义和构成要素、绘制步骤、解读技巧以及与折线图的区别,相信同学们已经对直方图有了更深入的了解。
直方图的知识点总结一、直方图的基本概念1.1 频数和频率频数是指某个数值范围内数据出现的次数,频率是指频数与总数据量的比值。
直方图通常以频数或频率作为纵轴的值来展示数据分布情况。
1.2 数值范围和组距直方图通常以数据不同数值范围为横轴,每个数值范围为一个组距。
组距的选择对直方图的展示效果有着重要影响,通常应根据实际数据的分布情况来选择合适的组距。
1.3 柱状图和直方图柱状图和直方图在外观上很相似,但柱状图通常用于表示分类数据的频数或频率,而直方图则用于表示连续型数据的频数或频率。
在横轴上,直方图通常是连续性的数值范围,而柱状图则是不同的分类变量。
二、直方图的绘制和解读2.1 直方图的绘制绘制直方图通常需要以下步骤:确定数据范围和组距、计算各组的频数或频率、绘制矩形条并标注等。
直方图的绘制需要根据数据的实际情况来进行,可以使用软件或者手工绘制。
2.2 直方图的解读直方图可以帮助人们直观地了解数据的分布情况和概貌。
直方图的形状、高度和数量等都可以反映数据的集中程度、偏态性和分散程度。
例如,对称的直方图表示数据的对称分布,峰态高的直方图表示数据集中在某个数值附近,而分散性较大的数据则对应直方图峰态低。
2.3 直方图的应用直方图广泛用于各个领域的统计分析和数据展示,例如市场营销、商业分析、财务分析、科学研究等。
通过直方图的分析,可以发现一些隐藏在数据背后的规律和趋势,帮助人们做出更加准确的决策。
三、直方图的特点和应用注意事项3.1 直方图的特点直方图是一种直观、形象的数据可视化方式,可以帮助人们快速理解数据的分布情况。
它能够同时展示数据的集中趋势和分散程度,并对比不同数据的分布情况。
3.2 直方图的应用注意事项在绘制和解读直方图时,需要注意以下几个方面的问题:组距选择的合理性、数据的准确性和完整性、直方图的标签和标题等。
此外,还需要注意避免过于片面或主观的解读,应该结合实际情况进行全面的分析。
四、直方图的优缺点及改进方法4.1 直方图的优点直方图是一种直观、易于理解和传达的数据可视化方式,能够帮助人们迅速了解数据的分布情况。
数学直方图知识点总结直方图是一种用来表示数据分布的图形,它以长方形的高度来表示相应的数据频数或频率。
直方图可以清晰地显示数据的分布规律和特点,因此在统计学中有着广泛的应用。
在本文中,我将对直方图的相关知识点进行总结,包括直方图的构成要素、绘制方法、应用场景等方面进行详细介绍。
一、直方图的构成要素1. 数据频数和频率直方图是由一系列长方形组成的,每个长方形的高度代表相应数据的频数或频率。
频数是指某个数值在数据集中出现的次数,而频率是指该数值在数据集中出现的频率。
频数和频率是直方图的基本构成要素,它们能够直观地反映数据的分布情况。
在绘制直方图时,我们通常选择频率作为纵轴的标度,以便更好地比较不同数据集之间的分布情况。
2. 数据区间直方图的横轴通常表示数据的区间范围,每个长方形代表一个数据区间。
在确定数据区间时,我们需要根据数据的大小和分布情况来选择合适的区间宽度,以便更好地呈现数据的分布规律。
通常情况下,数据区间的宽度应该尽量相同,这样才能使直方图更加准确地显示数据的分布情况。
3. 坐标轴和标题直方图通常由横轴、纵轴和标题组成。
横轴表示数据的区间范围,纵轴表示数据的频率或频数,而标题则说明直方图所表示的数据集名称或相关信息。
正确设置坐标轴和标题对于理解直方图所要传达的信息非常重要,因此在绘制直方图时,我们需要注重这些构成要素的设置。
二、直方图的绘制方法1. 确定数据区间在绘制直方图前,我们首先要确定数据的区间范围。
通常情况下,我们需要根据数据的分布情况选择合适的区间宽度,然后确定各个数据区间的范围。
在确定数据区间时,我们需要确保每个区间的宽度尽量相同,以便更好地呈现数据的分布规律。
2. 绘制长方形绘制直方图时,我们需要根据数据的频率或频数来确定每个长方形的高度。
一般来说,长方形的高度代表相应数据的频率或频数,而长方形的宽度则代表数据的区间范围。
在绘制长方形时,我们需要确保相邻的长方形之间没有空隙,以便更好地显示数据的分布情况。
学而思高中完整讲义:直线与圆锥曲线.板块一.直线与椭圆(1).学生版一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同.随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N的总体中抽取容量为n的样本,如果总体容量能被样本容量整除,设Nkn=,先对总体进行编号,号码从1到N,再从数字1到k中随机抽取一个数s作为起始数,然后顺次抽取第2(1)s k s k s n k+++-,,,个数,这样就得到容量为n的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N是有限的.⑵简单随机样本数n小于等于样本总体的个数N.⑶简单随机样本是从总体中逐个抽取的.⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N恰好是样本容量n的整数倍时,取Nkn =;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍然相等,为Nn.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;知识内容②决定组距与组数:取组距,用极差组距决定组数; ③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律. 三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出. 四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=,样本标准差(n x x s ++-=简化公式:22222121[()]n s x x x nx n=+++-.五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系. 2.散点图:将样本中的n 个数据点()(12)i i x y i n =,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设.5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥. 22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:如果有调查得来的四个数据111221224个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验. 六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y y i n -=,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点.记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法. 用最小二乘法求回归系数a b ,有如下的公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxyb xx xn x ====---==--∑∑∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b 分别为a ,b 的估计值,ˆa称为回归截距,b 称为回归系数,ˆy 称为回归值. 5.相关系数:6.相关系数r 的性质: ⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析. ②回归系数的推导过程:22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxy x x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 频率分布直方图 【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 . 【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 . 【例6】 (2009福建3)组别 (]010,(]1020, (]2030, (]3040, (]4050, (]5060, (]6070,频数1213 24 15 16 13 7(]A .0.13 B .0.39 C .0.52 D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名典例分析学生这一天平均每人的课外阅读时间为( ) A .0.6h B .0.9h C .1.0h D .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( ) A .200 B .600 C .500 D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )A .[610),的频率为0.32B .若样本容量为100,则[1014),的频数为40C .若样本容量为100,则(10]-∞,的频数为40D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位.⑴求m ;⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?)如下:⑴ 作出频率分布表; ⑵ 画出频率分布直方图.【例16】 (2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下: ⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm 之间的概率; ⑶从样本中身高在165~180cm 之间的女生..中任选2人,求至少有1人身高在170~180cm 之间的概率.【例17】 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm ).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】 为的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5. ⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内?⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题: ⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】某地区为了了解70~80岁老人的日平均睡眠时间(单位:h).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.=代替),则输出的S的值是.。
《直方图》教案
(教学目标)
掌握频数分布直方图和频数折线图的画法,并能用频数分布直方图解释数据中蕴含的信息, 进一步体会统计图表在描述数据中的作用.
(重点难点)
画频数分布直方图是重点;
解释数据中蕴含的信息是难点.
(教学过程)
一、复习导入
上节课我们学习了画频数分布图,回忆一下,画频数分布直方图有哪些步骤?怎样确龙组距和组数?
二、例题
看下而的例子:
为了考察某种大麦穗长的分布情况,在一块试验出时抽取了100个麦穗,疑得它们的长度如下表(单位:cm ):
列出样本的频数分布表,画岀频数分布直方图.
解:
1、计算最大值与最小值的差是多少?
最大值一最小值的差:7.4—4.0=3.4 (cm)
2、决左组距和组数
组距取多少时组数合适?
3 4 1
取组距0.3 cm,那么- = 11-,可分成12组,组数合适.
0.3 3
3、列频数分布表
4、画频数分布直方图
仔细观察上面的表和图,这组数据的分布规律是怎样的?
麦穗长度大部分落在5.2 cm至7.0 cm之间,英他区域较少•长度在5.8Sv<6.1范国内的麦穗个数最多,有28 个,长度在 4.gV4・3, 4.3<v<4.6, 4.6<v<4.9, 7.0<r<73, 7.39<7・6 范围内的麦穗个数很少,总共只有7个.
三、课堂练习
练习:(1)你认为组距是多少比较合适?为什么?
5组,因为100个数据以内可以分5〜12组,这里有48个数据,分5组或6组比较合适.
(2)画出直方图.。
经济数学基础第8章数据处理
第二单元直方图
一、学习目标
了解用直方图的方法处理数据.
二、内容讲解
当数据很多的时候,如何来处理数据?这包括两个方面的问题:从一个角度来说,若数据很多,计算数据的平均数和方差是很麻烦的,或者说不必要计算精确的特征数;第二个问方面,我们不满足计算数据的特征数,我们还要知道数据的全貌.
这就是频数分布标和频数直方图要解决的问题。
先看一个例子.
如果数据很多,如何了解它的分布?先讲一个例子.
例某食品厂用自动打包机包装食盐,为了解机器的生产状况,现抽取120袋食盐测试重量,具体数值如下:
经济数学基础 第8章 数据处理
第1步:确定全部数据所在的范围.
第2步:分组,确定组距和组限。
每组数据的组上限与组下限之差称为组距,即组距=组上限 - 组下限.
第3步:唱票,数出落在每组中的数据个数,这个数据个数称为组频数. 第4步:计算每组的组中值和组频率
各组的组频数与总频数之比n i
ν,称为该组的组频率
组上限与组下限的均值称为组中值,即组中值=组下限组上限
2+
这样,就得到数据的频数分布表: 频数分布表
第5步建立坐标系,画出直方图。
用数据作横轴,用频数作纵轴. 通过上面的例子,归纳列频数分布表、画频数直方图的步骤:
经济数学基础第8章数据处理
①找出数据中的最小值和最大值,确定数据所在的区间 (a,b);
②把(a,b)分组;
③计算组频数;
④计算组中值和组频率;
⑤建立坐标系,画出频数直方图.
大家可以看到,频数直方图既可以直观、简便地反映数据的全貌,又可以计算我们所需要的数据的特征数,大家可以想一想,我们也可以用频率来反映数据的全貌,这就是频率直方图.频率直方图是用数据作横轴、频率/组距作纵轴画出的直方图.
我们再看原来的例子:计算频率/组距的值填入表中:
以组距为底,以频率/组距为高画小矩形,从而画出频率直方图.
频率直方图
·以数据为横轴
·以频率/组距为纵轴
频率直方图中的小矩形的面积就等于有百分之多少的数据落在该区间内,整个直方图的面积总和应等于1.
三、例题讲解
例题有15个数据
经济数学基础 第8章 数据处理
101 114 106 118 108
117 111 114 110 104
114 108 107 113 114
(1)列出频数分布表,并画出频数直方图; (2)计算均值和方差.
解:这组数据中的最小值是101,最大值是118,确定区间为(100,120),分4组,组距=5,列表:
画出直方图.
计算特征数
利用频数分布表可以得到近似计算均值、方差的简便方法:
27.05.10713.05.102⨯+⨯≈x 13.05.11747.05.112⨯+⨯+=110.5
=2s (102.5-110.5)2×0.13+(107.5-110.5)2×0.27+(112.5-
110.5)2×0.47+(117.5-110.5)2×0.13=19
四、课堂练习
经济数学基础第8章数据处理下表是某城市30年(1967年~1996年〕的年降水量的资料(mm).将表中的数据分成5组,取a=770.0,b=1510.0.列出这些数据的频数分布表,画出频数直
方图和频率直方图,并计算均值和方差.
作频数分布表时,首先要确定数据所在的范围;其次分组,确定组距和组限;然后数出组频数;
最后计算每组的组中值和组频率,将它们分别填入表内,就得到频数分布表.
画频数直方图和频率直方图时,要注意小矩形的底都是组距,高分别是组频数和组频率/组距(而不是组频率). a,b的确定要保证所有的数据都落在[a,b]内,且分组后最小值应落在第1
组内,最大值应落在最后一组内. 找出数据中的最大值和最小值,最大值是1508.7,最小值
是772.3,a取略小于772.3的770,b取略大于1508.7的1510.0.这样所有数据都落在[a,b]内
了.B),C)都不能使所有的数据落在其中,D) 的范围太大了,分组后,第1组可能会没有值,
因此只有A)合适
五、课后作业
调查某企业100名职工的月收入(单位:元),具体数据见下表。
试就这100个数据
(1)列出频数分布表;
(2)作出频数直方图;
(3)作出频率直方图;
(4)近似计算均值、方差和标准差.
经济数学基础第8章数据处理
分10组,a=450,b=1200, 列频数分布表如下。