第五节数理统计的基础知识
- 格式:doc
- 大小:1.15 MB
- 文档页数:17
数理统计主要知识点数理统计是统计学的重要分支,旨在通过对概率论和数学方法的研究和应用,解决实际问题上的不确定性和随机性。
本文将介绍数理统计中的主要知识点,包括概率分布、参数估计、假设检验和回归分析。
一、概率分布概率分布是数理统计的基础。
它描述了一个随机变量所有可能的取值及其对应的概率。
常见的概率分布包括:1. 均匀分布:假设一个随机变量在某一区间内取值的概率是相等的,则该随机变量服从均匀分布。
2. 正态分布:正态分布是最常见的连续型概率分布,其概率密度函数呈钟形曲线,具有均值和标准差两个参数。
3. 泊松分布:泊松分布描述了在一定时间内发生某个事件的次数的概率分布,例如在一天内发生交通事故的次数。
4. 二项分布:二项分布描述了进行一系列独立实验,每次实验成功的概率为p时,实验成功的次数在n次内取特定值的概率。
二、参数估计参数估计是根据样本数据来推断随机变量的参数值。
常见的参数估计方法包括:1. 最大似然估计:假设数据服从某种分布,最大似然估计方法寻找最能“解释”数据的那个分布,计算出分布的参数值。
2. 矩估计:矩估计方法利用样本矩来估计分布的参数值,例如用样本均值估计正态分布的均值,样本方差估计正态分布的方差。
三、假设检验假设检验是为了判断一个统计假设是否成立而进行的一种统计方法。
它包括假设、检验统计量和显著性水平三个重要概念。
1. 假设:假设指的是要进行验证的观察结果,分为零假设和备择假设两种。
2. 检验统计量:检验统计量是为了检验零假设而构造的统计量,其值代表目标样本符合零假设的程度。
3. 显著性水平:显著性水平是用来决定是否拒绝零假设的标准,通常为0.01或0.05。
四、回归分析回归分析是用来研究和描述两个或多个变量之间关系的统计方法。
它可以帮助人们了解因果关系,做出预测和控制因素的效果。
1. 简单线性回归:简单线性回归是一种简单的回归分析方法,它描述一个因变量和一个自变量之间的线性关系。
2. 多元线性回归:多元线性回归描述多个自变量和一个因变量之间的关系,通过多元回归模型可以找到最佳的回归系数,从而用来预测未来的结果。
数理统计基础数理统计是统计学中的一个重要分支,它不仅是现代科学研究的必备工具,更是经济、金融、医学、社会科学等领域的重要基础。
本文将从基础概念、数据的搜集与整理、概率分布及其统计推断、参数估计与假设检验等方面,简要介绍数理统计的基本概念和理论。
一、基础概念1.总体和样本总体指我们需要研究的全体对象,样本则是从总体中选出的一部分对象。
为了使样本更具有代表性,我们需要采用随机抽样的方法。
总体和样本的关系是,样本是从总体中抽出的一部分,通过对样本的研究可以得到对总体的推断。
2.统计量和参数统计量是样本数据的函数,参数是总体分布的特征数值。
例如样本均值是样本数据的函数,而总体均值是总体分布的特征数值。
统计量可以用来描述样本的分布情况,帮助我们对总体进行推断。
3.分位数和分位点分位数是在数值序列中把一个样本分割为几个等份的数值,分位点则是将整个样本分成若干等份的点。
例如,中位数是50%分位数,将样本分为两个等份。
分位数和分位点是描述样本分布特征的指标。
二、数据的搜集与整理数据的搜集与整理是数理统计的重要前提。
在数据搜集时,需要注意样本的代表性、随机性和可比性。
在数据整理时,需要进行数据清洗,包括误差校正、缺失数据的填补等。
整理出清晰、准确、有意义的数据,是进行统计分析的基础。
三、概率分布及其统计推断在统计分析中,分布是一个关键概念。
常见的分布有正态分布、泊松分布等。
概率密度函数是描述分布特征的函数,可以用于对总体和样本进行分析和描述。
概率分布的统计推断包括参数估计和假设检验两个重要方面。
1.参数估计参数估计是指根据已知的样本数据,推断总体分布的参数。
这里介绍两种参数估计方法:最大似然估计法:在总体分布已知的情况下,利用样本数据进行最大似然估计。
最大似然估计是一种广泛应用于统计学中的方法,可以得到比较准确的参数估计。
贝叶斯方法:在总体分布未知的情况下,利用概率论的贝叶斯公式计算后验分布并进行参数估计。
贝叶斯方法面对的是更加复杂的情形,但能够在一定程度上处理不确定性。
10 06 数理统计的基本概念知识网络图正态总体下的四大分布统计量样本函数样本个体总体数理统计的基本概念→⎪⎪⎪⎭⎪⎪⎪⎬⎫⎪⎪⎪⎩⎪⎪⎪⎨⎧主要内容一、样本我们把从总体中抽取的部分样品n x x x ,,,21Λ称为样本。
样本中所含的样品数称为样本容量,一般用n 表示。
在一般情况下,总是把样本看成是n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。
在泛指任一次抽取的结果时,n x x x ,,,21Λ表示n 个随机变量(样本);在具体的一次抽取之后,n x x x ,,,21Λ表示n 个具体的数值(样本值)。
我们称之为样本的两重性。
二、.统计量1.定义:称不含未知参数的样本的函数),,,(21n X X X f Λ为统计量2.常用统计量样本均值 .11∑==ni i x n x 样本方差∑=--=n i i x x n S 122.)(11 样本标准差 .)(1112∑=--=ni i x x n S 样本k 阶原点矩∑===n i k i k k x n A 1.,2,1,1Λ 样本k 阶中心矩∑==-=ni k i k k x x n B 1.,3,2,)(1Λ μ=)(X E ,n X D 2)(σ=,22)(σ=S E ,221)(σnn B E -=, 其中∑=-=ni i X X n B 122)(1,为二阶中心矩。
三、抽样分布1.常用统计量分布(1)设n X X X ,,,21Λ是相互独立的随机变量,且均服从与标准正态分布)1,0(N ,则222212n n X X X X Λ++=,服从自由度为n 的-2χ分布,记为()n 2~χχ.(2)设()()n Y N X 2~,1,0~χ,且X 与Y 相互独立,则.n YXT =服从自由度为n 的-t 分布,记为()n t T ~.(3)设X 与Y 相互独立,分别服从自由度为1n 和2n 的-2χ分布,则1221n n Y X n Y n XF ⋅==。
第五章 样本及抽样分布从本章开始, 我们将讲述数理统计的基本内容. 数理统计作为一门学科诞生于19世纪末20世纪初, 是具有广泛应用的一个数学分支, 它以概率论为基础, 根据试验或观察得到的数据, 来研究随机现象, 以便对研究对象的客观规律性作出合理的估计和判断.由于大量随机现象必然呈现出它的规律性, 故理论上只要对随机现象进行足够多次观察, 则研究对象的规律性就一定能清楚地呈现出来, 但实际上人们常常无法对所研究的对象的全体(或总体) 进行观察, 而只能抽取其中的部分(或样本) 进行观察或试验以获得有限的数据.数理统计的任务包括: 怎样有效地收集、整理有限的数据资料; 怎样对所得的数据资料进行分析、研究, 从而对研究对象的性质、特点, 作出合理的推断, 此即所谓的统计推断问题, 本课程主要讲述统计推断的基本内容.第一节 数理统计的基本概念内容分布图示★ 引言 ★ 总体与总体分布 ★ 样本与样本分布 ★ 例1★ 例2 ★ 例3 ★ 例4★ 统计推断问题简述★ 分组数据统计表和频率直方图 ★ 例5 ★ 经验分布函数 ★ 例6★ 统计量 ★ 样本的数字特征★ 例7 ★ 例8 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题5-1 ★ 返回内容要点:一、总体与总体分布总体是具有一定共性的研究对象的全体, 其大小与范围随具体研究与考察的目的而确定. 例如, 考察某大学一年级新生的体重情况, 则该校一年级全体新生就构成了待研究的总体. 总体确定后, 我们称总体的每一个可观察值为个体. 如前述总体(一年级新生) 中的每一个个体即为每个新生的体重. 总体中所包含的个体的个数称为总体的容量. 容量为有限的称为有限总体, 容量为无限的称为无限总体.数理统计中所关心的并非每个个体的所有性质, 而仅仅是它的某一项或某几项数量指标. 如前述总体(一年级新生)中, 我们关心的是个体的体重, 进而也可考察该总体中每个个体的身高和数学高考成绩等数量指标.总体中的每一个个体是随机试验的一个观察值, 故它是某一随机变量X 的值,于是, 一个总体对应于一个随机变量X , 对总体的研究就相当于对一个随机变量X 的研究, X 的分布就称为总体的分布函数, 今后将不区分总体与相应的随机变量, 并引入如下定义:定义 统计学中称随机变量(或向量)X 为总体, 并把随机变量(或向量)的分布称为总体分布.注(i) 有时个体的特性很难用数量指标直接描述, 但总可以将其数量化,如检验某学校全体学生的血型, 试验的结果有O 型、A 型、B 型、AB 型4种, 若分别以1,2,3,4依次记这4种血型,则试验的结果就可以用数量来表示了;(ii) 总体的分布一般来说是未知的, 有时即使知道其分布的类型(如正态分布、二项分布等),但不知这些分布中所含的参数等(如p ,,2σμ等).数理统计的任务就是根据总体中部分个体的数据资料对总体的未知分布进行统计推断.二、样本与样本分布由于作为统计研究对象的总体分布一般来说是未知的,为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干个体进行观察,通过观察可得到关于总体X 的一组数值),,,(21n x x x Λ,其中每一i x 是从总体中抽取的某一个体的数量指标i X 的观察值.上述抽取过程为抽样,所抽取的部分个体称为样本.样本中所含个体数目称为样本的容量.为对总体进行合理的统计推断,我们还需在相同的条件下进行多次重复的、独立的抽样观察,故样本是一个随机变量(或向量).容量为n 的样本可视为n 维随机向量),,,(21n X X X Λ,一旦具体取定一组样本,便得到样本的一次具体的观察值),,,(21n x x x Λ,称其为样本值.全体样本值组成的集合称为样本空间.为了使抽取的样本能很好地反映总体的信息, 必须考虑抽样方法,最常用的一种抽样方法称为简单随机抽样, 它要求抽取的样本满足下面两个条件:1. 代表性: n X X X ,,,21Λ与所考察的总体具有相同的分布;2. 独立性: n X X X ,,,21Λ是相互独立的随机变量.由简单随机抽样得到的样本称为简单随机样本, 它可用与总体独立同分布的n 个相互独立的随机变量n X X X ,,,21Λ表示. 显然, 简单随机样本是一种非常理想化的样本, 在实际应用中要获得严格意义下的简单随机样本并不容易.对有限总体, 若采用有放回抽样就能得到简单随机样本,但有放回抽样使用起来不方便, 故实际操作中通常采用的是无放回抽样, 当所考察的总体很大时, 无放回抽样与有放回抽样的区别很小, 此时可近似把无放回抽所得到的样本看成是一个简单随机样本. 对无限总体, 因抽取一个个体不影响它的分布, 故采用无放回抽样即可得到的一个简单随机样本.注: 今后假定所考虑的样本均为简单随机样本, 简称为样本.设总体X 的分布函数为)(x F ,则简单随机样本),,,(21n X X X Λ的联合分布函数为∏==ni i n x F x x x F 121)(),,,(Λ并称其为样本分布.特别地, 若总体X 为连续型随机变量,其概率密度为)(x f ,则样本的概率密度为∏==ni i n x f x x x f 121)(),,,(Λ分别称)(x f 与),,,(21n x x x f Λ为总体密度与样本密度.若总体X 为离散型随机变量,其概率分布为}{)(i i x X P x p ==, x 取遍X 所有可能取值, 则样本的概率分布为,)(},,,{),,,(12121∏======ni i n n x p x X x X x X p x x x p ΛΛ分别称)(i x p 与),,,(21n x x x p Λ为离散总体密度与离散样本密度.三、统计推断问题简述总体和样本是数理统计中的两个基本概念. 样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数). 另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言). 我们称通过总体X 的一个样本n X X X ,,,21Λ对总体X 的分布进行推断的问题为统计推断问题.总体、样本、样本值的关系:总体↙ ↖推断(个体)样本 → 样本值抽样在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包含着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.为对总体进行统计推断, 还需借助样本构造一些合适的统计量, 即样本的函数, 下面将对相关统计量进行深入的讨论.四、分组数据统计表和频数直方图 通过观察或试验得到的样本值,一般是杂乱无章的,需要进行整理才能从总体上呈现其统计规律性. 分组数据统计表或频率直方图是两种常用整理方法. 1. 分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等, 称区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少,则难以反映出分布的特征,若分组太多,则由于样本取值的随机性而使分布显得杂乱. 因此,分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数陈为该区间的组频数. 组频数与总的样本容量之比称为组频率.2. 频数直方图:频率直方图能直观地表示出频数的分布,其步骤如下: 设n x x x ,,,21Λ是样本的n 个观察值.(i) 求出n x x x ,,,21Λ中的最小者)1(x 和最大者)(n x ;(ii) 选取常数a (略小于)1(x )和b (略大于)(n x ),并将区间],[b a 等分成m 个小区间(一般取m 使nm 在101左右): mab t m i t t t i i -=∆=∆+,,,2,1),,[Λ, 一般情况下,小区间不包括右端点.(iii) 求出组频数i n ,组频率i i f nn ∆=,以及),,2,1(,n i tfh i i Λ=∆=(iv) 在),[t t t i i ∆+上以i h 为高,t ∆为宽作小矩形,其面积恰为i f ,所有小矩形合在一起就构成了频率直方图五、经验分布函数样本的直方图可以形象地描述总体的概率分布的大致形态,而经验分布函数则可以用来描述总体分布函数的大致形状。
第五章数理统计的基础知识在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。
知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。
在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。
但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。
例如:1、某种电子元件的寿命服从什么分布是完全不知道的。
2、检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,则服从(0-1)分布,但其中的参数p未知。
对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数。
数理统计要解决的首要问题就是:确定一个随机变量的分布或分布中的参数。
数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。
数理统计研究的内容非常广泛,可分为两大类:一是:怎样有效地收集、整理有限的数据资料。
二是:怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断—本书中参数估计和假设检验。
第一节数理统计的基本概念一、总体与总体的分布在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。
总体中所包含的个体的个数称为总体的容量.容量为有限的总体称为有限总体;容量为无限的总体称为无限总体. 总体和个体之间的关系就是集合与元素之间的关系.在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X。
例如:研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体。
但在实际问题中,我们仅仅关心灯泡的使用寿命(记X表示该批灯泡的寿命)。
则X就是我们研究的总体(所有灯泡寿命的集合),每一个灯泡的寿命就是一个个体。
再如:考查某一群体的身高和体重,则全体人员的(身高、体重)是总体,每个人的身高和体重是个体。
由此给出定义:总体:对所研究对象的某些指标进行试验,将试验的全部可能的观测值称为总体记为X。
个体:每一个可能的观测值称为个体。
对不同的个体,X的取值一般是不同的。
例如在试验中观察若干个个体就会得到X的一种数值,但在试验或观察之前,无法确定会得到一组什么样的数值,所以X是一个随机变量或随机向量,而X的分布也就完全描述了我们所关心的指标,即总体的分布。
为方便起见,以后我们将X的可能取值的全体组成的集合称为总体,或直接称随机变量X为总体,X的分布也就是总体的分布。
例如:正态总体:是指表示总体某个数量指标的随机变量服从正态分布。
【注1】总体的分布一般情况下是未知的,这就需要利用总体中部分个体的数据资料来对总体服从的分布进行检验—这是分布拟合检验(非参数检验)问题;有时即使知道总体所服从的分布,但分布中的参数未知,这也需利用利用总体中部分个体的数据资料来对总体服从的分布中的未知参数进行统计推断(参数估计)。
而这就需要从总体中抽取若干个体进行观察,从中获得研究总体的一些观察数据,然后通过这些数据的统计分析,对总体的分布进行判断或对总体的参数做出合理的估计。
而一般的方法是按照一定的原则从总体中抽取若干个体进行观察,这个过程称为随机抽样。
二、样本与样本的分布由于每个个体的观察结果具有随机性,因此可以将第i 次抽取的个体记为i X ,则为随机变量,为此引入以下概念。
1、样本:从一个总体X 中,随机的抽出n 个个体12,,,n X X X L ,通常记为),,,(21n X X X 这样取得的12,,,n X X X L 称为总体X 的一个样本。
样本所含的个体数目称为样本容量.【注2】:(1)由于每个i X 都是从总体X 中随机抽出的,因此是一个随机变量,而样本),,,(21n X X X 就是n 维的随机向量。
(2)在依次取n 个个体12,,,n X X X L 观测完毕后,得到n 个具体的数据),,,(21n x x x ,称为样本),,,(21n X X X 的观测值—样本值。
因此样本本身是随机向量,而一经抽取就是一组确定的数值,这就是所谓的样本两重性。
2、简单随机样本我们的目的是根据从总体中抽取的一个样本值),,,(21n x x x 对总体X 的分布或某些特征进行各种分析推断,所以要求抽取的样本能很好地反映总体的特性,为此我们要求随机抽取的样本),,,(21n X X X 满足:(1)具有代表性。
即样本的每个分量X i 与总体X 有相同的分布;(2)具有独立性。
即12,,,n X X X L 是相互独立的随机变量,也就是说,n 次观察值之间是互相独立的;满足上述两条的样本称为简单随机样本,今后如无特别说明,所说的样本均指简单随机样本。
在实际问题中,抽取简单随机样本的方法很简单: (1)放回抽样;(2)不放回抽样:有限总体,当样本容量远小于总体容量时,不放回近似代替放回; 无限总体,总是用不放回抽样.综合上述,给出明确的数学概念:定义一:一个随机变量X 或其相应的分布函数(分布律、密度函数)称为一个总体。
定义二:若随机向量12,,,n X X X L 是相互独立的随机变量且每个分量X i 与总体X 有相同的分布,则称12,,,n X X X L 是来自总体的容量为n 的简单随机样本。
简单随机样本的分布有如下性质:设总体X 的分布函数为()F x (称为总体分布函数),或密度函数()f x 或分布律(称为总体概率密度),则来自总体的样本),,,(21n X X X 的 联合分布函数:121(,...)()nn ii F x x x F x,称为样本分布函数联合密度函数:121(,...)()nn ii f x x x f x,称为连续样本密度函数联合分布律:1211221(,,)(,...)()nn n n ii p x x x P X x X x X x P X x L ,称为离散样本密度【例1】 总体X 服从参数为p 的(0-1)分布,{1},{0}1P X p P X p ,求),,,(21n X X X 的分布。
【解】由题意X 的分布律为1{}(1),(0,1)xxP X x p p x ,设12(,,,)n x x x L 为来自X 的简单随机样本值,则),,,(21n X X X 的联合概率分布为1111211221(,,)(,...)(1)(1)nniiiii i nx n x x x n n n i p x x x P X x X x X x p p ppL【例2】总体X 服从2(,)N ,求样本),,,(21n X X X 的联合密度函数.【解】设12(,,,)n x x x L 为来自X 的简单随机样本值,则),,,(21n X X X 的联合概率分布为221221111(,,,)()]exp{()}22nnn i n ii i x f x x x x L 三、统计推断问题简述总体和样本是数理统计中的两个基本概念. 样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数). 另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言). 我们称通过总体X 的一个样本n X X X ,,,21 对总体X 的分布进行推断的问题为统计推断问题.总体、样本、样本值的关系:总体↙ ↖推断(个体)样本 → 样本值抽样在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包含着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.通过观察或试验得到的样本值,一般是杂乱无章的,例如: 例1样本的一些例子与观察值的表示方法:(1) 某食品厂用自动装罐机生产净重为345克的午餐肉罐头, 由于随机性, 每个罐头的净重都有差别. 现在从生产线上随机抽取10个罐头, 秤其净重, 得如下结果:344 336 345 342 340 338 344 343 344 343这是一个容量为10的样本的观察值, 它是来自该生产线罐头净重这一总体的一个样本的观察值.(2) 对363个零售商店调查周售额(单位:元)的结果如下:154211013561]30000,20000(]20000,10000(]10000,5000(]5000,1000(1000商店数零售额这是一个容量为363的样本的观察值, 对应的总体是所有零售店的周零售额. 不过这里没有给出每一个样本的具体的观察值, 而是给出了样本观察值所在的区间, 称为分组样本的观察值.这样一来当然会损失一些信息, 但是在样本量较大时, 这种经过整理的数据更能使人们对总体有一个大致的印象.通过该例可以看出,以上的两种样本值的表示方法,虽然能够反应出总体的一些大致的信息,但不够直观,判断不出总体服从什么分布。
为了对总体的分布有一个大致的判断,就需要对所获得的样本值进行整理,而分组数据统计表或频率直方图是两种常用整理方法.四、分组数据统计表和频率直方图1. 分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等, 称区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少,则难以反映出分布的特征,若分组太多,则由于样本取值的随机性而使分布显得杂乱. 因此,分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数称为该区间的组频数. 组频数与总的样本容量之比称为组频率.2. 频数直方图:设n X X X ,,,21 是总体X 的一个样本,又设总体具有概率密度f ,如何用样本来推断f ?注意到现在的样本是一组实数,因此,一个直观的办法是将实轴划分为若干小区间,记下诸观察值i X 落在每个小区间中的个数,根据大数定律中频率近似概率的原理,从这些个数来推断总体在每一小区间上的密度。
具体做法如下:设n x x x ,,,21 是样本的n 个观察值.(i) 求出n x x x ,,,21 中的最小者)1(x 和最大者)(n x ;(ii) 选取常数a (略小于)1(x )和b (略大于)(n x ),并将区间],[b a 等分成m 个小区间(一般取m 使nm在101左右): mab t m i t t t i i,,,2,1),,[ , 一般情况下,小区间不包括右端点.(iii) 求出组频数i n ,组频率i i f nn,以及),,2,1(,n i tfh i i(iv) 在),[t t t i i 上以i h 为高,t 为宽作小矩形,其面积恰为i f ,所有小矩形合在一起就构成了频率直方图频率直方图能够大体刻画总体的分布情况。