概率统计讲课稿第七章(第一,二节)
- 格式:doc
- 大小:343.00 KB
- 文档页数:19
第七章统计量及其分布数理统计学的任务在实际问题中,经常遇到要确定一个随机变量的概率分布或它的某些数字特征。
例确定某厂年生产灯泡的次品率。
灯泡的质量通常用寿命这个指标来衡量,若规定,寿命低于1000小时者为次品,那么确定该厂生产灯泡的次品率可以归结为求灯泡的寿命x这个随机变量的分布函数F(x),因为若F(x)已知,则X(FP=<就是所要确定()10001000)的次品率。
如何确定灯泡寿命x的分布函数呢?一个很自然的想法是:把每个灯泡的寿命都测试出来,根据测试的结果,就可以确定x的分布函数。
然而这种做法在实际中是不可行的,因为灯泡的寿命试验具有破坏性,一旦我们获得所有灯泡的寿命数据,这些灯泡也就全部报废了。
因此,在灯泡寿命试验中,一般只能从整批灯泡中选取若干个来进行测试,这样就产生一个问题,如何从试验所得的部分数据推断整批灯泡的寿命x的分布函数呢?例确定某半导体厂生产的三极管的电流放大倍数X的平均值。
这个问题就是确定X的数字特征E(X)。
此时,测试三极管电流放大倍数虽不会遇到上例中的破坏性问题,但想通过逐个测试来计算算术平均值求得E(X)也是不可取的,因为逐个测试需要耗费大量的人力、物力和时间。
因此,在实际工作中,也只能对其中一部分三极管进行测试。
这样又产生与上例相类似的问题,即如何从试验所得到的部分数据来推断三极管电流放大倍数的平均值呢?从以上两例可以看到,在实际问题中经常需要通过试验所得的部分(或局部)数据来推断整体的种种性质(如分布、数字特征等)。
怎样进行合理的推断呢?这就是数理统计所要解决的主要任务。
由于这种从局部观察去推断整体的方法有着普遍的意义,因此数理统计的方法应用非常广泛,目前已应用于教育科学、工程技术、管理科学、自然科学以及社会科学等领域。
例如,教育科学中的教学质量评估、预测以及试卷质量的评价,工业生产中的产品质量控制于抽样检查,气象学中的天气预报,地震学中地震预报,医学中的疾病分析、药品疗效检验,农业生产中的产品估计于种子优选,人口学中的优生学和人口控制等等都渗透了数理统计的方法。
第一节总体与样本在概率论部分,我们初步研究了随机事件的概率、随机变量及其分布。
在实际问题中,随机现象可以用随机变量来描述。
为了较全面的了解随机变量的规律性,就必须知道它的概率分布,或至少要知道它的一些数字特征,如数学期望、方差等。
用什么方法才能确定出这个随机变量的概率分布或数字特征呢?这是我们十分关心的问题,也是我们所要着眼解决的问题。
由于大量的随机实验必能呈现出随机现象的规律性,因此从理论上说,只要对随机现象进行足够多次的观察,它的规律一定能清楚的呈现出来。
但在实际中,我们只能对随机现象进行有限次的观察或实验,以取得有代表性的观察数据,再对这些数据进行分析,从而找出相应的随机变量的概率分布或数字特征。
一、总体与个体概念:在一个统计问题中,我们把研究对象的全体称为总体,而把组成总体的每一个单元称为个体。
(如同集合与元素的概念)。
总体通常用}{eS=Ω或用}={ω表示。
例如,我们要研究某批灯泡的平均寿命(平均耐用实数)时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体。
在研究某钢铁厂某一天生产的10000根钢筋的强度时,这10000根钢筋就组成一个总体,而每一根钢筋就组成一个个体。
在实际中,我们主要关心的常常是研究对象的某个数据指标)(ωX X =(如灯泡的寿命,钢筋的强度),它是一个随机变量。
例如,总体}{ω=Ω表示参加高考的全体考生,)(ωX X =表示考生ω的高考总分数,因此,ω与数量)(ωX 有对应关系。
各种需要转化为考察分数集}|)({Ω∈ωωX .总体}{ω=Ω的某数量指标)(ωX X =,随机变量X 取值的全体}|)({Ω∈ωωX ,从而研究总体的数量指标,只要研究随机变量X 或X 取值的全体}|)({Ω∈ωωX 。
因此,总体通常是指某个随机变量取值的全体,其中每一个体都是一个实数。
以后我们就把总体和数量指标X 可能取值的全体组成的集合等同起来。
随机变量X 的分布就是总体的分布。
总体就是指随机变量X 或X 的取值集合。
二、 样本与样本值数理统计学中我们总是通过观 测和试验以取得信息.我们可从客观存在的总体(母体)中按机会均等的原则随机地抽取一些个体,然后对这些个体进行观测或测试某一指标X 的数值.这种按机会均等的原则选取一些个体进行观测或测试的过程称为随机抽样.从一个总体X 中(它是数值集合}|)({Ω∈ωωX ),随机的抽取n 个个体(有放回的重复的抽样) nn x X x X x X =⋅⋅⋅==)(,,)(,)(2211ωωω, 其中每个ix 是一次抽样观察(记录)值结果。
我们称n x x x ,,,21⋅⋅⋅为总体X 的一组样本观察值,对于某一次抽样结果来说,它是完全确定的一组数。
但由于抽样的随机性,所以它又是随每次抽样观察而改变的。
记),,,(21n ωωωω⋅⋅⋅=→, 令 i i i x X X ==→)()(ωω n i ,,2,1⋅⋅⋅=, 则n X X X ,,,21⋅⋅⋅都是随机变量; 这样每个i x 都可以看作随机变量i X (n i ,,2,1⋅⋅⋅=)所取的观察值。
我们将n X X X ,,,21⋅⋅⋅称为总体X 的样本,样本中个体的数目n 称为样本容量,n x x x ,,,21⋅⋅⋅就是样本n X X X ,,,21⋅⋅⋅的一组观察值,称为样本值。
由于每次抽取是独立重复的(或可以这样认为),所以n X X X ,,,21⋅⋅⋅是相互独立的随机变量,i X 与总体X 有相同的分布.我们把nX X X ,,,21⋅⋅⋅所有可能取值的全体称为样本空间。
由于我们抽取样本的目的是为了对总体X 的某些特性进行估计、推断,因而要求抽取的样本具有:(1)独立性,(2)与总体X 有相同的分布,这样的样本称为简单随机本,获得简单随机样本的方法称为简单随机抽样。
进行重复抽样所得的随机样本,就是简单随机本.今后,如不作特殊声明,所提到的样本都是简单随机样本。
综上所述,所谓总体就是一个随机变量X ,所谓样本就是n 个相互独立且与X 有相同分布的随机变量n X X X ,,,21⋅⋅⋅。
显然,若总体X 具有分布函数)(x F ,设n X X X ,,,21⋅⋅⋅为来自于总体X 的样本,则n X X X ,,,21⋅⋅⋅相互独立, i X 的分布函数)(}{}{)(i i i i i X x F x X P x X P x F i =≤=≤=, ),,,(21nX X X ⋅⋅⋅的分布函数为 )(),,,(121∏==⋅⋅⋅ni i n x F x x x F .例如,设总体X 服从参数为λ的指数分布,⎩⎨⎧≤>-=-0,00,1)(x x e x F x λ ; nX X X ,,,21⋅⋅⋅为来自于总体X 的样本,则),,,(21nX X X ⋅⋅⋅的分布函数为 )(),,,(121∏==⋅⋅⋅ni i n x F x x x F ⎪⎩⎪⎨⎧>⋅⋅⋅>-=∏=-其它,00,,0),1(11n i n x x x e i λ .第二节 样本矩和统计量(对样本的简单加工、以提取信息)一、 样本矩在考查总体信息时,从总体中的到的样本值nx x x ,,,21⋅⋅⋅,是一堆杂乱无章的数据,需要对其研究加工,才能提取出有用的总体信息。
一般的作法是首先对样本进行简单的加工。
设nX X X ,,,21⋅⋅⋅为来自于总体X 的一个样本,称 ∑==ni iX n X 11, (7.1) 为样本均值;212)(11X X n S ini --=∑= , (7.2) 为样本方差;∑==n i kik X n A 11 为样本k 阶矩(或k 阶原点矩);kini k X X n B )(11-=∑= 为样本k 阶中心矩。
显然,样本均值,样本方差,样本k 阶矩,样本k 阶中心矩都是随机变量。
如果n x x x ,,,21⋅⋅⋅是样本nX X X ,,,21⋅⋅⋅的一组观察值(称为样本值),则∑==ni ix n x 11, 212)(11x x n s ini --=∑= , ∑==n i kik x n a 11 , kini k x x n b )(11-=∑=, 分别是X ,2S ,k A ,k B 的观察值。
总体矩:kk kk EX X E EX EX )(,,-===νμμ等称为总体矩。
人们也许会问:样本矩与相应的总体矩有什么关系?可以证明,只要总体的k 阶矩存在,样本k 阶矩依概率收敛于总体的k 阶矩。
例如 )(,∞→−→−n A k P k μ .二、统计量在研究总体的性质时,除了用到样本外,还要用到由样本构造的某种函数。
为了通过样本来了解总体,我们必须对样本进行加工,以提取其中有益的信息。
所谓对样本进行加工,就是针对不同的统计问题构造一个不含未知参数的样本的连续函数,这样的函数在数理统计学中称为统计量。
定义1 设n X X X ,,,21⋅⋅⋅为总体的一个样本,12(,,,)n G y y y ⋅⋅⋅为一个连续函数,则称样本的函数12(,,,)n G X X X ⋅⋅⋅为一个统计量。
显然,12(,,,)n G X X X ⋅⋅⋅是一个随机变量。
如果n x x x ,,,21⋅⋅⋅是样本nX X X ,,,21⋅⋅⋅的观察值(称为样本值), 则12(,,,)n G x x x ⋅⋅⋅是12(,,,)n G X X X ⋅⋅⋅的观察值。
例如∑==ni iX n X 11,211n i i X n =∑是统计量。
若总体),(~2σμN X ,其中2,μσ是未知参数,而nX X X ,,,21⋅⋅⋅为来自X 的样本,则∑==n i i X n X 11,212)(11X X n S i ni --=∑=是统计量。
而X μσ-,211()n i i X n μ=-∑不是统计量。
二、 顺序统计量与经验分布函数设n X X X ,,,21⋅⋅⋅为来自于总体X 的一个样本,n x x x ,,,21⋅⋅⋅(可以有相等的)是样本观察值。
将观察值按大小次序排列,得到 *1x ≤*2x ⋅⋅⋅≤≤*n x 。
我们规定*k X 取值为*k x ,由此得到的**2*1,,,n X X X ⋅⋅⋅, 称为n X X X ,,,21⋅⋅⋅的一组顺序统计量。
显然,有**2*1nX X X ≤⋅⋅⋅≤≤ 且 i n i X X ≤≤=1*1min , in i n X X ≤≤=1*max .令)(i i X x ω=,),,,(21nωωωω⋅⋅⋅=→, 记函数⎪⎪⎪⎩⎪⎪⎪⎨⎧≥-⋅⋅⋅=<≤<≤<==+→**1**2*1*1,1)1,,1(,,1,0),()(n k kn n x x n k x x x n k x x x n x x x F x F ω显然,)(x F n 是一非减右连续函数,且满足,0)(=-∞n F 和1)(=+∞n F , 由此可见,)(x F n是一个分布函数, 称它为总体X 的经验分布函数或样本分布函数。