第六章 样本及抽样分布.
- 格式:doc
- 大小:229.50 KB
- 文档页数:9
样本及抽样分布§6.1 基本概念一、总体:在统计学中, 我们把所研究的全部元素组成的集合称作母体或总体, 总体中的每一个元素称为个体。
我们只研究感兴趣的某个或者几个指标(记为X),因此把这些指标的分布称为总体的分布,记为X~F(x)。
二、样本:设总体X具有分布函数F(x),若X1, X2,…,Xn是具有分布函数F(x)的相互独立的随机向量,则称其为总体F(或总体X )的简单随机样本, 简称样本,它们的观察值x1,x2, …, xn称为样本观察值, 又称为X 的n 个独立的观察值。
三、统计量:设X 1, X 2, …, X n 是来自总体X 的一个样本, g (X 1, X 2, …, X n )是一个与总体分布中未知参数无关的样本的连续函数,则称g (X 1,X 2,…,X n )为统计量。
统计量是样本的函数,它是一个随机变量,如果x 1, x 2, …, x n 是样本观察值, 则g (x 1, x 2, …, x n )是统计量g (X 1, X 2, …, X n )的一个观察值.四、 常用的统计量:, ,)(x 11s ,,x 1x 1. n12i2n1i 称为样本方差均值仍称为样本它们的观察值为∑∑==--==i i x n n .B ,,1,2,X A ,1k 2.22221S S nn B k ≈-====当样本容量很大时时当时当3.kkkk若总体X 的k 阶矩E(X )存在,则当n时, A .P注:ni i 111. X X ;n ==∑样本均值2n 2i i 112. S (X );n-1X ==-∑样本方差n kk i 113. k A X , k 1, 2,;n i ===∑样本阶原点矩nk i i 114. k B (X ) , k 2, 3,.n k X ==-=∑样本阶中心矩4.样本的联合分布:2) 若总体X 是离散型随机变量,其分布律为 p x =P (X=x ) , x=x 1,x 2,… 则样本X 1, X 2, …, X n 的联合分布:11112(,,)(),,;(1,2,,)nn n i i i i P X y X y P X y y x x i n =======∏其中12n *12i 13)(), ,X , (, ,)()n n i X f x X X f x x x f x ==∏若具有概率密度则的联合概率密度为12121211)(),,,,, ,,,:()()n n n*n i i X ~F x X X X F X X X F x , x ,x F x ==∏若为的一个样本则的联合分布函数为例1:X~U (0,θ),X 1, X 2, …, X n 是来自X 的样本,求(X 1, X 2, …, X n )的联合密度函数。
第六章样本及抽样分布【基本要求】1、理解总体、个体和样本的概念;2、理解样本均值、样本方差和样本矩的概念并会计算;3、理解统计量的概念,掌握几种常用统计量的分布及其结论;4、理解分位数的概念,会计算几种重要分布的分位数。
【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布,F分布;分位数的理解和计算。
【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。
【学时分配】4学时【授课内容】§6.0 前言前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。
它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。
所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。
其研究方法是归纳法(部分到整体)。
对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。
数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。
§6.1 随机样本一、总体与样本1.总体、个体在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。
例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。
但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。
在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。
在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。
第六章 样本及抽样分布1.[一] 在总体N (52,6.32)中随机抽一容量为36的样本,求样本均值X 落在50.8到53.8之间的概率。
解: 8293.0)78()712(}63.68.163.65263.62.1{}8.538.50{),363.6,52(~2=-Φ-Φ=<-<-=<<X P X P N X2.[二] 在总体N (12,4)中随机抽一容量为5的样本X 1,X 2,X 3,X 4,X 5. (1)求样本均值与总体平均值之差的绝对值大于1的概率。
(2)求概率P {max (X 1,X 2,X 3,X 4,X 5)>15}. (3)求概率P {min (X 1,X 2,X 3,X 4,X 5)>10}.解:(1)⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=>-25541225415412}112{|X P X P X P =2628.0)]25(1[2=Φ-(2)P {max (X 1,X 2,X 3,X 4,X 5)>15}=1-P {max (X 1,X 2,X 3,X 4,X 5)≤15}=.2923.0)]21215([1}15{1551=-Φ-=≤-∏=i i X P (3)P {min (X 1,X 2,X 3,X 4,X 5)<10}=1- P {min (X 1,X 2,X 3,X 4,X 5)≥10}=.5785.0)]1([1)]21210(1[1}10{15551=Φ-=-Φ--=≥-∏=i i X P 4.[四] 设X 1,X 2…,X 10为N (0,0.32)的一个样本,求}.44.1{1012>∑=i i X P解:)5(1.0}163.0{}44.1{),10(~3.0101221012221012查表=>=>∑∑∑===i ii ii iX P XP χX7.设X 1,X 2,…,X n 是来自泊松分布π (λ )的一个样本,X ,S 2分别为样本均值和样本方差,求E (X ), D (X ), E (S 2).解:由X ~π (λ )知E (X )= λ ,λ=)(X D∴E (X )=E (X )= λ, D (X )=.)()(,)(2λX D S E nλnX D ===[六] 设总体X~b (1,p),X 1,X 2,…,X n 是来自X 的样本。
第六章样本及抽样分布
§1总体与样本
从理论上讲,对随机变量进行大量的观测,被研究的随机变量的概率特征一定能显现出来,可是实际进行的观测次数只能是有限的,有时甚至是少量的。
因此,我们关心的问题就是怎样有效地利用收集到的有限的资料,尽可能地对被研究的随机变量的概率特征作出精确而可靠的结论.
我们把被研究的对象的全体称为总体(或母体),而把组成总体的各个元素称为个体。
代表总体的指标是一个随机变量,所以总体就是指某个随机变量可能取的值的全体。
从总体中抽取一个个体,就是对代表总体的随机变量进行一次试验(或观测),得到的一个试验数据(或观测值)。
从总体中抽取一部分个体,就是对随机变量进行若干次试验(观测)。
从总体中抽取若干个个体的过程称为抽样。
抽样结果得到的一组试验数据(观测值),称为样本(或子样);样本中所含个体的数量称为样本容量。
从总体中抽取样本,一般总是假设满足下述两个条件:
(1)随机性为了使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的机会被抽取到,通常可以用编号抽签的方法或利用随机数表来实现。
(2)独立性各次抽样必须是相互独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其它各次抽样结果的影响。
这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本。
例如,从总体中进行放回抽样,显然是简单随机抽样,得到的样本就是简单随机样本。
从有限总体(即其中只含有有限多个个体的总体)中,进行不放回抽样,虽然不是简单随机抽
样,但是若总体容量很大而样本容量较小(,则可以近似地看作是放回抽样,因而也就可以近似地看作是简单随机抽样,得到的样本可以近似地看作是简单随机样本。
今后,凡是提到抽样与样本,都是指简单随机抽样与简单随机样本。
从总体中抽取容量为n的样本,就是对代表总体的随机变量随机地、独立地进行n次试验(观测),每次试验的结果可以看作是一个随机变量,n次试验的结果就是n个随机变量。
这些随机变量相互独立,并且与总体服从相同的分布。
设得到的样本观测值分别是
,
则可以认为抽样的结果是n个相互独立的事件
发生了。
若将样本看作是一个维随机变量,则
(1 当总体是离散型随机变量,若记其分布律为,则样本
的分布律为
;
(2当总体是连续型随机变量,且具有概率密度函数时,样本的联合概
率密度为。
§3样本函数与统计量
为了通过对样本观测值的整理、分析、研究,对总体的某些概率特征作出推断,往往需要
考虑各种适用的样本函数。
因为一组样本可以看作是一个维随机变量,所以任何样本函数
都是维随机变量的函数,显然也是随机变量。
根据样本
的观测值计算得到的函数值就是样本函数的观
测值。
定义若样本函数中不含有任何未知参数,则称这类样本函数为统计量。
数理统计中最常用的统计量及其观测值有:
(1).样本均值
它的观测值记为
(2).样本方差
它的观测值记为
(3).样本标准差
它的观测值记为
(4).样本k 阶原点矩,,
它的观测值记为,
显然,样本的一阶原点矩就是样本均值。
(5).样本k阶中心矩,,
它的观测值记为,
显然,样本一阶中心矩恒等于零。
§4抽样分布
统计量的分布称为抽样分布。
本节介绍来自正态总体的几个常用统计量的分布。
一、三个重要分布
为了讨论正态总体下的抽样分布,先引入由正态分布导出的统计量中的三个重要分布,即分布,分布,分布。
1. 分布
设是来自总体的样本,则称统计量
服从自由度为的分布,记为。
分布的概率密度为
的图形如下:
分布的可加性
设,,并且,独立,则
分布的数学期望和方差
若,则有
,
分布的分位点
定义设有分布函数,对给定的,若有
则称点为的上分位点。
当有概率密度时,上式可写成
由上述定义得分布的上分位点为
2. 分布
设,,且独立,则称随机变量
服从自由度为的分布,记为。
分布又称为学生氏(student)分布。
分布的概率密度函数为
,
的图形关于对称,当充分大时,其图形类似于标准正态变量概率密度的图形。
分布的分位点
对于给定的,称满足条件
的点为分布的上分位点。
由分布上分位点的定义及图形的对称性知。
在时,对于常用的的值,就用正态近似:。
3.分布
设,,且独立,则称随机变量
服从自由度为的分布,记为。
的概率密度为
的图形
由定义可知,若,则。
( 18)
分布的分位点
对于给定的,称满足条件
的点为分布的上分位点。
容易证明等式:
二、正态总体统计量分布
假设是来自正态总体的样本,即它们是独立同分布的,皆服从
分布。
样本均值与样本方差分别是
,。
定理1设总体服从正态分布,则,即。
定理2设总体服从正态分布,则
(1)样本均值与样本方差相互独立;
(2)统计量服从自由度为的分布,即
【例1】吴书p.148.例1。
设是来自的样本,则统计量
【例2】吴书p.148.例2。
设是来自,是来自的两个独立样本,记
,,,
,,,
则统计量
【例3】吴书p.149.例3。
(续上例)记
,
则
注若两个正态分布的方差与不等,则统计量
本节所介绍的几个分布以及几个重要结论,在下面各章中都起着重要的作用。
应注意,它们都是在总体为正态这一基本假定下得到的。