- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二讲 基本概念
一、总体,样本和统计模型
二、统计量及其分布
一、总体、样本和统计模型
N。在N件产品中 例1 有一批产品,总数为
有N件次品,是这批产品的次品率。
是我们感兴趣的参数,通常是未知的,需 要利用统计方法对参数做出推断。
(Population)
总体:研究对象的全体, 如例1中的这批产 产品就构成总体。通常用 X ,Y 等表示。
称为参数空间。
(Parameter Space)
如例1中,总体分布族为{ P , } ,其中 N N N k n k P { X k } , N n max(( n N (1 ),0) k min( N , n), 其中X表示一次试验中抽取的 n件产品的
2
1 2 2 ( t ) exp{i t t } 正态分布 N ( , ) : 2
特征函数的性质:
(1)有界性 对任意 t R,有| (t ) | (0) 1。 (2)设Y aX b ,其中 a , b 为常数,则 Y (t ) e ibtX (at ) (3)若 X 与 Y 相互独立,则有 X Y (t ) X (t )Y (t )
X F Y n1 n2
所服从的分布为自由度是 n1 , n2 的 F 分布, 记为 F ~ F (n1 , n2 ).
正态总体下常见统计量的分布
2 X , X , , X 定理5 设 1 2 n 是来自正态总体 N ( , )
的一个简单样本, A 是 p n 阶矩阵,则
Y1 Y2 Y Y p X1 X2 2 T A N ( A 1 , AA ) ~ X n
( n) (4)若 E( X )存在,则 X (t )存在,且
n
E( X k ) i k ( k ) (0), k 1, 2,, n
(5)特征函数与分布函数相互唯一确定。
三大分布 2 分布
设随机变量 X1 , X 2 ,, X n 相互独立且同服从 标准正态分布N (0,1),称随机变量
标准正态分布N (0,1),又设
Q1 Q2 Qk X i2
k 1 n
其中Q j ( j 1,2,, k ) 是秩为 n j 的 ( X1 , X 2 ,, X n ) 非负定二次型,则 Q j ( j 1,2,, k )相互独立且 k 2 Q j ~ ( n j ) n j n.
其中xi 0或1,s x分布为 1 P ( X 1 x1 , X 2 x2 ,, X n xn | s ) , n s
定义2 设总体分布族为 {P , }, T ( X ) 是 统计量。 如果在给定 T ( X )=t 的条件下, X 的 条件分布与参数 无关,则称统计量T ( X ) 是 参数 的充分统计量(Sufficient Statistics) 一般情况下,利用条件分布证明统计量的 充分性是比较困难的。但存在证明充分性的 一个充分必要准则,这是下面的因子分解定 理(Factorization theorem)。
2. 充分统计量
统计量既然是对样本的加工或压缩,在这 个过程中可能有损失有关参数的一部分信息, 现在问题是在这个过程中是否存在某些统计 量,既起到压缩作用,又不损失参数的信息, 这样的统计量称为充分统计量。
例3 续例2 设样本的观察值为x1 , x2 ,, xn , 则样本的联合
分布函数为 s n s P ( X 1 x1 , X 2 x2 ,, X n xn ) (1 ) ,
(Sample Space)
样本空间:样本所有可能的取值构成的空间 在统计中,对总体的推断,实际上是推断
总体的分布,即确定总体的分布。为此,我 们可以根据对总体了解程度,假设总体的分 布属于某个分布族 { P , }, 至于其中哪一 个分布最适合还得通过统计推断来确定,因 此往往将 { P , } 称为总体分布族。其中
T(X ) 定理1 设总体分布族为 {P , },
是充分的,当且仅当存在一个定义在I
上的函数g( t , )及定义在R 上函数h( x )使得
n
p( x , ) g(T ( x ), )h( x )
对所有的x R 都成立,其中I是T ( x )的值域,
n
p( x, )是样本的联合概率密度 函数或分布率。
n1
n2
定理9 设 X1 , X2 ,, Xn 和Y1 ,Y2 ,,Yn 是分别来自
1 2
2 正态总体 N ( 1 ,12 )和 N ( 2 , 2 )的两个简单样本,
且两样本独立,则 2 2 S1 1 F 2 2 ~ F (n1 1, n2 1) S2 2
定理10(Cochran分解定理) 设随机变量 X1 , X 2 ,, X n 相互独立且同服从
其中 1 (1,1,,1)T
定理6 设 X1 , X 2 ,, X n 是来自正态总体 N ( , 2 )
的一个简单样本, 则 2 (1) X ~ N ( , ),
n
(2) X 与 S 2 相互独立; ( 3)
( n 1) S
2
2
2 ~ (n 1),
定理7 设 X1 , X 2 ,, X n 是来自正态总体 N ( , 2 ) 的一个简单样本, 则 ( X ) ~ t (n 1)
次品数。
{ : 0 1}为参数空间。
二、统计量及其分布
设总体分布族为P , ,我们仅知道 总体的分布属于此分布族, 但哪个最合适
还需经过统计推断。 推断总体的分布,实际 上就是确定参数 ,为此,需抽取样本。
样本来源于总体,它应当包含参数的所有
相关信息,但观察值呈现为一堆杂乱无章
个体:总体中的每个对象, 如例1中的每个 产品。
(Sample)
样本:X 1 , X 2 ,, X n , 样本的实现称为样本 的一组观察值(Observation or data), 记为 x1 , x2 ,, xn . 今后,为了方便若不加特别声明,用
x1 , x2 ,, xn既表示样本,又表示样本观察值。
的函数 T ( X 1 , X 2 ,, X n ) X i . T实际上表
i 1
n
示样本中所含的次品个数,对不同观察值
可能对应相同的T值,这样实际上是对样本 起到了加工或压缩的作用。
1. 统计量
定义1 设X 1 , X 2 ,, X n是来自总体X的一个样
本,T ( X 1 , X 2 ,, X n )是样本的函数。如果 T ( X 1 , X 2 ,, X n )不包含任何未知参数,则称
2 2
t 分布 2 设随机变量 X ~ N (0,1), Y ~ ( n), 且 X 与Y 相互独立,则称随机变量
X T Y n
所服从的分布为自由度是 n 的 t 分布, 记为 T ~ t ( n).
F 分布
设随机变量 X ~ 2 ( n1 ), Y ~ 2 ( n2 ), 且 X 与Y 相互独立,则称随机变量
n
定理3 设 X ~ ( n),则
2
(1)X 的特征函数为 (t ) Ee (2) E ( X ) n, D( X ) 2n
itX
(1 2it )
n 2
定理4 设 X 1~ ( n1 ), X 2~ ( n2 ), 且相互独立, 则 X 1 X 2 ~ 2 ( n1 n2 ).
都是的充分统计量。
3. 抽样分布
特征函数
设 X 随机变量, 称函数
X ( t ) E (e )
itX
为 X 特征函数。 常见分布的特征函数:
it n B ( n , p ) 二项分布 : (t ) ( pe (1 p)) it P ( ) Poisson分布 : (t ) exp{(e 1)}
S n
定理8 设 X1 , X2 ,, Xn 和Y1 ,Y2 ,,Yn 是分别来自
1
2
正态总体 N ( 1 , 2 )和 N ( 2 , 2 )的两个简单样本, 且两样本独立,则
T ( X Y ) ( 1 2 ) Sw 1 1 n1 n2
~ t (n1 n2 2)
P{ X z p } p
由对称性有
z1 p z p
( n) 分布:用 ( n) 表示 p 分位点,即
2
2 p
P{ (n)} p
2 2 p
t ( n)分布:用 t p ( n) 表示 p 分位点,即
P{T t p ( n)} p
F ( n1 , n2 )分布:用 Fp ( n1 , n2 )表示 p 分位点,即
例4 设样本X 1 , X 2 ,, X n是来源于正态总体
N ( , 2 ),令参数 ( , 2 ),试证明
2 (1) T ( X ) X , X i i 及 i 1 i 1 1 n 1 n 2 ( 2) T ( X ) X i , ( X i X ) n i 1 n i 1 n n
j 1
4. 分位点
定义 设随机变量 X 的分布函数为F ( x ),对任意 给定的实数 p (0 p 1) , 若存在 x p 使得
P{ X x p } F ( x p ) p
成立, 则称 x p为此概率分布的 p 分位点。 常见分布分位点记号: 标准正态分布 N (0,1): 用 z p 表示,即
2 2 2 X 12 X 2 Xn
所服从的分布为自由度是 n 的 分布,记为
2
2~ 2 ( n)