统计学4.总体分布、参数估计

  • 格式:ppt
  • 大小:1.16 MB
  • 文档页数:66

下载文档原格式

  / 50
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 X = n

n
n
X
i =1
i
随机样本的方差函数: 随机样本的方差函数
S
2
1 = n 1

i =1
( X i X )2
三,统计量与统计量的分布 统计量定义:统计量是不含未知参数的,随机样本 统计量定义:统计量是不含未知参数的,随机样本X1,X2 的函数. ,, Xn的函数.
统计量的值的定义: 统计量的值是不含未知参数的, 统计量的值的定义 统计量的值是不含未知参数的 样本 观测值x 观测值 1,x2,,xn的函数 , 的函数. 四,由标准正态分布 N(0,1)的随机样本所引出的几 ( , ) 个重要统计量分布: 个重要统计量分布:χ2,t 与 F分布 分布 1, χ2(n)分布的构成 , ) 设随机变量 X 服从N(0,1)分布, X1,X2,, Xn 服从 ( , )分布, 样本, 为 X 样本,则 χ2 = ∑ X2i= X21 + X22 + X2n 服从自由度为n的 分布, 服从自由度为 的 χ2 分布,记为 χ2 ~ χ2 (n). ). χ2 (n)分布的均值 E(χ2)= n,方差 D( χ2 )= 2n. ) ( , ( .
m=100,n=20
m=15,n=20
密度函数形式为: 密度函数形式为:
m+ n m m+n 1 Γ( 2 ) m m 2 m ( )( x) (1+ x) 2 , x ≥ 0 f ( x) = n Γ(m / 2)Γ(n / 2) n n 0 x<0
重要性质: 重要性质:
1 F1α ( m , n ) = Fα ( n , m )
服从N( , ). 服从 (0,1).
n2
(2) )
n1n2 (n1 + n2 2) T= × 2 2 n1 + n2 (n1 1)S1 + (n2 1)S2
( X Y ) (1 2 )
服从t( 服从 (n1+n2 - 2),( σ1 = σ2 ). ),(
S 12 σ (3) F = ) S 22 σ
中心极限定理例题解析
对于一个学生而言, 对于一个学生而言 来参加家长会的家长 人数是一个随机变量. 设一个学生无家长, 名 人数是一个随机变量 设一个学生无家长,1名 家长, 名家长来参加会议的概率分别为 名家长来参加会议的概率分别为0.05, 家长, 2名家长来参加会议的概率分别为 , 0.8,0.15. 若学校共有 若学校共有400名学生 设各学生参加 名学生, , 名学生 会议的家长数相互独立, 且服从同一分布. 会议的家长数相互独立 且服从同一分布 (1) 求 参加会议的家长数X超过 超过450的概率 (2) 求有 名 的概率; 求有1名 参加会议的家长数 超过 的概率 家长来参加会议的学生数不多于340的概率 的概率. 家长来参加会议的学生数不多于 的概率 解 (1 ) 以 X
Z = X
σ
服从N( , )分布; 服从 (0, 1)分布;
n
2
(4) )
( n 1) S
σ
2
服从χ 服从χ2(n-1)分布; )分布;
(5) T = )
X S n
n
服从t( 服从 (n -1)分布; )分布;
(6) )
1
σ2
( X i ) 2 服从χ2(n)分布; 服从χ )分布; ∑
2 σX = 方差
所以, 来估计p 所以 常用 x 来估计 .
p(1 p) , X 的均值也是总体中某类个体的比例 p . n
七,大样本均值函数的分布:中心极限定理 大样本均值函数的分布: 服从任何均值为 标准差为σ 的分布, 设:随机变量 X 服从任何均值为,标准差为σ 的分布, X是随机样本 1,X2,, Xn的均值函数. 是随机样本X 的均值函数. 是随机样本 中心极限定理: 充分大时, 近似地服从均值为 中心极限定理:当 n 充分大时,X 近似地服从均值为, 标准差为σ 的正态分布. 标准差为σ / √ n的正态分布. 的正态分布 实际问题中n多大 多大? 在 实际问题中 多大?但一般 n ≥ 30. .
2,样本观测值 , n次随机抽样的结果:x1,x2,,xn (称为随机样本 1, 次随机抽样的结果: 称为随机样本X 次随机抽样的结果 , X2,, Xn 的样本观测值). 的样本观测值). , n称为随机样本向量( X1,X2,, Xn )的维度,即自由 称为随机样本向量( 的维度, 称为随机样本向量 , 度. 3,样本(累积)分布函数 ,样本(累积) 设样本观测值x 为小于x 设样本观测值 1 ≤ x2 ≤ ,, ≤ xn ki为小于 i+1的样本值出 现的累积频次, 为样本容量 为样本容量, 现的累积频次 n为样本容量 则可得样本累积频率分布函数 0 当 x < x1 如下: 如下 F n ( x ) = k i / n 当 x i ≤ x < x i+1 1 当 xn ≤ x 样本累积频率分布函数,又称样本 累积)分布函数 样本(累积 又称样本(累积 分布函数.样本 累积) 样本累积频率分布函数 又称样本 累积 分布函数 样本 累积 分布函数F 是对总体的累积分布函数F(x)的近似 n越大 的近似, 越大, 分布函数 n(x)是对总体的累积分布函数 是对总体的累积分布函数 的近似 越大 Fn(x)对F(x)的近似越好 的近似越好. 对 的近似越好
P{Y ≤ 340}
340 400 × 0.8 Y 400 × 0.8 = P ≤ 400 × 0.8 × 0.2 400 × 0.8 × 0.2 Y 400 × 0.8 = P ≤ 2.5 ≈ Φ ( 2.5) = 0.9938 . 400 × 0.8 × 0.2
n +1 Γ( ) 2 n+1 x 2 2 f n ( x) = (1+ ) ,∞ < x < +∞ n nπ Γ(n / 2)
t 分布图
3,F 分布 , F 分布是由两个 χ2 分布之比组成的: 分布之比组成的:
F = U m V n
服从F( , ). 服从 (m,n).
其中, 服从χ ),V 其中,U 服从χ2(m), 服从χ2(n). ), 服从χ ).
k
( k = 1 , 2 , , 400 ) 记
第 k 个学生来参加会议的家 长数 ,
Xk 则 X k 的分布律为 pk
0 1 2 0.05 0.8 0.15
易知 E ( X k ) = 1.1, D( X k ) = 0.19, ( k = 1,2,,400)
根据中心极限定理 而 X = ∑ X k , 根据中心极限定理
P ( lim
n → ∞ ∞ < x < +∞
sup
Fn ( x ) F ( x ) = 0 ) = 1
随机样本的均值函数和方差函数都是一个随机变量. 随机样本的均值函数和方差函数都是一个随机变量 的观测值; 样本数据的样本均值 x 是随机变量 X 的观测值;样本数据 的观测值. 的样本方差 s2 是随机变量 S2 的观测值 随机样本的均值函数: 随机样本的均值函数:
第四章 总体分布, 总体分布, 样本分布与参数估计
§ 4.1 总体分布与样本分布
反映总体特征的随机变量的取值的全体. 一,总体(母体):反映总体特征的随机变量的取值的全体. 总体(母体) 反映总体特征的随机变量的取值的全体 总体分布(母体分布):反映总体特征的随机变量的概率分 总体分布(母体分布):反映总体特征的随机变量的概率分 ): 布. 从无限次随机抽取(然后放回)的角度看, 从无限次随机抽取(然后放回)的角度看,表征一个总体 特征的变量(指标),都可以视为随机变量. ),都可以视为随机变量 特征的变量(指标),都可以视为随机变量. 有限总体的概率分布,就是有限总体中不同个体的比率( 有限总体的概率分布,就是有限总体中不同个体的比率( 频率)分布. 频率)分布. 二,随机样本与样本观测值(样本数据) 随机样本与样本观测值(样本数据) 1,随机样本 , 表征n次抽取个体的随机抽样的一组随机变量 表征 次抽取个体的随机抽样的一组随机变量X1,X2,, 次抽取个体的随机抽样的一组随机变量 , Xn .
五,由一般正态分布的随机样本所构成的若干重要统计量 的分布 定理: 是正态总体N( 定理:若X1,X2,, Xn 是正态总体 (, σ2)的一个 随机样本,则样本均值函数和样本方差函数, 随机样本,则样本均值函数和样本方差函数,满足如下性 质: (1)X 服从 (, σ2 / n)分布. ) 服从N( )分布. (2) X 与 S2 相互独立. 相互独立. (3) )
样本分布与总体分布
格利文科 ( Glivenko )定理 (样本分布与总体分布的关系 样本分布与总体分布的关系) 定理 样本分布与总体分布的关系 定理: 当样本容量 n 趋于无穷大时, Fn(x)以概率 关于 x )均匀 定理 趋于无穷大时 以概率1(关于 均匀 以概率 地收敛于F(x). 地收敛于 该定理是运用样本推断总体的理论依据 该定理是运用样本推断总体的理论依据. 运用样本推断总体的理论依据 定理的数学表达为: 定理的数学表达为
n=1 n=4 n=10 χ2(n)分布图 )
χ2(n)密度函数: )密度函数:
n x 1 1 x2 e 2,x ≥ 0 n fn ( x) = 2 2 Γ( n ) 2 0 ,x < 0
其中, 为自由度 为自由度. 其中,n为自由度.Γ(n/2)为珈玛函数,是一个含参数 )为珈玛函数, n/2的积分,为: 的积分, 的积分 +∞
k =1 400
随机变量
∑ X k 400 × 1.1 k =1
400 0.19
400
X 400 × 1.1 = 400 0.19
近似服从正态分布 N (0, 1),
( 2) 以 Y 记有一名家长来参加会 议的学生数 ,
中心极限定理可得: 则 Y ~ b(400, 0.8), 中心极限定理可得:
i =1
定理:若X1,X2,, Xn1 和Y1,Y2,, Yn2 分别是正态总 定理: 的一个随机样本, 体N(1, σ12)和N(2, σ22)的一个随机样本,且它 ( ( 们相互独立,则满足如下性质: 们相互独立,则满足如下性质:
( X Y ) (1 2 )
(1) )
σ
2 1
Hale Waihona Puke Baidu
n1
+
σ
2 2
六,任意分布的随机样本均值函数的均值与方差 服从任何均值为 标准差为σ 的分布, 设:随机变量 X 服从任何均值为,标准差为σ 的分布, X是随机样本 1,X2,, Xn的均值函数.记随机变量 是随机样本X 的均值函数. 是随机样本 X的分布函数的均值为X,标准差为σX ,则有如下结 的分布函数的均值为 标准差为σ 则有如下结 的分布函数的均值为 论成立: 论成立: (1) X = ; (2) σX = σ / √ n 或 σ2X = σ2 / √ n 一个应用广泛的样本均值函数的均值和方差: 注: 一个应用广泛的样本均值函数的均值和方差 0-1分布 分布 的样本均值函数均值和方差. 的样本均值函数均值和方差. 反映总体中某类个体的比例的随机变量X, 反映总体中某类个体的比例的随机变量 可以简单地 分布B(1, p)表示 E(X)= p, D(X)= p(1-p). p 是总体中 表示. 用0-1分布 分布 表示 某类个体的比例. 某类个体的比例 由样本X 产生均值函数X的均值 由样本 1,X2,, Xn产生均值函数 的均值 X = p,
Γ (n / 2) =
∫t
0
n t 1 2 2
e
dt
2,t 分布 , 自由度为n的 分布, ),是由 自由度为 的t 分布,记为 t(n),是由 (0,1)分布和 ( ),是由N( , ) χ2(n)分布组成的,其表达式为: )分布组成的,其表达式为:
T = X Y n
其中, ),Y 其中,X 服从 N(0,1), 服从χ2(n)分布,且X与 ( , ), 服从χ )分布, 与 Y相互独立. 相互独立. 相互独立 密度函数为: 密度函数为:
n1
2 1 2 2
服从F(n1-1,n2-1). 服从 ( , ).
(4) )
2 n2σ 2 ∑ ( X i 1 ) 2
n1σ 12 ∑ (Yi 2 ) 2
i =1
i =1 n2
服从F( 服从 (n1,n2).
其中, 是容量为n 的样本方差, 是容量为n 其中,S12是容量为 1的X的样本方差, S22是容量为 2 的Y 的样本方差 的样本方差. 的样本方差.