- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p( X (1) 2) P (
3 统计中几个常用的分布
(上侧) 分位数的概念 设X 为连续型随机变量,其概率密度函数为f ( x ) 为给定常数, 0 < <1 若 则称 x 为X 所服从的分布的上 分位数. 如果 X 的概率密度函数为偶函数,则对于满足
P ( X x )
E( X k ) k
1 n k P M k X i k n i 1
即
0 1 n k lim P X i k 0 n n i 1 k 1,2,
注2
样本方差S 2与样本的二阶中心矩CM2的区别
注3
(X
i 1
解 p( X (1) 0) P (
1
X 1 , X 2 , X 3 中一个为零全体)
2
p( X (1) 1) P ( X , X
P( P(
19 27
, X 3 全为1全体)
X1 , X 2 , X 3
7 两个为1一个为2的全体) 27 1 全为2) 27
X 1 , X 2 , X 3 一个为1两个为2的全体) X1 , X 2 , X 3
0
t x 1e t dt
0.4
n=2
0.3
n=3
0.2 0.1
n=5
n = 10 n = 15
5
10
15
20
25
2 ( n) 分布的性质:
1 E 2 ( n ) n, D 2 ( n ) 2 n
2 2 X ~ ( n ), X ~ ( n2 ), 且相互独立 2. 若 1 1 2
N ( i , 2i )
特别地, 若 X1 , X 2 ,
, X n 相互独立,且
X i ~ N ( , 2 ) i = 1,2,, n,
则
2 1 n Xi ~ N , n i 1 n
标准正态分布的上 分位数 z
0.4 0.3 0.2 0.1
0 < < 1/2 的 ,
若
P ( X x / 2 )
则称 x /2 为X 所服从的分布的双侧 分位数
0.4 0.3 0.2 0.1
1
-2
-1 0.4 0.3
z• 2
/2
-2
0.2 0.1
/2
1 2 z• / 2
• -1 -z / 2
下面介绍抽样分布,何为抽样分布? 为何需知道抽样分布?
, X n ) 取值为 ( x1 , x2 ,
,n
x
* n
当 ( X1 , X 2 ,
, x n ) 时,
* 定义随机变量 X ( k ) xk , k 1, 2,
则称统计量 X (1) , X ( 2) ,
1 k n
, X ( n ) 为顺序统计量.
1 k n
其中,X (1) min{ X k }, X ( n ) max{ X k } 称 Dn X ( n ) X (1) 为极差
样本—— 从总体中抽取部分个体,称为样本. 若抽取了 n 个个体,依次对他们进行观察 得到n个数据, x1 , x2 , , xn , 称 这个n 维实向量 为总体 X 的一个容量为n 的样本观测值,或 简称样本值. 可以将它们看作是n维随机向量
( X1 , X 2 , , X n )
的一组可能的取值, 称 ( X 1 , X 2 ,
则 X 1+X 2 ~ 2 ( n1+n2 )
2 (n) 的可加性
3. 当n 时,2(n) 正态分布 N(n,2n) 4. 2(n)的上侧 分位数可查表
0.1
例如
0.08
P (10) 18.307 0.05
2
2 0.05
(10) 18.307
0.06 0.04 0.02 5 10
n
, X n 相互独立
且都服从标准正态分布N (0,1),则
2 2 X ~ ( n) i i 1
自由度为 n 的 密度函数为:
( n)
2
其中,
x n 1 2 1 2 e x , n n 2 2 ( 2) f ( x) 0,
x0 x0
( x )
, Xn )
n
的联合概率密度函数为
f ( x1 , x2 ,, xn ) f ( xi )
i 1
2 统计量 定义 设( X 1 , X 2 ,
g ( r1 , r2 ,
, X n ) 是取自总体X 的一个样本,
, rn )
为一实值连续函数,且不含有未知参数, 则称随机变量 g ( X 1 , X 2 , , X n ) 为统计量. 若 ( x1 , x2 , , xn ) 是一个样本值, 称
, X 50 ) , X 50 )
的分布密度函数 的样本空间
解(1) E ( X ) E ( X ) x x dx 0 1
1 D ( X ) E ( X ) x x dx 1 2 1 1 D( X ) D( X ) 50 100
2 1 2
1
1 (2) E ( S ) D( X ) E ( X ) 2
n = 10
• 20 15 (10) 20.05
(3) t 分布(Student 分布)
定义: 设 X ~ N (0,1) , Y ~ 2 ( n), X , Y 相互独立,
X T Y n
则T 所服从的分布称为自由度为 n 的T 分布 记 T~T (n). 其密度函数为
n1 n1 2 2 t 2 f (t ) 1 n n n 2
2
为样本方差
与D(X)的区别
S
1 n Xi X n 1 i 1
2
为样本标准差,
与总体标准差的区别
1 n k (3) M k X i n i 1
1 n (4) CM k X i X n i 1
为样本的k 阶原点矩
与总体k 阶原点矩 E(Xk) 的区别
数理统计的分类:
描述统计学
研究对随机现象进行观测、试验,以取得 有代表性的观测值
推断统计学
对已取得的观测值进行整理、分析,作 出推断、决策,推断出所研究的对象的规律性
参数估计
假设检验
推断统计学 方差分析 回归分析
1
总体和样本
总体: 所研究的对象的全体
所研究的对象的某个(或某些)数量指标的全体, 它是一个随机变量(或多维随机变量). 若为一个随机变量,可记为X . 主要讨论一维 随机变量的情形 .例如, 某钢铁厂生产的钢锭的 强度. X 的分布函数和数字特征称为总体的分布 函数和数字特征 个体 组成总体的每一个元素称为一个 个体, 即总体的每个数量指标, 可以看作随机变量 X 的某个取值.
1
-2
-1
z
•2
常用的分位数
z0.05 1.645 z0.025 1.96 z0.005 2.575
0.4 0.3
/2
-2
0.2 0.1
/2
1
-z/2
-1
•
z / 2
•2
-z/2 = z1-/2
(2) ( n) 分布 (n为自由度)
2
定义: 设 X 1 , X 2 ,
n 2 1 2 2 1 2 2 E X i nE X E( S ) E X i nX n 1 i 1 n 1 i 1 n
1 n 2 2 D( X ) E X n D( X ) E X 2 n 1 i 1
故
(CM )2 M 2 X
2
2 n n S (M2 X ) (CM )2 n1 n1
重要结论 设总体 X 的期望与方差存在, E ( X ) , D( X ) 2
n 1 则 E X E n Xi i 1 1 n 1 2 1 n D X D Xi 2 D Xi n n i 1 n i 1
2 2
(3)
1 X ~ N (0, ) 100
(近似),由中心极限定理
P ( X 0.02) 1 P ( X 0.02) 0.02 0 21 0.1 2 1 Φ 0.2 0.8414
(4)
f ( x1 , x2 ,
若 ( x1 , x2 , , xn )为样本值,则上述统计量 的样本值为
1 n x xi n i 1
n 1 s2 xi x n 1 i 1 1 n k mk xi n i 1
k
2
1 n cmk xi x n i 1
注1 若总体 X 的 k 阶矩 存在, 则
t
0.4 0.3 0.2 0.1
n= 1
n=20
-3 -2 -1 1 2 3
T分布的图形(红色的是标准正态分布)
n i 1
n
i
2 i
X ) (Xi 2Xi X X )
2 2 2 i 1
n n 2 i 1 i 1
n
X 2X Xi X
X 2n X n X
i 1 2 i 2
n
2
X nX
i 1 2 i
n
2
n( M 2 X )
2
2
50 x , x50 ) i 1 i 0