- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 数理统计的基本概念 与抽样分布
数理统计是研究大量随机现象统计规律的 一门数学科学,以概率论为基础: 收集、整理和分析受到随机性影响的数据 为随机现象选择和检验数学模型 推断和预测随机现象的性质、特点和统计 规律 为决策提供依据和建议
(1) (2) (3) (4)
具体内容: 基本概念 经验分布函数和直方图 常用统计分布 抽样分布 顺序统计量与样本极差 充分统计量
X i2 ~ 2 ( n)
i 1 n
(2) 若总体 ~ N (, 2 ),而 X1 , X 2 ,, X n )为来自 的 X ( X
一个样本,则统计量
1 2 ( X i ) 2 ~ 2 ( n)
i 1 n
(3) 若 2 ~ 2 (n),则 2 的特征函数为(t ) (1 2it )
n 2 2 k ~ nk . k 1 k 1
n
定理3: 若随机变量 2 ~ 2 (n),则 定理4: (Fisher定理)
2 - 2 n 1
2
2 n
2n
~ N (0,1)。
设2 ~ 2 (n),则
N (0,1)
n .
L
举例,先复习一个定理 设 X 是一个取值于区间[ a , b ],具有 概率密度 f ( x ) 的连续型随机变量 ;又设 y = g ( x ) 处处可导,且对于任意 x , 恒有 g ( x ) 0 或恒有 g ( x ) 0 ;则 Y = g (X) 是一个连续型随机变量 , 它的概率密度为
min g x , max g x
a xb a xb
22
例
设总体
X f ( x)
,且
e x , x 0, f ( x) 其中 0 x 0. 0, X1 , X 2 ,, X n 为抽自总体X的样本,则
T 2( X1 X 2 X n ) 2n X 2 (2n) 证明:由于2 X1的密度为
令vi 表示事件 X ai }在n次重复独立观测中出现 { 的次数
vi n
p1
p2
P
pi
n
v3 n
p3
p4
v1 n
v2 n
v4 n
连续型:
设总体 为连续型随机变量,密f (x)为未知的 X 度
ba 对 任 一 有 限 区 间 , b], 等 分 成 个 子 区 间 , 其 长 度 为 [a m m
d h y f h y dy , y fY y 0 , 其它
21
定理 (续)
d h y f h y dy , y fY y 0 , 其它
其中, x = h ( y ) 是 y = g ( x ) 的反函数
样本值: 样本抽定后的具体数据
定理: 若( X 1 , X 2 ,, X n )是来自总体 ( x )的样本,则 F
( X 1 , X 2 ,, X n )的联合分布函数为
F(x )
i
(1) X1 , X 2 ,, X n为来自于总体 (, 2 )的样本 N
vn ( x) ~ B(n, F ( x)).
经验频数
经验分布函数:
vn ( x ) Fn ( x ) n
把样本值 1 , x2 ,, xn按值从小到大排序 x
x(1) x( 2) x( n)
则
0 k Fn ( x ) n 1
x x( 1 ) x ( k ) x x( k 1 ) x( n ) x k 1,2, , n 1
n 2
并且E 2 n,D 2 2n。
定理1:自由度为 的2变量的分布密度为 n
n x 1 1 x2 e 2 n f ( x ) 2 2 ( n ) 2 0
x0 x0
其中( s ) t s 1e t dt ( s 0)为 函数。
n 2 n ( xi ) 1 i 1 e xp 2 2 2
(2) X1 , X 2 ,, X n的分布律为
P ( X 1 x1 , X 2 x2 ,, X n xn ) P ( X i xi )
§2.1 数理统计的几个基本概念
一、总体和样本
总体: 研究对象的全体 个体: 每一个研究对象 研究对象的某个指标
总体的容量: 总体中所含有的个体的总数N
例:任何一个灯泡的寿命事先是不能确定的,而每 一个灯泡都确实对应着一个寿命值,所以可以 认为灯泡的寿命是一个随机变量。 总 体 随机变 量
抽样:在总体中抽取一定数量的个体进行观测 抽样方法原则: 1) 总体中每个个体被抽到的机会均等 2) 抽取一个个体后总体的成分不改变
1 1 x e 2 , x 0, f ( x) 2 0, x 0.
恰好是参数为2的 2分布
23
又由X1, X 2 ,, X n独立同分布,根据 分布的可加性
2
得到
T 2( X1 X 2 X n ) 2n X 2 (2n)
24
例:设总体 体的样本。令
2 5
§2.3 常用统计分布
一、 分布
2
定义1: ( X1 , X n )为来自于正态总体(0,1)的样本 设 N
则称统计量: X X
2 2 1 2 n
所 服 从 的 分 布 为 自 由 是n的 2分 布 。 度 记 为 ~ ( n)
2 2
常用的结论:
(1) 若总体 ~ N (0,1),而 X1 , X 2 ,, X n )为来自 的 X ( X 一个样本,则统计量
1 n 常用统计量: 样 本 均 值 : X X i n i 1 n 1 n 1 2 2 2 样本方差: S (Xi X ) [ X i nX 2 ] n 1 i 1 n 1 i 1
1 n 样本标准差: S2 S ( X i X )2 n 1 i 1
n
(4) Fn ( x)以概率 一致收敛于它的理论分 1 布函数 ( x) F
P limsup| Fn ( x ) F ( x ) | 0 1 n x (格里纹科定理)
二、直方图
离散型:
设总体 为离散型随机变量,分 X 布列为 ( X ai ) pi P
i 1 n
p xi (1 p)1 xi
i 1
n
p i 1 (1 p)
p (1 p)
k
xi
n
n
xi
i 1
n
n k
其中k为观测值x1 , x2 ,, xn )中1的个数, 0,1,, n。 ( k
二、统计量
对数据进行加工、提炼和压缩,把样本中所含 的有关信息集中起来。 统计量: 不含有任何未知参数的样本的函数
简单随机样本(样本):
在不变条件下对总体(随机变量) X进行n次
样本容量:
无限总 体 有限总体
重复独立观测X 1 , X 2 ,, X n .
抽样次数n
无放回抽 样 有放回抽 样
n 很小 N
简单随机抽样的特点:
(1) 代表性; 每一个X i与总体有相同的分布
(2) 独立性: X1, X 2 ,, X n是相互独立的
X ~ N (0,4) ,
5 2 10
为来自总 X1 , X 2 , X10
2
Y X i X j i 1 j 6
试确定C使CY服从 2分布,并指出其自由度。
25
解:由已知条件有
X
i 1
5
i
~ N (0,20), 1 1
X
i 6 i
n
1 e 2
t2 2
性质3:设 T~t(n ), 则
n ET 0, (n 1);DT , (n 2) n2
a a0 a1 am1 am b
vi 表示n次重复独立观测得样本, X 2 ,, X n中落在 X1 区间 ai , ai 1 ]中的个数 (
vi n
P
P{ai X ai 1 }
ai 1
ai
f ( x )dx
vi ba 当m, n充分大时, n f (ai ) m
定义函数:
vi m 当ai x ai 1时 , 有 n ( x ) f ,i 0,1, , m 1, n ba
称f n ( x )在区间a, b)的图形为a, b)上的频率直方图 [ [ , 简称为直方图。
小区间个数:
m 1.87(n 1)
f n ( x) f ( x)
经验分布函数的性质:
(1) 是分布函数
v ( x) (2) 随机变量样本函数 : E[vn ( x )] n F ( x ) E n ( ) F ( x) n
( 3) lim P Fn ( x ) F ( x ) 1 0 依概率收敛
随机变量
X t Y n 称为自由度为的t变量,它所服从的分布 n
称为t分布,记为 ~ t (n)。 t
Y 注: 若X ~ N (, 2 ), 2 ~ 2 ( n), 且X,Y独 立 , 则
X t ~ t ( n). Y n
定理5: 若t ~ t (n),则t的分布函数为
n1 n1 2 2 2 1 x f ( x) n n n 2
ft ( 定理6:设t ~ t (n),其分布密度记作n) ( x),则
1 lim f t ( n ) ( x ) e n 2