- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经验分布函数的性质:
(1) Fn ( x)满足分布函数的特征, 是一个分布函数.
(2) Fn ( x)依概率收敛于F ( x).即 lim P{| Fn ( x) F ( x) | } 1 ( 0)
n
四、 抽样分布
统计量是随机变量,所以有对应的概率分布,称之为 统计量的抽样分布(sampling distribution).
* n
, xn )
是样本观测值,将它们由小到大排序为 , X n 取值 ,n 为 x1 , x2 , , xn 时,定义随机变量
* X ( k ) xk , k 1, 2,
则称统计量X (1) , X (2) ,
, X ( n )为次序统计量.
称X i 为第i个次序统计量.
称X 1 min X 1 , X 2 , X ( n ) max X 1 , X 2 ,
, xn
为统计量g X 1 , X 2 ,
, X n 的一个样本值. 随机变量 统计量的二重性 具体的数
二、常用的统计量
设 X1 , X 2 , 称统计量 , X n 是来自总体X的容量为n的样本,
1
1 n X Xi n i 1
---样本均值
n 1 2 Xi X 2 S n 1 i 1
(2)假设检验——依据抽样数据资料,对 总体的某种假设做检验,从而决定对此假设是 3 拒绝还是接受.
例
某钢筋厂日产某型号钢筋10000根,
质量检验员每天只抽查50根的强度,于是提
出以下问题:
(1) 如何从仅有的50根钢筋的强度数据去 估计整批(10000根)钢筋的强度平均值?又 如何估计这批钢筋强度偏离平均值的离散程
1. 2分布
定义 设X 1 , , X n相互独立, 且都服从标准正态分布N(0,1), 则
n i 1 2 n
随机变量Y X i2所服从的分布称为自由度是n的卡方分布, 记作 X ~
i 1 2 i n
自由度为n的 n随机变量的概率密度函数为
2
x n 1 1 2 2 e x , x 0; n 2 n f ( x) 2 ( 2 ) 0, x 0.
, xn 在集合 {0,1}中取值.
由样本推断总体特征, 需要对样本进行“加工” “ , 提炼” . 这就需要构造一些样本的函数, 它把样本中所含的信 息集中起来.
6. 统计量 不含有任何未知参数的样本的函数g X 1 , 称为统计量. , Xn
若 x1 , x2 ,
, xn 是一个样本值, 称g x1 , x2 ,
2
2 Sn
例1 从一批钢筋中随机抽取10条,测得其直径(单位:mm) 为: 24.2, 25.4, 24, 24, 25, 25, 24.4, 24.6, 25.2, 25.2. (1)写出总体、样本、样本值、样本容量; (2)求样本观测值的均值、方差及二阶原点矩(保留二位). 解 (1)总体为该批钢筋的直径; 样本为X1, X2 ,…, X10 样本值: 24.2, 25.4, 24, 24, 25, 25, 24.4, 24.6, 25.2, 25.2. 样本容量: n=10; (2)样本均值
i 1
n
例2 设总体 X 服从两点分布 B(1, p), 其中0 p 1,
X1, X 2 , X1, X 2 ,
, X n 是来自总体的样本, 求样本 , X n 的联合概率分布律.
解 总体 X 的概率分布律为
f ( x ; p ) P X x p x (1 p )1 x ,
1 x 1 (24.2 25.2 ... 25.2) 24.68mm i n 10 i 1
n
n
样本方差 s 2 1 ( xi x )2 n 1 i 1
2 2 2 2 2 ( 0.48) (0.72) ( 0.68) ( 0.68) (0.32) 1 0.278 2 2 2 2 2 9 (0.32) ( 0.28) ( 0.08) ( 0.52) (0.52)
所以 ( X1, X 2 , , X n ) 的联合概率分布律为
n n i 1 i 1
x 0,1
f ( x1 , x2 ,
, xn ; p) f ( xi ; p) p xi 1 p 1 xi
n
p i1 (1 p)
xi
n
xi
i 1
n
其中 x1 , x2 ,
例3 设X
U (0, ), X 1 ,
, X n 是来自总体X 的样本,
分别求最小次序统计量X 1和最大次序统计量X n 的概率密度函数.
1 , 0 x ; 解 总体X 的概率密度为f ( x; ) 0, 其他.
0, x 0; x X 的分布函数为F ( x; ) , 0 x ; 1, x.
, n;
xi n e i1 , x 0, i 1, = i 0, 否则.
n
, n;
如果把离散型随机变量的概率分布律也记为f ( x; ), 即P X x 表示为: f x; ,则样本的联合概率分布律可
f ( x1 , x2 ,
, xn ; ) f ( xi ; )
数理统计部分
第六章 样本及抽样分布 第七章 参数估计 第八章 假设检验
1
1
引言
我们实际动手研究并解决一个实际问题 时,会立即遇到下面的问题: (1)这个随机现象可以用什么样的分布律 (分布函数) 来刻画,这种分布的选择合理吗?
(2)所选用的分布的参数是多少?如何估 计和确定这些参数?
只能求助于观测,合理地取得一些数据, 据此作出统计上的推断,从而解决问题。这 就是数理统计的基本且主要任务。
identical distribution简写为:i.i.d)
X 1 ,X X的样本 2 , , X n 若总体 X1, X 2 ,
, X n 满足 :
设总体X的分布函数为F ( x; ), 则样本 X1 , 联合分布函数为
F ( x1 , x2 , , xn ; ) F ( xi ; )
2
---样本方差
---样本标准差
1 n Xi X 3 S n 1 i 14) Ak X i n i 1
---样本的k 阶原点矩
1 n (5) M k X i X n i 1
k
---样本的k 阶中心矩
例如 :A1 X
n 1 2 1 n M2 S Xi X n n i 1
所以, X (1)的概率密度为 n x n 1 1 , 0 x ; f X (1) ( x; ) 0, 其他.
X ( n )的概率密度为 n n 1 n x , 0 x ; f X ( n ) ( x; ) 其他. 0,
随机变量 样本具有二重性: 具体的观测值
5. 简单随机样本
X, ,X 1, X 2 , n , X 与 X有相同的分布 ; 1 X 1 n , X相互独立 ) 2 , , X n; 2 X 1 ,( X ,1X n 则称 X 1 , , X n 为简单随机样本(independent
, X n 为最小次序统计量, , X n 为最大次序统计量,
称Dn X ( n ) X (1)为极差.
(1) 最小次序统计量X (1)的概率密度为 f X (1) ( x; ) n[1 F ( x; )]
n 1
f ( x; )
(2) 最大次序统计量X ( n )的概率密度为 f X ( n ) ( x; ) n[ F ( x; )]n1 f ( x; )
2
更准确地说 数理统计的主要内容是:
1. 实验设计和研究,即研究如何更合理、更 有效地抽取样本来获得观测数据和资料的方法;
2. 统计推断:如何利用一定的数据资料,对 所关心的问题,得出尽可能准确的统计结论: (1)估计——从局部观测资料的统计特征, 推断所观测对象的总体特征(包括总体分布与 数字特征);
度?
----参数估计
(2)若规定了这种型号钢筋的标准强度, 从抽查得的50个强度数据如何判断整批钢筋 的平均强度与规定标准有无差异? ----假设检验 4
4
第6章 数理统计的基本概念 与抽样分布
统计学的任务: 收集数据,整理数据,分析数据
本章主要内容:
统计学的基本概念 总体,样本,统计量,次序统计量, 经验分布函数 抽样分布------统计量的分布 正态分布,卡方分布,t分布,F分布
2.经验分布函数 定义6.1.4 设 X1 , , X n 是取自总体X的样本,对应 的次序统计量为 X (1) X (2) ... X (n) ,当给定次序统 计量的观测值 x(1) x(2) ... x(n) 时,对任意实数x, 称 下列函数
0, x x(1) , k Fn ( x) , x( k ) x x( k 1) , n 1, x x ; ( n )
解:因为X EXP , 则 e x , x 0; f ( x; ) x 0. 0, 所以, X1 , , X n 的联合概率密度函数为
f x1 , x2 ,
n xi e , xi 0, i 1, , xn ; i 1 0, 否则.
为总体X的经验分布函数
例 1 从总体中抽取容量为7的样本,其观测值为: 32,65,28,32,35,30,29. 试求X的经验分布函数.