数理统计样本及抽样分布.

格式：ppt
大小：358.00 KB
文档页数：26

下载文档原格式

概率论与数理统计第六章样本及抽样分布

x0 o.w.
n 1
n5
n 15
15
（2）t-分布（学生分布）
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随机变量，则称随机变量
t
X Y /n

X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为： t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。个体: 总体X中的每一个元素（实数）xi。根据总体所含的个体数分为：有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体样本统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )

F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]

z
(1)标准正态分布分位点

(x)
( x)dx 1 ( x)dx

z
z1
( x)
Pr[ X z ]

数理统计基础公式详解样本统计量与抽样分布

数理统计基础公式详解样本统计量与抽样分布数理统计作为一门重要的学科，为我们分析和理解数据提供了基础和方法。

在数理统计中，样本统计量和抽样分布是两个关键概念。

本文将详细解释这些概念，并介绍相关的公式和定理。

一、样本统计量样本统计量是从数据样本中计算得到的数值，用于描述总体的特征。

常用的样本统计量有平均值、方差、标准差、相关系数等。

下面我们将详细介绍这些统计量以及它们的计算公式。

1. 平均值平均值是一组数据的总和除以观测数量，用于衡量数据的集中趋势。

样本平均值的计算公式如下：\[ \overline{x} = \frac{\sum_{i=1}^{n} x_i}{n} \]其中，\( \overline{x} \) 表示样本平均值，\( x_i \) 表示第 i 个观测值，n 表示观测数量。

2. 方差方差衡量了一组数据的离散程度，它表示各观测值与平均值之差的平方和的平均值。

样本方差的计算公式如下：\[ S^2 = \frac{\sum_{i=1}^{n} (x_i - \overline{x})^2}{n-1} \]其中，\( S^2 \) 表示样本方差，\( x_i \) 表示第 i 个观测值，\( \overline{x} \) 表示样本平均值，n 表示观测数量。

3. 标准差标准差是方差的平方根，用于衡量数据的离散程度。

样本标准差的计算公式如下：\[ S = \sqrt{S^2} \]其中，S 表示样本标准差，\( S^2 \) 表示样本方差。

4. 相关系数相关系数衡量了两个变量之间的线性关系的强弱和方向。

样本相关系数的计算公式如下：\[ r = \frac{\sum_{i=1}^{n} (x_i - \overline{x})(y_i -\overline{y})}{\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2 \sum_{i=1}^{n} (y_i - \overline{y})^2}} \]其中，r 表示样本相关系数，\( x_i \) 和 \( y_i \) 分别表示第 i 个观测值的两个变量，\( \overline{x} \) 和 \( \overline{y} \) 分别表示两个变量的样本平均值，n 表示观测数量。

概率论与数理统计(06)第6章统计量及其抽样分布

一个任意分布的总体
σx =
σ
n
当样本容量足够大时( 大时(n ≥ 30) ，样本均值的抽样分布逐渐趋于正态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋于正态分布的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章样本与统计量
6.1引言 6.1引言
数理统计学：运用概率论的基础知识，对要研究的随机现象进行多次观察或试验，研究如何合理地获得数据资料，建立有效的数学方法，根据所获得的数据资料，对所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。组成总体的某个基本单元，称为个体。总体可以是具体事物的集合，如一批产品。也可以是关于事物的度量数据集合，如长度测量。总体可以包含有限个个体，也可以包含无限个个体。有限总体在个体相当多的情况下，可以作为无限总体进行研究。总体中的个体，应当有共同的可观察的特征。该特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高塞特 (W.S.Gosset) 于 1908 年在一篇以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ，则
2
χ2分布
2. 3.
z=
X −µ
Y=z

概率论与数理统计-ch6-样本与抽样分布

概率论与数理统计-ch6-样本与抽样分布概率论中，所研究的随机变量是假定其分布是已知的，在此前提下研究它的性质、数字特征等。

在数理统计中，所研究的随机变量的分布是未知或不完全知道的，通过重复独⽴的试验得到许多观察值去推断随机变量的种种可能分布。

1、随机样本总体：试验的全部可能的观察值。

=样本空间个体：每⼀个可能观察值。

=样本点容量：总体中所包含的个体的个数。

有限总体⽆限总体⼀个总体对应⼀个随机变量X，对总体的研究就是对随机变量X的研究。

所以将不区分总体与相应的随机变量，统称为总体X。

样本：在数理统计中，⼈们都是通过从总体中抽取⼀部分个体，根据获得的数据来对总体分布得出推断的，被抽出的部分个体叫做总体的⼀个样本。

对总体进⾏⼀次观察，就会得到⼀个随机变量X1，对总体进⾏n次重复的、独⽴的观察，就会得到n个随机变量X1，X2，...,Xn，这n个随机变量X1，X2，...,Xn是对总体随机变量X观察的结果。

则X1，X2，...,Xn是相关独⽴且与X具有相同分布，称为来⾃总体X的⼀个简单随机样本。

n称为样本的容量。

进⾏n次观察得到的⼀组实数x1,x2,...,xn是随机变量X1，X2，...,Xn的观察值，称为样本值，也称为X的n个独⽴的观测值。

2、抽样分布样本是统计推断的依据，但往往不直接使⽤样本本⾝，⽽是由样本构造的函数。

统计量：设X1，X2，...,Xn是来⾃总体X的⼀个样本，g(X1，X2，...,Xn)是其函数，且g中不含任何未知参数，则称g(X1，X2，...,Xn)是⼀统计量。

统计量也是⼀个随机变量。

g(x1,x2,...,xn)是统计量的观测值。

常⽤的统计量：经验分布函数：经验分布函数(empirical distribution function)是根据样本得到的分布函数.如设，是总体的样本值，将它们按⼤⼩顺序排列为，则称分布函数为经验分布函数是与总体分布函数相对应的统计量。

总体的分布函数是F(x)，统计量的经验分布函数是F n（x)，⽤F n（x)去推断F(x)，当n⾜够⼤时，F n（x)以概率1收敛于F(x)。

生物数学-数理统计习题(一)

生物数学—-数理统计习题(前半部分)一、抽样与抽样分布1.设X 1,X 2,···,X n 为样本，¯X n =1n n i =1X i ,S 2n =1n n i =1(X i −¯X )2,X n +1为第n +1次的观测样本，试证：¯X n +1=¯X n +1n +1(X n +1−¯X n )2.设x 1,x 2,···,x n 及u 1,u 2,···,u n 为两个样本观测值，它们有如下关系：u i =x i −a b,b =0,a 都为常数，求样本平均值¯u 与¯x ，样本方差S 2u 与S 2x 之间的关系。

3.证明如下等式：(1)n i =1(X i −¯X )=0;(2)n i =1(X i −C )2=n i =1(X i −¯X )2+n (¯X −C )2;(3)n i =1(X i −¯X )2=n i =1X 2i −n ¯X,进而有S 2n =¯X 2−¯X 2，其中¯X 2=1n n i =1X 2i 。

4.若从总体中抽取容量为13的一个样本：−2.1,3.2,0,−0.1,1.2,−4,2.22,2.01,1.2,−0.1,3.21,−2.1,0试写出这个样本的次序统计量，中位数和极差。

5.设X ∼N (µ,σ2),求样本均值¯X与总体期望µ的偏差不超过1.96σ2n的概率。

6.在总体N (52,633)中随机抽一容量为36的样本，求样本均值¯X 落在50.8和53.8之间的概率。

7.求总体N (20,3)的容量分别为10,15的两个独立样本均值差的绝对值大于0.3的概率。

8.设X 1,X 2,···,X 10为N (0,0.09)的一个样本，求P (10i =1X 2i >1.44)。

数理统计基本知识

2 (5), Y
E( 2 ) n, D( 2 ) 2n.
P{ (n)}
2 2
2 2 ( n ) 的点为分布 (n) 的上分位点.

( n)
2
f ( y)dy
19
•当n充分大(>45)时,有
2
1 ( z 2n 1 ) 2 2

i 1
n
X i 2 等均
1 ( X 1 X 2 ) 等都不是统计 2 Xi i 1 2 量，因为它们含有未知参数 ,
为统计量，而
1
n
2
从统计量的定义可知，统计量是不含任何未知参数的
随机变量．
10
几个常用的统计量设X1, X2 ,…, Xn是来自总体X
的一个样本, (x1,x2,…,xn)是其观察值.
§6.2
抽样分布
一、统计量样本是进行统计推断的依据.但在应
用时,往往不是直接使用是样本本身,而是针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断. 定义1 设X1, X2 ,…, Xn是来自总体 X 的一个样本, g(X1, X2 ,…, Xn)是X1, X2 ,…, Xn函数,若g 中不含任何未知参数，则称g(X1, X2 ,…, Xn)是一个统计量． [注] (1) 统计量是一个随机变量;
n 11
0
18
y

2 分布的可加性设 12 ~ 2 (n1 ), 2 ~ 2 (n2 ) 2 2 2 2 2 且 1 与 2相互独立,则有 1 2 ~ ( n1 n2 )
分布的数学期望和方差
例： X

U ( 0, 4), 则 E ( X Y ) _____ D( X Y ) _____ . 分布的分位点对于给定正数 (0<<1), 称满足

第十六讲(数理统计中常用的分布、抽样分布定理)

2 1 2 2
3 n足够大时， (n)近似服从• (n,2n) N
2
证
1设
2 (n) X i2
i 1
n
X i ~ N (0,1) i 1,2, , n
X 1 , X 2 , , X n
相互独立,
2 i
则 E ( X i ) 0, D( X i ) 1, E ( X ) 1
•2
P{ X z } 1
-z= z1-
例1 求
z0.05 , z0.025 , z0.005 , z0.95 .
解： P{ X 1.645} 0.05, P{ X 1.96} 0.05, P{ X 2.575} 0.005.
z0.05 1.645 , z0.025 1.96 , z0.005 2.575
0.4 0.3 0.2 0.1
n= 1 n=20
-3

-1
1
2
3
t 分布的图形(红色的是标准正态分布)
t分布的性质： 1. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形， 1 t 2 2 再由函数的性质有 lim f (t ) 2 e . n
~ ( n2 ), U
2
与V 相互
U n1 F V n2
服从自由度为n1及 n2 的F分布，n1称为第一自由度，n2称为第二自由度，记作
F~F(n1,n2) . 由定义可见，
1 V n2 ~F(n2,n1) F U n1
若F~F(n1,n2)， F的概率密度为
( n1 n2 ) n n1 n21 1 n n 2 n ( n1 ) 2 ( y ) 1 n1 y 2 ( y ) ( 1 ) ( 2 ) 2 2 2 0

概率论6-1,2,3

例如，考察某工厂10月份生产的灯泡的寿命所组例如，考察某工厂月份生产的灯泡的寿命所组成的总体。成的总体。灯泡寿命落在各个时间区间内有一定的百分比，如灯泡寿命落在1000小时小时~1300小时的占灯百分比，如灯泡寿命落在小时小时的占灯泡总数的85％，落在1300小时％，落在小时~1800小时的占灯泡总泡总数的％，落在小时小时的占灯泡总数的5％，％，…。即灯泡寿命的取值有一定的分布。数的％，。即灯泡寿命的取值有一定的分布。
就取位于 [ 是整数， x([ np ]+1) , 不是整数，当np不是整数， x 综上，综上， p = 1 [ x( np ) + x( np+1) ], 当np是整数 . 2
0 当特别，特别， p = 0.5时，.5分位数 x0 .5也记为Q2或
数据集的箱线图是由箱子和直线组成的图形，数据集的箱线图是由箱子和直线组成的图形，它是基于以下五个数的图形概括：它是基于以下五个数的图形概括：最小值 Min，第一四分位数 Q1，中位数M，第三四分位数 Q3和中位数最大值 Max. 作法如下：作法如下： (1) 画一水平数轴，在轴上标上 Min，Q1， M，画一水平数轴， Q3，Max. 在数轴上方画一个上、下侧平行于数在数轴上方画一个上、 Q 箱子的左右两侧分别位于 Q1， 3 的上方. 轴的矩形箱子，轴的矩形箱子，在 M点的上方画一条垂直线段 .线段位于箱子内部. ( 2)自箱子左侧引一条水平线至 Min；在同一水平高度自箱子右侧引一条水平线直至最大值. 高度自箱子右侧引一条水平线直至最大值. 如图所示. 如图所示.
1.总体与个体总体与个体
§1 随机样本
总体试验的全部可能的观察值称为总体. 试验的全部可能的观察值称为总体. 个体总体中的每个可能观察值称为个体. 总体中的每个可能观察值称为个体.

第四章二维正态分布

则有：
( X Y ) (1 2 )
(n1
1)S12

(n2

1)S
2 2
11
~ t(n1 n2 2)
n1 n2 2
n1 n2
第四章样本及抽样分布
证：X
Y
~
N
(1

2
,
2
n1
2)
n2
所以 ( X Y ) (1 2 ) ~ N (0,1) 1/ n1 1/ n2
正态总
体N
(
1
,
2 1
),
N
(
2
,
2
2
)的简
单随
机样本，
且相互独立，则
S12
F

2 1
S22
~
F(n1 1, n2
1)

2 2
第四章小结
1 给出了总体、个体、样本和统计量的概念，要掌握样本均值和样本方差的计算及基本性质。
2 引进了分2 布、t分布、F分布的定义，会查表计算。
(x)

(
(
n1 2
n1 n 2 2
)(
)
n2 2
)
(
n1 n2
)
n1 2
n1 1
x 2 (1
n1 n2
n1n2
x) 2

0
x0 其他
则称X服从自由度为n1, n2的F分布,简记为F(n1, n2 )
其中n1为第一自由度， n2为第二自由度
F-分布的上侧分位数对于给定的(0 1)，称满足条件：
2

0

概率论与数理统计-第六章

大街上随机抽取200人，进行调查。记录了
这200人的年龄数据。
总体：北京市民的年龄随机变量：年龄X
个体：张三28岁；李四5岁；
样本：{ 28；5；14；56；23；2；39；…；69} 样本容量：200
抽样：随机抽取200人进行调查的过程
6
例2：为了确定工厂生产的电池电量分布情况，在
产品中随机抽取500个，测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上分位数。F n1 , n2 的值可查F 分布表
17
不易计算！
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数抽样分布的计算：多维随机变量（独立、同分布）的函数的分布函数的计算问题。
得到统计量 Q 的抽样分布，就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解：(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立，且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2

概率论与数理统计答案第六章

第六章样本及抽样分布1.[一] 在总体N （52，6.32）中随机抽一容量为36的样本，求样本均值X 落在50.8到53.8之间的概率。

解：8293.0)78()712(}63.68.163.65263.62.1{}8.538.50{),363.6,52(~2=-Φ-Φ=<-<-=<<X P X P N X2.[二] 在总体N （12，4）中随机抽一容量为5的样本X 1，X 2，X 3，X 4，X 5. （1）求样本均值与总体平均值之差的绝对值大于1的概率。

（2）求概率P {max (X 1，X 2，X 3，X 4，X 5)>15}. （3）求概率P {min (X 1，X 2，X 3，X 4，X 5)>10}.解：（1）⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=>-25541225415412}112{|X P X P X P=2628.0)]25(1[2=Φ- （2）P {max (X 1，X 2，X 3，X 4，X 5)>15}=1－P {max (X 1，X 2，X 3，X 4，X 5)≤15} =.2923.0)]21215([1}15{1551=-Φ-=≤-∏=i i X P （3）P {min (X 1，X 2，X 3，X 4，X 5)<10}=1－ P {min (X 1，X 2，X 3，X 4，X 5)≥10} =.5785.0)]1([1)]21210(1[1}10{15551=Φ-=-Φ--=≥-∏=i iXP 4.[四] 设X 1，X 2…，X 10为N （0，0.32）的一个样本，求}.44.1{1012>∑=i iXP解：)5(1.0}163.0{}44.1{),10(~3.0101221012221012查表=>=>∑∑∑===i i i i i i X P X P χX7．设X 1，X 2，…，X n 是来自泊松分布π (λ )的一个样本，X ，S 2分别为样本均值和样本方差，求E (X ), D (X ), E (S 2 ).解：由X ~π (λ )知E (X )= λ ，λ=)(X D∴E (X )=E (X )= λ, D (X )=.)()(,)(2λX D S E nλn X D === [六] 设总体X~b (1,p)，X 1，X 2，…，X n 是来自X 的样本。

《概率论与数理统计》第六章

所以，X是一个随机变量!
既然总体是随机变量X，自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此，常把总体和总体分布视为同义语。
第六章样本及抽样分布 ‹#›
例2
在例1中，假定物体真实长度为(未知)。一般说来，测量值X就是总体，取附近值的概率要大一些，而离越远的值被取到的概率就越小。
k=1,2,…
第六章样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶中心矩的信息
第六章样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章样本及抽样分布 ‹#›
实际上，我们真正关心的并不一定是总体或个
体本身，而真正关心的是总体或个体的某项数量指标。
如：某电子产品的使用寿命，某天的最高气温，加工出来的某零件的长度等数量指标。因此，有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章样本及抽样分布 ‹#›
为评价某种产品质量的好坏，通常的做法是：从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值，又被看成随机变量，这就是所谓的样本的二重性。
随机样本
例 4 (例2续）在前面测量物体长度的例子中，如果我们在完全相同的条件下，独立地测量了n 次，把这 n 次测量结果，即样本记为
X1,X2,…,Xn .

应用数理统计(武汉理工大)1-样本及抽样分布

3. X 与S 2独立，且 X ~ t(n 1)
S/ n
第一章样本与抽样分布
设有两个独立正态总体
X ~ N (1, 12 ),样本 X1,X2,,Xn1，
Y ~ N (2, 22 ) 样本 Y1,Y2,,Yn2，
它们的样本均值及样本方差分别为
1 n1
1 n2
X
n1
如样本均值, 样本方差, 样本矩
经验分布函数F n ( x )
第一章样本与抽样分布
顺序统计量
设X1, X2, , Xn是总体X 的样本，将样本的各分量由
小到大的顺序排列成： X (1) X (2) X (n) 称 X (1) X (2) X (n) 为顺序统计量。
X (1) min{X1, X 2 , , X n} X (n) max{X1, X 2 , , X n} 极差 R X (n) X (1)
X
2 n
,
Xi
~ N (0,1)
称 2 服从自由度是 n 的卡方分布。
概率密度为
f
(x
)

n 22
1 ( n )
x
n 1 x
2 e2
,
x

0,
2
0 , x 0
第一章样本与抽样分布
2 分布的性质
① E ( 2(n ) ) = n， D ( 2(n) ) = 2 n
T
X Y / n 则称 T 服从自由度是n的t 分布
概率密度为
f (t)
( n 1) 2
n ( n )
1
t2 n

n1 2

t 分布的性质
2

数理统计基本概

第五章样本及抽样分布从本章开始, 我们将讲述数理统计的基本内容. 数理统计作为一门学科诞生于19世纪末20世纪初, 是具有广泛应用的一个数学分支, 它以概率论为基础, 根据试验或观察得到的数据, 来研究随机现象, 以便对研究对象的客观规律性作出合理的估计和判断.由于大量随机现象必然呈现出它的规律性, 故理论上只要对随机现象进行足够多次观察, 则研究对象的规律性就一定能清楚地呈现出来, 但实际上人们常常无法对所研究的对象的全体(或总体) 进行观察, 而只能抽取其中的部分(或样本) 进行观察或试验以获得有限的数据.数理统计的任务包括: 怎样有效地收集、整理有限的数据资料; 怎样对所得的数据资料进行分析、研究, 从而对研究对象的性质、特点, 作出合理的推断, 此即所谓的统计推断问题, 本课程主要讲述统计推断的基本内容.第一节数理统计的基本概念内容分布图示★ 引言 ★ 总体与总体分布 ★ 样本与样本分布 ★ 例1★ 例2 ★ 例3 ★ 例4★ 统计推断问题简述★ 分组数据统计表和频率直方图 ★ 例5 ★ 经验分布函数 ★ 例6★ 统计量 ★ 样本的数字特征★ 例7 ★ 例8 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题5-1 ★ 返回内容要点：一、总体与总体分布总体是具有一定共性的研究对象的全体, 其大小与范围随具体研究与考察的目的而确定. 例如, 考察某大学一年级新生的体重情况, 则该校一年级全体新生就构成了待研究的总体. 总体确定后, 我们称总体的每一个可观察值为个体. 如前述总体(一年级新生) 中的每一个个体即为每个新生的体重. 总体中所包含的个体的个数称为总体的容量. 容量为有限的称为有限总体, 容量为无限的称为无限总体.数理统计中所关心的并非每个个体的所有性质, 而仅仅是它的某一项或某几项数量指标. 如前述总体(一年级新生)中, 我们关心的是个体的体重, 进而也可考察该总体中每个个体的身高和数学高考成绩等数量指标.总体中的每一个个体是随机试验的一个观察值, 故它是某一随机变量X 的值,于是, 一个总体对应于一个随机变量X , 对总体的研究就相当于对一个随机变量X 的研究, X 的分布就称为总体的分布函数, 今后将不区分总体与相应的随机变量, 并引入如下定义:定义统计学中称随机变量(或向量)X 为总体, 并把随机变量(或向量)的分布称为总体分布.注(i) 有时个体的特性很难用数量指标直接描述, 但总可以将其数量化,如检验某学校全体学生的血型, 试验的结果有O 型、A 型、B 型、AB 型4种, 若分别以1,2,3,4依次记这4种血型,则试验的结果就可以用数量来表示了;(ii) 总体的分布一般来说是未知的, 有时即使知道其分布的类型(如正态分布、二项分布等),但不知这些分布中所含的参数等(如p ,,2σμ等).数理统计的任务就是根据总体中部分个体的数据资料对总体的未知分布进行统计推断.二、样本与样本分布由于作为统计研究对象的总体分布一般来说是未知的,为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干个体进行观察,通过观察可得到关于总体X 的一组数值),,,(21n x x x Λ,其中每一i x 是从总体中抽取的某一个体的数量指标i X 的观察值.上述抽取过程为抽样,所抽取的部分个体称为样本.样本中所含个体数目称为样本的容量.为对总体进行合理的统计推断,我们还需在相同的条件下进行多次重复的、独立的抽样观察,故样本是一个随机变量(或向量).容量为n 的样本可视为n 维随机向量),,,(21n X X X Λ,一旦具体取定一组样本,便得到样本的一次具体的观察值),,,(21n x x x Λ,称其为样本值.全体样本值组成的集合称为样本空间.为了使抽取的样本能很好地反映总体的信息, 必须考虑抽样方法,最常用的一种抽样方法称为简单随机抽样, 它要求抽取的样本满足下面两个条件:1. 代表性: n X X X ,,,21Λ与所考察的总体具有相同的分布;2. 独立性: n X X X ,,,21Λ是相互独立的随机变量.由简单随机抽样得到的样本称为简单随机样本, 它可用与总体独立同分布的n 个相互独立的随机变量n X X X ,,,21Λ表示. 显然, 简单随机样本是一种非常理想化的样本, 在实际应用中要获得严格意义下的简单随机样本并不容易.对有限总体, 若采用有放回抽样就能得到简单随机样本,但有放回抽样使用起来不方便, 故实际操作中通常采用的是无放回抽样, 当所考察的总体很大时, 无放回抽样与有放回抽样的区别很小, 此时可近似把无放回抽所得到的样本看成是一个简单随机样本. 对无限总体, 因抽取一个个体不影响它的分布, 故采用无放回抽样即可得到的一个简单随机样本.注: 今后假定所考虑的样本均为简单随机样本, 简称为样本.设总体X 的分布函数为)(x F ,则简单随机样本),,,(21n X X X Λ的联合分布函数为∏==ni i n x F x x x F 121)(),,,(Λ并称其为样本分布.特别地, 若总体X 为连续型随机变量,其概率密度为)(x f ,则样本的概率密度为∏==ni i n x f x x x f 121)(),,,(Λ分别称)(x f 与),,,(21n x x x f Λ为总体密度与样本密度.若总体X 为离散型随机变量,其概率分布为}{)(i i x X P x p ==, x 取遍X 所有可能取值, 则样本的概率分布为,)(},,,{),,,(12121∏======ni i n n x p x X x X x X p x x x p ΛΛ分别称)(i x p 与),,,(21n x x x p Λ为离散总体密度与离散样本密度.三、统计推断问题简述总体和样本是数理统计中的两个基本概念. 样本来自总体，自然带有总体的信息，从而可以从这些信息出发去研究总体的某些特征（分布或分布中的参数）. 另一方面，由样本研究总体可以省时省力（特别是针对破坏性的抽样试验而言）. 我们称通过总体X 的一个样本n X X X ,,,21Λ对总体X 的分布进行推断的问题为统计推断问题.总体、样本、样本值的关系:总体↙ ↖推断（个体）样本 → 样本值抽样在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包含着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.为对总体进行统计推断, 还需借助样本构造一些合适的统计量, 即样本的函数, 下面将对相关统计量进行深入的讨论.四、分组数据统计表和频数直方图通过观察或试验得到的样本值，一般是杂乱无章的，需要进行整理才能从总体上呈现其统计规律性. 分组数据统计表或频率直方图是两种常用整理方法. 1. 分组数据表：若样本值较多时，可将其分成若干组，分组的区间长度一般取成相等, 称区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少，则难以反映出分布的特征，若分组太多，则由于样本取值的随机性而使分布显得杂乱. 因此，分组时，确定分组数（或组距）应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数陈为该区间的组频数. 组频数与总的样本容量之比称为组频率.2. 频数直方图：频率直方图能直观地表示出频数的分布，其步骤如下：设n x x x ,,,21Λ是样本的n 个观察值.(i) 求出n x x x ,,,21Λ中的最小者)1(x 和最大者)(n x ；(ii) 选取常数a （略小于)1(x ）和b （略大于)(n x ），并将区间],[b a 等分成m 个小区间（一般取m 使nm 在101左右）： mab t m i t t t i i -=∆=∆+,,,2,1),,[Λ, 一般情况下，小区间不包括右端点.(iii) 求出组频数i n ，组频率i i f nn ∆=，以及),,2,1(,n i tfh i i Λ=∆=(iv) 在),[t t t i i ∆+上以i h 为高，t ∆为宽作小矩形，其面积恰为i f ，所有小矩形合在一起就构成了频率直方图五、经验分布函数样本的直方图可以形象地描述总体的概率分布的大致形态，而经验分布函数则可以用来描述总体分布函数的大致形状。

概率论与数理统计总结之第六章

第六章样本及抽样分布总体与个体：我们将试验的全部可能的观察值称为总体，这些值不一定都不相同，数目上也不一定是有限的，每一个可能观察值称为个体总体中所包含的个体的个数称为总体的容量容量为有限的称为有限总体容量为无限的称为无限总体设X 是具有分布函数F 的随机变量，若,,21X X …n X ,是具有同一分布函数F 的、相互独立的随机变量，则称,,21X X …n X ,为从分布函数F （或总体F 、或总体X ）得到的容量为n 的简单随机样本，简称样本，它们的观察值,,21x x …n x ,称为样本值，又称为X 的n 个独立的观察值由定义得：若,,21X X …n X ,为F 的一个样本，则,,21X X …n X ,相互独立，且它们的分布函数都是F ，所以（,,21X X …n X ,）的分布函数为,,(21*x x F …)(),1∏==ni i n x F x又若X 具有概率密度f ，则（,,21X X …n X ,）的概率密度为,,(21*x x f …).(),1∏==ni i n x f x设,,21X X …n X ,是来自总体X 的一个样本，g(,,21X X …n X ,)是,,21X X …n X ,的函数，若g 中不含未知参数，则称g(,,21X X …n X ,)是一统计量设,,21X X …n X ,是来自总体X 的一个样本，n x x x ,^,,21是这一样本的观察值，定义：样本平均值∑==ni i X n X 11样本方差⎪⎭⎫ ⎝⎛--=--=∑∑==n i i n i i X n X n X X n S 12221211)(11样本标准差∑=--==ni i X X n S S 122)(11 样本k 阶（原点）矩,2,1,11==∑=k X n A n i ki k …样本k 阶中心矩,3,2,)(11=-=∑=k X X n B k ni i k …经验分布函数设,,21X X …n X ,是总体F 的一个样本，用∞<<-∞x x S ),(表示,,21X X …n X ,中不大于x 的随机变量的个数。

数理统计第六章

i =1 iid n
称为自由度为n的χ 2 − 分布.
2.χ 分布的密度函数f(y)曲线分布的密度函数f(y) 2.χ2—分布的密度函数f(y)曲线
n −1 − y 1 n/2 y2 e 2, y > 0 f ( y ) = 2 Γ(n / 2) 0, y≤0
3. 分位点设X ~ χ2(n)，若对于α：0<α<1， α α ，存在
不是
1 2 2 2 T6 = 2 ( X 1 + X 2 + X 3 ). σ
2. 几个常用统计量的定义
设 X 1 , X 2 ,L, X n 是来自总体的一个样本 , x1 , x2 ,L, xn 是这一样本的观察值 . 1 n (1)样本平均值样本平均值 X = ∑ Xi; n i =1 1 n 其观察值 x = ∑ x i . n i =1
设 x1 , x2 ,L, xn 是相应于样本 X 1 , X 2 ,L, X n 的样本值 , 则称 g ( x1 , x2 ,L, xn ) 是 g ( X 1 , X 2 ,L, X n ) 的观察值 .
实例1 实例设 X 1 , X 2 , X 3是来自总体 N ( µ ,σ 2 )的一个
2.基本性质 2.基本性质: 基本性质 f(t)关于t=0(纵轴对称。关于t=0(纵轴) (1) f(t)关于t=0(纵轴)对称 f(t)的极限为N(0，1)的密度函数的极限为N(0 的密度函数， (2) f(t)的极限为N(0，1)的密度函数，即
lim f ( t ) = ϕ ( t ) =
f * ( x1 , x 2 , L , x n ) =
例1 设总体 X 服从参数为 λ (λ > 0) 的指数分

概率论与数理统计 --- 第六章{样本及抽样分布} 第四节：抽样分布

P T 1.059
0.15.
例2:
从正态总体N ( , 0.5 )中抽取样本X 1 , , X 10 .
2
数理统计
10 2 （1）已知 0，求概率P X i 4 ; i 1 10 2 （2）未知，求概率P ( X i X ) 2.85 . i 1
S1 和S2 分别是这两个样本的样本方差, 则有:
2 2
(1)
S1
2 2
S2
~ F ( n1 1, n2 1);
2 2
若两方差 1 2，则
S1 1
2 2
2 2
S2 2
~ F ( n1 1, n2 1);
(2)
X Y ( 1 2 ) ( n1 1) S1 ( n2 1) S2
n取不同值时
( n 1) S
2

2
的分布
定理3 (样本均值的分布) 数理统计设X1, X2, …, Xn是取自正态总体 N(μ, σ2)的样本, 2 X和S 分别为样本均值和样本方差, 则有:
X S n ~ t ( n 1)
证:由定理1、和t分布的定义可得： 2
X ~ N (0,1), ( n 1) S
2) F分布的分位点:
对于给定的， 1, 称满足条件: 0
P F F ( n1 , n2 )

( y )dy
F ( n1 , n2 )
的点F ( n1 , n2 )为F ( n1 , n2 )分布的上分位点.
F分布的上分位点的性质：
F1 ( n1 , n2 ) 1 F ( n2 , n1 )

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第一章样本与抽样分布
2. 格列汶科定理
设总体分布函数为F (x) ，经验分布函数为Fn(x) ，则
P lim sup Fn ( x) F ( x) 0 1
n

即当n 很大时， F n ( x ) F ( x )
第一章
样本与抽样分布
三. 样本的数字特征
1. 样本均值
1 n X Xi n i 1
第一章样本及抽样分布
1.1 总体和样本 1.2 抽样分布
武汉理工大学应用数学系模式分析研究室王展青
1.1 总体和样本
一. 二. 三. 四. 总体与样本经验分布函数样本的数字特征统计量
武汉理工大学应用数学系模式分析研究室王展青
一. 总体与样本
1. 总体和个体
总体：研究对象的全体，用随机变量X表示。个体：总体的每个单元。
称 2 服从自由度是 n 的卡方分布。概率密度为
n x 1 1 2 2 x e , x 0, n 2 n f ( x ) 2 ( ) 2 , x0 0
第一章样本与抽样分布
2 分布的性质
① E ( 2 ( n ) ) = n， D ( 2 ( n ) ) = 2 n ② 2分布的可加性若12 ~ 2(n1)， 22 ~ 2(n2)且相互独立， 12 + 22 ~ 2(n 1 + n 2) 则
2. 样本方差 n 1 2 S2 ( X X ) i n 1 i 1 3. 样本标准差
1 n x xi nቤተ መጻሕፍቲ ባይዱi 1
n 1 2 s2 ( x x ) i n 1 i 1
S
1 2 ( X X ) i n 1 i 1
第一章
n
s
1 n 2 ( x x ) i n 1 i 1
P
n→∞
总体均值 E ( X ) 总体方差 D ( X )
P
n→∞
P
n→∞
第一章
总体矩
样本与抽样分布
四. 统计量
设X1, X2, , Xn是总体X的样本，若函数 g ( X1, X2, , Xn )不含任何未知参数，则称函数g ( X1, X2, , Xn )为一个统计量。
如样本均值, 样本方差, 样本矩经验分布函数F n ( x )
P ( U ≤ u ) =1 － = ( u )

1 －

u o
u
u 0.05 = 1.645
第一章样本与抽样分布
2. 2 (卡方)分布
定义：设总体X ~ N(0,1)，X1, X2, , Xn是X的样本统计量2定义为
2 2 2 X12 X 2 Xn , X i ~ N (0,1)
1 (1.645 99 ) 2 2 67.221
第一章

x o
2 ( n)
样本与抽样分布
3. t 分布
X T 则称 T 服从自由度是n的t 分布 Y /n n 1 n 1 概率密度为 ( ) 2 2 t 2 f (t ) 1 n n n ( ) 2 t 分布的性质
第一章
样本与抽样分布
1.2 抽样分布
一. 分布函数的分位点二. 四大统计分布三. 正态总体的抽样分布定理
武汉理工大学应用数学系模式分析研究室王展青
一. 分布函数的分位点
抽样分布统计量的分布。分位点设统计量U服从某分布，如果对于 (0<<1) 有 P ( U > U ) = 则称U为该分布的上分位点。
③ 当 n = 1时，2 ( n ) 为分布, 当 n = 2时，2 ( n ) 为指数分布。
第一章
样本与抽样分布
2 分布的分位数计算
① 当n ≤ 45时, 可直接查表求出如 20.1 ( 25 ) = 34.328 ② 当n ＞ 45时, 利用以下近似公式计算 1 2 (n) (u 2n 1) 2 2 2 如 2 0.05 (50)
二. 经验分布函数
1.经验分布函数将n个样本值按大小排成顺序
x(1) x (2)

x (n)
记Fn (x)为不大于x的样本值出现的频率,则
称Fn (x) 为经验分布函数。
0 , x x(1) , k Fn ( x ) , x( k ) x x( k 1) , n 1 , x x( n ) .
样本与抽样分布
4. 样本的 k 阶原点矩
1 n Ak X ik n i 1
5. 样本的 k 阶中心矩
1 n k ak xi n i 1
1 n k Bk ( X i X ) n i 1
1 n bk ( xi x) k n i 1
第一章
样本与抽样分布
由大数定律可知定理样本的数字特征依概率收敛到总体的数字特征样本均值样本方差样本矩
F(u)
面积 =
u o
第一章
U
样本与抽样分布
二. 四大统计分布
1. 正态分布
设 X ~ N(μ, σ2), 则U = ( X-μ) /σ ~ N ( 0, 1 ) 记标准正态分布的分布函数为(u), 分位点为u P ( U > u ) = 例如由于查表所以求 u 0.05 1 － = 0.95 (1.645) = 0.95
样本的联合分布函数为F*(x1,x2,,xn), 样本的联合概率密度函数为f*(x1,x2,,xn),
且 F* (x1, x2 ,, x n) = F (x1 ) F (x2 )F (xn )
f* (x1, x2 ,, xn) = f (x1 ) f (x2 )f (xn )
第一章样本与抽样分布
2. 样本与样本值
样本在总体X中抽取n个个体X1, X2 , , Xn , n为样本容量， (X1, X2 , , Xn)构成n维随机变量。
样本值样本的取值，即样本的观察值x1, x2 , , xn
第一章样本与抽样分布
简单随机样本 ( 1 ) 每个个体Xi与总体X同分布； ( 2 ) 个体之间相互独立。设总体X的分布函数为F ( x ),概率密度为f ( x )，则

数理统计样本及抽样分布.

合集下载

概率论与数理统计第六章样本及抽样分布

数理统计基础公式详解样本统计量与抽样分布

概率论与数理统计(06)第6章统计量及其抽样分布

概率论与数理统计-ch6-样本与抽样分布

生物数学-数理统计习题(一)

数理统计基本知识

第十六讲(数理统计中常用的分布、抽样分布定理)

概率论6-1,2,3

第四章二维正态分布

概率论与数理统计-第六章

概率论与数理统计答案第六章

《概率论与数理统计》第六章

应用数理统计(武汉理工大)1-样本及抽样分布

数理统计基本概

概率论与数理统计总结之第六章

数理统计第六章

概率论与数理统计 --- 第六章{样本及抽样分布} 第四节：抽样分布

文档推荐

最新文档

数理统计 样本及抽样分布.

合集下载

概率论与数理统计 第六章 样本及抽样分布

数理统计基础公式详解样本统计量与抽样分布

概率论与数理统计(06)第6章 统计量及其抽样分布

概率论与数理统计-ch6-样本与抽样分布

生物数学-数理统计习题(一)

数理统计基本知识

第十六讲(数理统计中常用的分布、抽样分布定理)

概率论6-1,2,3

第四章二维正态分布

概率论与数理统计-第六章

概率论与数理统计答案第六章

《概率论与数理统计》第六章

应用数理统计(武汉理工大)1-样本及抽样分布

数理统计基本概

概率论与数理统计总结之第六章

数理统计第六章

概率论与数理统计 --- 第六章{样本及抽样分布} 第四节：抽样分布

文档推荐

最新文档

数理统计样本及抽样分布.

概率论与数理统计第六章样本及抽样分布

概率论与数理统计(06)第6章统计量及其抽样分布