三大抽样分布
- 格式:doc
- 大小:136.00 KB
- 文档页数:3
常用的三种抽样分布
概述
在统计学中,抽样分布是指从总体中抽取一定数量的样本,并计算样本统计量的分布。
根据中心极限定理,当样本数足够大时,样本的均值和标准差会呈正态分布。
然而,并非所有的抽样分布都符合正态分布。
本文将介绍统计学中常用的三种抽样分布,包括正态分布、t分布和χ²〔卡方〕分布。
1. 正态分布〔Normal Distribution〕
正态分布是最常见的一种抽样分布,也被称为高斯分布。
它具有以下特点: - 均值为μ,标准差为σ; - 对称分布,其曲线呈钟型,两侧尾部逐渐下降; - 总体分布和抽样分布均为正态分布; - 标准正态分布
的均值为 0,标准差为 1。
可以通过标准化计算将任意正态分布转换为标准正态分布。
正态分布在实际应用中非常重要,尤其是在假设检验和置信区间计算中的应用广泛。
2. t分布〔Student’s t-Distribution〕
t分布是由英国统计学家William Sealy Gosset〔也被称为。
三大抽样分布众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2分布、t布和F分布。
这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。
X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。
三大抽样分布的研究意义c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。
”这句话一语道破统计学的重要性。
三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。
在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。
具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。
纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。
三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。
为此,要想研究三大抽样分布,就应该对其发展过程进行研究。
统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。
X2分布x2的早期发展由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。
在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。
但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。
三大抽样分布知识点一览抽样分布的概念抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。
抽样分布是统计推断的理论基础。
如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。
抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。
如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。
由平均数构成的新总体的分布,称为平均数的抽样分布。
随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。
三大抽样分布1. 卡方分布χ2(n)定义:若n个相互独立的随机变量ξ₁、ξ₂、……、ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
2. t分布定义:设X1服从标准正态分布N(0,1),X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量t=X1(X2/n)1/2所服从的分布为自由度为n的t分布。
3. F分布定义:设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n。
与正态分布一同构成数理统计中的四大分布。
由标准正态总体样本的适当组合构成的统计量形成数理统计中的其他三大基础分布。
所以,数理统计中总是以正态总体作为研究对象展开。
在数理统计中,"总体"、"抽样"、"样本"是三个基本概念,分位点是"小概率事件"发生的临界点,置信区间是参数估计和假设检验的核心计算问题。
三大抽样分布
教程
一、复习特征函数
1:()it t Ee ξξϕ=与概率分布函数()F x ξ相互唯一确定。
2:独立随机变量和的特征函数等于每个特征函数的乘积。
()
()()11
1
,...,...n n
n
X X X X X X t t t ϕϕϕ++=
独立
综合利用上面特征函数性质可以得到很多结论 例题1:证明,()()222~,~,X N a d cX N ca c d →
证明:
syms a t x real syms pi
syms d positive
characterfunction=int(exp(i*t*x)*1/sqrt(2*pi)/d*exp(-(x-a)^2/2/d^2),x,-inf,inf) characterfunction =
exp(1/2*i*t*(i*t*d^2+2*a)) 变形一下,结合性质1得到()()2222
~,d iat t
X t e
X N a d ϕ-=↔
由特征函数定义知
()()()()()()()22
22
()222
2
~,cd d iact ct i ac t t i ct X it cX cX X t Ee Ee ct e e
cX N ac c d ϕϕ-
-
=====↔
例题2
()()22
111222~,,~,X N a d X N a d ,12,X X 独立,则
()()()()2222
2
2
2
1212
12121
2
1
222
2
d d d d ia t t ia t t i a a t t X X X X t t t e
e e
ϕϕϕ+--+-+===
()
2
212121
2
12~,X X N a a d d N a a ⎛⎫↔+++=+ ⎪⎝⎭
推论:{},1,2,...,i X i n =为独立随机变量序列且对每个i 有()
2~,i i i X N a d ,则
()
2
2111
1...~...,......n n n
n X X N a a d d N a a ⎛⎫++++++=++ ⎪⎝⎭
推论
()
2
2111
1...~...,......n n n
n X X N a a d d N a a ⎛⎫++++++=++ ⎪⎝⎭
{}n X X ,...,1为独立随机变量序列,且对每个i 有()2~,i i i X N a d ,则
()
∑∑
∑
===n
i i
i
n i i i n
i i i d c a c N X c 122
1
1
,~
例题:定义取值非负随机变量X ,如果概率密度函数
()()
()x I e x x f x
),0[1∞--Γ=λαααλ(参数都为正数),称()~,X Ga αλ服从伽玛分布(显然,
参数为λ的指数分布e(λ)=Ga(1,λ)是其特例)。
求伽玛分布特征函数 clear
syms alfa lamda x positive syms t real
characterfunction=simple(int(exp(i*t*x)*lamda^alfa/gamma(alfa)*x^(alfa-1)*exp(-lamda*x),x,0,i nf));
characterfunction=simplify(characterfunction); pretty(characterfunction)
人工化简得
()()()
()()1,01x
X X it t f x x e I x α
ααλλϕλα----∞⎛⎫
=-↔= ⎪
Γ⎝⎭
注:11~(,)X Ga αλ,22~(,)X Ga αλ,两者独立,如何一下看出
1212~(,)X X Ga ααλ++,写出12X X +概率密度函数。
例题:()1,0~N X i ,{}n X X ,...,1为独立同分布随机变量序列,
()()()()()
n
X X X X X
t t t t n
n
21
22
1
221...ϕϕϕϕ==++ 而
()2
/12
2/112122
2
121
--∞
∞
-⎪
⎭
⎫ ⎝⎛
-===⎰it dx e
e
Ee
t x itx itX X π
ϕ
因此
()()()()2/1,2/~...2/112
212
/ (21)
221n Ga X X it t t n n n
X X X
n
++↔⎪⎭
⎫ ⎝⎛-==-++ϕϕ
二:三大抽样分布
背景:由中心极限定理看出,正态分布在现实生活中应用极广。
卡方分布、学生分布、F 分布都是在总体假定为正态分布的时候,和样本均值以及样本方差有关的一些统计量的概率分布。
定义1:n 个独立同分布的标准正态分布随机变量的平方和的分布称为自由度为n 的卡方分布()2n χ。
问题,若总体()2~,,0X N a d d >,()1,...,n X X 为样本,问()
2
2
1n
i i X a d
=-∑
服从什么
分布?
我们下次将证明()
2
2
1~n
i n i X X d
=-∑
定义2:学生分布
()2~0,1,~()X N Y n χ,X 、Y
()~t n 为自由度n 的学生分布 练习
1:假定总体X 服从指数分布e(λ),样本1...n X X ++的特征函数是什么?概率密度函数是什么?
1...n
X X n
++的特征函数是什么,概率密度函数是什么?n 趋向无穷大时候,情况如
何?
2:按照提示解答问题:
随机变量~(0,1)X N ,称2
X 为自由度1的卡方分布()2
1χ,它是什么伽玛分布?
如果{},1,2,...,i Y i n = i.i.d ,()2
~1i Y χ
,称1...n Y Y ++服从自由度为n 的卡方分布()2n χ,
它又是什么伽玛分布,它的特征函数是什么,按照特征函数和概率分布一一对应结论,求
()2n χ的概率密度。