三大抽样分布
- 格式:doc
- 大小:16.41 KB
- 文档页数:4
三大抽样分布知识点一览抽样分布的概念抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。
抽样分布是统计推断的理论基础。
如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。
抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。
如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。
由平均数构成的新总体的分布,称为平均数的抽样分布。
随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。
三大抽样分布1. 卡方分布χ2(n)定义:若n个相互独立的随机变量ξ₁、ξ₂、……、ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
2. t分布定义:设X1服从标准正态分布N(0,1),X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量t=X1(X2/n)1/2所服从的分布为自由度为n的t分布。
3. F分布定义:设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n。
与正态分布一同构成数理统计中的四大分布。
由标准正态总体样本的适当组合构成的统计量形成数理统计中的其他三大基础分布。
所以,数理统计中总是以正态总体作为研究对象展开。
在数理统计中,"总体"、"抽样"、"样本"是三个基本概念,分位点是"小概率事件"发生的临界点,置信区间是参数估计和假设检验的核心计算问题。
常用的三种抽样分布
概述
在统计学中,抽样分布是指从总体中抽取一定数量的样本,并计算样本统计量的分布。
根据中心极限定理,当样本数足够大时,样本的均值和标准差会呈正态分布。
然而,并非所有的抽样分布都符合正态分布。
本文将介绍统计学中常用的三种抽样分布,包括正态分布、t分布和χ²(卡方)分布。
1. 正态分布(Normal Distribution)
正态分布是最常见的一种抽样分布,也被称为高斯分布。
它具有以下特点: - 均值为μ,标准差为σ; - 对称分布,其曲线呈钟型,两侧尾部逐渐下降; - 总体分布和抽样分布均为正态分布; - 标准正态分布
的均值为 0,标准差为 1。
可以通过标准化计算将任意正态分布转换为标准正态分布。
正态分布在实际应用中非常重要,尤其是在假设检验和置信区间计算中的应用广泛。
2. t分布(Student’s t-Distribution)
t分布是由英国统计学家William Sealy Gosset(也被称为。
一、 三大抽样分布的分布函数综 述:)a 根据大数定理和中心极限定理,但样本容量n 较大时(数学上一般要求45n >),任何分布都依概率收敛于正态分布()2, N μσ,并可标准化为()0, 1N 。
)b 现实世界和工程技术中的任何数据样本流到目前为止,不外乎()0, 1N 的函数分布,集中表现为3大抽样分布规律。
)c 考研数学中规定:()0, 1N 的分位数定义为下分位数(从图形上看为左边面积),3 大抽样分布的分位数定义都为上分位数(从图形上看为右边面积)1. ()2n χ分布(分布函数不要求掌握)量纲模型:性 质:()1{}i X ()2 可加性212~()n n χ+++()3证 明()3:由于()()()~0,10; 1i i i X N E X D X ⇒==()()()()()2224421 1,2,,3i i i i x iE X E X E X D X i n E X x edx +∞--∞=-===⎡⎤⎣⎦==()()()()()()()()()224222211222113122iii n ni i i i n n i i i i D X E X E X E n E X E X n D n D X D X nχχ====⎡⎤=-=-=⎣⎦⎛⎫=== ⎪⎝⎭⎛⎫=== ⎪⎝⎭∑∑∑∑样本函数中的必需记住的数字特征()4 上分位点 α定义为()2n χ分布的分位数2. ()t n 分布(分布函数不要求掌握){}i X 独立同分布 2~(0,1), ~(); i X N Y n X Y χ和独立 性 质:()1 t 分布密度函数()()~(0,1)t n n f x N →∞⇒()2 上分位点 α定义为()t n 分布的分位数()3 ()0, 22nEX DX n n ==>- ()4 性质T 分布具有对称性, 1()(); 45t nt n n αα-=->时,()t n Z αα≈3.(), F m n 分布(分布函数不要求掌握)X 、Y 相互独立,2~(); ~()X m Y n χχ;量纲模型:例:假定()12, X X 来自正态整体()2~0, X N σ的一个样本,求()()2122124X X P X X ⎡⎤+<⎢⎥-⎢⎥⎣⎦。
(三)三大抽样分布(l)t分布首先,我们应把注意力放在服从t分布的t变量的构造上。
设百,叼,…,凝是来自正态总体您)的一个样本.则有:对样本均值x施行标准化变换,则有:公=与=向〜)〜秋o,D当用样本标准差S代替上式中的总体标准差b,则上式U变量改为t变量,标准正态分布N①,1)也随之改为''自由度为n-1的t分布” .记为.即:――G-〃) -.[修一V尾部概率产(x>3) =0.00155. F(r >3) >0,02自由度为n-1的t分布的概率密度函数与标准正态分布N(0, 1)的概率密度函数的图形大致类似,均为对称分布,但它的峰比N(0, 1)的峰略低一些,而两侧尾部要比N①,1)的两侧尾部略粗一点,参见图1.3-8。
当自由度超过3。
后,两者区别已很小,这时可用N9, 1)代替1号-1)・(2) /分布设百,叼,…,演是来自正态总体从(人〃)的一个样本,则其样本方差一的n-l倍(也即离差M平方和2:(々- 3)2除以总体方差的分布是自由度为n-1的Z?分布,记为才 2 (% 一1),即:2-1♦一?S - = £ - 2)2 / /〜F 伽-1)自由度为n-1的1?分布的概率密度函数在正半轴上呈偏态分布,参见图1.3-9o(3)F 分布设有两个独立的正态总体N (〃i ,/)和4),它们的方差相等。
又设x P 叼,…,/是来自N (〃i ,〃)的一个样本;Xp -一,是来自》(外,〃)的一个样 本 > 两个样本相互独立。
它f 门的样本方差比的分布是自由度为n-1和的F 分布:其中n-1称为分子自由度或第1自由度;m-1称为分母自由度或第2自由度■ F 分布的概率密度函数在正半轴上呈偏态分布,参见图l.3-10o阳131。
尸储加-1)的IK 率密度函数 n-X _次(演-五)2 1 2-1〜F (力一 L W-1)。
三大抽样分布
众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2
分布、t布和F分布。
这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。
X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。
三大抽样分布的研究意义
c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。
”这句话一语道破统计学的重要性。
三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。
在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。
具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。
纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。
三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。
为此,要想研究三大抽样分布,就应该对其发展过程进行研究。
统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。
X2分布
x2的早期发展
由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。
在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。
但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。
1891年,X2分布首次被作为统计量的分布导出。
Pizzetti在求线性
模型最小二乘估计残差平方和的分布时,通过富氏分析法得出了X2的分布。
随着时代的发展,正态分布理论的局限更加明显,更加推动了偏态分布的发展。
KarlPearson是对偏态分布贡献最大的人,成为了一代统计学巨人。
按照他的观点,统计学应该把在模型基础上对观测数据进行有效预测作为基本任务,所以他开创了一族曲线对观测数据进行拟合,使得分布拟台数据的应用范围进一步扩大。
X2模型
t分布
1 Gosset与t分布
在2O世纪初之前,统计学理论的发展都是在大样本的基础上进行数据分析的。
众所周知,中心极限定理在当时占据了统治地位,在社会统计领域发挥着重要作用,但是随着时代的发展,科技的进步,统计学家对于人工控制的条件试验越来越重视,统计学家的数据来源也不再局限于自然采集,而是逐渐加强了人工条件的控制。
对于统计数据的量也不再是大量的,而是逐渐转向小样本。
为此,小样本统计理论获得了发展,从而引发了统计学理论的革命,而Wiliam SealeyGosset就成为了这场统计学革命的领导者,开创了小样本统计理论的先河:他的论文《均值的或然误差》1908年发表在《生物计量学》上,在论文中提出了小样本理论,从而为统计学的发展做出了重要贡献。
Gosset在学习误差理论和最小二乘的统计学知识时,发现这些书中的传统方法和定理都不能解决他的问题,这些理论都要求观测值具有独立性,但是他的样本是小样本,无论是在农业试验还是实验室检验条件下,他的观测值都具有明显的相关性。
之后他还跟KarlPearson有过一次会面,KarlPearson向他展示了很多相关系数和或然误差的最新论文,使他获益匪浅。
在以后的时间中,Gosseti继续写了很多关于统计方法的文章。
在1927年,他的《一般分析的误差》论文中有这样的表述:“这个程序的应用给了一个规则,但是应该记住这个的规则应该被当成必须的补助而不是常识的替代。
”Gosset的t 分布为现代统计学的发展做出了重要贡献,促进了现代统计学的发展。
2 t分布
F分布
1.Fisher和F分布
在2O世纪初,统计学理论的研究仍然以相关和回归为主要研究内容,尤其是对多元性模型和多维正态分布,更是在统计学中占据着统治地位,长期没有受到动摇。
x2分布来源于线性模型最小二乘方法所得残差平方,t分布则来源于线性模型,更值得一提的是,F分布也是来源线性模型理论理论。
Fisher对回归方程进行拟合优度检验时发现了F分布。
此后,f分布在回归系数显著性的检验和方差分析检验中逐渐得到了广泛应用。
2 F分布
结语
随着社会的进步,科技的发展,统计学理论在社会发展中的地位和作用越来越重要,为社会发展做出了重要贡献。
x2分布、F分布和t分布这统计学中的三大抽样分布为抽样分析、解决实际问题做出了不可磨灭的贡献,随着时代的发展,统计学理论也会更加完善,从而成为推动经济发展、社会进步的重要动力之一。