三大抽样分布
- 格式:ppt
- 大小:2.36 MB
- 文档页数:44
三大抽样分布众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2分布、t布和F分布。
这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。
X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。
三大抽样分布的研究意义c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。
”这句话一语道破统计学的重要性。
三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。
在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。
具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。
纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。
三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。
为此,要想研究三大抽样分布,就应该对其发展过程进行研究。
统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。
X2分布x2的早期发展由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。
在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。
但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。
一、 三大抽样分布的分布函数综 述:)a 根据大数定理和中心极限定理,但样本容量n 较大时(数学上一般要求45n >),任何分布都依概率收敛于正态分布()2, N μσ,并可标准化为()0, 1N 。
)b 现实世界和工程技术中的任何数据样本流到目前为止,不外乎()0, 1N 的函数分布,集中表现为3大抽样分布规律。
)c 考研数学中规定:()0, 1N 的分位数定义为下分位数(从图形上看为左边面积),3 大抽样分布的分位数定义都为上分位数(从图形上看为右边面积)1. ()2n χ分布(分布函数不要求掌握)量纲模型:性 质:()1{}i X ()2 可加性212~()n n χ+++()3证 明()3:由于()()()~0,10; 1i i i X N E X D X ⇒==()()()()()2224421 1,2,,3i i i i x iE X E X E X D X i n E X x edx +∞--∞=-===⎡⎤⎣⎦==()()()()()()()()()224222211222113122iii n ni i i i n n i i i i D X E X E X E n E X E X n D n D X D X nχχ====⎡⎤=-=-=⎣⎦⎛⎫=== ⎪⎝⎭⎛⎫=== ⎪⎝⎭∑∑∑∑样本函数中的必需记住的数字特征()4 上分位点 α定义为()2n χ分布的分位数2. ()t n 分布(分布函数不要求掌握){}i X 独立同分布 2~(0,1), ~(); i X N Y n X Y χ和独立 性 质:()1 t 分布密度函数()()~(0,1)t n n f x N →∞⇒()2 上分位点 α定义为()t n 分布的分位数()3 ()0, 22nEX DX n n ==>- ()4 性质T 分布具有对称性, 1()(); 45t nt n n αα-=->时,()t n Z αα≈3.(), F m n 分布(分布函数不要求掌握)X 、Y 相互独立,2~(); ~()X m Y n χχ;量纲模型:例:假定()12, X X 来自正态整体()2~0, X N σ的一个样本,求()()2122124X X P X X ⎡⎤+<⎢⎥-⎢⎥⎣⎦。
三大抽样分布知识点一览抽样分布的概念抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。
抽样分布是统计推断的理论基础。
如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。
抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。
如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。
由平均数构成的新总体的分布,称为平均数的抽样分布。
随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。
三大抽样分布1. 卡方分布χ2(n)定义:若n个相互独立的随机变量ξ₁、ξ₂、……、ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
2. t分布定义:设X1服从标准正态分布N(0,1),X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量t=X1(X2/n)1/2所服从的分布为自由度为n的t分布。
3. F分布定义:设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n。
与正态分布一同构成数理统计中的四大分布。
由标准正态总体样本的适当组合构成的统计量形成数理统计中的其他三大基础分布。
所以,数理统计中总是以正态总体作为研究对象展开。
在数理统计中,"总体"、"抽样"、"样本"是三个基本概念,分位点是"小概率事件"发生的临界点,置信区间是参数估计和假设检验的核心计算问题。
(三)三大抽样分布(l)t分布首先,我们应把注意力放在服从t分布的t变量的构造上。
设百,叼,…,凝是来自正态总体您)的一个样本.则有:对样本均值x施行标准化变换,则有:公=与=向〜)〜秋o,D当用样本标准差S代替上式中的总体标准差b,则上式U变量改为t变量,标准正态分布N①,1)也随之改为''自由度为n-1的t分布” .记为.即:――G-〃) -.[修一V尾部概率产(x>3) =0.00155. F(r >3) >0,02自由度为n-1的t分布的概率密度函数与标准正态分布N(0, 1)的概率密度函数的图形大致类似,均为对称分布,但它的峰比N(0, 1)的峰略低一些,而两侧尾部要比N①,1)的两侧尾部略粗一点,参见图1.3-8。
当自由度超过3。
后,两者区别已很小,这时可用N9, 1)代替1号-1)・(2) /分布设百,叼,…,演是来自正态总体从(人〃)的一个样本,则其样本方差一的n-l倍(也即离差M平方和2:(々- 3)2除以总体方差的分布是自由度为n-1的Z?分布,记为才 2 (% 一1),即:2-1♦一?S - = £ - 2)2 / /〜F 伽-1)自由度为n-1的1?分布的概率密度函数在正半轴上呈偏态分布,参见图1.3-9o(3)F 分布设有两个独立的正态总体N (〃i ,/)和4),它们的方差相等。
又设x P 叼,…,/是来自N (〃i ,〃)的一个样本;Xp -一,是来自》(外,〃)的一个样 本 > 两个样本相互独立。
它f 门的样本方差比的分布是自由度为n-1和的F 分布:其中n-1称为分子自由度或第1自由度;m-1称为分母自由度或第2自由度■ F 分布的概率密度函数在正半轴上呈偏态分布,参见图l.3-10o阳131。
尸储加-1)的IK 率密度函数 n-X _次(演-五)2 1 2-1〜F (力一 L W-1)。
三大抽样分布的定义及应用三大抽样分布是指正态分布、t分布和卡方分布。
它们在统计学中具有重要的应用,并且广泛地被用于估计和推断总体参数。
正态分布是指具有钟形曲线的连续概率分布,其概率密度函数的形状由均值和标准差决定。
在实际应用中,正态分布广泛用于描述许多自然现象,例如人的智力分布、心脏跳动的间隔时间等等。
对于大样本量的情况下,根据中心极限定理,样本均值的分布可以近似服从正态分布。
因此,正态分布在统计推断中起到了至关重要的作用,例如用于构建置信区间、假设检验、回归分析等。
t分布是由英国统计学家威廉·戴韦提出的,是用来处理小样本量情况下的统计推断问题的一种概率分布。
t分布与正态分布相似,但是其概率密度函数的形状更加平坦,有更宽的尾部。
t分布的自由度是影响其形状的一个参数,自由度越小,尾部越厚重。
在小样本量的情况下,使用t分布进行统计推断可以更准确地估计总体参数。
例如,当样本量较小时,使用t分布来计算置信区间或进行假设检验,可以避免过度自信导致错误的推断结果。
卡方分布是由皮尔逊提出的,是应用在统计推断中的一种概率分布。
卡方分布常用于分析分类数据的相关性以及拟合度。
在这两个统计问题中,卡方分布提供了一个用于检验观察值与期望值之间的差异程度的方法。
卡方分布的自由度取决于数据的维度。
在统计推断中,卡方分布被广泛用于拟合度检验,例如用于检验样本的观察频数与理论频数是否有显著差异。
正态分布、t分布和卡方分布的应用在各个领域和学科中都非常广泛。
在医学研究中,这些分布被用于分析临床试验的数据,进行数据建模以及推断总体参数。
在市场研究中,这些分布被用于对市场数据进行概率分析和预测。
在财务管理中,这些分布被用于分析股价的波动性和风险评估。
在工程领域中,这些分布被用于分析产品的可靠性和质量控制。
总之,正态分布、t分布和卡方分布是统计学中的三大抽样分布,它们在统计推断中具有重要的应用价值。
通过使用这些分布进行数据分析和推断,我们可以准确地估计总体参数,进行假设检验,以及进行优化和决策制定等重要统计任务。