正态分布 t分布参考课件
- 格式:ppt
- 大小:1.57 MB
- 文档页数:50
T分布(近似标准正态分布)1.1 定义定义:假设X服从标准正态分布N(0,1),Y服从卡⽅分布,那么的分布称为⾃由度为n的t分布,记为。
T分布密度函数其中,Gam(x)为伽马函数。
可⽤于两组独⽴计量资料的假设检验。
由于在实际⼯作中,往往σ(总体⽅差)是未知的,常⽤s(样本⽅差)作为σ总体⽅差的估计值,为了与u变换(正态化变换)区别,称为t变换,统计量t 值的分布称为t分布。
【u分布也叫标准正态分布】u变换:[(X-µ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为µ=0,σ=1的标准正态分布(standard normaldistribution),亦称u分布。
在和中,t-分布(t-distribution)⽤于根据⼩样本来估计呈且⽅差未知的总体的均值。
如果总体⽅差已知(例如在样本数量⾜够多时),则应该⽤正态分布来估计总体均值。
经常应⽤在对呈的总体的进⾏估计。
它是对两个差异进⾏测试的学⽣t测定的基础。
t检定改进了Z检定(en:Z-test),不论样本数量⼤或⼩皆可应⽤。
在样本数量⼤(超过120等)时,可以应⽤Z检定,但Z检定⽤在⼩的样本会产⽣很⼤的误差,因此样本很⼩的情况下得改⽤学⽣t检定。
t分布曲线形态与n(确切地说与⾃由度df)⼤⼩有关。
与标准正态分布曲线相⽐,⾃由度df越⼩,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈⾼;⾃由度df愈⼤,t分布曲线愈接近正态分布曲线,当⾃由度df=∞时,t分布曲线为标准正态分布曲线。
当总体的是未知的但却⼜需要估计时,我们可以运⽤t-分布。
【特征】:(1)以0为中⼼,左右对称的单峰分布;(2)其数学期望E(Z) = 0,n>1;⽅差D(Z)=n/n-2 , n>2 。
(3)t分布是⼀簇曲线,其形态变化与n(确切地说与df)⼤⼩有关。
⾃由度df越⼩,t分布曲线越低平;⾃由度df越⼤,t分布曲线越接近标准正态分布(u分布)曲线;(4)随着⾃由度逐渐增⼤,t分布逐渐接近标准正态分布。
1。
设X1服从以自由度为m的卡方分布,X2服从以自由度为n的卡方分布,X1与X2独立,则F=(X1/m)/(X2/n)的分布就是自由度为m与n的F分布2。
设随机变量X1,X2独立且X1服从标准正态分布,X2服从以自由度为n的卡方分布,则t=X1/根号(X2/n)的分布就是自由度为n的t分布、在实际工作中,抽取足够多的样本容量进行调查意味着人力、物力和财力的增加,尤其对一些具有破坏性的试验来说也不宜抽取太多的样本容量。
也就是说,对于大样本进行观察受到某些条件的限制。
这里主要讨论t分布、>2分布和F分布。
一、t-分布关于t 分布的早期理论工作,是英国统计学家威廉?西利?戈塞特(WillamSealy Gosset)在1900年进行的。
t分布是小样本分布,小样本分布一般是指n<30。
t分布适用于当总体标准差R未知时用样本标准差s代替总体标准差R,由样本平均数推断总体平均数以及2个小样本之间差异的显著性检验等。
从平均值为L、方差为R2的正态总体中抽取容量为n的一个样本,其样本平均数服从平均值为L,方差为R2/n的正态分布,因此,。
但是总体方差R2总是未知的,从而只能用s2来代替,(1)如果n很大,那么,s2就是R2的一个较好的估计量,仍然是一个近似的标准正态分布;(2)如果n较小,s2常常与R2的差异较大,因此,统计量就不再是一个标准正态分布,而是服从t分布。
(一)t分布的性质1、t分布是对称分布,且其均值为0。
2、当样本容量n较小时,t分布的方差大于1;当n增大到大于或等于30时,t分布的方差就趋近于1,t分布也就趋近于标准正态分布。
3、t分布是一个分布族,对于不同的样本容量都对应不同的分布,且其均值都为0。
4、与标准正态分布相比,t分布的中心部分较低,2个尾部较高。
5、变量t的取值范围在与之间。
t分布与标准正态分布的比较(二)t分布的自由度样本中独立观察值的个数(即样本容量)n减去1(由于样本要估计的总体参数的个数为1,即R2)。
数理统计实验t分布与标准正态分布院(系):班级:成员:成员:成员:指导老师:日期:目录t分布与标准正态分布的关系 (1)一、实验目的 (1)二、实验原理 (1)三、实验内容及步骤 (1)四、实验器材 (5)五、实验结果分析 (5)六、实验结论 (6)t分布与标准正态分布的关系一、实验目的正态分布是统计中一种很重要的理论分布,是许多统计方法的理论基础。
正态分布有两个参数,μ和σ,决定了正态分布的本质。
为了应用和计算方便,常将一般的正态变量X通过μ变换[(X-μ)/σ]转化成标准正态变量μ,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布,亦称μ分布。
对于标准正态分布来说,μ是数据整体的平均值,σ是整体的标准差。
但实际操作过程中,人们往往难以获得μ和σ。
因此人们只能通过样本对这两个参数做出估计,用样本平均值和样本标准差代替整体的平均值和标准差,从而得出了t分布。
另外从图像的层面说,正态分布的位置和形态只与μ和σ有关,而t分布不只与样本平均值和样本标准差有关,还与自由度相关。
通过实验了解t分布与标准正态分布之间的关系。
二、实验原理运用EXCEL软件验证t分布与标准正态分布的关系,绘制相应的统计图表进行分析。
三、实验内容及步骤1.打开Excel文件,将“t分布与标准正态分布N(0,1)”合并并居中,黑体,20字号,红色;2.选中文件,选项,自定义功能区,加载开发工具.在开发工具中插入滚动条,调节滚动条大小;3.设置A2单元格格式,数字自定义区” !n=#,##0;[红色]¥-#,##0”.然后左对齐,设置为红色;4.设置滚动条格式,单元格连接为$A$2;5.在A3中输入-4.0,单击开始,填充,序列,设置等差序列,步长0.1,当出现十字下拉即出现等差序列;6.在B3中插入标准正态分布函数”=NORM.S.DIST(A3,0)”,十字出现向下拉;7.在C3中插入t分布函数”=T.DIST(A3,$A$2,0)”,十字出现向下拉;8.选中整体区域,作X,Y(散点图),设置标题,横纵截距,箭头方向。