附表四卡方分布表
- 格式:pdf
- 大小:31.06 KB
- 文档页数:1
统计学附录-卡方分布 t-分布表卡方分布卡方分布(χ2分布)是概率论与统计学中常用的一种概率分布。
k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。
卡方分布常用于假设检验和置信区间的计算。
卡方分布的数学定义若k 个随机变量Z1、……、Zk 相互独立,且数学期望为0、方差为 1(即服从标准正态分布),则随机变量X被称为服从自由度为 k 的卡方分布,记作卡方分布的特征卡方分布的概率密度函数为:其中x?0, 当x?0时fk(x) = 0。
这里Γ代表Gamma 函数。
卡方分布的累积分布函数为:其中γ(k,z)为不完全Gamma函数在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。
此外许多表格计算软件如 Calc和Microsoft Excel中都包括卡方分布函数。
卡方分布可以用来测试随机变量之间是否相互独立,也可用来检测统计模型是否符合实际要求。
自由度为 k 的卡方变量的平均值是 k,方差是 2k。
卡方分布是伽玛分布的一个特例,它的熵为:其中ψ(x) 是 Digamma function。
卡方变数与 Gamma变数的关系当Gamma变数频率(λ)为1/2 时,α 的2倍为卡方变数之自由度(Degree of freedom)即:卡方变数之期望值=自由度卡方变数之方差=两倍自由度卡方分布参数 k > 0, 自由度值域 ,概率密度函数,累积分布函数(cdf),期望值 k,中位数大约k ? 2 / 3,众数 k-2, if,方差 2,k,偏态 ,峰态 12/k,熵值动差生成函数(mgf) ,2t<1,特征函数 ,t-分布表For a particular number of degrees of freedom, entry represents the critical value of t Corresponding to a specified upper-tail area (α) Upper-Tail AreasDegrees of 0 t (α, df) 0.25 0.10 0.05 0.025 0.01 0.005 Freedom1 1.0000 3.0777 6.3137 12.7062 31.8210 63.65592 0.8165 1.8856 2.9200 4.3027 6.9645 9.92503 0.7649 1.6377 2.3534 3.1824 4.5407 5.84084 0.7407 1.5332 2.1318 2.7765 3.7469 4.60415 0.7267 1.4759 2.0150 2.5706 3.3649 4.03216 0.7176 1.4398 1.9432 2.4469 3.1427 3.70747 0.7111 1.4149 1.8946 2.3646 2.9979 3.4995 8 0.7064 1.3968 1.85952.3060 2.89653.3554 9 0.7027 1.3830 1.8331 2.2622 2.8214 3.2498 100.6998 1.3722 1.8125 2.2281 2.7638 3.1693 11 0.6974 1.3634 1.7959 2.2010 2.7181 3.1058 12 0.6955 1.3562 1.7823 2.1788 2.6810 3.0545 13 0.69381.3502 1.77092.1604 2.65033.0123 14 0.6924 1.3450 1.7613 2.1448 2.62452.9768 15 0.6912 1.3406 1.7531 2.1315 2.6025 2.9467 16 0.6901 1.33681.74592.1199 2.5835 2.9208 17 0.6892 1.3334 1.7396 2.1098 2.5669 2.8982 18 0.6884 1.3304 1.7341 2.1009 2.5524 2.8784 19 0.6876 1.3277 1.72912.0930 2.5395 2.8609 20 0.6870 1.3253 1.7247 2.0860 2.5280 2.8453 210.6864 1.3232 1.7207 2.0796 2.5176 2.8314 22 0.6858 1.3212 1.7171 2.07392.5083 2.8188 23 0.6853 1.3195 1.7139 2.0687 2.4999 2.8073 24 0.68481.3178 1.71092.0639 2.4922 2.7970 25 0.6844 1.3163 1.7081 2.0595 2.48512.7874 26 0.6840 1.3150 1.7056 2.0555 2.4786 2.7787 27 0.6837 1.31371.70332.0518 2.4727 2.7707 28 0.6834 1.3125 1.7011 2.0484 2.4671 2.7633 29 0.6830 1.3114 1.6991 2.0452 2.4620 2.7564 30 0.6828 1.3104 1.69732.0423 2.4573 2.7500 31 0.6825 1.3095 1.6955 2.0395 2.4528 2.7440 320.6822 1.3086 1.6939 2.0369 2.4487 2.7385 33 0.6820 1.3077 1.6924 2.0345 2.4448 2.7333 34 0.6818 1.3070 1.6909 2.0322 2.4411 2.7284 35 0.68161.3062 1.68962.0301 2.4377 2.7238 36 0.6814 1.3055 1.6883 2.0281 2.43452.7195 37 0.6812 1.3049 1.6871 2.0262 2.4314 2.7154 38 0.6810 1.30421.68602.0244 2.4286 2.7116 39 0.6808 1.3036 1.6849 2.0227 2.4258 2.7079 40 0.6807 1.3031 1.6839 2.0211 2.4233 2.7045。
卡方分布概念及表和查表方法目录1简介2定义3性质4概率表简介分布在数理统计中具有重要意义。
分布是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡·皮尔逊(C K·Pearson)分别于1875年和1900年推导出来,是统计学中的一个非常有用的著名分布。
定义若n个相互独立的随机变量ξ₁、ξ₂、……、ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为分布(chi-square distribution),卡方分布其中参数称为自由度,正如正态分布中均数或方差不同就是另一个正态分布一样,自由度不同就是另一个分布。
记为或者(其中,为限制条件数)。
卡方分布是由正态分布构造而成的一个新的分布,当自由度很大时,分布近似为正态分布。
对于任意正整数x,自由度为的卡方分布是一个随机变量X的机率分布。
性质1) 分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数的增大,分布趋近于正态分布;卡方分布密度曲线下的面积都是1。
2) 分布的均值与方差可以看出,随着自由度的增大,分布向正无穷方向延伸(因为均值越来越大),分布曲线也越来越低阔(因为方差越来越大)。
3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
4) 若互相独立,则:服从分布,自由度为。
5) 分布的均数为自由度,记为E( ) = 。
6) 分布的方差为2倍的自由度( ),记为D( ) = 。
概率表分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在分布中得对每个分布编制相应的概率值,这通过分布表中列出不同的自由度来表示,卡方分布临界值表在分布表中还需要如标准正态分布表中给出不同P 值一样,列出概率值,只不过这里的概率值是值以上分布曲线以下的概率。
由于分布概率表中要列出很多分布的概率值,所以分布中所给出的P 值就不象标准正态分布中那样给出了400个不同的P 值,而只给出了有代表性的13个值,因此分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。
卡方分布概念及表和查表方法若n个相互独立的随机变量斤,农,…,n,E均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution )。
目录1简介2定义3性质4概率表简介斤分布在数理统计中具有重要意义。
*分布是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡皮尔逊(C K・Pearson)分别于1875年和1900年推导出来,是统计学中的一个非常有用的著名分布。
定义若n个相互独立的随机变量斤、农 ...... En,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和Q = &2 ' 2构成一新的随机变量,其分布规律称为X分^fp(chi-square distribution ),条件数)。
r卡方分布是由正态分布构造而成的一个新的分布, 当自由度v 很大时,誥分布近似为正态分布。
对于任意正整数X ,自由度为「的卡方分布是一个随机变量X 的机率分布。
性质1)尤2分布 在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数 V的增大,分布趋近于正态分布;卡方分布密度曲线下的面积都是1。
2)'分布的均值与方差可以看出,随着自由度:■的增大,■分布向正无穷方向延伸(因为均值「越来越大),分布曲线也越来越低阔(因为方差 越来越大)。
3) 不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
4) 若沁毗丹*互相独立,则:X 伽)+/ (血)服从*分布,自由度为叫十巾。
5) 尤2分布的均数为自由度 砂,记为E (*) =1 C22 6) 尤分布的方差为2倍的自由度(2# ),记为D (雄)=2”。
概率表一 …2匚分布不象正态分布那样将所有正态分布的查表都转化为标准正态2在X 分布表屮还需要如标准正态分布表屮给岀不同 P 值-样,列出概率值,只不过这里2 2 2 2 的概率值是 X 值以上X 分布曲线以下的概率。
表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1. 1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.0 1即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。
通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。
卡方分布表
卡方分布表是数学、统计学中常用的一种工具,它用于
帮助人们计算卡方分布的概率值。
卡方分布是一种重要的概率分布,它在统计学中具有广泛的应用。
卡方分布表中所列出的数值代表着不同自由度下的卡方
统计量与对应的概率值。
卡方统计量是用来衡量观察值与期望值之间的差异程度的,它的计算方式需要使用到频数和期望频数,因此广泛应用于假设检验和拟合优度检验等领域。
卡方分布表一般是按照不同自由度分别列出来的,常见
的有1自由度、2自由度、3自由度等,数值从0开始,依次
递增。
使用卡方分布表时,我们可以通过查找对应的自由度和相应的卡方统计量来得到概率值。
例如在1自由度下,如果卡方统计量为3.84,它对应的概率值为0.05,这表示了卡方统
计量为3.84时,有5%的概率出现在1自由度下。
在实际应用中,卡方分布表被广泛应用于各种统计分析中,比如拟合优度检验、协方差分析、参数估计等,它可以帮助人们计算出卡方统计量的概率值,并且从而进行假设检验。
比如,在进行拟合优度检验时,我们可以通过计算观察频数和期望频数之间的卡方统计量,并通过查找卡方分布表来获取对应的概率值,进而决定是否拒绝原假设。
总体来说,卡方分布表是一种十分有用的统计学工具,
它在统计分析中发挥着重要的作用,能够帮助人们进行各种假设检验并进行数据分析。
需要注意的是,在使用卡方分布表时,我们要根据具体的实际情况选择对应自由度的卡方分布表,并
且正确地解读概率值。
通过充分理解和运用卡方分布表,可以更好地进行数据分析和统计研究。