卡方分布概念及表和查表方法
- 格式:doc
- 大小:105.00 KB
- 文档页数:4
[论文]卡方分布及其它分布卡方分布一、卡方分布的定义:若n个相互独立的随机变量ξ1,ξ2,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和?ξi?2构成一新的随机变量,其分布规律称为χ2(n)分布(chi-square distribution),其中参数 n 称为自由度。
: 二、卡方分布的性质:2(1) (可加性) 设~ Y,,i,1,?,k,且相互独立,则n,,iii2 Y,?,Y~,,kn,1,这里 n,n,,,,.,,ii22(2) E(,),n,,, Var(,),2n,4,. n,n,,,证明 (1)根据定义易得。
2Y可表示为)设Y~,,则依定义, (2n,,222 Y,X,?,X,X,,1n1n其中X~N(0,1),i,1,?,n,1,X~N(,,1),且相互独立,于是inn2E(Y),E(X),(1),i,1i n2Var(Y),Var(X).(2),i,1i因为1,i,1,?,n,1,,22(),(),(),EXVarXEX ,iii1,,,i,n.,代入(1),第一条结论可得证。
直接计算可得4EX,3,i,1,?,n,1,i 42EX,,,6,,3.n于是2422Var(X),EX,(EX),3,1,2,i,1,?,n,1, iii2422 Var(X),EX,(EX),2,4,.nnn代入(2)便证明了第二条结论。
三、卡方分布的概率密度函数:nx,1,,122,当,0xex,n,n,,2 ,,,fx2,2,,,x2,,,,0,其他,设随机变量X1,....Xn相互独立且都服从N(0,1)。
现在来推导随机变数,^2,,^2,.....,,^2的分布。
1n11,,,,,,?,的密度函数为,^,x^2,?,x^21n1nn2,,2n^ 2222,当z,0时,P,z,P,,?,X,z,0,,,,,,,,1n1xx-,,^2,?,^2 11n2222,,,,,,当z,o时,P,,,,z,P,,?X,z,Dz?ed,x1n,,n2,,2n22其中Dx为n维x空间内由不等式所定的区域。
卡方分布上下分位点的转化
(最新版)
目录
1.卡方分布简介
2.卡方分布上下分位点的概念
3.卡方分布上下分位点的转化方法
4.实际应用案例
5.总结
正文
【1.卡方分布简介】
卡方分布(Chi-squared distribution)是一种概率分布,主要用于假设检验中,尤其是用于拟合优度检验和独立性检验。
卡方分布的形状取决于自由度(degrees of freedom,df),自由度等于分子(分子中各项的自由度之和)减去分母(分子中各项的自由度之和)。
【2.卡方分布上下分位点的概念】
卡方分布的上下分位点是指在某个置信水平下,卡方分布曲线上对应的点。
例如,卡方分布的 95% 分位点,就是指在卡方分布曲线上,从负无穷大到该点的面积为 95%。
上下分位点是统计学中常用的一种描述概率分布的方式。
【3.卡方分布上下分位点的转化方法】
由于卡方分布没有解析解,所以通常需要通过查表或者使用统计软件来获取卡方分布的上下分位点。
具体转化方法如下:
1)先计算卡方值:根据观测值和期望值计算卡方值,公式为:χ2=Σ[(观测值 - 期望值)/期望值]。
2)查表或使用统计软件:根据卡方值和自由度,在卡方分布表中查找对应的分位点,或者使用统计软件进行计算。
【4.实际应用案例】
例如,在独立性检验中,我们通常会使用卡方分布来检验两个变量是否相关。
假设我们有一组观测值,我们首先计算期望值,然后计算卡方值,接着根据卡方值和自由度查找卡方分布表,得到相应的上下分位点,最后比较卡方值与上下分位点的大小,从而判断两个变量是否相关。
卡方检验(Chi-square test)Li Junrongstat9@7.1 四格表资料的χ2检验χ2检验(Chi-square test)是现代统计学的创始人之一,K. Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率(或者构成比)之间的比较,计数资料的关联度分析,拟合优度检验等。
一、卡方检验的基本思想卡方分布⏹属连续型分布⏹可加性是其基本性质⏹唯一参数,即自由度(1) 自由度为1的χ2分布若Z N ~(,),01则Z 2的分布称为自由度为1的χ2分布.(chi-square distribution),记为χ()12或χ21(). 图形:从纵轴某个点开始单调下降,先凸后凹.02468100.00.10.20.3 2220.05(1)0.05/22220.01(1)0.01/23.84(1.96)6.63(2.5758)Z Zχχ======(2) νZ Z Z ,...,,21互相独立,均服从N (,)01,则22221...νZ Z Z +++的分布称自由度为 ν的χ2分布,记为χν()2或)(2νχ,或简记为χ2.* 图形:单峰,正偏峰;自由度ν很大时,2()νχ近似地服从正态分布.有2()2(),22Z ννχνχννν-=服从均数为,方差为的正态分布.00.10.20.30.40.50369121518¿¨·½Öµ×Ý·ß×ÔÓɶȣ½1×ÔÓɶȣ½2×ÔÓɶȣ½3Óɶȣ½62/)12/(2222)2/(21)(χνχνχ--⎪⎪⎭⎫⎝⎛Γ=ef 3.847.8112.59P =0.05的临界值χ2分布(chi-square distribution )性质:若χνχν2122(),()互相独立, 则χνχν2122()()+服从χ2分布, 自由度=+νν12 χνχν2122()()-服从χ2分布, 自由度=-νν12卡方检验的基本思想组别有效无效合计有效率(%)试验组99 5 10495.20(p 1)对照组7521 9678.13(p 2)合计1742620087.00(p c )表7-1两组降低颅内压有效率的比较实际频数A (actual frequency)理论频数T (theoretical frequency)nn n column row T C R =⨯=总例数合计列合计行)()(RC四格表(fourfold table)它反映了理论数与实际数的吻合情况,该统计量近似地服从自由度为ν的卡方分布。
混合卡方分布表【实用版】目录1.混合卡方分布表的定义和含义2.混合卡方分布表的性质和特点3.混合卡方分布表的应用领域和实际例子4.混合卡方分布表的计算方法和工具5.混合卡方分布表的局限性和未来发展方向正文混合卡方分布表是一种在统计学中广泛应用的分布表,它是由两个或两个以上的卡方分布相加而成的。
混合卡方分布表的定义和含义是指,当一组数据由多个独立的卡方分布组成时,其联合分布就是混合卡方分布。
混合卡方分布表的性质和特点主要表现在,它的形状取决于各个卡方分布的自由度、协方差矩阵和权重。
具体来说,当各个卡方分布的自由度相同且协方差矩阵为单位矩阵时,混合卡方分布表就退化为一个卡方分布。
混合卡方分布表的应用领域非常广泛,它常用于构建置信区间、假设检验和回归分析等。
例如,在构建置信区间时,我们可以使用混合卡方分布表来计算某个参数的置信区间;在假设检验中,我们可以使用混合卡方分布表来计算某个检验统计量的 p 值;在回归分析中,我们可以使用混合卡方分布表来计算回归系数的置信区间。
混合卡方分布表的计算方法和工具有很多,例如,我们可以使用统计软件(如 R、Python 和 SPSS 等)来计算混合卡方分布表,也可以使用手动计算的方法(如查表或使用公式等)来计算混合卡方分布表。
尽管混合卡方分布表在统计学中有着广泛的应用,但它也存在一些局限性,例如,它的计算过程比较复杂,需要考虑多个卡方分布的自由度、协方差矩阵和权重等因素,因此,对于一些复杂的问题,可能需要使用其他的统计方法来解决。
此外,随着数据科学的发展,混合卡方分布表可能需要进行一些改进和拓展,以适应新的数据形式和分析需求。
总的来说,混合卡方分布表是一种重要的统计工具,它在构建置信区间、假设检验和回归分析等方面有着广泛的应用。
§1.4 常用的分布及其分位数1. 卡平方分布卡平方分布、t 分布及F 分布都是由正态分布所导出的分布,它们与正态分布一起,是试验统计中常用的分布。
当X 1、X 2、…、Xn 相互独立且都服从N(0,1)时,Z= ∑i i X 2的分布称为自由度等于n 的分布,记作Z ~(n),它的2χ2χ分布密度 p(z )=⎪⎪⎩⎪⎪⎨⎧>⎪⎭⎫ ⎝⎛Γ--,,00,2212122其他z e x n z n n 式中的=,称为Gamma 函数,且=1, ⎪⎭⎫⎝⎛Γ2n u d e u u n ⎰∞+--012()1Γ=。
分布是非对称分布,具有可加性,即当Y 与Z ⎪⎭⎫ ⎝⎛Γ21π2χ相互独立,且Y ~(n ),Z ~(m ),则Y+Z ~(n+m )。
2χ2χ2χ 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、X n+m 相互独立且都服从N(0,1),再根据分布的定义以及上述随机变量2χ的相互独立性,令Y=X +X +…+X ,Z=X +X +…+X ,21222n 21+n 22+n 2m n +Y+Z= X +X +…+X + X +X +…+X ,21222n 21+n 22+n 2m n +即可得到Y+Z ~(n +m )。
2χ2. t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~(n ),则Z = 的分布称为自由度2χn YX 等于n 的t 分布,记作Z ~ t (n ),它的分布密度P(z)= 。
)()(221n nn ΓΓ+2121+-⎪⎪⎭⎫ ⎝⎛+n n z 请注意:t 分布的分布密度也是偶函数,且当n>30时,t 分布与标准正态分布N(0,1)的密度曲线几乎重叠为一。
这时, t 分布的分布函数值查N(0,1)的分布函数值表便可以得到。
3. F 分布 若X 与Y 相互独立,且X ~(n ),Y ~(m ),2χ2χ 则Z=的分布称为第一自由度等于n 、第二自由度等于m Y n X m 的F 分布,记作Z ~F (n , m ),它的分布密度p(z)=⎪⎪⎪⎩⎪⎪⎪⎨⎧>++-⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛+Γ∙。
§1、4 常用得分布及其分位数1、 卡平方分布卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。
当X 1、X 2、…、Xn 相互独立且都服从N(0,1)时,Z=∑ii X 2 得分布称为自由度等于n 得2χ分布,记作Z ~2χ(n),它得分布密度p(z )=⎪⎪⎩⎪⎪⎨⎧>⎪⎭⎫ ⎝⎛Γ--,,00,2212122其他z e x n z n n 式中得⎪⎭⎫ ⎝⎛Γ2n =u d e u u n ⎰∞+--012,称为Gamma 函数,且()1Γ=1,⎪⎭⎫ ⎝⎛Γ21=π。
2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。
证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +,Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +,即可得到Y+Z ~2χ(n +m )。
2、 t 分布 若X 与Y 相互独立,且X ~N(0,1),Y ~2χ(n ),则Z =n Y X得分布称为自由度等于n 得t 分布,记作Z ~ t (n ),它得分布密度 P(z)=)()(221n nn ΓΓ+2121+-⎪⎪⎭⎫ ⎝⎛+n n z 。
请注意:t 分布得分布密度也就是偶函数,且当n>30时,t 分布与标准正态分布N(0,1)得密度曲线几乎重叠为一。
这时, t 分布得分布函数值查N(0,1)得分布函数值表便可以得到。
3、 F 分布 若X 与Y 相互独立,且X ~2χ(n ),Y ~2χ(m ), 则Z=m Y n X得分布称为第一自由度等于n 、第二自由度等于m 得F 分布,记作Z ~F (n , m ),它得分布密度 p(z)=⎪⎪⎪⎩⎪⎪⎪⎨⎧>++-⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛+Γ•。
§1.4 常用的分布及其分位数 1. 卡平方分布卡平方分布、t 分布及F 分布都是由正态分布所导出的分布, 它们与正态分布一起,是试验统计中常用的分布。
当X i 、X 2 ..... Xn 相互独立且都服从 N(0,1)时,Z= X ;的分i布称为自由度等于 n 的2分布,记作Z 〜2(n),它的分布密度1= . n 。
2分布是非对称分布,具有可加性,即当 2独立,且 丫〜2(n ), z 〜2(m ,贝y 丫+z 〜2(n+m 。
证明:先令X 1、X 2、…、X n 、X n+1、X n+2、…、X n+m 相互独立且都 服从N(0,1),再根据 2分布的定义以及上述随机变量的相互独 立性,令Y =X 旳…+Xn , z =Xn 1+X2 2+- +Xn m ,Y+z= X2+X 2+…+x n+%莒%2+…+X2 m 即可得到丫+Z 〜2(n +m 。
2. t 分布若X 与丫相互独立,且X 〜N(0,1) , 丫〜2(n ),则Z = X 丫的分布称为自由度等于n 的t 分布,记作Z 〜t ( n ),它的分布密度请注意:t 分布的分布密度也是偶函数,且当 n>30时,t 分 布与标准正态分布 N(0,1)的密度曲线几乎重叠为一。
这时, t 分布的分布函数值查 N(0,1)的分布函数值表便可以得到。
p( z )=z 12e0,z 0其他,式中的 1e ud u ,称为 Gamma ®数,且 1 =1 ,丫与Z 相互P(z)=z2 nn13. F 分布若X 与丫相互独立,且X 〜2(n ) , 丫〜2(m ), 则Z=— /—的分布称为第一自由度等于 n 、第二自由度等于 m 的n mF 分布,记作 Z 〜F ( n , m ),它的分布密度nz2 请注意:F 分布也是非对称分布,它的分布密度与自由度的次 序有关,当Z 〜F( n , m 时,-〜F (Z4. t 分布与F 分布的关系若 X 〜t( n ),则 Y=X 2〜F(1, n )。
卡⽅分布与卡⽅检验卡⽅检验是⼀种⽤途很⼴的计数资料的假设检验⽅法。
它属于⾮参数检验的范畴,主要是⽐较两个及两个以上样本率( 构成⽐)以及两个分类变量的关联性分析。
其根本思想就是在于⽐较理论频数和实际频数的吻合程度或拟合优度问题。
它在分类资料统计推断中的应⽤包括:两个率或两个构成⽐⽐较的卡⽅检验;多个率或多个构成⽐⽐较的卡⽅检验以及分类资料的相关分析等。
举例:实际情况1情况2合计情况1的⽐例条件1439613930.94%条件2288411225.00%合计7118025128.29%表1 实际统计表格(⼀般:条件2 = ¬条件1 )通过简单的统计,得出在条件1和条件2下,出现情况1的⽐例分别为30.94%和25.00%,两者的差别有可能是误差导致,也有可能是在条件1下,情况1出现的⽐例更⾼。
(实际假设:在条件1下,情况1出现的⽐例更⾼,即条件1 对情况1的出现有影响)为了确定实际假设是否成⽴,先假设条件1 对情况1 的出现没有影响,(理论假设:条件1 对情况1 的出现没有影响,理论假设 = ¬实际假设)在实际统计中,情况1出现的⽐例为28.29%,那么在理论假设下(即条件1 对情况1 的出现没有影响),表1 条件1和情况1 对应的那⼀格的数据应该为 139 * 28.29% = 39.3231 。
表1 条件1和情况2 对应的那⼀格的数据应该为 139 * (1-28.29%) = 99.6769。
同样,表1 条件2 的那⼏格也按照上⾯的⽅式填。
这样得到,理论(条件1 对情况1 的出现没有影响)的表格,如下理论情况1情况2合计情况1的⽐例条件139.323199.676913928.29%条件231.684880.315211228.29%合计7118025128.29%表2 理论统计表如果理论假设(条件1 对情况1 的出现没有影响)成⽴,那么理论值与实际值的差别应该会很⼩。
理论值与实际值的差别的计算就会⽤到卡⽅公式:将表1 和表2 对应格的数据带⼊公式得到卡⽅值接下来是利⽤这个卡⽅值,通过查卡⽅分布的临界表,来判断理论假设(条件1 对情况1 的出现没有影响)是否成⽴。
医学统计方法之卡方检验卡方检验,又称卡方分布检验(Chi-Square Test),是一种常用的统计方法,用于检验两个或多个分类变量之间是否存在显著差异。
本文将详细介绍卡方检验的原理、应用范围以及具体的步骤。
一、原理:卡方检验的原理是基于卡方分布的性质。
卡方分布是指具有自由度的正态分布的平方和,记为χ^2(k),其中k为自由度。
在卡方检验中,我们将观察到的频数与理论预期频数进行比较,从而判断两个或多个分类变量之间的差异是否显著。
二、应用范围:卡方检验广泛应用于医学研究中的数据分析,尤其是在对两个或多个分类变量之间的关联进行检验时。
常见的应用场景包括但不限于以下几种:1.检验观察频数与理论预期频数之间的差异,以判断观察结果是否与理论预期相符。
2.检验两个或多个分类变量之间的关联性,以确定它们之间是否存在显著的相关性。
3.比较两个或多个群体在一个或多个分类变量上的分布差异,从而判断它们之间是否存在显著差异。
三、步骤:卡方检验的主要步骤包括以下几个:1. 建立假设:首先需要明确检验的假设。
在卡方检验中,通常有两种假设:“原假设”(null hypothesis,H0)和“备择假设”(alternative hypothesis,H1)。
原假设通常表示没有差异或关联,备择假设则表示存在差异或关联。
2.计算期望频数:根据原假设,计算出理论预期频数。
理论预期频数是基于既定的分布假设和样本总体的参数计算得出的。
3.计算卡方值:将观察频数与理论预期频数进行比较,计算出卡方值。
卡方值是观察频数与理论预期频数之间的差异的平方和。
4.确定自由度:根据检验问题的具体情况确定自由度。
在卡方检验中,自由度通常由分类变量的水平数目决定。
5.查表找出p值:根据卡方分布表,找出相应自由度下的临界值。
将计算得到的卡方值与临界值进行比较,确定其显著性水平。
p值是指在原假设成立的前提下,观察到的差异大于或等于当前差异的概率。
6.做出判断:根据p值与显著性水平的比较,做出判断是否拒绝原假设。
卡方分布表-资料类关键信息项1、卡方分布表的版本及发布日期:____________________________2、卡方分布表的适用范围:____________________________3、卡方分布表的精度和准确性说明:____________________________4、数据来源及可靠性验证方式:____________________________5、卡方分布表的更新频率和通知方式:____________________________6、使用卡方分布表的许可和限制条件:____________________________7、对于卡方分布表的解释和说明的责任方:____________________________11 引言本协议旨在规范和明确关于卡方分布表的相关事宜,包括其使用、获取、更新等方面的规定,以确保使用者能够正确、有效地利用卡方分布表进行相关的数据分析和研究。
111 卡方分布表的定义卡方分布表是一种用于统计分析的工具,它列出了不同自由度下卡方分布的临界值。
112 目的和用途卡方分布表主要用于假设检验、方差分析等统计方法中,以确定观察值与期望值之间的差异是否具有统计学意义。
21 卡方分布表的获取211 免费获取使用者可以通过指定的官方网站免费下载卡方分布表的电子版。
212 付费获取如有需要印刷版或特定格式的卡方分布表,可能需要支付一定的费用。
22 卡方分布表的版本控制221 每次发布新的卡方分布表版本,将明确标注版本号和发布日期。
222 使用者应及时关注最新版本,以确保使用的是最准确和有效的卡方分布表。
31 卡方分布表的适用范围311 适用于各类学术研究、数据分析项目等。
312 不适用于非法或未经授权的活动。
32 精度和准确性321 卡方分布表的数值经过严格计算和验证,具有一定的精度和准确性。
322 然而,使用者在使用时仍需谨慎,对于关键决策应进行多次验证和分析。
若n个相互独立的随机变量ξ₁,ξ₂,...,ξn,均服从标准正态分布(也称独立同分
布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,
其分布规律称为卡方分布(chi-square distribution)。
中文名 卡方分布 外文名 chi-square distribution
别 称 西格玛分布 提出者 Friedrich Robert Helmert
提出时间 1863 应用学科 统计学
目录
1 简介
2 定义
3 性质
4 概率表
简介
分布在数理统计中具有重要意义。 分布是由阿贝(Abbe)于1863年首先提出的,
后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡·皮尔逊(C K·Pearson)分别于
1875年和1900年推导出来,是统计学中的一个非常有用的著名分布。
定义
若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立
同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和
构成一新的随机变量,其分布规律称为 分布(chi-square distribution),
卡方分布
其中参数 称为自由度,正如正态分布中均数或方差不同就是另一个正态分布一样,自由
度不同就是另一个 分布。记为 或者 (其中 , 为限制条件数)。
卡方分布是由正态分布构造而成的一个新的分布,当自由度 很大时, 分布近似
为正态分布。
对于任意正整数x, 自由度为 的卡方分布是一个随机变量X的机率分布。
性质
1) 分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数
的增大, 分布趋近于正态分布;卡方分布密度曲线下的面积都是1。
2) 分布的均值与方差可以看出,随着自由度 的增大,分布向正无穷方向延伸(因
为均值 越来越大),分布曲线也越来越低阔(因为方差 越来越大)。
3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
4) 若 互相独立,则: 服从 分布,自由度为
。
5) 分布的均数为自由度 ,记为 E( ) = 。
6) 分布的方差为2倍的自由度( ),记为 D( ) = 。
概率表
分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在
分布中得对每个分布编制相应的概率值,这通过 分布表中列出不同的自由度来表示,
卡方分布临界值表
在 分布表中还需要如标准正态分布表中给出不同 P 值一样,列出概率值,只不过这里
的概率值是 值以上 分布曲线以下的概率。由于 分布概率表中要列出很多 分布
的概率值,所以 分布中所给出的 P 值就不象标准正态分布中那样给出了400个不同的
P 值,而只给出了有代表性的13个值,因此 分布概率表的精度就更差,不过给出了常
用的几个值,足够在实际中使用了。
查 分布概率表时,按自由度及相应的概率去找到对应的 值。如上图所示的单侧
概率 (7)=的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率这一列,
行列的交叉处即是。
表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值。例如,要在自由度
为7的卡方分布中,得到双侧概率为所对应的上下端点可以这样来考虑:双侧概率指的是在
上端和下端各划出概率相等的一部分,两概率之和为给定的概率值,这里是,因此实际上上
端点以上的概率为2=,用概率查表得上端点的值为16,记为 2(7)=16。下端点以下的概
率也为,因此可以用查得下端点为,记为 2(7)=。
当然也可以按自由度及 值去查对应的概率值,不过这往往只能得到一个大概的结
果,因为 分布概率表的精度有限,只给了13个不同的概率值进行查表。例如,要在自
由度为18 的 分布查找 =30对应的概率,则先在第一列找到自由度18,然后看这一
行可以发现与30接近的有与,它们所在的列是与,所以要查的概率值应于介于与之间,当
然这是单侧概率值,它们的双侧概率值界于与之间。如果要更精确一些可以采用插值的方法
得到,这在正态分布的查表中有介绍。
为什么从正态总体中抽取出的样本的方差服从 分布
在抽样分布理论一节里讲到,从正态总体进行一次抽样就相当于独立同分布的n个正态
随机变量ξ1,ξ2,…,ξn的一次取值,将n个随机变量针对总体均值与方差进行标准化
得(i=1,…,n),显然每个都是服从标准正态分布的,因此按照 分布的定义,应该服从参
数为 的 分布。
如果将总体中的方差σ2 用样本方差 s2代替,它是否也服从 分布呢理论上可以
证明,它是服从 分布的,但是参数 不是n而是n-1了,究其原因在于它是n-1个独立
同分布于标准正态分布的随机变量的平方和。
我们常常把一个式子中独立变量的个数称为这个式子的“自由度”,确定一个式子自由
度的方法是:若式子包含有n个变量,其中k个被限制的样本统计量,则这个表达式的自由
度为 n-k。比如中包含ξ1,ξ2,…,ξn这n个变量,其中ξ1-ξn-1相互独立,ξn为
其余变量的平均值,因此自由度为n-1。
附卡方表
n/P
1 … … … …
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
注:1. 当n充分大时,χ2(n)的值近似等于【Zα + SQRT(2n-1)】的平方/2
2. =, =。