假设检验经典总结
- 格式:docx
- 大小:35.06 KB
- 文档页数:1
假设检验一、假设检验的概念统计推断包括两大方面的内容,其一为参数估计(如总体均数的估计),另一方面,即假设检验(hypothesis test)。
假设检验过去亦称显著性检验(significance test)。
其基本原理和步骤用以下实例说明。
例为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。
某医生在一山区随机抽查了25名健康成年男子,求得其脉搏的均数为74.2次/分,标准差为6.0次/分。
根据大量调查,已知健康成年男子脉搏均数为72次/分;能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏均数?本例可用下图表示。
显然,本例其目的是判断是否μ>μ0。
从所给条件看,样本均数X与已知总体均数μ0不等,造成两者不等的原因有二:①非同一总体,即μ#μ0;②同一总体即μ=μ0,两个均数不相等的原因在于抽样误差。
假设检验的目的就是要判断造成上面两个均数不等的原因是哪一个。
也就是说,是解决样本均数代表性如何的问题。
上例是,样本均数比已知总体均数大,有可能是由于抽样误差引起,也有可能是由于所调查的样本人群的生活环境、生活习惯、遗传或其他原因所致,如何判断呢,这就需要利用统计学方法----假设检验方法。
假设检验也是统计分析的重要组成部分。
(提问:统计分析包括参数估计和假设检验)下面我们以例题所提出的问题学习假设检验的基本步骤,同时学习样本均数与总体均数比较的t检验。
假设检验一般都是有“名”的,比如t检验,大家要知道假设检验的命名通常是以所要计算的统计量来命名的,如t检验、F检验、X2检验等。
后面有进一步介绍。
二、假设检验的基本步骤建立检验假设(一)建立假设表示。
这种假设的含义是假设两个指标(样本指标与总体指标、假设有两种:一种是检验假设,常称无效假设,用H表示,是或两个样本指标)是相等的,它们的差别是由于抽样误差引起的。
另一种是备择假设,常称对立假设,常用H1相对立的假设,假设两个指标不相等,它们的差别不是由于抽样误差引起的,若无效假设被否决则该假设成立。
常见的假设检验一般地说,根据样本对总体某项或某几项作出假设,并对该假设作出接受或拒绝的判断,这种方法称为假设检验。
u—检验法检验的是:在大样本(n>30)的情况下,某一随机变量的期望是否等于一个常数C。
t检验法/学生检验检验的是:在小样本(n<30)的情况下,两个变量的平均值差异程度。
对于两个变量的解释:可以看作是两个不同的样本;也可以看作是抽样样本和总体。
据此就分为:单样本T检验、配对样本T检验和独立样本T检验例子:难产婴儿和总体婴儿对比;治疗前后对比;北京人和南京人对比χ2检验法(卡方检验)检验的是:两个及其以上的频率/构成比例之间的差异分析,对比的数是“比例”案例:某咨询公司想了解南京和北京的市民对最低生活保障的满意程度是否相同。
他们从南京抽出600居民,北京抽取600居民,每个居民对满意程度(非常满意、满意、不满意、非常不满意)任选一种,且只能选一种。
南京和北京居民对最低生活保障满意程度比例相同吗?检验的是:来自不同总体的两个样本的方差是否存在差异。
F检验又叫方差齐性检验。
简单的说,检验两个样本的方差是否有显著性差异。
从两个研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。
若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。
要判断两个总体方差是否相等,就可以用F检验。
(在OLS中,假设随机扰动项是0均值、同方差——方差齐性、非序列相关)。
在两样本t检验(两个样本的均值差异性检验)中要用到F检验。
这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。
F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差 σ2,以确定他们的精密度是否有显著性差异。
至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t检验。
计算方法:检验的是:比较两个独立样本的分布是否存在差异适用范围:在实践中我们常常会遇到以下一些资料,如需比较患者和正常人的血铁蛋白、血铅值、不同药物的溶解时间、实验鼠发癌后的生存日数、护理效果评分等,这类资料有如下特点:(1)资料的总体分布类型未知;(2)资料的总体分布类型已知,但不符合正态分布;(3)某些变量可能无法精确测量;(4)方差不齐。
第三节u检验和t检验u检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。
理论上要求样本来自正态分布总体。
但在实用时,只要样本例数n较大,或n小但总体标准差σ已知时,就可应用u检验;n小且总体标准差σ未知时,可应用t检验,但要求样本来自正态分布总体。
两样本均数比较时还要求两总体方差相等。
一、样本均数与总体均数比较比较的目的是推断样本所代表的未知总体均数μ与已知总体均数μ0有无差别。
通常把理论值、标准值或经大量调查所得的稳定值作为μ0.根据样本例数n大小和总体标准差σ是否已知选用u检验或t 检验。
(一)u检验用于σ已知或σ未知但n足够大[用样本标准差s作为σ的估计值,代入式(19.6)]时。
以算得的统计量u,按表19-3所示关系作判断。
表19-3 u值、P值与统计结论例19.3根据大量调查,已知健康成年男子脉搏均数为72次/分,标准差为6.0次/分。
某医生在山区随机抽查25名健康成年男子,求得其脉搏均数为74.2次/分,能否据此认为山区成年男子的脉搏高于一般?据题意,可把大量调查所得的均数72次/分与标准差6.0次/分看作为总体均数μ0和总体标准差σ,样本均数x为74.2次/分,样本例数n为25.H0:μ=μ0H1:μ>μ0α=0.05(单侧检验)算得的统计量u=1.833>1.645,P<0.05,按α=0.05检验水准拒绝H0,可认为该山区健康成年男子的脉搏高于一般。
(二)t检验用于σ未知且n较小时。
以算得的统计量t,按表19-4所示关系作判断。
表19-4 |t|值、P值与统计结论例19.4 若例19.3中总体标准差σ未知,但样本标准差已求出,s=6.5次/分,余数据同例19.3.据题意,与例19.3不同之处在于σ未知,可用t检验。
H0:μ=μ0H1:μ>μ0α=0.05(单侧检验)本例自由度v=25-1=24,查t界值表(单侧)(附表19-1)得t0.05(24)=1.711.算得的统计量t=1.692<1.711,P>0.05,按α=0.05检验水准不拒绝H0,尚不能认为该山区成年男子的脉搏高于一般。
统计学假设检验类型公式整理在统计学中,假设检验是一种常用的方法,用于根据样本数据对总体特征进行推断。
通过假设检验,我们可以得出结论,判断某个总体参数是否符合我们的预期或者所提出的假设。
本文将整理常见的统计学假设检验类型及其相关公式,以帮助读者更好地理解和运用这些方法。
一、单样本均值检验单样本均值检验主要用于判断一个样本的平均值与已知总体的平均值是否有显著差异。
以下是单样本均值检验的公式:1. 步骤1:设定假设和显著性水平2. 步骤2:计算样本均值(x)和标准误差(SE)3. 步骤3:计算检验统计量(t值)4. 步骤4:计算p值5. 步骤5:作出决策,接受或拒绝原假设二、双样本均值检验双样本均值检验用于比较两个样本的均值是否存在显著差异。
以下是双样本均值检验的公式:1. 步骤1:设定假设和显著性水平2. 步骤2:计算两个样本的均值差值(x1 - x2)和标准误差(SE)3. 步骤3:计算检验统计量(t值)4. 步骤4:计算p值5. 步骤5:作出决策,接受或拒绝原假设三、配对样本均值检验配对样本均值检验用于比较同一组样本在不同时间或条件下的均值差异。
以下是配对样本均值检验的公式:1. 步骤1:设定假设和显著性水平2. 步骤2:计算配对样本的均值差值(d)和标准误差(SE)3. 步骤3:计算检验统计量(t值)4. 步骤4:计算p值5. 步骤5:作出决策,接受或拒绝原假设四、单样本比例检验单样本比例检验用于比较一个样本中某一属性的比例与已知总体比例是否有显著差异。
以下是单样本比例检验的公式:1. 步骤1:设定假设和显著性水平2. 步骤2:计算样本比例(p)和标准误差(SE)3. 步骤3:计算检验统计量(z值)4. 步骤4:计算p值5. 步骤5:作出决策,接受或拒绝原假设五、双样本比例检验双样本比例检验用于比较两个样本中某一属性的比例是否存在显著差异。
以下是双样本比例检验的公式:1. 步骤1:设定假设和显著性水平2. 步骤2:计算两个样本的比例差值(p1 - p2)和标准误差(SE)3. 步骤3:计算检验统计量(z值)4. 步骤4:计算p值5. 步骤5:作出决策,接受或拒绝原假设六、方差分析方差分析用于比较多个样本均值是否存在显著差异。
常见假设检验公式的详细解析假设检验是统计学中常用的一种推断方法,用于判断一个假设是否成立。
常见的假设检验公式有很多种,下面将对其中几种进行详细解析。
1. 单样本均值检验公式假设我们有一组观测值X₁,X₂,...,Xₙ,要检验这些观测值的总体均值是否等于某个值μ₀。
假设检验的原假设(H₀)是:总体均值等于μ₀,备择假设(H₁)是:总体均值不等于μ₀。
使用t检验进行检验时,计算统计量的公式如下:t = (x - μ₀) / (s/√n)其中,x是样本均值,s 是样本标准差,n 是样本容量。
根据t值和自由度的对应表,可以得到该t值的显著性水平和p值。
2. 双样本均值检验公式双样本均值检验用于比较两组样本的均值是否有显著差异。
假设我们有两组样本X₁,X₂,...,Xₙ和Y₁,Y₂,...,Yₙ,要检验它们的总体均值是否相等。
使用独立样本t检验进行检验时,计算统计量的公式如下:t = (x₁ - x₂) / √((s₁²/n₁) + (s₂²/n₂))其中,x₁和x₂分别是两组样本的均值,s₁和 s₂分别是两组样本的标准差,n₁和 n₂分别是两组样本的容量。
根据t值和自由度的对应表,可以得到该t值的显著性水平和p值。
3. 单样本比例检验公式单样本比例检验用于检验样本的比例是否等于某个给定的比例。
假设我们有一组观测值,成功的事件发生的次数为x,总事件发生的次数为n,要检验成功的概率是否等于某个给定的比例p₀。
使用正态分布的近似方法进行检验时,计算统计量的公式如下:z = (p - p₀) / √(p₀(1-p₀)/n)其中,p是样本成功的比例,p₀是给定的比例,n 是样本容量。
根据z值和显著性水平的对应关系,可以得到该z值的p值。
总结:上述所介绍的是常见假设检验公式中的几种,每种假设检验有其适用的前提条件和计算公式。
在进行假设检验时,需要注意选择适当的公式和假设检验方法,以及正确计算统计量并进行显著性检验。
关于假设检验的详细总结与典型例题假设检验是数一考生普遍反映非常头疼的一块内容,因为它入门较难,其思想在初次复习时理解起来较难。
虽然这一部分在历年真题中考查次数很少,但为了做到万无一失,我们也应该准备充分,何况相对来说这一部分内容的难度和变化并不大。
为了让各位考生对假设检验有一个全面深入的理解和掌握,我们给出如下总结与例题。
对于假设检验,首先要理解其基本原理,即小概率原理,假设检验的方法即是从此原理衍生而来;其次,要掌握其步骤,会根据显著性水平α,即第一类心理学考研错误,来求拒绝域与接收域,其求法要根据不同的条件来套用公式,能根据理解推导公式是上策,如果时间不够,可以选择记忆各种不同条件下的求拒绝域的公式。
最后,相比之下两个正态总体参数的假设检验的考查可能性要低于一个正态总体参数的假设检验。
假设检验的基本概念数理统计的基本任务是根据样本推断总体,对总体的分布律或者分布参数作某种假设,然后根据抽得的样本,运用统计分析的方法来检验这一假设是否正确,从而作出接受假设或者拒绝假设的决定,这就是假设检验.根据实际问题提出的假设0H 称为原假设,其对立假设1H 称为备择假设. 假设检验中推理的依据是小概率原理:小概率事件在一次试验中实际上不会发生. 假设检验中的小概率α称为显著性水平,通常取0.05α=或者0.01α=.假设检验中使用的推理方法是:为了检验原假设0H 是否成立,我医学考研论坛们先假定原假设0H 成立. 如果抽样的结果导致小概率事件在一次试验中发生了,根据小概率原理,有理由怀疑0H 的正确性,从而拒绝0H ,否则接受0H .假设检验的步骤⑴根据实际问题提出原假设0H 和备择假设1H ; ⑵确定检验统计量T ;⑶根据给定的显著水平α,查概率分布表,确定拒绝域W ;⑷利用样本值计算统计量T 的值t ,若t W ∈,则拒绝0H ,否则接受0H .假设检验中可能犯的两类错误由于小概率事件还是可能发生的,根据小概率作出的判断可能是错误的. 事件0H 真而拒绝0H ,称为第一类(弃真)错误,犯第一类错误的概率为{}0P t W H α∈≤,因此显著性水平α是用来控制犯第一类错误的概率的. 0H 假而接受0H ,称为第二类(纳伪)错误,犯第二类错误的概率为{}1P t W H ∉,记作β.典型例题1.136,,X X 是取自正态总体(,0.04)N μ的简单随机样本,检验假设0:0.5H μ=,备择假设11:0.5H μμ=>,检验的显著水平0.05α=,取否医学考研论坛定域为X c >,则c = ,若10.65μ=,则犯第二类错误的概率β= .解 ⑴0H 成立时,0.04~(0.5,)36X N , {}00.50.051()0.1/3c P X c H αΦ-==>=-,0.5()0.95(1.645)0.1/3c ΦΦ-==,0.51.6450.1/3c -=,得0.5548c =.⑵1H 成立时,0.04~(0.65,)36X N{}10.55480.65()( 2.856)0.1/3P X c H βΦΦ-=≤==-.1(2.856)10.99790.0021Φ=-=-=2.设总体20~(,)X N μσ,20σ已知,检验假设00:H μμ=,备择假设10:H μμ>,取否定域为X c >,则对固定的样本容量n ,犯第一类错误的概率α随c 的增大而 .(减小)解 0H 成立时,200~(,)X N nσμ,犯第一类(弃真)错误的概率{}001(/P X c H nαΦσ=>=-,故犯第一类错误的概率α随c 的增大而减小.一个正态总体2(,)N μσ参数的假设检验 ⑴ 2σ已知,关于μ的检海文考研验(u 检验) 检验假设00:H μμ= 统计量X U =拒绝域2U u α>检验假设00:H μμ>统计量X U =拒绝域U u α<-检验假设00:H μμ<统计量X U =拒绝域U u α>⑵2σ未知,关于μ的检验(t 检验) 检验假设00:H μμ=统计量X t =拒绝域2(1)t t n α>-检验假设00:H μμ> 统计量0/X t S n = 拒绝域(1)t t n α<--检验假设00:H μμ< 统计量0/X t S n=拒绝域(1)t t n α>-⑶μ未知,关于2σ的检验(2χ检验) 检验假设2200:H σσ=统计量2220(1)n S χσ-=拒绝域222(1)n αχχ>-或者2212(1)n αχχ-<-检验假设2200:H σσ>统计量2220(1)n S χσ-=拒绝域221(1)n αχχ-<-检验假设2200:H σσ< 统计量2220(1)n S χσ-= 拒绝域22(1)n αχχ>-▲拒绝域均采用上侧分位数.两个正态总体21(,)N μσ、22(,)N μσ参数的假设检验.⑴两个正态总体21(,)N μσ、22(,)N μσ均值的假设检验(t 检验) 检验假设012:H μμ=统计量X Yt =拒绝域122(2)t t n n α>+-检验假设012:H μμ>统计量X Yt =拒绝域12(2)t t n n α<-+-检验假设012:H μμ<统计量X Yt =拒绝域12(2)t t n n α>+-⑵两个正态总体211(,)N μσ、222(,)N μσ方差的假设检验(F 检验) 检验假设22012:H σσ=统计量2122S F S = 拒绝域122(1,1)F F n n α>--或者1212(1,1)F F n n α-<--检验假设22012:H σσ>统计量2122S F S = 拒绝域112(1,1)F F n n α-<--检验假设22012:H σσ< 统计量2122S F S = 拒绝域12(1,1)F F n n α>--▲拒绝域均采用上侧分位数. 典型例题1.设n X X X ,,,21 是来自正态总海文考研体2(,)N μσ的简单随机样本,其中参数2,μσ未知,记22111,(),n ni i i i X X Q X X n ====-∑∑则假设0:0H μ=的t 检验使用统计量t = .解 统计量2(1)//(1)n n XX nXt S n Q n -===-2.某酒厂用自动装瓶机装酒,每瓶规定重500克,标准差不超过10克,每天定时检查,某天抽取9瓶,测得平均重X =499克,标准差S =16.03克. 假设瓶装酒的重量X 服从正态分布.问这台机器是否工作正常?(05.0=α).解 先检验0H :500μ=,统计量X t =, 拒绝域0.025(8) 2.3060t t >=,4995000.18716.03/3X t -===-,接受0H ;再检验0H ':2210σ≤,统计量222(1)10n S χ-=, 拒绝域220.05(8)15.507χχ>=, 22222(1)816.0320.5571010n S χ-⨯===,拒绝220:10H σ'≤, 故该机器工作无系统误差,但不稳定3.设127,,,X X X 是来自正态总体211(,)N μσ的简单随机样本,设128,,,Y Y Y 是来自正态总体222(,)N μσ的简单随机样本,且两个样本相互独立,它们的样本均值分别为13.8,17.8X Y ==,样本标准差123.9, 4.7S S ==,问在显著性水平0.05下,是否可以认为12μμ<?解 先检验0H :2212σσ=,检验统计量2122S F S =,拒绝域0.025(6,7) 5.12F F >=或者0.9750.02511(6,7)(7,6) 5.70F F F <==,221222 3.90.68854.7S F S ===,接受0H ; 再检验0H ':12μμ<,统计量1211w X Yt S n n =+, 拒绝域0.05(13) 1.7709t t >=,1.7773X Yt ==-,接受0H ',即可以认为12μμ<. ▲检验两个正态总体均值相等时,应先检验它们的方差相等.。
假设检验
一、假设检验的概念
先对总体参数/分布形式提出某种假设,然后利用样本信息/相关统计量的分布特征检验这个假定是否拒绝原假设。
二、假设检验的目的
找出样本均值x 与总体均值μ存在差距的原因。
三、如何进行假设检验
小概率事件原理:取05.0=α的显著性水平。
1.提出原假设和备选假设;
某一数值)
某一数值;某一数值(或≥≤=μμμ:0H 某一数值)
某一数值;某一数值(或 μμμ≠:0H 2.选定检验统计量:(Z 统计量/t 统计量)
n x z σμ0-=,n
s x t 0μ-=; 3.选定显著性水平:(第一类错误,第二类错误)
第一类错误:(弃真错误)
0H 为真时拒绝,拒绝正确0H ;
(第一类错误的概率为α); 第二类错误:(取伪错误)
0H 为假时接受,当1H 正确时,反而认为0H 正确;
(第二类错误的概率为β); 两类错误不可同犯,也不是必犯其一,犯第一类错误的概率最大不超过α,但无法算出犯第二错误的概率。
4.根据数据计算检验统计量的值与其对应的概率p 值,并进行决策。
检验统计量的值:
根据给定α,查临界值2
2ααααt t z z 或,或
将z 值,t 值与临界值进行比较后得出结论。
P 值:
单侧检验:2 p ,不能拒绝0H ;
2 p ,拒绝0H ;
双侧检验:
2α
p ,拒绝0H ; 2α
p ,不能拒绝0H ;。