统计学第七章假设检验
- 格式:doc
- 大小:849.11 KB
- 文档页数:25
图一两组乳猪脑组织钙泵含量该例为异源配对设计,首先对对照组和试验组数据差值进行正态检验。
Analyse-Descriptive Statics-Explore。
结果如下:图二差值正态检验结果因样本数量为7,需看Shapiro-Wilk,其值为0.771>0.05,服从正态分布。
可用配对样本均数的t检验。
(1)建立假设、确定检验水准α。
H0:µd=0,即两种处理的猪脑组织该泵的含量无差别。
H1:µd≠0, 即两种处理的猪脑组织该泵的含量有差别。
检验水准α=0.05(2)进行t检验Analyse-Compare Means-paired samples T test,结果如下:图三配对t检验结果95%的置信区间为(-0.009,0.097),包含0值,故接受H0,拒绝H1,两组间差别没有统计学意义,根据实验结果尚不能认为两种处理对猪组织钙泵含量有影响。
图四A、B鼠肝中铁的含量该例为完全随机设计。
首先对A、B两组进行正态性检验。
Analyse-Descriptive Statics-Explore。
结果如下:图五A、B两组鼠肝中铁含量的正态检验因样本数量为10,需看Shapiro-Wilk,A组值为0.319>0.05,服从正态分布。
B组值为0.269>0.05,服从正态分布。
对两组进行两样本方差齐性检验,Analyse-Compare Means-Independent samples T test结果为:图六A、B两组的方差齐性检验和t检验由上图得该两组样本方差齐性检验不满足方差齐性(F=8.246,P<0.05)。
可用均数比较的t`检验。
(1)建立假设、确定检验水准α。
H0:µ1=µ2,即不同饲料对鼠肝中铁的含量无影响。
H1:µ1≠µ2,即不同饲料对鼠肝中铁的含量有影响。
检验水准α=0.05(2)进行t检验如上述图六所示,两组样本方差齐性检验不满足方差齐性时,其95%的置信区间为(-0.1674,1.64674),包含0值。
第7章假设检验一、假设检验概述1.概念:假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。
2.主要目的:在于判决原假设的总体和当前抽样所取自的总体是否发生了显著的差异。
3.假设检验的检验法则假设检验过程就是比较样本观察结果与总体假设的差异。
差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0。
4.假设检验中的两类错误:“弃真”、“取伪”在假设检验中,在一定样本容量下,不能同时做到犯这两类错误的概率都很小。
因为减少α会引起β增大,减少β会引起α增大。
5.基本思想:反证法思想、小概率原理6.假设检验的步骤:根据题意合理地建立原假设和备择假设→选择适当的检验统计量,并确定其分布形式→选定显著性水平,并根据相应统计量的统计分布表查出临界值→根据样本观察值计算检验统计量的观察值→根据检验规则作出接受或拒绝原假设的判断二、单个正态总体的假设检验(显著水平为α)三、两个正态总体的假设检(显著水平为α)注:2221212222212121211s s n n f s s n n n n ⎛⎫+ ⎪⎝⎭=⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭+-- 四、总体比率的假设检验1、根据中心极限定理,在大样本条件下,若np 和nq 都大于5时,样本比率的抽样分布近似服从正态分布,因此,我们可用Z =作为检验统计量2、对于两总体比率之差的概率分布,可证明其近似地服从正态分布。
若总体比率未知,且1111,(1)n p n p -和 2222,(1)n p n p -都大于5时,我们可用样本比率1p 和2p 来替代。
因此,我们可用Z =五、假设检验中的其他问题1、区间估计与假设检验的关系:两者推断的角度不同、两者立足点不同、两者的主要决策参考点不同。
两者都属于统计推断方法,根据样本统计量对总体参数进行推断 对相同条件的推断问题,其推断的理论依据——抽样分布理论相同都是建立在概率基础上的推断,推断结果都具有一定的可靠程度或风险 利用置信区间可以进行假设检验2、假设检验中的p -值假设检验的p -值就是拒绝原假设的最小显著性水平。
第七章 假设检验【思考与练习】一、思考题1.解释零假设与备择假设的含义。
2.简述假设检验的基本步骤。
3.举例说明单侧检验与双侧检验的选择。
4.解释I 型错误、II 型错误和检验效能,并说明它们之间的关系。
5.简述假设检验与置信区间估计的联系。
二、案例辨析题为了比较非洛地平与常规药物治疗高血压的疗效差异,某医生随机抽取100名原发性高血压患者,分别测量患者接受非洛地平治疗前后的血压差值,计算得其21.5X =mmHg ,8.0S =mmHg 。
现已知常规药能使高血压患者的血压平均下降20mmHg 。
该医生对其进行了t 检验,零假设是μμ0=,备择假设是μμ0≠,检验水准0.05α=。
计算得 1.875t =,按100ν查t 界值表,得0.10P 0.05<<,故接受0H ,认为非洛地平与常规药物治疗高血压的疗效无差别。
你认为该结论正确吗?请说明理由。
三、最佳选择题1.比较两药疗效时,下列可作单侧检验的情形是A .已知A 药与B 药均有效 B .已知A 药与B 药均无效C .已知A 药不会优于B 药D .已知A 药与B 药差不多好E .不知A 药好还是B 药好 2.假设检验的基本步骤是A .计算检验统计量、确定P 值、做出推断结论B .建立无效假设、建立备择假设、确定检验水准C .建立无效假设、计算检验统计量、确定P 值D .确定单侧检验或双侧检验、选择t 检验或Z 检验、估计I 型错误概率和II 型错误概率E.建立检验假设和确定检验水准、计算检验统计量、确定P值并做出统计推断3.假设检验时,若检验水准α=0.05,则下列关于检验结果的说法正确的是A.若P<0.05,则不拒绝H,此时可能犯II型错误B.若P<0.05,则拒绝H,此时可能犯II型错误C.若P<0.05,则不拒绝H,此时可能犯I型错误D.若P>0.05,则拒绝H,此时可能犯I型错误E.若P>0.05,则不拒绝H,此时可能犯II型错误4.假设检验时,所犯II型错误概率最小的检验水准α为A.0.01 B.0.025 C.0.05D.0.10 E.0.205.有关两样本均数的比较,检验统计量t越大A.说明总体参数差别越大B.说明总体参数差别越小C.说明样本统计量差别越大D.说明样本统计量差别越小E.越有理由认为两总体参数不等6.在样本均数与已知总体均数比较的t检验中,结果 3.24t=,0.05/2,2.086tν=,0.01/2,2.845tν=,按检验水准0.05α=,可认为此样本均数A.与该已知总体均数不同B.与该已知总体均数差异很大C.所对应的总体均数与已知总体均数差异很大D.所对应的总体均数与已知总体均数相同E.所对应的总体均数与已知总体均数不同7.下列关于单侧检验和双侧检验的说法正确的是A.采用单侧检验更好B.采用双侧检验更好C.采用单、双侧检验都无所谓D.根据专业知识确定采用单侧检验还是双侧检验E.根据检验统计量的计算结果确定采用单侧检验还是双侧检验8.样本均数与已知总体均数比较的t检验时,P值越小说明A.样本均数与已知总体均数差别越小B.样本均数与已知总体均数差别越大C.样本所对应的总体均数与已知总体均数差别越大D.越有理由认为样本均数与已知总体均数不同E.越有理由认为样本所对应的总体均数与已知总体均数不同9.下列关于I型错误概率α和II型错误概率β的说法不正确的是A.当样本量确定时,α越小,β越大B.当样本量确定时,α越大,β越小C.欲减小犯I型错误的概率,可取较小αD.欲减小犯II型错误的概率,可取较大αE.若样本含量足够大,可同时避免犯这两型错误四、综合分析题1.已知服用某种营养素一个疗程后,受试者某项生化指标平均增加52个单位。
《应用统计学》第7章:单个总体的假设检验第7章单个总体的假设检验本章教学目标了解和掌握统计推断中的另一个基本问题:参假设检验及其在经济管理中的应用;掌握运用 Excel 的“数据分析”及其统计函数功能求解假设检验问题。
本章主要内容:§71>.1 案例介绍§7.2 假设检验的基本原理§7.3 单个正态总体均值的检验§7.4 单个正态总体方差的检验本章重点:假设检验中不可避免的两类错误及其应用 Excel“数据分析”功能的使用及其运行输出结果分析。
难点:假设检验中不可避免的两类错误及其应用。
§7.1 案例介绍【案例1】新工艺是否有效?某厂生产的一种钢丝的平均抗拉强度为 10560 (kg/cm2)。
现采用新工艺生产了一种新钢丝,随机抽取 10 根,测得抗拉强度为: 10512, 10623, 10668, 10554, 1077610707, 10557, 10581, 10666, 10670求得新钢丝的平均抗拉强度为 10631.4(kg/cm2)。
是否就可以作出新钢丝的平均抗拉强度高于原钢丝,即新工艺有效的结论?某台加工缸套外径的机床,正常状态下所加工缸套外径的标准差应不超过0.02 mm。
检验人员从加工的缸套中随机抽取 9 个,测得外径的样本标准差为 S = 0.03 mm。
问:该机床的加工精度是否符合要求?【案例2】机床加工精度是否符合要求?§7.2 假设检验的原理一、实际推断原理假设检验的理论是小概率原理,又称为实际推断原理,其具体内容是:小概率事件在一次试验中是几乎不可能发生的。
二、假设检验推理的思想方法假设检验推理的思想方法是某种带有概率性质的反证法。
三、基本原理和步骤例1:统计资料表明,某电子元件的寿命 X~N(??0 , ?? 2 ),其中 ??0已知,?? 2 未知。
现采用了新工艺生产,测得新工艺生产的 n 个元件寿命为 x1, x2, ···, xn。
第七章 假设检验Ⅰ.学习目的假设检验包括参数检验与非参数检验,是一种最能体现统计推断思想和特点的方法。
通过本章学习,要求:1.掌握统计检验的基本原理,理解该检验的规则及犯两类错误的性质;2.熟练掌握总体均值、总体成数及总体方差指标的各种检验方法,包括:z 检验、t 检验和p 值检验;3.掌握2 检验、符号检验、秩和检验及游程检验四种基本的非参数检验方法。
Ⅱ.课程内容要点 第一节 假设检验的基本原理一、假设检验的基本原理 “小概率原理”:小概率事件在一次试验中几乎是不会发生的。
事先所做的假设,是假设检验中关键的一项工作。
它包括原假设和备选假设两部分。
原假设是建立在假定原来总体参数没有发生变化的基础之上的。
备选假设是原假设的对立,是在否认原假设之后所要接受的,通常这是我们真正感兴趣的一个判断。
二、假设检验的规则与两类错误 1、假设检验的规则 假设检验的步骤:(1)首先根据实际应用问题确定合适的原假设0H 和备选假设1H ; (2)确定检验统计量,通过数理统计分析确定该统计量的抽样分布;(3)给定检验的显著性水平α。
在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况求出相应的临界值,该临界值为原假设的接受域与拒绝域的分界值;(4)从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。
从检验程序我们可以看出,统计量的取值范围可以分为接受域和拒绝域两个区域。
拒绝域正是统计量取值的小概率区域。
按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是两端,可以将检验分为单侧检验或双侧检验。
双侧检验中,又可以根据拒绝域,是在左侧还是在右侧而分为左侧检验和右侧检验。
对于这些双侧、左、右单侧检验,我们要结合备选假设来考虑。
在检验规则中,我们经常碰到两种重要的检验方法:z检验与t检验。
p值检验的原理:给出原假设后,在假定原假设正确的情况下,参照备选假设,可以计算出检验统计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算的检验统计量的数值的概率,这便是p值;而后将此概率值跟事先给出的显著性水平值α进行比较。
如果该值小于α,否定原假设,取对应的备选假设。
如果该值大于α,我们不就能否定原假设。
2、两类错误H实际为真,但我们却依据样本信息,做出拒绝的错误结论当原假设时,称为“弃真”错误;当原假设实际为假,而我们却错误接受时,称为“纳伪”错误。
通常记显著性水平α为犯“弃真”错误的可能性大小,β为犯“纳伪”错误的可能性大小。
由于两类错误是一对矛盾,在其他条件不变得情况下,减少犯“弃真”错误的可能性大小(α),势必增大犯“纳伪”错误的可能性大小(β),也就是说,β的大小和显著性水平α的大小成相反方向变化。
三、检验功效-可以用来表明所做假设检验工作好坏的一个指标,我们称之为检1β验功效。
它的数值表明我们做出正确决策的概率为1β-。
解决增强检验功效的唯一办法只有增大样本容量,这样既能保证满足取得较小的α,又能取得较小的β值。
第二节 总体参数假设检验一、总体均值的假设检验 1、总体方差2σ已知对于双侧检验,建立的假设为:0010:,:H H μμμμ=≠对于左(右)单侧检验来说,建立的假设为:0010:,:(H H μμμμ=<或>)检验统计量X z =~(0,1)N原假设的拒绝域为:样本统计量的值z 满足:12z zα->(双侧检验);1z z α-<-(左单侧检验);1z z α->(右单侧检验)。
当z 值处于拒绝域中时,我们就可拒绝原假设,否则不能拒绝原假设。
2、总体方差2σ未知对于双侧检验,建立的假设为:0010:,:H H μμμμ=≠ 对于左(右)单侧检验来说,建立的假设为:0010:,:(H H μμμμ=<或>)检验统计量X t =~(1)t n -,其中221()1ni i X X s n =-=-∑为样本标准差。
原假设的拒绝域为:样本统计量的值t 满足12(1)t tn α->-(双侧检验);1(1)t t n α-<--(左单侧检验);1(1)t t n α->-(右单侧检验)。
当t 值落入拒绝域,就拒绝原假设,否则不能拒绝原假设。
二、两个总体均值之差的检验1、两总体方差22X Yσσ、已知 ⑴ 双侧检验原假设为:0:X Y H μμ=,备选假设为1:X Y H μμ≠检验统计量:X Yz =~(0,1)N 。
该检验的否定域:12z zα->。
反之不能拒绝原假设。
⑵ 左单侧检验原假设与双侧一样,备选假设为1:X Y H μμ< 检验的否定域为:计算的样本统计量满足:1z z α-<- (3) 右单侧检验原假设与双侧一样,备选假设为1:X Y H μμ> 检验的否定域为:计算的样本统计量满足:1z z α->2、两总体方差22X Yσσ、未知但相等 双、单侧检验的原假设都相同,均为0:X Y H μμ=。
只是在双侧检验时,备选假设1:X Y H μμ≠;在左单侧检验时,备选假设为1:X Y H μμ<;在右单侧检验时,备选假设为1:X Y H μμ>。
检验统计量:X Yt =12(2)t n n +-。
对于双侧检验,原假设的拒绝域为:12t tα->。
反之就不能拒绝原假设。
对于左、右单侧检验,左单侧检验拒绝原假设的范围是:112(2)t t n n α-<-+-。
右单侧检验拒绝原假设的范围为:112(2)t t n n α->+-。
三、总体成数的假设检验1、单样本成数检验建立假设:0010:,:H P H P ρρ=≠检验统计量z =~(0,1)N 。
将样本统计量与临界值进行比较,若12z z α->,则否定原假设;反之则不能拒绝原假设。
当然,如果对应的原假设是单边的,即为00:()H P ρ≥≤或。
对应的临界值应该是1z α-,其余的计算和判断规则如上面所述。
2、两个样本总体成数差的检验检验统计量(0,1)z N =。
若建立的原假设为:012:H ρρ=,相应的临界值为12zα-;而如果建立的原假设为:012:()H ρρ≥≤或,相应的临界值为1z α-。
能否拒绝原假设的判断规则如前面所述。
四、正态总体方差的假设检验原假设为2200H σσ=:,备选假设:2210()H σσ≠≥≤:或者检验统计量 22212(1)n n s χχσ--=五、两个正态总体方差比的检验 1、两总体均值X Y μμ、已知检验统计量2122(,)X Ys F F n n s = ,其中122111()n X i X i s X n μ==-∑ ;222121()n Yi Y i s Y n μ==-∑。
原假设为:220X Y H σσ=:。
对于双侧检验,备选假设为:221X Y H σσ≠:,若()()1212122,,F F n n F Fn n αα-<>或则拒绝原假设,反之,则不能拒绝原假设。
对于左单侧检验: 备选假设:221X Y H σσ≥:,拒绝域为样本统计量()12,F F n n α<。
对于右单侧检验:备选假设:221X Y H σσ≤:,拒绝域为样本统计量()112,F F n n α->。
2、两样本均值X Y μμ、未知建立的原假设为:220X Y H σσ=:,检验统计量2122(1,1)XYS F F n n S =-- ,其中122111()1n Xi i S X X n ==--∑和222121()1n Yi i S Y Y n ==--∑。
对于双侧检验:备选假设:221X YH σσ≠:,当样本统计量122(1,1)F F n n α<--或1212(1,1)F Fn n α->--时,我们就拒绝原假设,反之不能拒绝原假设。
对于左单侧检验:建立的备选假设:221X YH σσ≥:,供判断的临界值为12(1,1)F n n α--,拒绝域为样本统计量()121,1F F n n α<--。
对于右单侧检验:建立的备选假设:221X YH σσ≤:,供判断的临界值为112(1,1)F n n α---,拒绝域为样本统计量()1121,1F F n n α->--。
第三节 非参数检验一、非参数检验概述实际问题中,可能无法获知或者是不一定很了解总体的分布类型,而只是通过样本来检验关于总体分布的假设。
这种检验方法称为非参数检验。
非参数检验与传统的参数检验比较有一些优缺点;对检验的限制更少,更加避免先见偏差,具有较好的稳健性;可以在更少样本资料要求的情况下进行,在一定程度上弥补有些实际中样本资料不足等的缺陷;可以弥补上述参数检验中碰到的无法运用的属性资料问题,然而,同时也就可能损失了其中所包含的另外信息。
二、2χ检验2χ检验是利用2χ分布的原理,通过对样本数据进行分析来对样本所属的总体情况进行判断的一种检验方法。
1.分布拟合检验原假设为:0010:()(),:()()H F X F X H F X F X =≠。
其中()F X 为总体的分布函数,0()F X 是某个事先假定的总体分布函数。
检验统计量:221()mi i i i f np np χ=-=∑~2(1)m k χ--。
其中i f 为各个样本区间内的实际频数,11()()()i i i i i p P X x X F X F X --=<<=-为落在各个区间的理论概率值,k 为待估计的参数个数。
拒绝原假设的值域:22(1)m k αχχ>--,如果样本统计量2χ大于2(1)m k αχ--,那么就可以拒绝原假设,否则不能拒绝原假设。
2.独立性检验该检验主要是考察多个变量之间是否有关联,如果变量之间没有关联性,那么就说变量之间是相互独立的。
我们这里的变量主要是定类、定序的资料。
为了分析变量之间的关联性,我们需要将资料整理成列联表的形式。
列联表是多行多列纵横交错所形成的一个表体。
三、符号检验1.单样本的符合检验在单样本的情况下,符号检验适用于检验总体中位数是否在某一指定的位置。
中位数检验的基本原理是,假设总体中位数的真值e M A =,然后在实际抽取的容量为n 的样本中,将每个观测值(1)i x i n ≤≤均减去A ,并只记录其差值的符合,即为()i i i x Asign x A x A +>⎧-=⎨-<⎩当当。
若i x A =,就略去不计。
接着分别计算“+”的个数(用n +表示)和“-”的个数(用n -表示)。
理论上,当中位数e M A =为真时,得到的正负号个数应该接近相等,即n n +-≈。
若从样本中得到的n +和n -相差较远,那么就有理由拒绝e M A =。