实验二单样本符号检验
- 格式:doc
- 大小:538.99 KB
- 文档页数:8
u检验、t检验、F检验、X2检验常用显著性检验1.t检验适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。
包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。
2.t'检验应用条件与t检验大致相同,但t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。
3.U检验应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t检验可以代替U检验。
4.方差分析用于正态分布、方差齐性的多组间计量比较。
常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较,方差分析首先是比较各组间总的差异,如总差异有显著性,再进行组间的两两比较,组间比较用q检验或LST检验等。
5.X2检验是计数资料主要的显著性检验方法。
用于两个或多个百分比(率)的比较。
常见以下几种情况:四格表资料、配对资料、多于2行*2列资料及组内分组X2检验。
6.零反应检验用于计数资料。
是当实验组或对照组中出现概率为0或100%时,X2检验的一种特殊形式。
属于直接概率计算法。
7.符号检验、秩和检验和Ridit检验三者均属非参数统计方法,共同特点是简便、快捷、实用。
可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。
其主要缺点是容易丢失数据中包含的信息。
所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。
8.Hotelling检验用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。
计量经济学检验方法讨论计量经济学中的检验方法多种多样,而且在不同的假设前提之下,使用的检验统计量不同,在这里我论述几种比较常见的方法。
在讨论不同的检验之前,我们必须知道为什么要检验,到底检验什么?如果这个问题都不知道,那么我觉得我们很荒谬或者说是很模式化。
检验的含义是要确实因果关系,计量经济学的核心是要说因果关系是怎么样的。
那么如果两个东西之间没有什么因果联系,那么我们寻找的原因就不对。
Minitab实用金典――初级班【目标学员】各企业从事质量、生产和工程工作的中高层技术及管理人员,有一定统计基础。
【课程目的】MINITAB作为6sigma最佳工具软件,让复杂的统计技术在您的企业中变成广泛应用的工具。
本课程内容设计兼顾对学员相关统计技术的巩固,同时结合6西格项目应用时的相关工具来讲授。
通过该培训课程,学员们将能够:a)掌握Minitab基本统计技术和假设检验的操作方法。
b)进一步理解和掌握测量系统分析、方差分析、回归分析、试验设计、统计过程控制和QC常见工具的应用。
c)掌握相关工具的Minitab操作、数据和图形结果的分析与判定。
d)掌握6 Sigma中MAIC各阶段中常用的统计分析手法和工具【主讲老师】顾松老师MBA硕士IPTS注册培训师实战派讲师【培训大纲】第1天第1章:MINITAB操作系统概述1、认识MINITAB2、启动MINITAB3、MINITAB图表表示数据4、分析数据5、生成报告案例演示与练习第2章:常用图形制作1、散布图2、矩阵散布图3、长条图4、直方图5、箱型图6、茎叶图7、等高线图8、3D曲线图案例演示与练习第3章:基本统计量1、1-sampleZ检验2、1-sampleT检验3、2-sampleT检验4、Paired T检验5、1-Proportion检验6、2-Proportion检验7、2-Variances检验8、相关分析9、正态检验案例演示与练习第4章:回归与方差分析1、简单回归2、二元一次回归3、曲线回归4、多元回归5、单因子方差分析6、两因子方差分析7、主效应图案例演示与练习第2天第5章:非参数检验1、单样本符号检验2、单样本Wilcoxon检验3、Mann-Whitney检验4、Kruskal-Wallis检验5、Mood检验6、游程检验案例演示与练习第6章:质量工具1、运行图Run chart2、柏拉图Pareto3、特性要因图(鱼骨图)4、制程能力分析(常态分配)5、制程能力Sixpack(常态)6、制程能力分析(组内/组间)7、制程能力Sixpack(组内/组间)8、制程能力分析(二项式)9、制程能力分析(泊松分布)案例演示与练习第7章:量测系统分析1、量具运行图2、线性、偏倚研究3、G R&R研究(交叉)4、G R&R研究(嵌套)5、属性一致性分析案例演示与练习第8章:控制图1、Xbar-R管制图2、Xbar-S管制图3、P管制图4、NP管制图5、C管制图6、U管制图案例演示与练习第9章:DOE与田口实验设计1、DOE实验计划2、全因子实验3、中心点实验4、静态田口试验5、动态田口试验案例演示与练习。
符号检定法符号检定法符号检定法是一种用于比较两个样本差异是否显著的统计方法。
它不需要对数据进行任何假设,也不需要知道数据分布的形态,因此被广泛应用于各种实验设计和数据分析中。
下面将从符号检定法的原理、应用、优缺点以及注意事项等方面进行详细介绍。
一、原理符号检定法是一种非参数检验方法,它基于样本中每个观测值的正负性来判断两个样本是否存在显著差异。
具体而言,它将每个观测值都看作一个符号(“+”或“-”),然后比较两个样本中正符号的数量是否显著大于负符号的数量或者反之。
如果差异显著,则可以拒绝零假设,即认为两个样本存在显著差异;否则不能拒绝零假设,即认为两个样本不存在显著差异。
二、应用符号检定法适用于以下情况:1. 样本大小较小,不能满足正态性和方差齐性等假设条件;2. 数据分布未知或不满足正态分布等常见分布形式;3. 感兴趣的变量是二元的,如生存与死亡、成功与失败等;4. 研究对象是匹配样本或成对样本。
三、步骤符号检定法的实施步骤如下:1. 对每个观测值确定符号,比如大于中位数的为“+”,小于中位数的为“-”;2. 计算正负符号的数量,以及它们之间的差异(即正负差);3. 判断正负差是否显著,如果显著,则拒绝零假设;否则不能拒绝零假设。
四、优缺点符号检定法具有以下优点:1. 不需要知道数据分布形态,因此具有较强的鲁棒性和稳健性;2. 不需要满足正态性等假设条件,因此适用范围广泛;3. 可以处理匹配样本或成对样本数据。
但是符号检定法也存在一些缺点:1. 效率较低,因为它只利用了部分信息而没有充分利用所有数据;2. 对于连续型变量而言,它可能会丢失一些有价值的信息。
五、注意事项在使用符号检定法时需要注意以下事项:1. 样本大小应该足够大,一般建议每组样本不少于10个;2. 如果样本大小较小,则可以使用精确符号检定法(exact sign test)进行检验;3. 符号检定法只能用于比较两个样本之间的差异,不能用于多组数据之间的比较;4. 对于连续型变量而言,建议先将其离散化为二元变量再进行符号检定。
符号检验什么是符号检验符号检验法是通过两个相关样本的每对数据之差的符号进行检验,从而比较两个样本的显著性。
具体地讲,若两个样本差异不显著,正差值与负差值的个数应大致各占一半。
符号检验与参数检验中相关样本显著性t检验相对应,当资料不满足参数检验条件时,可采用此法来检验两相关样本的差异显著性。
根据符号检验判断差异显著性时也要查表找出相应的临界值。
但特别应注意的是在某一显著性水平下,实得的r值大于表中r的临界值时,表示差异不显著,这一点与参数检验时的统计量和临界值的判断结果不同。
表1单侧符号检验统计判断规则r与临界值的比较P值显著性r > r0.05P>0.05 不显著显著极显著符号检验的步骤编符号:一对一比较,如果前者大于后者,或者前者较优,记以符号”+”,否则记以”-”,如二者相等或不能判明优劣,就记为”0”。
建立假设:H0:P(X1 > X2) = P(X2 > X1) = 0.5清点“+”、“-”、“0”各有几个,分别记为n+、n-、n0进行显著性检验查符号检验表(表中N = n++ n−):r = min(n+,n−),查表,如r>表值,差异不显著,r≤表值,差异显著。
符号检验的计算方法符号检验的具体检验方法因样本大小的不同而不同。
1、小样本(N<25)时的检验方法例1:研究人员将三岁儿童经配对而成的实验组进行颜色试验教学,对照组不进行此种教学。
后期测验得分如表2。
问颜色教学是否有显著效果?解:检验步骤:(1)建立假设:H0:颜色教学无显著效果H1:颜色教学有显著效果(2)求差数并记符号:计算X1与X2每对数据的差数,“+”的个数n+= 7,“-”的个数n−= 3,差数为0不予考虑。
于是有:n = n++ n−= 7 + 3 = 10。
将n+和n_中较小的一个记为r,本例r=3。
(3)统计决断:根据n = n++ n−= 7 + 3 = 10及显著性水平,查符号检验表寻找r的临界值,r0.05 = 1,而实际的r=3,有r > r0.05。
非参数统计分析实验指导书朱宁编2012.3.12实验二单样本符号检验一.实验目的1.了解Excel、Minitab程序结构及其使用方法;2.会用Excel、Minitab对数据进行预处理;3.会用符号检验法来解决中位数的检验问题。
二.实验要求1. 会用Excel、Minitab软件对建立的数据集进行分析;2. 掌握中位数检验问题的符号检验法及其步骤。
三.实验原理1.基本原理在对总体分布不做任何假设的前提下,当原假设错误!未找到引用源。
:(已知)为真时,大于错误!未找到引用源。
的数据个数S+与小于错误!未找到引用源。
的数据个数S-应该很接近;若两者相差太大,就有理由拒绝原假设。
2.单样本中位数符号检验的适用范围1)在数据呈偏态分布的情况下,我们可能对总体的中位数更感兴趣,希望对总体的中位数做出推断,这时可以使用符号检验(sign test)的方法。
2)在非正态总体小样本的情况下,如果要对总体分布的位置进行推断,由于t检验不适用,也可使用符号检验的方法。
3.符号检验的基本思想每个数据都减去零假设中的中位数,记录其差值的符号。
计算正、负符号的个数(差值为0的不计算在任何一个中),当原假设为真时二者应该很接近;若两者相差太远,就有理由拒绝原假设。
4.符号检验问题的原假设和备择假设该假设检验有三种情况:原假设错误!未找到引用源。
为:错误!未找到引用源。
,其中错误!未找到引用源。
是给定的常数.备择假设错误!未找到引用源。
分别是:错误!未找到引用源。
、错误!未找到引用源。
和错误!未找到引用源。
.5.符号检验的检验统计量检验统计量:错误!未找到引用源。
记号“#”表示计数,即S+是集合G中的元素,其中G是使得错误!未找到引用源。
成立的错误!未找到引用源。
(错误!未找到引用源。
)构成的集合。
错误!未找到引用源。
1)在原假设成立的条件下,检验统计量错误!未找到引用源。
服从二项分布。
2)按照这个概率可以根据二项分布计算得到P值,从而得出检验的结论。
四.应用实例【例1】某市劳动和社会保障部门的资料说明,1998年高级技术师的年收入的中位数为21700元.该市某个行业有一个由50名高级技师组成的样本.这些高级技师的年收入如下表:用符号检验法来解决中位数的检验问题的步骤如下:①给出原假设和备择假设。
针对该问题,经计算,这50名高级技师年收入的中位数为23276,超过了全市高级技师年收入的中位数21700.因此,这个假设检验问题的原假设和备择假设分别为:错误!未找到引用源。
②用统计软件Minitab进行符号检验的步骤:a)将表1高级技师的年收入数据放在Excel里面做成一列;b)输入数据:将Excel表中50个高级技师的年收入数据输入到C1列;c)选择Stat(统计)下拉菜单;图1 Stat下拉菜单对话框d)选择Nonparametric(非参数)选项;e)在Nonparametric的下拉菜单中选择1-Sample Sign(单样本符号)选项;图2 Nonparametric下拉菜单对话框f)在对话框的Variable(变量)方框内键入C1;选择Test median(检验中位数)并在Test median栏中键入欲检验的中位数错误!未找到引用源。
的值,本例是21700;还要在Alternative(备择)的下拉菜单的3个选项(小于,不等于和大于)中选择一项,本例是选大于。
图3 单样本符号对话框g)单击OK(确定).输出结果如下图:图4 输出的检验结果图从输出的结果可以看出,对于给定的α=0.05的检验水平,从得出的p值=0.0325<α,我们可以得出结论:拒绝原假设错误!未找到引用源。
,从而认为总体中该行业高级技师的年收入的中位数错误!未找到引用源。
>21700.【例2】以上述50名高级技师年收入数据为例,来说明Excel在单样本场合符号检验中的应用。
具体步骤如下:同例1,首先给出假设问题的原假设和备择假设:错误!未找到引用源。
①输入数据。
如图5所示,A2:A51输入年收入数据,A1输入列标志“年收入”。
②计算S+。
在C2单元格输入公式“=COUNTIF(A2:A51,">21700")”即可,该函数表示统计A2:A51单元格中大于21700的数据点的个数。
③计算S-。
在C3单元格输入公式“=COUNTIF(A2:A51,"<21700")”,该函数表示统计A2:A51单元格中小于21700的数据点的个数。
④计算n。
在C4单元格输入公式“=C2+C3”。
⑤由Excel计算P值。
如果在Excel中输入“=binomdist(k,n,p,1)“,就可以求得累积概率P(b(n,p)<=k)的值;如果在Excel中输入” =binomdist (k,n,p,0)“,则求得概率P(b(n,p)=k)的值.所以在Excel中输入”“,就可以得到符号检验的P值,即P(b(n,1/2)>= 1-binomdist(S+-1,n,0.5,1)S+)的值。
此例中n=50,S+=32,由Excel算的检验的P值为P(b(n,1/2)>= 32)=0.32454.结果如图5所示。
⑥判断。
根据以上计算出的数据可进行判断。
图5 Excel算的结果通过Excel计算得到的结果可知:对于给定的α=0.05的检验水平,由于P 值比较小,即P=0.032454<0.05,因此我们认为在总体中该行业高级技师的年收入的中位数me比全市高级技师年收入的中位数21700元要高.倘若要根据观测值算的S+拒绝原假设,那么P值也可以用来度量犯第一类错误的概率.此例的P值为0.032454.它表示,若要根据S+=32拒绝原假设,那么犯第一类错误的概率只有0.032454.注1:此例是针对备择假设为:错误!未找到引用源。
情况,计算得到的P值;如果是对于错误!未找到引用源。
情况,由Excel算P值,应在Excel中键入“=binomdist(S+,n,0.5,1)“,就可以求得P(b(n,1/2)<=S+)的值;如果是对于错误!未找到引用源。
情况,由Excel算P值:S+>=n/2时输入”2(1-binomdist(S+-1,n,0.5,1))“;S+<=n/2时输入”2(binomdist(S+,n,0.5,1))“,即可求得P值。
至于选择哪种情况,要视具体问题来选择。
注2:n为S++S-而不是题中的数据总数。
五.(本次课)实验内容某地区从事管理工作的职员的月收入的中位数是6500元.现有一个该地区从事管理工作的40个妇女组成的样本.她们的月收入数据如下表。
使用该样本数据检验:该地区从事管理工作的妇女的月收入的中位数是否低于6500元?要求:分别用Minitab和Excel来完成。
表2 职员的月收入数据六.课后练习(注:一班做练习4,二班做练习5,其它练习选做)【练习1】质量监督部门对商店里出售的某厂家的西洋参片进行抽查。
对于25包写明净重为100g的西洋参片的承重结果为:99.05 100.25 102.56 99.15 104.89 101.86 96.37 96.79 99.3796.90 93.94 92.97 108.28 96.86 93.94 98.27 98.36 100.8192.99 103.72 90.66 98.24 97.87 99.21 101.79检验厂家包装的西洋参片分量是否足够。
由于不了解总体分布,因此对其进行符号检验。
原假设和备择假设为:错误!未找到引用源。
【练习2】假设某地16座预出售的楼盘均价,单位(百元/平方米),数据如下所示:36 32 31 25 28 36 40 3241 26 35 35 32 87 33 35问:该地区平均楼盘价格是否与媒体公布的3700元/平方米的说法一致?原假设和备择假设为:错误!未找到引用源。
【练习3】某城镇去年居民家庭平均每人每月生活费收入275元。
根据抽样调查,今年该城镇50户居民家庭平均每人每月生活费收入如下:367 322 294 273 237 398 327 298 276 246311 355 240 275 296 324 382 229 264 288235 271 291 319 360 226 262 286 309 352337 222 260 284 304 343 217 259 283 303200 253 281 301 329 212 257 281 303 332试问该城镇居民家庭平均每人每月生活费收入今年与去年比较是否明显提高(α=0.05)?原假设和备择假设为: H0:μ=275;H1:μ>275。
【练习4】如果一个矩形的宽度w与长度l的比11)0.6182wl=≈,这样的矩使用符号检验法检验假设0:0.618Hμ= vs1:0.618Hμ≠。
【练习5】下表为不同季节20个实验动物体重变化情况。
A 组表示冬季, B 组表。