六西格玛6个sigma黑带系列十六:假设检验(附有案例和数据源)
- 格式:ppt
- 大小:1.40 MB
- 文档页数:71
6Sigmal 培训资料之假设检验一 假设检验定义:对总体参数分布做某种假设,再根据抽取的样本观测值,运用统计分析方法检验这种假设是否正确,从面决定接受假设或气绝假设的过程就是假设检验.假设将代表实际存在的问题转化为统计问题,它使我们能够在进行调查之前就提出可能的所有结果.在统计调查后,只需接受或拒绝每个假设,再将统计问题转化为实际问题,对实际问题做二 假设检验的步骤:1. 定义问题/陈述检验的目的.例如: 装配线A 的直通率在最近3个月由95%降到85%. 我们经分析认为供应商A 和B 提供的电子物料品质(如某个参数的均值)不同是引起装配直通率下降的原因.想通过假设检验对这种判断进行检验.2. 建立假设H0 和Ha.H0即零假设,是对不存在变化或差异的假设.如没有充分证据证明它,就假设这一命题是真的. Ha 是备选假设,是对存在变化或差异的假设,如果拒绝H0则认为这一命题为真.3.4.陈述可接受的α风险和β风险水平.α风险: 当H0为真时,拒绝H0, 又称为厂家风险.β风险: 当H0为假时,接受H0,又称为消费者风险.通常取α风险为5%,β风险为10%-20%.5. 使用检验灵敏度δ/σ6. 制定抽样计划并收集样本.7. 根据数据计算检验统计值.(t, F 或X 2)8. 确定所计算的检验统计值是由于偶然因素引发的概率(P 值). 如概率P 值<α,则拒绝H0,并接受Ha,如P>=α,则不能拒绝H0.9. 将统计结论转化为实际问题解决方案.实施假设检验三 假设检验的两类错误:四 显著水平, P 值:1. P 值用以描述统计假设检验结果,判断差异大小是归因于偶然因素还是特殊因素.理解: a. 观察到的显著水平. 如果P<α, 则差异具有统计显著性.否则说明差不具有显著性.b. 当不存在差异时,接受Ha,即接受存在差异的因素.c. 导致拒绝零假设的最小α值,即如p<α,则拒绝零假设.一般的, 如果P<0.05,则拒绝零假设H0.五 假设的定义:1. 单侧检验和双侧检验双则检验是备选假设Ha 相对于零假设H0而言,即有可能是检验对象A>B,也有可能是A<B.格式为: H0: A=B, Ha: A ≠ B.单侧检验是备选假设Ha 相对零假设H0而言,或者检验对象A>B,或者检验对象A<B.2. 成对t 检验成对t 检验用以对同一被测试单元在不同条件下进行两次测试的结果进行检验. 如某个产品参数在改善前后的比较测量,用不同设备测量同一工件. 决定实际α风险 0.05 β风险0.1-0.2。
六西格玛统计工具——假设检验六西格玛统计工具——假设检验假设检验是六西格玛团队项目中应用最多的统计工具。
诸如要判断下列结论是否正确:“新员工比老员工得到更多的投诉”,“改进工作后平均产量有提高”,“加工温度为180度时比160度时垫圈断裂强度要高”等等。
由于我们观测到数据总会带有误差,不能从简单的样本统计量的结果下定论,必须使用严格的统计假设检验方法才能得出准确的判断结论。
参数估计和假设检验是统计推断的两个重要方面。
参数估计是以“数”为其输出结果,而假设检验是以“判断”为其输出结果。
下面介绍假设检验步骤。
1、建立假设。
假设检验的第一步便是建立假设,通常需要建立两个假设:原假设Ho和备择假设H1。
2、选择检验统计量,确定拒绝域的形式。
若对总休的均值进行检验,那么我们将用样本均值引出检验统计量;若对正态总体的方差进行检验,我们将从样本方差引出检验统计量。
根据统计量的值把整个样本空间分成两个部分:拒绝域W与非拒绝域A。
当样本统计量的值落在拒绝域中就拒绝原假设,否则就无法拒绝原假设。
所以在假设检验中我们必须找出拒绝域。
根据备择假设的不同;拒绝域可以是双边的也可以是单边的。
在确定了拒绝域的类型后,还要确定临界值。
这应根据允许犯错误的概率来确定。
3、给出检验中的显著性水平a。
在对原假设是否成立进行判断时,由于样本的随机性,判断可能产生两类错误。
第1类错误是当原假设为真时,由于样本的随机性,使样本观测值落在拒绝域w中,从而做出拒绝原假设的决定,这类错误称为第1类错误,也称为弃真概率。
关于第2类错误的说明:如果钢筋平均抗拉强度比原来真有提高,这时钢筋平均抗拉强度已经不是原来的2 000kg了,但我们没有拒绝Ho误认为没提高,即把“已提高”误认为“未提高”。
一般来说就是,当Ho不成立时,我们却没有拒绝Ho,这就是第二类错误。
4、给出临界值,确定拒绝域。
有了显著性水平a后,可以根据给定的检验统计量的分布,查表得到临界值,从而确定具体的拒绝域。
6Sigma(六西格玛管理)知识学习-假设检验假设检验用于确定所观测的差异是确实存在,还是偶然产生的。
我们可以量化确实存在差异的置信程度。
如果确实存在显著差异,则说明X是关键少数的变量.重点就是原假设H0和备择假设H1,两者是完全对立的两种假设。
另外两个概念就是显著性差异,一般是根据p值来确定。
显著性差异(Significant Difference):用于描述统计假设检验结果的术语,即:差异大得不能合理地归因于偶然因素。
P-value是原假设H0真实的结论时,我们观察到样本的值有多大的概率,简称P值。
如果此值小,就下原假设为不真实的结论。
统计学上称为小概率事件,即样本不是从原假设的分布中抽出的。
一般P值大于α,则无法拒绝原假设,相反,P值小于α,则拒绝原假设。
p<0.05 - 可以拒绝相等的原假设,说明两者是不等的,即有显著性差异p>0.05 - 不能拒绝相等的原假设,即需要接受相等的原假设,说明两者没有显著性差异1.均值的检验对于单个正态总体均值的检验主要有Z检验和1 Sample T检验。
Z检验 - 对于样本数较大,而且方差已知的情况下采用1 Sample T - 对于样本数较少,而且方差未知的情况下采用对于两个独立正态总体均值的校验主要有2 Sample T检验和Z检验Z检验 - 对于两总体方差都已知的情况下使用,对于方差不等但大样本情况也可使用2 Sample T - 对于两总体方差相等,但未知的情况。
Pair T检验 - 对成对数据比较平均的差异后确认是否有显著性差异时使用。
对同一个体,测量两次后比较时使用方差分析 - 适合对超过两个的总体正态分布的均值是否相等进行检验。
可以分析因子间的相互作用2.方差的检验方差的检验主要有卡方检验和F检验卡方(X2)检验-是判断单个正态总体的方差是否有显著差异F检验-是判断两个正态分布的总体方差是否存在显著差异,也叫方差齐次检验3.比率的检验主要用于离散变量,分析一个或多个总体的比率是否是一致的.1 Proportion - 单个总体的比率检验2 Proportion - 比较两个比率的差,决定统计上是否显著性差异时使用。
六西格玛公式计算案例资料六西格玛(Six Sigma)是一种旨在通过减少过程的变异性从而提高产品和服务质量的管理方法。
这种方法依赖于数据分析和统计学原理,并提供了一些工具和技术来解决问题和改进业务过程。
以下是一个案例资料,展示六西格玛的应用。
案例:质量改进项目背景:公司制造汽车零部件。
他们近期发现自己的一些关键工序(工序A)的产品不合格率明显增加,导致了较高的废品率和客户投诉率。
公司决定通过使用六西格玛来解决这些问题,提高工序A的质量。
第一步:问题定义和目标设定该公司成立了一个质量改进小组,由工序A的生产人员和质量控制人员组成。
小组通过分析过程中的数据和讨论,定义了问题是工序A产品不合格率的增加。
他们的目标是将不合格率降低到最多0.1%,以减少废品率和客户投诉率。
第二步:数据收集和分析小组成员开始收集与工序A相关的数据。
他们收集到了过去12个月的数据,包括每个月的产品总数和不合格数。
然后,他们计算了每个月的不合格率,并用控制图将数据可视化。
第三步:根本原因分析通过观察控制图,小组发现数据的变动性在过去几个月明显增加。
他们认为这可能是导致不合格率增加的根本原因。
小组决定进一步分析这些变动性的原因。
他们收集了更多的数据,并使用六西格玛的工具和技术,如鱼骨图、5W1H分析和因果图,来找出造成变动性增加的原因。
通过这个分析,他们确定以下几个原因可能导致不合格率增加:操作人员技能不足、设备老化、材料质量不稳定。
第四步:改进措施制定和实施小组制定了一系列的改进措施,以解决上述确定的原因。
他们决定:1.为操作人员提供培训和教育,提高他们的技能水平。
2.更新和维护设备,确保其正常运行。
3.与供应商合作,改善材料质量。
他们计划逐步实施这些改进措施,并制定了一份详细的实施计划。
第五步:改进效果评估和持续改进小组在改进措施实施后的一段时间内继续收集数据,并监控不合格率的变化。
他们还收集了其他一些指标,如废品率和客户投诉率,来评估改进效果。
常用的参数假设检验方法由于正态分布是母体中最常见的分布,所抽取的子样也服从正态分布,由此类子样构成的统计量是进行假设检验时最常用的统计量,以下的几种参数假设检验方法均是此类统计量。
一、u检验法1.u检验法的概念22N( , ),设母体服从正态分布母体方差 为已知。
从母体中随机抽取容量为n的子样,可求得子样均值,利用子样均值对母体均值 进行假设检验,则可用统计量un,其分布为标准正态分布。
即u ~N(0,1) n (7-2-1)将这种服从标准正态分布的统计量称为u变量,利用u统计量所进行的检验方法称为u检验法。
2.u检验法的类型根据检验问题的不同,利用u检验法对母体均值 进行检验时,可选用双尾检验法、单尾检验法(左尾检验法或右尾检验法)。
(1)双尾检验法。
假设:H0: 0;H1: 0;0P z z P z u z P u z 1n22 2 2 2 即P z z 0 1 n n 2 2 或或写成P 0 k 1k z z2 n ,2为标准正态分布的双侧100 百分位点。
式中u z当20或(2)左尾检验法 k时,接受H0,拒绝H1;反之,拒绝H0,接受H1;假设:H0: 0;H1: 0。
即0 P z P u z n或写成P 0 k, 为标准正态分布的上100 百分位点。
式中k z zn当u z 或( 0) k时拒绝H0,接受H1;反之,接受H0,拒绝H1;,H0: 0;H1: 0。
(3)右尾检验法假设:即0 P z P u z n或写成P 0 k式中k z n当u z 或( 0) k时拒绝H0,接受H1;反之,接受H0,拒绝H1;,例[7-1] 已知基线长L0 5080.219m,认为无误差。
为了鉴定光电测距仪,用该仪器0.08m,问该仪器测量对该基线施测了34个测回,得平均值 5080.253m,已知0的长度是否有显著的系统误差(取解:(1) 0 0.05)。
H0: L0 5080.219mH0成立时,计算统计量值x L0(2)当 n 5080.2535080.219 2.480.08(3)查得,故拒绝H0,即认为在因为 2 0.025 1.96 2.48 2 1.960 0.05的显著水平下,该仪22器测量的长度存在系统误差。