六西格玛系列之统计学-第3章概率
- 格式:doc
- 大小:425.00 KB
- 文档页数:6
正态分布6西格玛概率解释说明以及概述1. 引言1.1 概述引言部分将对文章的主题进行概述和介绍。
在本文中,我们将探讨正态分布六西格玛概率的解释说明以及概述。
正态分布是一种重要的统计分布,它具有许多优秀的性质和应用领域。
而六西格玛原理则是基于正态分布而发展起来的一种质量管理方法,它通过计算事件发生在六个标准差之内的概率来评估过程或产品是否稳定。
1.2 文章结构本文共分为五个部分进行论述。
首先,在第二部分我们将介绍正态分布的定义与性质,同时探讨其常见应用领域以及参数估计与假设检验方法。
然后,在第三部分中,我们将回顾六西格玛原理的背景和发展历程,并详细解释其核心概念和特点。
此外,还将深入研究六西格玛在不同应用场景中的优势和实际价值。
在第四部分中,我们将系统地介绍正态分布六西格玛概率计算方法。
具体包括Z-score转化与标准化方法以及六西格玛事件发生概率计算步骤的详细介绍。
通过实例分析和案例研究,我们将进一步展示如何应用这些方法来评估潜在风险并进行决策。
最后,在结论部分,我们将总结本研究的重要成果,并对正态分布六西格玛概率在实际应用中的前景进行展望。
1.3 目的本文旨在提供关于正态分布六西格玛概率的全面说明和概述。
通过对正态分布和六西格玛原理进行深入探讨,读者将能够了解到这两个领域的基本定义、性质以及应用方法。
同时,通过具体案例和实证研究的呈现,读者还将获得运用这些方法进行质量管理、风险评估和决策制定方面的指导思路。
通过本文的阅读,读者将更加深入地理解正态分布与六西格玛原理之间的关系,并能够灵活运用相关计算方法来解决实际问题。
希望本文能为读者提供有益的信息,并促进相关领域的学术研究和实践应用。
2. 正态分布:正态分布,又称高斯分布或钟形曲线,是概率论和统计学中最为重要的连续型概率分布之一。
它的特点是对称且呈现钟形曲线状,由于具有良好的性质与广泛的应用领域,被广泛地使用于数据建模、参数估计以及假设检验等方面。
一、***某个元件损坏的概率(至少抽到一件坏件)(指数分布、泊松分布、正态分布、虚发报警)***某厂生产一批小型装置,它的使用寿命服从均值为8,标准差为2(单位:年)的正态分布,根据下面的标准正态分布函数表,试问如果工厂规定在4 年保修期内有故障可以免费换新,所有已售产品的免费换新率估计会是多少?A.0B. 2.27%C. 4.54%D.47.73%等于概率P(X<4)=cμσ-⎛⎫Φ ⎪⎝⎭=482-⎛⎫Φ ⎪⎝⎭=Ф(-2)=1-Ф(2)=1-0.9773=2.27%题目:某铸造车间生产出的铸件需要经过无损探伤检查铸件内是否有细微砂眼,根据顾客要求,一个铸件内如果有2个或2个以上的细微砂眼即为不合格,不合格铸件不可返修。
大量检验结果显示,正常生产条件下,平均每个铸件上的砂眼数(DPU)为0.3,估计该铸造过程的合格率为:A. 70%B. 74%C.96.3%D. 99.6%(滚动产出率 RTY(Rolled To Yield) ,RTY是用来表征合格品率的,它等于没有任何缺陷产品即合格品的数量与产品总数的比值,当用泊松分布的公式计算此比值时:λ= DPURTY=P(X=x)=(λ^x)/x!×e^(-λ)= (DPU^0)/0!×(e^-DPU)= e^-DPU。
无缺陷的概率):=P(0,0.3)=e^(-0.3)=0.7408(一个缺陷的概率):=P(1,0.3)=0.3*e^(-0.3)=0.2222因为两个或两个以上的判定不合格,因此,一个缺陷的也算合格,故估计该铸造过程的合格率为:0.7408+0.2222=0.963Cλ=DPU=200/1000=0.2p(x=0)=P(0,0.2)= e^(-0.2)=0.8187=81.87%题目:某工厂生产了10件产品,其中3件是缺陷产品,由于工作疏忽,7件好品和3件坏品混在一起,现技术中心需要从10件产品中抽取2件进行检测,问至少抽到一件坏品的概率有多大?BA. 49/100B. 8/15C. 7/15D. 3/10先求出全是好的概率,用1减去全是好的概率就是至少一件坏品的概率。
第三章概率3.1概率在统计学中(统计推断中)的作用基于样本数据作出的推断是不确定的,一个样本很少能完美精确的叙述它所来自的总体,总是存在一定范围内的误差,因此关于估计(推断)不确定程度的度量(推断的可靠性)在统计学中十分重要。
我们用概率来度量估计(推断)的不确定程度(推断的可靠性)3.2事件、样本空间和概率试验是获得一个观测值或进行一次测量的过程简单事件是一个试验的基本结果,它不能分解为更简单的结果样本空间是试验所有简单事件的集合页脚内容1页脚内容2页脚内容3维恩(Venn)图样本空间(S)用一个封闭的图形表示,包含一个称作样本点的点集,每个点代表一个简单事件,样本空间(S)中的样本点的个数等于与试验相关的简单事件个数维恩图为解决概率问题提供了一个简单直接的方法,画图通常可以使问题一目了然简单事件的概率是进行试验时度量简单事件将会发生的可能性的一个数。
当试验重复的次数非常多时,概率可以用观测到的简单事件的次数的比例来近似,大数定律表述了当试验被不断地重复进行时,一个结果发生次数的相对频率趋近于这个结果的真实(理论)概率。
有些试验不可能重复,因此不可能通过反复的试验来估算概率(如投资一个项目时,投资成功的概率),可以通过确定类似投资成功的比例来估算概率SSS从生产线抽取一个产品(试验),它的样本空间S{产品有缺陷,产品无缺陷},已知生产线受控时,10%的产品是有缺陷的,求产品无缺陷的概率1.不能将等概率指派给简单事件,即产品无缺陷的概率不是50%2.生产线可能是失控的,因此不能将生产线受控时的缺陷率10%当作产品无缺陷的概率3.可以通过收集一段时间内缺陷产品和无缺陷产品的个数来近似的估计两个简单事件的概率对于一个简单事件E,E的概率记为P(E)1.0P(E i )1(所有简单事件的概率必须在0和1之间)样本空间中所有简单事件的概率之和等于1)事件是简单事件的一个指定集合(投掷骰子的试验中,观测到的点数为奇数)事件A的概率等于事件A所包含的简单事件概率之和[P(1)+ P(3)+ P(5)]计算任意事件概率的步骤a定义试验,即描述获得观测值(测量值)的过程及记录的观测值(测量值)类型b定义并列举简单事件c指派简单事件的概率d确定事件所包含简单事件的集合页脚内容4e求事件所包含简单事件的概率之和3.3复合事件复合事件是两个或更多事件的组合事件A和事件B(A或B)是在一次单独的试验中,事件A与事件B所包含的简单事件之和事件A和事件B(A和B)是在一次单独的试验中,事件A与事件B同时包含的简单事件考虑有等可能简单事件S{1,2,3,4,5,6}的投掷骰子试验事件A{投掷出一个偶数点}={2,4,6}事件B{投掷出一个小于等于3的数}={1,2,3}事件C{投掷出一个大于1的数}={2,3,4,5,6}求多个事件并和交的概率时,先求两个事件并和交的概率,再将结果和下一个事件求并和交的概率3.4补事件事件A的补事件(A c)是所有不在事件AP(A)+P(A c)=1,页脚内容5在很多概率问题中,计算事件的补事件的概率要比计算事件本身的概率更容易3.5条件概率投掷一颗均匀的骰子时,观测到偶数(事件A)的概率是1/2,假如已经知道某次投掷骰子的结果是小于等于3的一个数(事件B),事件A发生的概率就应该为1/3,因为事件B发生后样本空间从6个简单事件缩减到了3个在给定事件B发生的前提条件下,事件A发生的条件概率抽取生产线10000Pcs零件,分别用工厂标准和客户标准对零件进行检验,事件I表示零件用工厂标准检验合格(检验合格后才能出货给客户),事件B表示零件用客户标准检验合格(符合客户要求),求试验分别用工厂标准和客户标准对零件进行检验包含4个简单事件如下表页脚内容6P(I)工厂标准检验合格的概率=P(I和B)+P(I和B c)=0.80+0.02=0.82P(B)客户标准检验合格的概率=P(I和B)+P(I c和B)=0.80+0.15=0.95P(I)比P(B)小说明工厂的检验标准比客户检验标准严格3.6并和交的概率法则1.A和事件B是互斥事件2.如果事件B(A)的发生不改变事件A(B)A和事件B为独立事件,不独立的事件称作相关事件3.独立事件和互斥事件3.1互斥事件可以由维恩图证明或说明,独立事件不可以,一般检查独立性的最好办法是确定页脚内容73.2互斥事件是相关事件。
六西格玛的基本统计概念和作用引言六西格玛(Six Sigma)是一种以数据分析和统计方法为基础的质量管理体系,旨在通过降低过程的变异性来提高产品和服务质量。
六西格玛的核心理念是追求极致的质量水平,将缺陷率控制在每百万次机会中不超过3.4个。
本文将介绍六西格玛的基本统计概念和作用。
基本统计概念平均值在统计学中,平均值是一组数据的总和除以观测次数的结果。
它表示了数据的中心位置。
六西格玛中使用平均值作为性能指标的度量。
标准偏差标准偏差是对数据分布的离散程度的度量。
它度量了数据离平均值的平均差异程度。
在六西格玛中,标准偏差用来估计一组数据的稳定性和可靠性。
概率分布概率分布是对随机变量取值的可能性进行描述的数学函数。
在六西格玛中,常用的概率分布包括正态分布和泊松分布。
这些分布用于建模和分析数据,帮助决策者了解过程的性能和潜在的问题。
测量系统分析测量系统分析是对用于收集和测量数据的测量系统进行评估和改进的过程。
六西格玛需要可靠准确的测量系统来获取准确的数据,从而进行有效的数据分析和问题解决。
六西格玛的作用降低变异性六西格玛的核心目标是降低过程的变异性。
通过分析和改进过程中的各种因素,六西格玛可以帮助组织降低内部和外部因素对产品和服务质量的影响,从而使过程更加稳定和一致。
提高质量性能六西格玛的基础是使用统计工具来分析数据,找到问题的根本原因,并采取相应的措施来解决问题。
通过消除或减少缺陷和错误,六西格玛可以显著提高产品和服务的质量性能,满足客户的需求和期望。
优化业务流程六西格玛注重优化业务流程,通过分析和改进各项业务活动和流程,将无效的步骤和浪费的资源降至最低。
六西格玛可以帮助组织提高工作效率、减少成本,并提供更好的客户体验。
数据驱动决策六西格玛强调数据的重要性,将数据作为决策的依据。
通过数据分析和统计方法,六西格玛可以提供客观的事实和证据,帮助决策者做出准确的决策,避免主观偏见和随意决策。
持续改进六西格玛是一个持续改进的过程。
六西格玛相关参数及计算公式六西格玛是一种质量管理工具,用于衡量和改进一个过程或产品的稳定性和可靠性。
它通过统计学原理和方法,帮助分析员工在执行工作过程中的变异性,并提出改进措施。
以下是六西格玛的一些相关参数和计算公式。
1. 均值(Mean):均值表示一组数据的平均数。
它是通过将所有数据值相加,然后除以数据数量得到的。
计算公式如下:均值=Σx/n其中,Σx表示所有数据值的总和,n表示数据的数量。
2. 方差(Variance):方差度量了数据集合中各个数据值与均值的偏差。
计算公式如下:方差=Σ(x-μ)²/n其中,Σ(x-μ)²表示各个数据值与均值之差的平方之和,n表示数据的数量。
3. 标准差(Standard Deviation):标准差是方差的平方根,用于度量数据的离散程度和变异程度。
计算公式如下:标准差=√方差其中,√表示平方根。
4. 正态分布(Normal Distribution):正态分布是一个常见的连续型概率分布,也称为高斯分布。
正态分布用于描述大量独立且随机分布的随机变量总和的概率分布情况。
正态分布的概率密度函数如下:f(x)=(1/(σ√(2π)))*e^(-((x-μ)²/(2σ²)))其中,f(x)表示概率密度函数,σ表示标准差,μ表示均值,e表示自然对数的底数。
通过计算一个过程或产品的六西格玛范围,可以评估其能力和性能,帮助确定改进措施和目标。
六西格玛的计算公式和参数有助于分析员工的工作过程和产品质量,提供了量化的指标和数据支持,帮助组织和管理者进行决策和改进。
同时,六西格玛也可以应用于其他领域,如服务行业、流程改进等,帮助提高效率和质量。
需要注意的是,以上仅是六西格玛的一些基本参数和计算公式,实际应用中可能还需要考虑其他因素和方法。
此外,六西格玛的应用需要具备统计学和质量管理知识的人员进行分析和解释。
六西格玛方法论
六西格玛方法论的概念始于统计学理论,“σ”是希腊字母,读音为“西格玛”,在统计学中表示质量特征值偏离正态分布均值的大小。
从统计学角度解释,六西格玛方法论含义如下:对于计量型工序,若工序只受随机性因素影响即处于稳定状态时,工序的质量特征值通常服从N(μ,σ2)的正态分布。
当均值分布中心与总体分布中心重合时(理想状态下),落在公差上限USL与公差下限LSL之间,即μ±6σ内的质量特征值均符合要求,而超出此范围时将会产生不合格品。
传统模式下,工序的质量特征值一般在μ±3σ范围内波动,其过程能力指数Cp约为1.0;而在六西格玛质量水准下,过程能力指数Cp 可达到2.0。
在实际生产过程中,由于现有生产条件的限制,均值分布中心与总体分布中心不可能恰好重合,此时会发生分布漂移的现象,通常认为偏移量约为1.5西格玛,此时分布中心距离公差较近一侧的距离为4.5西格玛。
由正态分布定义可得超出公差限的概率即缺陷率为3.4×10-6(百万分之3.4),此时的Cpk=1.5。
六西格玛方法论是一种语言企业越大、流程越复杂,则管理的难度也越大、效率越低下,不同专业、部门间沟通越突出。
其实很多矛盾是一种缺乏共同语言的表现。
如果每个部门、每个员工都用一种共同的语言――六西格玛,则沟通的效率会极大地提高。
六西格玛管理是一套复杂的系统,需要分层次地进行专业的培训,而且还要持之以恒地在运用中不断学习与提高。
因此,要求每个员工,从管理层到操作层,都需要掌握不同程度的六西格玛专业知识。
有了共同的六西格玛语言,增强了每个员工追求的一致性,大量协调性的、限制性的规章制度和行为将极大地简化,从而极大地降低了管理成本。
了解六西格玛中的统计分布摘要: 许多顾问会做假设的测试模板来决定进行何种类型的测试。
不管如何要考虑所取得的数据的类型。
假如仅有总结性的数据,如何应用它来得到结论?原始数据最能反映情况的状况,然而它可能不直观,那就仍旧需要进行测试 ...为演绎数据,顾问需要了解分布。
本文讨论了如何了解统计分布的不同类型、不同分布的应用以及给出一个分布的假设。
-许多顾问会做假设的测试模板来决定进行何种类型的测试。
不管如何要考虑所取得的数据的类型。
假如仅有总结性的数据,如何应用它来得到结论?原始数据最能反映情况的状况,然而它可能不直观,那就仍旧需要进行测试。
为了不仅是看到数据,还要演绎它,顾问需要了解分布。
本文讨论了以下几点:l 了解统计分布的不同类型。
l 了解不同分布的应用。
l 给出一个分布的假设。
l六西格玛绿带的培训集中在图形、中心和宽度。
图形的概念受限于连续数据的正态分布。
本文会通过分布所表现出来的〔包括总体和样本〕而在图形概念上进行延展。
回到差不多原理建立在一个假设模型基础上,用概率,陈述估量必定事件发生的机会。
关于数据统计学说,观看数据适应上确定一个描述那个数据的模型。
该模型与数据的分布有关。
统计是从样本推断到总体,而概率是从总体到样本。
推断性统计是基于样本数据描述总体参数的一门科学。
推断性统计能够应用于:l 确定过程能力〔确定百万分缺陷数〕。
l 利用分布来估量给出参数的变量事件的发生概率。
推断性统计基于正态分布。
Figure 1: Normal Curve and Probability Areas图1:正态曲线和概率面积正态曲线分布能够扩展获得其它分布。
结合收集到的数据类型在对过程策划和分布离差或图形明白得的基础上指定恰当的分布。
它能够关心我们得到最好的分析结果。
分布的类型分布的分类与数据分类相同-连续和离散:l 连续概率分布是随机变量相关的概率,在一个区间内能够取无限多个数值即为随机变量。
l 离散概率分布列出一个实验所有可能的结果和它们各自发生的概率。
第三章 概率3.1概率在统计学中(统计推断中)的作用基于样本数据作出的推断是不确定的,一个样本很少能完美精确的叙述它所来自的总体,总是存在一定范围内的误差,因此关于估计(推断)不确定程度的度量(推断的可靠性)在统计学中十分重要。
我们用概率来度量估计(推断)的不确定程度(推断的可靠性)3.2事件、样本空间和概率试验是获得一个观测值或进行一次测量的过程简单事件是一个试验的基本结果,它不能分解为更简单的结果维恩(Venn)图样本空间(S)用一个封闭的图形表示,包含一个称作样本点的点集,每个点代表一个简单事件,样本空间(S)中的样本点的个数等于与试验相关的简单事件个数维恩图为解决概率问题提供了一个简单直接的方法,画图通常可以使问题一目了然简单事件的概率是进行试验时度量简单事件将会发生的可能性的一个数。
当试验重复的次数S SS非常多时,概率可以用观测到的简单事件的次数的比例来近似,大数定律表述了当试验被不断地重复进行时,一个结果发生次数的相对频率趋近于这个结果的真实(理论)概率。
有些试验不可能重复,因此不可能通过反复的试验来估算概率(如投资一个项目时,投资成功的概率),可以通过确定类似投资成功的比例来估算概率从生产线抽取一个产品(试验),它的样本空间S{产品有缺陷,产品无缺陷},已知生产线受控时,10%的产品是有缺陷的,求产品无缺陷的概率1.不能将等概率指派给简单事件,即产品无缺陷的概率不是50%2.生产线可能是失控的,因此不能将生产线受控时的缺陷率10%当作产品无缺陷的概率3.可以通过收集一段时间内缺陷产品和无缺陷产品的个数来近似的估计两个简单事件的概率对于一个简单事件E,E的概率记为P(E)1.0P(E i)1(所有简单事件的概率必须在0和1之间)样本空间中所有简单事件的概率之和等于1)事件是简单事件的一个指定集合(投掷骰子的试验中,观测到的点数为奇数)事件A的概率等于事件A所包含的简单事件概率之和[P(1)+ P(3)+ P(5)]计算任意事件概率的步骤a定义试验,即描述获得观测值(测量值)的过程及记录的观测值(测量值)类型b定义并列举简单事件c指派简单事件的概率d确定事件所包含简单事件的集合e求事件所包含简单事件的概率之和3.3复合事件复合事件是两个或更多事件的组合事件A和事件B的并(A或B)是在一次单独的试验中,事件A与事件B所包含的简单事件之和事件A和事件B的交 (A和B)是在一次单独的试验中,事件A与事件B同时包含的简单事件考虑有等可能简单事件S{1,2,3,4,5,6}的投掷骰子试验事件A{投掷出一个偶数点}={2,4,6}事件B{投掷出一个小于等于3的数}={1,2,3}事件C{投掷出一个大于1的数}={2,3,4,5,6}求多个事件并和交的概率时,先求两个事件并和交的概率,再将结果和下一个事件求并和交的概率3.4补事件事件A的补事件(A c)是所有不在事件A中的简单事件组成的事件,P(A)+P(A c)=1,在很多概率问题中,计算事件的补事件的概率要比计算事件本身的概率更容易3.5条件概率投掷一颗均匀的骰子时,观测到偶数(事件A)的概率是1/2,假如已经知道某次投掷骰子的结果是小于等于3的一个数(事件B),事件A发生的概率就应该为1/3,因为事件B发生后样本空间从6个简单事件缩减到了3个在给定事件B发生的前提条件下,事件A发生的条件概率抽取生产线10000Pcs零件,分别用工厂标准和客户标准对零件进行检验,事件I表示零件用工厂标准检验合格(检验合格后才能出货给客户),事件B表示零件用客户标准检验合格(符合客户要求),求工厂检试验分别用工厂标准和客户标准对零件进行检验包含4个简单事件如下表P(I)工厂标准检验合格的概率=P(I和B)+P(I和B c)=0.80+0.02=0.82P(B)客户标准检验合格的概率=P(I和B)+P(I c和B)=0.80+0.15=0.95P(I)比P(B)小说明工厂的检验标准比客户检验标准严格3.6并和交的概率法则1.A和事件B是互斥事件2.如果事件B(A)的发生不改变事件A(B)事件A和事件B为独立事件,不独立的事件称作相关事件3.独立事件和互斥事件3.1互斥事件可以由维恩图证明或说明,独立事件不可以,一般检查独立性的最好办法是确3.2互斥事件是相关事件。
因为我们假定事件B已经发生,那么事件A就不可能发生(除非其中有一个事件的概率为0,否则结果总成立)3.33.43.7贝叶斯法则利用概率进行推断的早期尝试是统计方法论的一个分支,称作贝叶斯统计方法,17世纪中叶英国伟大的哲学家托马斯·贝叶斯所用的逻辑是将未知的条件概率转换为已知的条件概率无人监控系统检测到闯入者的概率(设计概率)为0.90,但是天气(晴天/阴天/雨天)会影响无人监控系统检测到闯入者的概率,已知系统实际检测到闯入者时,天气有75%是晴天,20%是阴天,5%是雨天。
系统不能检测到闯入者时,天气有60%是晴天,30%是阴天,10%是雨天。
利用这些信息求已知天气为雨天时系统检测到闯入者的概率事件D为系统检测到闯入者,D c系统不能检测到闯入者已知P(D)=0.90,P(D c)=1.00-0.90=0.10;P(晴天|D)=0.75,P(阴天|D)=0.20,P(雨天|D)=0.05;P(晴天|D c)=0.60,P(阴天|D c)=0.30,P(雨天|D c)=0.10,求P(D|雨天)根据条件概率的计算公式,为了求P(D|雨天)需要知道和P(雨天)= P(雨天|D)*P(D)=0.05*0.90=0.045= P(雨天|D c)* P(D C)=0.10*0.10=0.01=0.045+0.01=0.055(和是两个互斥且完备的事件),P(D|雨天)=0.045/0.055=0.818贝叶斯法则给定k个互斥且完备的自然状态(事件)A1,A2,…,A k和一个观测(测量)到的事件E上面的例子中P(D)=A1,P(D c)=A2是互斥且完备的自然状态(事件),{雨天}为一个观测(测量)到的事件EP(D|雨天)=P(D)P(雨天|D)/[ P(D)P(雨天|D)+ P(D c) P(雨天|D c)]=0.90*0.05/[0.90*0.05+0.10*0.10]=0.818P(D|晴天)=P(D)P(晴天|D)/[ P(D)P(晴天|D)+ P(D c) P(晴天|D c)]=0.90*0.75/[0.90*0.75+0.10*0.60]=0.918P(D|阴天)=P(D)P(阴天|D)/[ P(D)P(阴天|D)+ P(D c) P(阴天|D c)]=0.90*0.20/[0.90*0.20+0.10*0.30]=0.8573.8计数法则1.乘法法则从k个大小为n1,n2,…,n k的每个集合中抽取一个元素,不同结果的个数S=n1*n2*…*n k一个产品可以通过3条不同航线运输,每个航线有4个不同路径,k=2,n1为3条不同航线,n2为每条航线的4个不同路径,则不同结果的个数S=3*4=12,决策树表示法从装配线选择10个产品检查,每个产品分为有缺陷和无缺陷,求简单事件的个数k=10,每个集合包括2个元素,S=210=10242.排列法则从N个元素的集合中抽取n个元素并将n个元素按不同次序排列,不同结果的个数SN!(N的阶乘)=N(N-1)(N-2)…(2)(1),0!=120个候选人竞争3个不同的机械工程师岗位E1,E2,E3(需要考虑次序)乘法法则解法,k=3,{担任岗位E1的候选人n1=20},{担任岗位E2的候选人(E1有人以后)n2=19},{担任岗位E3的候选人(E1和E2有人以后)n3=18},S=20*19*18=6840排列法则解法,N=20,n=3,S=20*(20-1)(20-3+1)=6840从一个起点依次通过5个城市中的每一个N=5,n=5,S=5!/0!=1203.分割法则将N个元素的集合分割成分别包括n1,n2,…,n k(n1+n2+…+n k=N)个元素的k组,不同结果的个数假设有12个程序员,3个安排编写程序A,4个编写程序B,5个编写程序C,有多少种安排的方法k=3,N=12,n1=3,n2=4,n3=5,4.组合法则从N个元素中抽取n个元素,不考虑n个元素的次序,不同结果个数S=组合法则是分割法则k=2时的特殊情况3.9概率和统计清晰的建立概率和统计之间的连接非常重要。
贝叶斯法则论证了概率可以用于统计推断,传统的统计推断以稍微不同的方式利用概率某公司为了证明生产的新型化学柱头螺栓比传统机械柱头螺栓有更强的保持能力和更大的负载能力(张力负荷强度)。
从一天生产的化学柱头螺栓中随机选择3个测量张力负荷强度,这3个螺栓的张力负荷强度均大于12000,已知传统机械柱头螺栓有16%的张力负荷强度大于12000定义事件A1{化学柱头螺栓1张力负荷强度大于12000},A2{化学柱头螺栓2张力负荷强度大于12000},A3{化学柱头螺栓3张力负荷强度大于12000}3个化学柱头螺栓的张力负荷强度都大于120001) P(A2) P(A3)(3个螺栓是从大量产品中随机选取的,即第一个螺栓的张力负荷强度大于12000不影响第二个螺栓的张力负荷强度大于12000)。
假定新型化学柱头螺栓不比传统机械柱头螺栓强或弱(化学柱头螺栓张力负荷强度的相对频率分布与传统机械柱头螺栓基本一致),即P(A i)=0.161) P(A2) P(A3)=0.16*0.16*0.16=0.04096(在统计学上这是不太可能发生的)而从一天生产的化学柱头螺栓中随机选择3个测量张力负荷强度,这3个螺栓的张力负荷强度均大于12000,说明新型化学柱头螺栓比传统机械柱头螺栓有更强的保持能力和更大的负载能力(张力负荷强度)这是稀有事件对统计推断的一个应用,从中可以看出概率的基本原则起着重要的作用3.10随机抽样在统计推断中,如何从总体中选取样本至关重要,因为样本的概率将用于推断总体的特征。
随机选择和随机化的概念是进行统计推断的的关键之一简单随机样本指所有可能的样本有相等的选中概率,从有N个元素的总体中抽取有n个元素的样本,每个样本被选中的概率相等,被选中的概率均为从10个(总体)零件中随机抽取5个(样本)测量尺寸Minitab计算随机数据来自列的样本概率抽样按照随机原则进行抽样,不加主观因素,组成总体的每个元素都有被抽中的概率(非零概率),可以避免样本出现偏差,样本对总体有很强的代表性1.简单随机样本(SPS抽样)2.系统样本(SYS抽样)3.分层随机样本(STR抽样)4.整群样本非概率抽样按主观意向进行抽样(非随机的),组成总体的很大部分元素没有被抽中的机会(零概率),使推断很容易出现倾向性偏差有放回抽样属于概率抽样,无放回抽样属于非概率抽样,实际抽样通常为无放回抽样,当回抽样与有放回抽样每个样本被选中的概率基本上是相等的。