当前位置:文档之家› 统计过程控制的几种常用方法

统计过程控制的几种常用方法

统计过程控制的几种常用方法
统计过程控制的几种常用方法

统计过程控制

1、统计过程控制的基本知识

1.1统计过程控制的基本概念

统计过程控制(Stastistical Process Control简称SPC)是为了贯彻预防原则,应用统计方法对过程中的各个阶段进行评估和监控,建立并保持过程处于可接受的并且稳定的水平,从而保证产品与服务符合规定要求的一种技术。

SPC中的主要工具是控制图。因此,要想推行SPC必须对控制图有一定深入的了解,否则就不可能通过SPC取得真正的实效。

对于来自现场的助理质量工程师而言,主要要求他们当好质量工程师的助手:(1)在现场能够较熟练地建立控制图;

(2)在生产过程中对于控制图能够初步加以使用和判断;

(3)能够针对出现的问题提出初步的解决措施。

大量实践证明,为了达到上述目的,单纯了解控制图理论公式的推导是行不通的,主要是需要掌握控制图的基本思路与基本概念,懂得各项操作的作用及其物理意义,并伴随以必要的练习与实践方能奏效。

1.2统计过程控制的作用

(1)要想搞好质量管理首先应该明确下列两点:

①贯彻预防原则是现代质量管理的核心与精髓。

②质量管理学科有一个十分重要的特点,即对于质量管理所提出的原则、方针、目标都要科学措施与科学方法来保证他们的实现。这体现了质量管理学科的科学性。

为了保证预防原则的实现,20世纪20年代美国贝尔电话实验室成立了两个研究质量的课题组,一为过程控制组,学术领导人为休哈特;另一为产品控制组,学术领导人为道奇。其后,休哈特提出了过程控制理论以及控制过程的具体工具——控制图。道奇与罗米格则提出了抽样检验理论和抽样检验表。这两个研究组的研究成果影响深远,在他们之后,虽然有数以千记的论文出现,但至今仍未能脱其左右。休哈特与道奇是统计质量控制(SQC)奠基人。1931年休哈特出版了他的代表作《加工产品质量的经济控制》这标志着统计过程控制时代的开始。

(2)“21世纪是质量的世纪”。美国著名质量管理专家朱兰早在1994年的美国质量管理年会上即提出此论断,若干年来得到越来越多的人的认同。朱兰提出这样的论断是有其科学背景的。

要想在市场上立于不败之地,就要生产出世界级质量的产品,这就需要采用先进的技术科学与先进的管理科学。一般说来,先进的技术科学可以改进与提高产品质量指标的绝对值,而先进的质量科学则可以在现有条件下将其波动调整到最小。这就好比一辆摩拖车的两个轮子,两者缺一不可,推行SPC等质量科学就是贯彻先进的科学管理。

(3)西方工业发达国家来华加工定货,一般都要求加工企业在生产线推行SPC,如未推行就认为该企业的产品质量没有保证,拒绝定货。现在,此风愈演愈烈,甚至一些发展中国家也提出上述要求。我国加入世贸组织(WTO)后,可以预计在国际市场中的竞争将更加激烈,从而各个企业对质量科学的需求将会更加迫切。

1.3统计过程控制的特点

(1)与全面质量管理相同,强调全员参加,而不是依靠少数质量管理人员;

(2)强调应用统计方法来保证预防原则的实现,而不是只停留在口头上或书面上的空头保证;

(3)SPC不是用来解决个别工序采用什么控制图的问题,SPC强调从整个过程、整个体系出发来解决问题。SPC的重点就在于“P(Process,过程)”。

1.4统计过程诊断

SPC可以判断过程的异常,及时警告。但早期的SPC不能判断此异常是什么因素引起的,发生于何处,即不能进行诊断。而在现场迫切需要解决诊断问题,否则即使要想纠正异常也无从下手。故现场与理论都迫切需要将SPC加以发展,现代SPC 已包含了此部分内容,也即统计过程诊断(Statistical Process Diagnosis,简称SPD)。

SPD不但具有早期SPC告警进行控制的功能,而且具有诊断功能,故SPD是现代SPC理论的发展和重要组成部分。SPD就是利用统计技术对过程中的各个阶段进行监控与诊断,从而达到缩短诊断异常的时间、以便迅速采取纠正措施、减少损失、保证产品质量的目的。SPD是20世纪80年代发展起来的。

2、常规控制图

2.1常规控制图的构造

控制图是对过程质量特性值进行测定、记录、评估和监察过程是否处于统计控制

状态的一种用统计方法设计的图。图上有用实线绘制的中心线(CL,Central Line)、用虚线绘制的上控制限(UCL,Upper control Limit)和下控制线(LCL,Lower Control Limit),图中并有按时间顺序抽取的样本统计量数值的描点序列,各点之间用直线段相连,以便看出点子的变化趋势。UCL、CL与LCL统称为控制线(Control Lines),它们是互相平行的。若控制图中的描点落在UCL与LCL之外或描点在UCL 与LCL之间的排列不随机,则表明过程异常。世界上第一张控制图是美国休哈特在1924年5月16日提出的不合格品率(p)控制图。

本章将主要讨论常规控制图,也称休哈特控制图。(见下图)

2.2控制图的重要特性

控制图的重要特性体现在下列各点:

(1)控制图是贯彻预防原则的SPC的重要工具,控制图可用以直接控制与诊断过程,故为质量管理七个工具的重要组成部分。

(2)1984年日本名古屋工业大学调查了200家日本各行各业的中小型工厂,结果发现平均每家工厂采用137张控制图。这个数字对于推行SPC与SPD有一定的参考意义。

(3)当然,有些大型企业应用控制图的张数是很多的,例如美国柯达彩色胶卷公司有5000职工,一共应用了35000张控制图。

(4)我们不追求控制图张数的多少,但可以说,工厂中使用控制图的张数在某种意义上反映了管理现代化的程度。

2.3控制图的形成及控制图原理解释

2.3.1控制图的形成

将通常的正态分布图转个方向,使自变量增加的方向垂直向上,并将u、u﹢3σ和u-3σ分别标为CL、UCL和LCL,这样就得到一张控制图。UCL为上控制线,CL 为中心线,LCL为下控制线。

2.3.2控制图原理的第一种解释

为了控制加工螺钉的质量,设每隔1小时随机抽取一个车好的螺丝,测量其直径,将结果描点,并用直线段将点子连起来,以便观察点子的变化趋势。如前3个点子都在控制界限内,但第4个点子却超出了UCL,为了醒目,把它用小圆圈圈起来,表示第4个螺丝的直径过分粗了,应引起注意。现在对这第4个点子应作什么判断呢?摆在我们面前有两种可能性:

(1)若过程正常,即分布不变,则出现这种点子超过UCL的概率只有1‰左右。

(2)若过程异常,譬如设异常原因为车刀磨损,则随着车刀的磨损,加工的螺丝会逐渐变粗,u逐渐变大,于是分布曲线上移,发生这种情况的可能性

很大,其概率可能为1‰的几十至几百倍。

现在第4个点子已经超出UCL,问在上述1、2两种情形中,应该判断是哪种情形造成的?由于情形2发生的可能性要比情形1大几十、几百倍,故我们合乎逻辑地认为上述异常是由情形2造成的。于是,得出点出界就判异的结论。

用数学语言来说,这就是小概率事件原理:小概率事件在一次试验中几乎不可能发生,若发生即判断异常。

2.3.3控制图原理的第二种解释

现在换个角度来研究一下控制图原理。根据来源的不同,影响质量的原因(因素)可分为人、机、料、法、环五个方面。但从对产品质量的影响大小来分,可分为偶然因素与异常因素两类。偶因是过程固有的,始终存在,对质量的影响微小,但难以除去,例如机床开动时的轻微振动等。异因则非过程固有,有时存在,有时不存在,对质量影响大,但不难除去,例如车刀磨损等。

偶因引起质量偶然波动,异因引起质量的异常波动。偶然波动是不可避免的,但对质量的影响一般不大。异常波动则不然,它对质量的影响大,且采取措施不难消除,故在过程中异常波动及造成异常波动的异因是我们注意的对象,一旦发生,就应该尽快找出,采取措施加以消除。将质量波动区分为偶然波动与异常波动两类并分别采取不同的对待策略,这是休哈特的贡献。

偶然波动与异常波动都是产品质量的波动,如何能发现异常波动的到来呢?假定现在异常波动均已消除,只剩下偶然波动,则此偶然波动的波动将是正常波动。以此波动作为基础,若过程中异常波动发生,则此异常波动叠加于正常偶然波动上后所产生的波动一定会比原来的最小偶然波动大为增加,从而在控制图上会造成点子频频出界,故可由此判断过程已经发生异常的变化。控制图上的控制限就是区分偶然波动与异常波动的科学界限。

根据上述,可以说常规控制图的实质是区分偶然因素与异常因素两类因素。

2.4控制图的作用

按下述情形分别考虑:

情形1:应用控制图对生产过程进行监控,如出现(下图所示)上升倾向,显然过程有问题,故异因刚一露头,即可发现,于是可及时采取措施加以消除,这当然是预防。但在现场出现这种情形是不多的。

控制图点子形成倾向

情形2:更经常地是控制图上点子无任何预兆,突然出界,显示异常。这时应查出异因,采取措施,加以消除。

控制图的作用是及时警告。只在控制图上描描点子,当然是不可能起到预防作用的。必须强调要求现场第一线的工程技术人员推行SPC,把它作为日常工作的一部分,而质量管理人员则应该起到组织、协调、监督、鉴定与当好领导参谋的作用。

2.5统计控制状态

(1)统计控制状态也称稳态,即过程中只有偶因而无异因产生的变异的状态。

统计控制状态是生产追求的目标,因为在统计控制状态下,有下列几大好处:

①对产品的质量有完全的把握(通常,控制图的控制界限都在规范界限之内,故至少有99.73%的产品是合格品)。

②生产也是最经济的(偶因和异因都可以造成不合格品,但由偶因造成的不合格品极少,在3σ控制原则下平均只有2.7‰左右,主要是由异因造成)。故在统计控制状态下所产生的不合格品最少,生产最经济。

③在统计控制状态下,过程的变异最小。

(2)所谓控制都要以某个标准为基准,一旦偏离了这个基准,就要尽快加以纠正,使之保持这个基准。SPC(统计过程控制)就是以统计控制状态(稳态)作为基准的,对于SPC与SPD而言,这是一个非常重要的基本概念。在现场,很多单位都未搞清楚这一点。

(3)推行SPC为什么能够保证实现全过程的预防?一道工序达到统计控制状态称

为稳定工序,道道工序都达到统计控制状态称为全稳生产线,SPC所以能够保证实现全过程的预防,依靠的就是全稳生产线。

2.6 3σ原则

在控制图上,上控制限UCL与下控制限LCL之间的距离应该是多少才最合适呢?休哈特提出它们与中心线的距离为3σ时是较好的。实际经验证明,在不少情况,上述3σ原则是接近最优的,根据3σ原则,中心线与上、下控制线的公式为:UCL=u+3σ

CL=u

LCL=u-3σ

式中u、σ为总体参数。

具体应用时需要下列两个步骤:

(1)具体化。式中的u与σ都是泛指常规控制图的各个情况的,需要针对具体情况加以确定。例如,若欲控制过程的不合格品率p,则式中的u与σ成为:u

p 与σ

,即统计量p的u与σ。

p

(2)对总体参数进行估计。注意,总体参数与样本统计量不能混为一谈,总体包括过去已制成的产品、现在正在制造的产品以及未来将要制造的产品的全体,而样本只是从已制成产品中抽取的一小部分。故总体参数的数值是不可能精

确知道的,只能通过以往已知的数据来加以估计,而样本统计量的数值则是

已知的。

注意,规范限不能用作控制限。规范限用以区分合格与不合格,控制限则用以区分偶然波动与异常波动,两者不能混淆。

2.7常规控制图的分类

常规控制图的分类见下表:

常规控制图的分类

3、分析用控制图与控制用控制图

3.1分析用控制图与控制用控制图的含义

在一道工序开始应用控制图时,几乎总不会恰巧处于统计控制状态(稳态),也即总存在异因。如果就以这种非稳态下的参数来建立控制图,控制图界限之间的间隔一定较宽,以这样的控制图来控制未来,将导致错误的结论。因此,一开始,总要将非稳态的过程调整到稳态的过程,也即调整到过程的基准,这就是分析用控制图的阶段。等到过程调整到稳态后,才能延长控制图的控制线作为控制用控制图,这就是控制用控制图的阶段。故日本有句质量管理的名言:“始于控制图,终于控制图。”所谓“始于控制图”是指对过程的分析从应用控制图对过程进行分析开始,所谓“终于控制图”是指对过程的分析结束,最终建立了控制用控制图。故根据使用的目的的不同,控制图可分为分析用控制图与控制用控制图。

3.1.1分析用控制图

分析用控制图主要分析以下两个方面:

(1)所分析的过程是否处于统计控制状态?

(2)该过程的过程能力指数是否满足要求?荷兰学者维尔达将过程能力指数满足要求称为技术控制状态(State in Technical Control)。

由于过程能力指数Cp需在稳态下计算,故应先将过程调整到统计控制状态,然后再调整到技术控制状态。

根据过程状态是否达到统计控制状态与技术控制状态,可以将它们分为如下表所示的四种情况:

(1)状态I:统计控制状态与技术控制状态同时达到,是最理想的状态;

(2)状态II:统计控制状态未达到,技术控制状态达到;

(3)状态III:统计控制状态达到,技术控制状态未达到;

(4) 状态IV :统计控制状态与技术控制状态都未时达到,是最不理想的状态。 显然,状态IV 也是现场不能容忍的,需要加以调整,使之逐步达到状态I 。 从上表可见,从状态IV 到状态I 的途径有二:状态I 或状态IV

状态状态I ,究竟通过哪条途径应由具体的技术经济分析来决定。有

时,为了更加经济,宁可保持在状态II 也是有的。当然,在生产线的末道工序一般以保持状态I 为宜。

3.1.2控制用控制图

当过程达到了我们确认的状态后,才能将分析用控制图的控制线延长作为控制用控制图。由于后者相当于生产中的立法,故由前者转为后者时应有正式交接手续。这里要用到判断稳态的准则(简称判断准则),在稳定之前还要用到判断异常的准则。

进入日常管理后,关键是保持所确定的状态。经过一个阶段的使用后,可能又会出现异常,这时应查出原因,采取必要措施,加以消除,以恢复统计控制状态。

3.2判异准则的思路

判异准则有两类:(1)点出界就判异;(2)界内点排列不随机判异。

上述(1)是针对界外点的,而上述(2)则是针对界内点的。关于判异准则,常规控制图的标准GB/T4091—2001有8种准则,参见下图。将控制图等分为6个区每个区宽1σ。这6个区的标号分别为A 、B 、C 、C 、B 、A 。其中两个A 区、B 区及C 区都关于中心线CL 对称,需要指明的是这些判异准则主要适用于X 图及单值X 图,且假定质量特性X 服从正态分布。

由于在过程正常的条件下,上述8种准则出现的概率都很小,若出现即判断过程异常。

准则3:连续9点落在中心线同一侧

准则4:连续6点递增或递减

准则5:连续14点中相邻点交替上下

B 区以外

准则7:连续5点中有4点落在中心线同一侧的C区以外

C

准则8:连续8点落在中心线两侧且无一在C区内

4、过程能力分析

4.1过程能力

过程能力是指加工质量方面的能力,它是衡量过程加工内在一致性的,而生产能力则指加工数量方面的能力,二者不可混淆。过程能力决定于质量因素:人、机、料、法、环(4M1E)而与公差无关,其中人是最活跃的因素。

SPC的基准就是统计控制状态或称稳态,过程能力即稳态下所能达到的最小变差。过程能力反映了稳态下该过程本身所表现的最佳性能(分布宽度最小)。因此,在稳态下,过程的性能是可预测的,过程能力也是可评价的。离开稳态这个基准,对过程就无法预测,也就无法评价。

过程能力决定于由偶因造成的总变差σ。当过程处于稳态时,产品的计量质量特性值有99.73%落在u±3σ的范围内,其中u和σ为质量特性值的总体参数,也即是99.73%的产品落在上述6σ范围内,这几乎包括了全部产品。故通常用6倍标准差(6σ)表示过程能力,它的数值越小越好。

根据上述,显然,在评估过程能力之前,首先必须将过程调整到稳态,并且当所使用的控制图已经判稳,反映出过程处于稳态,然后才能开始对过程能力进行评估。

4.2过程能力指数

过程能力指数(Process Capability Index)简称PCI或Cp,以往称为工序能力指数,现在则统一称为过程能力指数。

过程能力一般是通过过程能力指数度量如下:

Cp=规定的公差/过程变异度=T/6σ≈T/6?(双侧规范)

式中,公差T=Tu-Tl,Tu为公差上限,Tl为公差下限,σ为质量特性值总体的标准差,?为其估计值。

其中T反映了对产品的技术要求,而σ则反映过程加工的质量,故在过程能力指数Cp中将6σ与T比较,反映了过程加工质量满足产品技术要求的程度,也即企业产品的控制范围满足客户要求的程度。

根据T与6σ的相对大小可以得出(如下图所示)三种典型情况。Cp值越大,表明加工质量越高,但这时对设备和操作人员的要求也高,加工成本也越大,所以对于Cp值的选择应根据技术与经济的综合分析来决定。当T=6σ,Cp=1,从表面上看,似乎这是既满足技术要求又很经济的情况。但由于过程总是波动的,分布中心有一偏移,不合格品率就要增加,因此,通常取Cp大于1。从式可知,当Cp=1.33,T=8σ,这样整个质量指标值的分布基本上在上下规范限制内,且留有相当余地。需要说明的是,随着时代的进步,对于高质量、高可靠性的“6σ控制原则”情况,甚至要求Cp达到2.0以上,所以对Cp的要求应视具体情况而定。过程能力指数Cp 值的评价参考下表。

T L C P>1 T U

T L C P=1 T U

情况1 情况2 情况3

过程能力指数Cp值的评价参考

Cp值的范围级别过程能力的评价参考

Cp≥1.67 I 过程能力过高(应视具体情况而定)

1.67>Cp≥1.33 II 过程能力充分,表示技术管理能力已很

好,应继续维持。

1.33>Cp≥1.0 III 过程能力充足,但技术管理能力较勉

强,应设法提高为II级。

1.0>Cp≥0.67 IV 过程能力不足,表示技术管理能力已很

差,应采取措施立即改善。

0.67>Cp V 过程能力严重不足,表示应采取紧急措

施和全面检查,必要时可停工整顿。

4.3有偏移情况的过程能力指数

当产品质量特性值分布的平均值u与规范中心M不重合(有偏移)时,见下图,显然不合格品率将增大,也即Cp值将降低,故下式

Cp=规定的公差/过程变异度=T/6σ≈T/6?(双侧规范)所计算的无偏移过程能力指数不能反映有偏移的实际情况,需要加以修正:

Cpk=(1-K)Cp=(1-K)T/6σ 0≤K<1

其中K为分布中心u与规范中心M的偏移度:

K=2|M-u|/T

产品质量分布的均值u与

规范中心M不重合(有偏移情形)

4.4Cp和Cpk的比较

无偏移情况的Cp表示过程加工的一致性,即“质量能力”,Cp越大,质量能力越强;而有偏移情况的Cpk表示过程中心u与规范中心M偏移情况下的过程能力指数,Cpk越大,则二者偏离越小,是过程的“质量能力”与“管理能力”二者综合的结果。故Cp与Cpk二者的着重点不同,需要同时加以考虑。

常用统计分析方法

常用统计分析方法 排列图 因果图 散布图 直方图 控制图 控制图的重要性 控制图原理 控制图种类及选用 统计质量控制是质量控制的基本方法,执行全面质量管理的基本手段,也是CAQ系统的基础,这里简要介绍制造企业应用最广的统计质量控制方法。 常用统计分析方法与控制图 获得有效的质量数据之后,就可以利用各种统计分析方法和控制图对质量数据进行加工处理,从中提取出有价值的信息成分。 常用统计分析方法 此处介绍的方法是生产现场经常使用,易于掌握的统计方法,包括排列图、因果图、散布图、直方图等。 排列图 排列图是找出影响产品质量主要因素的图表工具.它是由意大利经济学家巴洛特(Pareto)提出的.巴洛特发现人类经济领域中"少数人占有社会上的大部分财富,而绝大多数人处于贫困状况"的现象是一种相当普遍的社会现象,即所谓"关键的少数与次要的多数"原理.朱兰(美国质量管理学家)把这个原理应用到质量管理中来,成为在质量管理中发现主要质量问题和确定质量改进方向的有力工具. 1.排列图的画法

排列图制作可分为5步: (1)确定分析的对象 排列图一般用来分析产品或零件的废品件数、吨数、损失金额、消耗工时及不合格项数等. (2)确定问题分类的项目 可按废品项目、缺陷项目、零件项目、不同操作者等进行分类。 (3)收集与整理数据 列表汇总每个项目发生的数量,即频数fi、项目按发生的数量大小,由大到小排列。最后一项是无法进一步细分或明确划分的项目统一称为“其它”。 (4)计算频数fi、频率Pi和累计频率Fi 首先统计频数fi,然后按(1)、(2)式分别计算频率Pi和累计频率Fi (1) 式中,f为各项目发生频数之和。 (2)

污染物排放j计算方法

工业污染物排放统计方法 一、工业污染物估算常用方法 工业企业环境统计工作中对废气、废水和固体废物及所含污染物产生量、排放量的计算通常采用三种方法,即实测法、物料衡算法和产排污系数法。 1、实测法 实测法是通过监测手段或国家有关部门认定的连续计量设施,测量废气、废水的流速、流量和废气、废水中污染物的浓度,用环保部门认可的测量数据来计算各种污染物的产生量和排放总量的统计计算方法。 G=KC i Q 式中:G——污染物产生量或排放量; Q——介质流量; C i——介质中i污染物浓度; K——单位换算系数。 浓度和流量的单位不一致时,单位换算系数K取不同的值。废水中污染物的浓度单位常取mg/L,系数K取10-3;废气中污染物的浓度一般取mg/L,系数K取10-6。 实测法的基础数据主要来自于环境监测站。监测数据是通过科学、合理地采集样品、分析样品而获得的。监测采集的样品是对监测的环境要素的总体而言,如采集的样品缺乏代表性,尽管测试分析很准确,不具备代表性的数据也毫无意义。 因受现有监测技术和监测条件的约束,实测法有一定的局限性。这主要是目前除了重点污染源有比较准确的监测数据外,其他多数非重点污染源不能得到有效的监测;而且很多重点污染源还未实现连续监测,监测结果的代表性有待提高。 例某炼油厂年排废水2万t,废水中废油浓度C油为500mg/L,COD浓度C COD为300mg/L,水未处理直接排放。计算该厂废油和COD的年排放量。 解:G油=K C油Q =10-6×500×2×104 =10(t) G COD=K C COD Q =10-6×300×2×104 =6(t) 例某冶炼厂排气筒截面0.4m2,排气平均流速12.5m/s,实测所排废气中SO2平均浓度12mg/m3,粉尘浓度8mg/L计算该排气筒每小时SO2和粉尘的排放量。 解:每小时废气流量Q=12.5×0.4×3600 = 1.8×104(m3/h) 每小时SO2排放量Gso2 = 10—6×12×1.8×104 = 0.216(kg/h) 每小时粉尘排放量G粉尘= 10—6×8×1.8×104 = 0.144((kg/h) 2、物料衡算法 物料衡算法是指根据物质质量守恒原理,对生产过程中使用的物料变化情况进行定量分析的一种方法。即: 投入物料量总和=产出物料量总和 =主副产品和回收及综合利用的物质量总和+排出系统外的废物质量这里的排出系统外的废物质量包括可控制与不可控制生产性废物及工艺过程的泄漏等物料流失。

科研常用的实验数据分析与处理方法

科研常用的实验数据分析与处理方法 对于每个科研工作者而言,对实验数据进行处理是在开始论文写作之前十分常见的工作之一。但是,常见的数据分析方法有哪些呢?常用的数据分析方法有:聚类分析、因子分析、相关分析、对应分析、回归分析、方差分析。 1、聚类分析(Cluster Analysis) 聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。 2、因子分析(Factor Analysis) 因子分析是指研究从变量群中提取共性因子的统计技术。因子分析就是从大量的数据中寻找内在的联系,减少决策的困难。因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性□2估值。在社会学研究中,因子分析常采用以主成分分析为基础的反覆法。

3、相关分析(Correlation Analysis) 相关分析(correlation analysis),相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。相关关系是一种非确定性的关系,例如,以X和Y 分别记一个人的身高和体重,或分别记每公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而又没有确切到可由其中的一个去精确地决定另一个的程度,这就是相关关系。 4、对应分析(Correspondence Analysis) 对应分析(Correspondence analysis)也称关联分析、R-Q 型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。 5、回归分析 研究一个随机变量Y对另一个(X)或一组(X1,X2,…,Xk)变量的相依关系的统计分析方法。回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一

《统计学原理》常用公式及计算题目分析

《统计学原理》常用公式汇总及计算题目分析 第三章统计整理 a) 组距=上限-下限 b) 组中值=(上限+下限)÷2 c) 缺下限开口组组中值=上限-1/2邻组组距 d) 缺上限开口组组中值=下限+1/2邻组组距 第四章综合指标 i. 相对指标 1. 结构相对指标=各组(或部分)总量/总体总量 2. 比例相对指标=总体中某一部分数值/总体中另一部分数值 3. 比较相对指标=甲单位某指标值/乙单位同类指标值 4. 强度相对指标=某种现象总量指标/另一个有联系而性质不同的 现象总量指标 5. 计划完成程度相对指标=实际数/计划数 =实际完成程度(%)/计划规定的完成程度(%) ii. 平均指标

1.简单算术平均数: 2.加权算术平均数或 iii. 变异指标 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ= 3.标准差系数: 第五章抽样估计 1.平均误差: 重复抽样: 不重复抽样:

2.抽样极限误差 3.重复抽样条件下: 平均数抽样时必要的样本数目 成数抽样时必要的样本数目 4.不重复抽样条件下: 平均数抽样时必要的样本数目 第八章 指数分数 一、综合指数的计算与分析 ()() ()p x 2 2 2 2 x 2 p n (1)1N (2)p 1-p p 1-p (3)p 1-p μ= μ= σσ σδδ?? ?????→??→??→??→,最基本的是:若为:乘以-若不重复抽样类型抽样整为:若为群抽样: n N R r ??→??→

(1)数量指标指数 此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。 ( - ) 此差额说明由于数量指标的变动对价值量指标影响的绝对额。 (2)质量指标指数 此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。 ( - ) 此差额说明由于质量指标的变动对价值量指标影响的绝对额。 加权算术平均数指数= 加权调和平均数指数= (3)复杂现象总体总量指标变动的因素分析 相对数变动分析: = ×

SPC常用计算方法

SPC常用计算方法 SPC基础知识及常用计算方法 SPC基础知识 一、 SPC定义: 1、 SPC——统计制程管制:是指一套自制程中去搜集资料,并加以统计分析,从分析中去发气掘制程的异常,立即采取修正行动,使制程恢复正常的方法。 也就是说:品质不应再依赖进料及出货的抽样检验,而应该采取在生产过程中,认良好的管理方法,未获得良好的品质。 2、良好品质,必须做到下面几点: ①变异性低 ②耐用度 ③吸引力 ④合理的价格 3、变异的来源:大概来自5个方面: ①机器②材料③方法④环境⑤作业人员 应先从机器,材料方法,环境找变异,最后考虑人。 4、 SPC不是一个观念,而是要行动的 步骤一、确立制程流程——首先制程程序要明确,依据制程程序给制造流程图,并依据流程图订定工程品质管理表。 步骤二、决定管制项目——如果把所有对品质有影响的项目不论大小,轻重缓急一律列入或把客户不很重视的特性一并管制时,徒增管制成本浪费资料且得不赏失,反之如果重要的项目未加以管制时,则不能满足设计者,后工程及客户的需求,则先去管制的意义。 步骤三、实施标准化——欲求制程管制首先即得要求制程安定,例如:在风浪很大的船上比赛乒乓球,试部能否确定谁技高一筹,帮制程作业的安定是最重要的先决条件,所以对于制程上影响产品口质的重要原因,应先建立作业标准,并透过教育训练使作业能经标准进行。 步骤四、制程能力调查——为了设计、生产、销售客户满意且愿意购买的产品,制造该产品的制程能力务必符合客户的要求。因此制程的能力不足时,必顺进行制程能力的改善,而且在制程能力充足后还必须能继续,所以在品质管理的系统中制程能力的掌握很重要。 步骤五、管制图运用——SPC的一个基本工具就是管制图,而管制图又分计量值管制图与计数值管制图。 步骤六、问题分析解决——制程能力调查与管制图是可筛提供问题的原因系由遇原因或非机遇原因所造成,但无法告知你确切的原因为何及如何解决决问题?解决问题?而问题的解决技巧,在于依据事实找出造成变异的确切原因,并提此对策加以改善,及如何防止再发生。 步骤七、制程之继续管制——经过前6个步骤,人制程能力符合客户的要求,且管制图上的点未出管制界限时,则可将此管制界限沿有作为制程之继续管制,但当制程条件如有变动时,如机器,材料,方法等产生异动时,则须回到步骤三,不可沿原先之管制界限。 SPC的应用步骤其流程图如下: Ca制程准确度 Cp制程精密度 Cpk制程能力指数 二、管制图的运用 管制图的种类又依数值资料是计量值或计数值者,划分为二大类即计量值管制图与计数值管制图,计量值管制图不但只告诉你制程有问题了,还可以告诉你制程在什么地方出了问题,是中心值产生了问题还是变异量产生了问题。而在计量值管制图应用不便或应用时,则可采用计数值

统计学常用公式汇总情况

统计学常用公式汇总 项目三 统计数据的整理与显示 组距=上限-下限 a) 组中值=(上限+下限)÷2 b) 缺下限开口组组中值=上限-邻组组距/2 c) 缺上限开口组组中值=下限+1/2邻组组距 例 按完成净产值分组(万元) 10以下 缺下限: 组中值=10—10/2=5 10—20 组中值=(10+20)/2=15 20—30 组中值=(20+30)/2=25 30—40 组中值=(30+40)/2=35 40—70 组中值=(40+70)/2=55 70以上 缺上限:组中值=70+30/2=85 项目四 统计描述 i. 相对指标 1. 结构相对指标=各组(或部分)总量/总体总量 2. 比例相对指标=总体中某一部分数值/总体中另一部分数值 3. 比较相对指标=甲单位某指标值/乙单位同类指标值 4. 动态相对指标=报告期数值/基期数值 5. 强度相对指标=某种现象总量指标/另一个有联系而性质不同的现 象总量指标 6. 计划完成程度相对指标K = 计划数 实际数 =%%计划规定的完成程度实际完成程度 7. 计划完成程度(提高率):K= %10011?++计划提高百分数实际提高百分数 计划完成程度(降低率):K= %10011?--计划提高百分数 实际提高百分数

ii. 平均指标 1.简单算术平均数: 2.加权算术平均数 或 iii. 变异指标 1. 全距=最大标志值-最小标志值 2.标准差: 简单σ= ; 加权 σ= 成数的标准差(1) p p p σ=-3.标准差系数: 项目五 时间序列的构成分析 一、平均发展水平的计算方法: (1)由总量指标动态数列计算序时平均数 ①由时期数列计算 n a a ∑= ②由时点数列计算 在连续时点数列的条件下计算(判断标志按日登记):∑ ∑=f af a 在间断时点数列的条件下计算(判断标志按月/季度/年等登记): 若间断的间隔相等,则采用“首末折半法”计算。公式为: 1 212 11 21-++++=-n a a a a a n n Λ

常用统计工具1

1. np ——在一容量为n 的样本中不合格品的数量,np 图的介绍见第Ⅲ章第2节。 2. P n ——样本容量恒定为n 时,不合格品数的平均数。 3. P ——一个样本中的不合格品率,p 图的介绍如见第Ⅲ单第1节。 4. P ——一系列样本中的平均不合格品率。 5. P P ——性能指数,通常定义为S LSL USL σ?6)(-。 6. PR ——性能比率,通常定义为) (?6LSL USL s -σ。 7. Ppk ——性能指数,通常定义为 S X USL σ?3-或S LSL X σ?3-的最小值。 8. Pz ——输出超过利益点的比例,这种利益点诸如特定的规范限值,与过程均值之差为z 个标准差 单位。 9. R ——子组的极差(最大值减去最小值);R 图的介绍见第Ⅱ章。 10. R ——一系列容量相等子组的平均极差。 11. R ——一系列容量相等子组的平均极差的均值。 12. R ~——一系列容量相等子组的极差的中位数极差。 13. S ——子组的样本标准差,S 图的介绍见第Ⅱ章第2节。 14. s ——过程的样本标准差,s 的介绍见第Ⅱ章第5节。 15. S ——一系列子组的平均样本标准差,如有必要可以按样本容量加权。 16. SL ——单边工程规范极限。 17. u ——一个样本中每单元不合格数,这个样本可能含有一个以上单位,u 图的介绍见第Ⅲ章第4节。 18. u ——样本中单位不合格数的平均值,样本的容量不必相等。 19. UCL ——上控制限,P R X UCL UCL UCL ,,等分别是均值、极差、不合格品率等的上控制限。 20. USL ——工程规范的上限。 21. X ——一个单值,是其它子组统计值的基础,单值图的讨论见第Ⅱ章第4节。 22. X ——一个子组内数值的平均数,X 图的讨论见第Ⅱ章第1节。 23. LCL ——下控制限。P R LCL LCL 、、X LCL 等分别是均值、极差、不合格品率等的下控制限。 24. LSL ——工程规范的下限。 25. MR ——主要用于单值图的一系列点的移动极差。 26. n ——一个子组内的单值的个数;子组的样本容量。 27. n ——平均子组样本容量。 28. X ——子组均值的均值(如有必要可按样本容量加权);测得的过程均值。 注:在本手册中,X 用作单值图的过程均值(第Ⅱ章第4节)尽管它仅代表一个水平的平均(单值点),以便避免与通常代表子组均值的X 相混淆。 29. X ~ ——一个子组的数值的中位数;中位数图的讨论见第Ⅱ章第3节。

常用的数据统计方法

常用的数据统计方法 一、集中趋势分析 集中趋势反映一组资料中各数据所具有的共同特征,如资料中各数据聚集的位置或者一组数据的中心点等,可以是算术平均数、中位数、众数等。 ?算术平均数 算术平均数也可以称作均值,是数据集中趋势的最主要测度量。 (1)简单算术平均数。简单算术平均数的计算公式如下:(P2) ∑ = 求和符号 X = 每一变量 N = 样本量 例 1:已知某组织五类主要职工的月收入分别是 4000 、 5000 、 6000 、 10000 和15000 元,求这五类职工的平均月收入。 解: (元) 以上大小不等五个数值的月收入水平相互抵消的结果反映的该组织职工公众的平均月收入水平。从数据分布来看各个数据围绕 8000 元上下分布,算术平均数就是该组数据的中心值,反映了该组数据的集中趋势。 (2)加权算术平均数 如果是根据分组资料计算算术平均数,由于分组资料中每个数值出现的次数不同,所以要用次数做权数计算加权算术平均数。计算公式如下:

F = 权数(每一变量的次数或频率) ∑ F = N = 样本量 例 2:某组织有月收入 3000 元的公众 50 人, 5000 的 30 人, 7000 的 10 人,10000 的 8 人, 15000 的 2 人,求该组公众的平均月收入。 解: =480000/100=4800 (元) 可见该组公众的平均月收入不简单地等于(3000+5000+7000+10000+15000) /5 。从加权算术平均数的计算公式以及上例的计算过程及结果来看,算术平均数大小不仅受到各组变量数值大小的影响,而且还受各组变量权数大小的影响。 例 3:某组织公众周工资水平整理成分组资料如下表,试计算该组织公众周收入的平均值。 按工资分组工人数组中值 F M 100~200 10 150 200~300 30 250 300~400 40 350 400~500 20 450 合计 100 — 解:

病案室常用统计公式

病案室常用统计公式 治愈率%= [治愈人数(13)/出院病人数(12)] *100% 好转率%=[好转人数(14)/出院病人数(12)] *100% 病死率%=[死亡人数(16/出院病人数(12)] *100% 病床周转次数(次)=出院病人数“总计”(11)/平均开放病床数(20)病床工作日(日)=实际占用总床数(21)/平均开放病床数(20) 实际病床使用率=实际占用总床数(21)/实际开放总床数(19) 出院者平均出院日=出院者占用总床日数(22)/出院人数“总计”(11)疾病构成%=(实际数/合计总数)*100% 增减数=本次数-上次数 增减率%=(增减数/上次数)*100%

*实际开放总床日数:指年内医院各科每日夜晚12点开放病床数总和,不论该床是否被病人占用,都应计算在内。包括消毒和小修理等暂停使用的病床,超过半年的加床。不包括因病房扩建或大修而停用的病床及临时增设病床。 *实际占用总床日数:指医院各科每日夜晚12点实际占用病床数(即每日夜晚12点住院人数)总和。包括实际占用的临时加床在内。病人入院后于当晚12点前死亡或因故出院的病人, 作为实际占用床位1天进行统计,同时亦应统计“出院者占用总床日数”1天,入院及出院人数各1人。 *出院者占用总床日数:指所有出院人数的住院床日之总和。包括正常分娩、未产出院、住院经检查无病出院、未治出院及健康人进行人工流产或绝育手术后正常出院者的住院床日数。 *平均开放病床数=实际开放总床日数/本年日历日数(365)。 *病床使用率=实际占用总床日数/实际开放总床日数X100%。 *病床周转次数=出院人数/平均开放床位数。 *病床工作日=实际占用总床日数/平均开放病床数。 *出院者平均住院日=出院者占用总床日数/出院人数。 *病床周转率=每月(年)出院人数/科(院)床位数 *病床使用率是反映每天使用床位与实有床位的比率,即实际占用的总床日数与实际开放的总床日数之比。 *实际占用的总床日数应该从每天实际占床人数中累加得到,依据于各科室每日的动态报表中 *出院者占用总床日数是出院人数住院天数的总和,依据于出院病人病案中住院天数,实际占用的总床日数用来计算病床使用率和平均病床工作日 抗生素使用强度%=所有抗菌药物累计DDD数/同期收治患者人天数(<40) 住院患者抗菌药物使用率%=使用了抗菌药物的患者数/患者总数

环境统计6

第六次作业 1、分发统一的含铜0.100mg/L的样品到六个实验室,各实验室5次测定值如表1,试比较不同实验室之间是否存在显著性差异? 表1 6个实验室测定结果比较 实验室铜测定值(mg/L) 10.0980.0990.0980.1000.099 20.0990.1010.0990.0980.097 30.1010.1010.1010.1010.102 40.1000.1000.0970.0970.095 50.0980.0940.1020.1000.100 60.0980.0940.0980.0980.098解:单因素方差分析 (1)H0: 不同实验室之间不存在差异 H A:. 不同实验室之间存在差异。 (2)确定显著水平α=0.05 (3)计算 进行F 检验,P=0.017 由此判断组间差异极显著 为了确定各个实验室之间的差异是否显著,需要进行多重比较。结果表明3与1、2、4、5、6差异显著。其余差异不显著。 2、用3种方法测定水中硫酸盐含量,结果如表2,问3种方法测定结果是否有显著性差别?

表2 3种方法测定水中硫酸盐含量 甲法乙法丙法 279229210 334274285 303310117 378 198 解:组内观测次数不相等的方差分析 (1)H0: 3种方法测定结果没有显著性差别 H A: 3种方法测定结果有显著性差别 (2)确定显著水平α=0.05 (3)计算 进行F 检验,P=0.212 组间差异无显著性差异 3、某地区通过大量饮用水源调查得知,压力井细菌总数合格率为63%,先抽查压水井水样80份,细菌总数合格的58份,合格率为72.5%。问这批抽查水样的合格率与大量调查的合格率有无显著性差别? 解:进行适合性检验 (1)H0: 这批抽查水样的合格率与大量调查的合格率无差别。 H A:.这批抽查水样的合格率与大量调查的合格率有差别。 (2)确定显著水平α=0.05 (3)计算

统计分析的八种方法

统计分析的八种方法 统计分析的八种方法一、指标对比分析法指标对比分析法,又称比较分析法,是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法。有比较才能鉴别。单独看一些指标,只能说明总体的某些数量特征,得不出什么结论性的认识;一经过比较,如与国外、外单位比,与历史数据比,与计划相比,就可以对规模大小、水平高低、速度快慢作出判断和评价。 指标分析对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较,如不同部门、不同地区、不同国家的比较,也叫横向比较;动态比较是同一总体条件不同时期指标数值的比较,也叫纵向比较。这两种方法既可单独使用,也可结合使用。进行对比分析时,可以单独使用总量指标或相对指标或平均指标,也可将它们结合起来进行对比。比较的结果可用相对数,如百分数、倍数、系数等,也可用相差的绝对数和相关的百分点(每1%为一个百分点)来表示,即将对比的指标相减。 二、分组分析法指标对比分析法是总体上的对比,但组成统计总体的各单位具有多种特征,这就使得在同一总体范围内的各单位之间产生了许多差别,统计分析不仅要对总体数量特征和数量关系进行分析,还要深入总体的内部进行分组分析。分组分析法就是根据统计分析的目的要求,把所研究的总体按照一个或者几个标志划分为若干个部分,加以整理,进行观察、分析,以揭示其内在的联系和规律性。 统计分组法的关键问题在于正确选择分组标值和划分各组界限。 三、时间数列及动态分析法时间数列。是将同一指标在时间上变化和发展的一系列数值,按时间先后顺序排列,就形成时间数列,又称动态数列。它能反映社会经济现象的发展变动情况,通过时间数列的编制和分析,可以找出动态变化规律,为预测未来的发展趋势提供依据。时间数列可分为绝对数时间数列、相对数时间数列、平均数时间数列。 时间数列速度指标。根据绝对数时间数列可以计算的速度指标:有发展速度、增长速度、平均发展速度、平均增长速度。 动态分析法。在统计分析中,如果只有孤立的一个时期指标值,是很难作出判断的。如果编制了时间数列,就可以进行动态分析,反映其发展水平和速度的变化规律。 进行动态分析,要注意数列中各个指标具有的可比性。总体范围、指标计算方法、计算价格和计量单位,都应该前后一致。时间间隔一般也要一致,但也可以根据研究目的,采取不同的间隔期,如按历史时期分。为了消除时间间隔期不同而产生的指标数值不可比,可采用年平均数和年平均发展速度来编制动态数列。此外在统计上,许多综合指标是采用价值形态来反映实物总量,如国内生产总值、工业总产值、社会商品零售总额等计算不同年份的发展速度时,必须消除价格变动因素的影响,才能正确的反映实物量的变化。

常用相关分析方法及其计算

二、常用相关分析方法及其计算 在教育与心理研究实践中,常用的相关分析方法有积差相关法、等级相关法、质量相关法,分述如下。 (一)积差相关系数 1. 积差相关系数又称积矩相关系数,是英国统计学家皮尔逊(Pearson )提出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。 积差相关系数记作XY r ,其计算公式为 ∑∑∑===----= n i i n i i n i i i XY Y y X x Y y X x r 1 2 1 2 1 ) ()() )(( (2-20) 式中i x 、i y 、X 、Y 、n 的意义均同前所述。 若记X x x i -=,Y y y i -=,则(2-20)式成为 Y X XY S nS xy r ∑= (2-21) 【 式中 n xy ∑称为协方差,n xy ∑的绝对值大小直观地反映了两列变量的一致性程 度。然而,由于X 变量与Y 变量具有不同测量单位,不能直接用它们的协方差 n xy ∑来表示两列变量的一致性,所以将各变量的离均差分别用各自的标准差 除,使之成为没有实际单位的标准分数,然后再求其协方差。即: ∑∑?= = )()(1Y X Y X XY S y S x n S nS xy r Y X Z Z n ∑?= 1 (2-22) 这样,两列具有不同测两单位的变量的一致性就可以测量计算。 计算积差相关系数要求变量符合以下条件:(1)两列变量都是等距的或等比的测量数据;(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布;(3)两列变量必须具备一一对应关系。 2. 积差相关系数的计算

利用公式 (2-20)计算相关系数,应先求两列变量各自的平均数与标准差,再求离中差的乘积之和。在统计实践中,为方便使用数据库的数据格式,并利于计算机计算,一般会将(2-20)式改写为利用原始数据直接计算XY r 的公式。即: ∑∑∑∑∑∑∑---= 2 22 2) () (i i i i i i i i XY y y n x x n y x y x n r (2-23) (二)| (三)等级相关 在教育与心理研究实践中,只要条件许可,人们都乐于使用积差相关系数来度量两列变量之间的相关程度,但有时我们得到的数据不能满足积差相关系数的计算条件,此时就应使用其他相关系数。 等级相关也是一种相关分析方法。当测量得到的数据不是等距或等比数据,而是具有等级顺序的测量数据,或者得到的数据是等距或等比的测量数据,但其所来自的总体分布不是正态的,出现上述两种情况中的任何一种,都不能计算积差相关系数。这时要求两列变量或多列变量的相关,就要用等级相关的方法。 1. 斯皮尔曼(Spearman)等级相关 斯皮尔曼等级相关系数用R r 表示,它适用于两列具有等级顺序的测量数据,或总体为非正态的等距、等比数据。 斯皮尔曼等级相关的基本公式如下: ) 1(612 2--=∑n n D r R (2-24) 式中: Y X R R D -=____________对偶等级之差; n ____________对偶数据个数。 , 如不用对偶等级之差,而使用原始等级序数计算,则可用下式 )]1() 1(4[13+-+?-= ∑n n n R R n r Y X R (2-25) 式中: X R ___________X 变量的等级; Y R ____________Y 变量的等级; n ____________对偶数据个数。 (2-25)式要求∑∑=Y X R R ,∑∑=2 2Y X R R ,从而保证22Y X S S =。在观测变量中没有相同等级出现时可以保证这一条件。但是,在教育与心理研究实践中,搜集到的观测变量经常出现相同等级。在这种情况下,∑∑=Y X R R 的条件仍可得

环境影响评价 常用计算系数

环境影响评价必须掌握的方法 计算系数 烧一吨煤,产生1600×S%千克SO2,1万立方米废气;产生200千克烟尘。 烧一吨柴油,排放2000×S%千克SO2,1.2万立米废气;排放1千克烟尘。 烧一吨重油,排放2000×S%千克SO2,1.6万立米废气;排放2千克烟尘。 大电厂,烟尘治理好,去除率超98%,烧一吨煤,排放烟尘3-5千克。 普通企业,有治理设施的,烧一吨煤,排放烟尘10-15千克; 砖瓦生产,每万块产品排放40-80千克烟尘;12-18千克二氧化硫。 规模水泥厂,每吨水泥产品排放3-7千克粉尘;1千克二氧化硫。 乡镇小水泥厂,每吨水泥产品排放12-20千克粉尘;1千克二氧化硫。 【物料衡算公式】 1吨煤炭燃烧时产生的SO2量=1600×S千克;S含硫率,一般0.6-1.5%。若燃煤的含硫率为1%,则烧1吨煤排放16公斤SO2 。 1吨燃油燃烧时产生的SO2量=2000×S千克;S含硫率,一般重油 1.5-3%,柴油0.5-0.8%。若含硫率为2%,燃烧1吨油排放40公斤SO2 。 排污系数:燃烧一吨煤,排放0.9-1.2万标立方米燃烧废气,电厂可取小值,其他小厂可取大值。燃烧一吨油,排放1.2-1.6万标立方米废气,柴油取小值,重油取大值。 【城镇排水折算系数】 0.7~0.9,即用水量的70-90%。 【生活污水排放系数】采用本地区的实测系数。。 【生活污水中COD产生系数】60g/人.日。也可用本地区的实测系数。 【生活污水中氨氮产生系数】7g/人.日。也可用本地区的实测系数。使用系数进行计算时,人口数一般指城镇人口数;在外来较多的地区,可用常住人口数或加上外来人口数。 【生活及其他烟尘排放量】 按燃用民用型煤和原煤分别采用不同的系数计算: 民用型煤:每吨型煤排放1~2公斤烟尘 原煤:每吨原煤排放8~10公斤烟尘 【工业废气排放总量计算】 1.实测法 当废气排放量有实测值时,采用下式计算: Q年= Q时× B年/B时/10000 式中: Q年——全年废气排放量,万标m3/y; Q时——废气小时排放量,标m3/h;

16种常用的数据分析方法汇总

一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。 2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。 二、假设检验 1、参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。 1)U验使用条件:当样本含量n较大时,样本值符合正态分布 2)T检验使用条件:当样本含量n较小时,样本值符合正态分布 A 单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别; B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似;

C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。 2、非参数检验 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。 A 虽然是连续数据,但总体分布形态未知或者非正态; B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下; 主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。 三、信度分析 检査测量的可信度,例如调查问卷的真实性。 分类: 1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度 2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。 四、列联表分析 用于分析离散变量或定型变量之间是否存在相关。

统计学常用公式汇总

《统计学原理》常用公式汇总 组距=上限-下限组中值=(上限+下限)÷2 缺下限开口组组中值=上限-1/2邻组组距缺上限开口组组中值=下限+1/2邻组组距 111平均指标 1.简单算术平均数: 2.加权算术平均数 或 iii.变异指标 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ= 3.标准差系数: 第五章抽样估计 1.平均误差:重复抽样: 不重复抽样: 2.抽样极限误差 3.重复抽样条件下:平均 数抽样时必要的样本数目 成数抽样时必要的样本数目 4.不重复抽样条件下:平均数抽样时必要的样本数目 第七章相关分析 1.相关系数 2.配合回归方程y=a+bx

3.估计标准误: 第八章指数分数一、综合指数的计算与分析 (1)数量指标指数 此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。 ( - ) 此差额说明由于数量指标的变动对价值量指标影响的绝对额。 (2)质量指标指数 此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。 ( - ) 此差额说明由于质量指标的变动对价值量指标影响的绝对额。 加权算术平均数指数= 加权调和平均数指数= (3)复杂现象总体总量指标变动的因素分析 相对数变动分析: = × 绝对值变动分析: - = ( - )×( - ) 第九章动态数列分析 一、平均发展水平的计算方法:

(1)由总量指标动态数列计算序时平均数 ①由时期数列计算 ②由时点数列计算 在间断时点数列的条件下计算: a.若间断的间隔相等,则采用“首末折半法”计算。公式为: b.若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为: (2)由相对指标或平均指标动态数列计算序时平均数 基本公式为: 式中:代表相对指标或平均指标动态数列的序时平均数; 代表分子数列的序时平均数; 代表分母数列的序时平均数; 逐期增长量之和累积增长量 二. 平均增长量=─────────=───────── 逐期增长量的个数逐期增长量的个数 (1)计算平均发展速度的公式为: (2)平均增长速度的计算 平均增长速度=平均发展速度-1(100%)

环境统计主要计算方法

工业污染物排放统计方法 工业企业环境统计工作中对废气、废水和固体废物及所含污染物产生量、排放量的计算通常采用三种方法,即实测法、物料衡算法和产排污系数法。 1、实测法 实测法是通过监测手段或国家有关部门认定的连续计量设施,测量废气、废水的流速、流量和废气、废水中污染物的浓度,用环保部门认可的测量数据来计算各种污染物的产生量和排放总量的统计计算方法。 G=KC i Q 式中:G——污染物产生量或排放量; Q——介质流量; C i——介质中i污染物浓度; K——单位换算系数。 浓度和流量的单位不一致时,单位换算系数K取不同的值。废水中污染物的浓度单位常取mg/L,系数K取10-3;废气中污染物的浓度一般取mg/L,系数K取10-6。 实测法的基础数据主要来自于环境监测站。监测数据是通过科学、合理地采集样品、分析样品而获得的。监测采集的样品是对监测的环境要素的总体而言,如采集的样品缺乏代表性,尽管测试分析很准确,不具备代表性的数据也毫无意义。监测样品的代表性由以下环节来决定:(1)采样点的布设。应充分考虑采样点的代表性,满足概率随机性的要求,尽量减少主观误差。废水污染物的监测要求,一类污染物一律在各车间或车间处理设施排放口取样监测;二类污染物在企业各个废水排放口取样监测。 (2)采样时问和频率。应根据监测的目的及监测组分的时间变化而定。污染源的监测频率要求一年监测2~4次,每次间隔时间不得少于1个月;一般监测两次(在正常生产条件下),上半年和下半年各监测一次。 (3)样品的完整性。数据的完整性取决于采集到的样品的完整性,只有对所有采样点采集到的全套样品进行监测分析,才能得到完整的监测数据。 (4)监测数据的可比性。要使监测数据具有可比性,常采用的办法是使用标准样品(又称标准物质)和国家认可的环境监测分析方法。使用国家级标准样品可以使监测结果在很大范围内准确可比,使用国家认可的环境监测分析方法可减少系统误差,增加监测数据之间的可比性。 因受现有监测技术和监测条件的约束,实测法有一定的局限性。这主要是目前除了重点污染源有比较准确的监测数据外,其他多数非重点污染源不能得到有效的监测;而且很多重点污染源还未实现连续监测,监测结果的代表性有待提高。 例某炼油厂年排废水2万t,废水中废油浓度C油为500mg/L,COD浓度C COD为300mg/L,水未处理直接排放。计算该厂废油和COD的年排放量。 解:G油=K C油Q =10-6×500×2×104 =10(t) G COD=K C COD Q =10-6×300×2×104 =6(t) 例某冶炼厂排气筒截面0.4m2,排气平均流速12.5m/s,实测所排废气中SO2平均浓度12mg/m3,

常用统计软件介绍

常用统计软件介绍

常用统计软件介绍 《概率论与数理统计》是一门实践性很强的课程。但是,目前在国内,大多侧重基本方法的介绍,而忽视了统计实验的教学。这样既不利于提高学生创新精神和实践能力,也使得这门课程的教学显得枯燥无味。为此,我们介绍一些常用的统计软件,以使学生对统计软件有初步的认识,为以后应用统计方法解决实际问题奠定初步的基础。 一、统计软件的种类 1.SAS 是目前国际上最为流行的一种大型统计分析系统,被誉为统计分析的标准软件。尽管价格不菲,SAS已被广泛应用于政府行政管理,科研,教育,生产和金融等不同领域,并且发挥着愈来愈重要的作用。目前SAS已在全球100多个国家和地区拥有29000多个客户群,直接用户超过300万人。在我国,国家信息中心,国家统计局,卫生部,中国科学院等都是SAS系统的大用户。尽管现在已经尽量“傻瓜化”,但是仍然需要一定的训练才可以使用。因此,该统计软件主要适合于统计工作者和科研工作者使用。 2.SPSS SPSS作为仅次于SAS的统计软件工具包,在社会科学领域有着广泛的应用。SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于20世纪60年代末研制。由于SPSS容易操作,输出漂亮,功能齐全,价格合理,所以很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。迄今SPSS软件已有30余年的成长历史。全球

约有25万家产品用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。因此,对于非统计工作者是很好的选择。 3.Excel 它严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。而且凡是有Microsoft Office的计算机,基本上都装有Excel。但要注意,有时在装 Office时没有装数据分析的功能,那就必须装了才行。当然,画图功能是都具备的。对于简单分析,Excel 还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用函数,甚至根本没有相应的方法了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。 4.S-plus 这是统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。它也在进行“傻瓜化”,以争取顾客。但仍然以编程方便为顾客所青睐。 5.Minitab 这个软件是很方便的功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。

环境统计指标体系编制说明.doc

“十二五”环境统计指标体系编制说明 2011年9月

一、背景情况 环境统计是环境管理的一项重要内容和基础工作。1980年11月,为了加强环境管理,掌握环境污染、治理情况和环境保护工作开展情况,为制定相关政策、编制规划和开展管理工作服务,国务院环境保护领导小组办公室在北京主持召开了全国第一次环境统计工作会议,针对我国县及县以上工业“三废”排放,及其治理情况和环保队伍自身建设、工作发展情况开展环境统计,这标志着我国环境统计工作的起步和环境统计报表制度的建立。 经过30多年的不断探索和完善,环境统计已经在为各级政府制定社会经济和环境保护方针政策,开展各项环境管理工作,向社会提供环境保护情况信息等方面都发挥了十分重要的作用。而且已经初步形成了较为系统、完整的部门统计体系。 现行的环境统计报表制度,包括环境统计综合报表、环境统计专业报表制度和环境统计年报工作技术要求等一系列文件。其中,环境统计综合报表和环境统计专业报表制度是核心内容。 环境统计综合年报制度的实施范围为有污染排放的工业企业、医院、城镇生活及其他排污单位、实施污染物集中处置的危险废物集中处置厂和城市污水处理厂等。环境统计综合年报制度由16张年报表、5张季报表、351项指标组成,主要统计内容为企业污染物排放和环境治理设施运行情况。 环境统计专业年报制度的实施范围是除核安全和外事(单独统

计)以外的所有环境保护业务部门的工作,包括环保系统能力建设,污染防治、生态保护、环境法制和监督执法,环境监测、科技标准、环境影响评价等环境管理工作情况。“十一五”环境统计专业报表制度由22张年报表、7张季报表、639项指标组成。 环境统计报表按年度每年初上报一次。其中综合报表由企业和相关单位填报,各级环保部门逐级汇总上报;专业报表由各级环保部门的主管业务部门统计填报并逐级上报。国家环境统计年报和公报在完成全国环境统计数据汇总之后,一般在六五世界环境日前发布。 随着环境管理工作的不断深入,尤其是“十一五”期间主要污染物总量减排工作的推动,环境统计数据质量引起各级领导和各相关方面更高的重视与关注,环境统计工作得到了明显的强化和提高。 二、修改的必要性 “十二五”期间我国将进一步推进主要污染物总量减排工作,各项环境管理工作也在不断深入和实行量化管理,对环境统计的要求也将越来越高,从而使环境统计面临着严峻的挑战和良好的发展机遇。 近年来,环境统计工作虽然不断进行积极的探索和必要的调整,但从总体上看,主要统计指标体系、技术体系和管理模式仍沿用上世纪九十年代甚至更早期的做法,而且由于长期以来环境统计能力建设和工作基础薄弱、方法相对落后,加之客观上存在统计对象种类多、差异大、变化快、数据获取难等具体困难,尤其是一部分企业和地方,为了应付各种检查和考核,人为调整数据,更使得数据质量受到严重影响,许多方面已不能适应当前环境保护工作的需要,改革势在必行。

相关主题
文本预览
相关文档 最新文档