聚类算法在锅炉运行参数基准值分析中的应用
- 格式:pdf
- 大小:172.01 KB
- 文档页数:4
《基于改进的K-means聚类算法的火电厂锅炉燃烧优化研究》篇一一、引言火电厂作为重要的能源供应设施,其运行效率和环保性能对于我国能源发展和环境保护具有重要意义。
其中,锅炉燃烧作为火电厂的核心过程,其运行优化对于提高能源利用效率、减少污染物排放具有关键作用。
传统的锅炉燃烧优化方法往往依赖于经验或简单的数学模型,难以实现精确的优化控制。
因此,本研究提出了一种基于改进的K-means聚类算法的火电厂锅炉燃烧优化方法,旨在通过数据分析和优化算法实现锅炉燃烧过程的精确控制。
二、K-means聚类算法的改进K-means聚类算法是一种常用的无监督学习方法,能够根据数据点的相似性将数据划分为不同的簇。
在火电厂锅炉燃烧优化中,我们可以利用K-means算法对锅炉运行数据进行聚类分析,找出不同工况下的最优燃烧状态。
然而,传统的K-means算法在处理大规模数据时存在计算复杂度高、易陷入局部最优等问题。
因此,本研究对K-means算法进行了改进。
首先,我们引入了密度峰值检测方法,对数据进行预处理,快速识别出数据点的密度峰值和簇心。
这样可以在初始阶段就找到较为合理的簇心点,提高了算法的初始化和收敛速度。
其次,我们采用了动态调整的聚类数目,根据数据分布的实际情况动态调整簇的数量,使得聚类结果更加符合实际需求。
最后,我们引入了粒子群优化算法对K-means算法进行优化,通过粒子群在解空间中的搜索和迭代,找到最优的聚类结果。
三、锅炉燃烧优化研究在火电厂锅炉燃烧过程中,涉及到燃料量、空气量、烟气排放等多个因素。
这些因素之间的相互影响和制约关系使得锅炉燃烧过程的控制变得复杂。
通过改进的K-means聚类算法,我们可以对锅炉运行数据进行聚类分析,找出不同工况下的最优燃烧状态。
具体而言,我们首先收集了火电厂锅炉的运行数据,包括燃料量、空气量、烟气成分等。
然后,利用改进的K-means算法对数据进行聚类分析,找出不同工况下的数据模式。
基于数据聚类的锅炉受热面吹灰对再热减温水量相关性研究钱虹;宋亮;陈纲;马浩【摘要】针对锅炉优化吹灰策略制定的需要,通过研究吹灰对受热面吸热量与再热减温水量影响的相关性分析,旨在为优化吹灰指导提供依据.基于生产数据进行层次聚类法处理,用聚类后的有效数据计算吹灰前后受热面工质的吸热量,再通过滑动平均算法对吸热量和再热减温水进行数据平滑处理,使吸热量数据和再热减温水大小具有单一关系,利用相关性分析得到两者的相关系数,表征吹灰对两者的影响程度的关系.分析结果表明,不同受热面吹灰与再热减温水的相关系数不同.因此通过各受热面相关性系数比较,可对受热面吹灰序列的优化即吹灰策略的制定进行指导.%According to the need of making sootblowing optimization strategy, the correlation analysis of the sootblowing effect on the heat absorption and reheating and cooling water quantity of the heating surface was carried out,which provided the basis for optimization of sootblowing guidance.Based on the production data, hierarchical clustering method was used to calculate the heat absorption of the working surface of the heating surface before and after soot blowing with the effective data after clustering, and then through the sliding average algorithm for heat absorption and reheat desuperheating water data for smoothing, so that the heat absorption data and the size of reheat desuperheating water has a single relationship, And their correlation coefficients were obtained by correlation analysis, the influence of sootblowing on them was characterized.The results show that the correlation coefficients of soot-blowing and reheat desuperheating water in different heating surfaces aredifferent.Therefore, by comparing the correlation coefficient of each heating surface, we can guide the optimization of soot-blowing sequence of the heating surface, that is, the soot-blowing strategy.【期刊名称】《计算机应用与软件》【年(卷),期】2017(034)005【总页数】6页(P48-53)【关键词】受热面吹灰;再热减温水;数据聚类;相关性【作者】钱虹;宋亮;陈纲;马浩【作者单位】上海电力学院自动化工程学院上海 200090;上海电力学院自动化工程学院上海 200090;华能上海石洞口第一电厂上海 200942;华能上海石洞口第一电厂上海 200942【正文语种】中文【中图分类】TP391燃煤电站锅炉煤粉燃烧过程中,受热面积灰结渣是不可避免的问题,吹灰是解决受热面积灰结渣问题的主要途径[1]。
《基于改进的K-means聚类算法的火电厂锅炉燃烧优化研究》篇一一、引言随着能源需求的不断增长和环境保护意识的提高,火电厂的燃烧优化问题变得日益重要。
在火电厂中,锅炉的燃烧过程直接影响着电厂的效率、燃料消耗以及排放质量。
为了实现锅炉燃烧的优化,需要对燃烧过程进行精细控制,以达到高效、低耗、低排放的目标。
近年来,数据挖掘和机器学习技术在火电厂燃烧优化中得到了广泛应用。
其中,K-means聚类算法作为一种常用的无监督学习方法,在锅炉燃烧优化中发挥了重要作用。
本文提出了一种基于改进的K-means聚类算法的火电厂锅炉燃烧优化研究方法,以期提高火电厂的运行效率和减少排放。
二、火电厂锅炉燃烧问题分析火电厂锅炉燃烧过程中,存在许多影响燃烧效率、燃料消耗和排放质量的问题。
首先,燃料的质量和成分差异较大,导致燃烧过程不稳定。
其次,锅炉的运行参数众多,各参数之间的耦合关系复杂,难以实现精确控制。
此外,排放物的处理和回收利用也是一大挑战。
因此,需要对这些因素进行综合考虑,以实现锅炉燃烧的优化。
三、改进的K-means聚类算法针对火电厂锅炉燃烧的复杂性,本文提出了一种改进的K-means聚类算法。
该算法通过引入遗传算法和粒子群优化算法,对初始聚类中心进行优化选择,以提高聚类的准确性和效率。
同时,该算法还考虑了不同参数之间的耦合关系,通过多维度特征提取和降维技术,将高维数据转化为低维数据,以便更好地揭示数据之间的内在联系。
此外,该算法还具有自动识别异常数据和噪声数据的能力,以提高数据的可靠性。
四、火电厂锅炉燃烧优化研究在火电厂锅炉燃烧优化研究中,我们首先收集了大量的运行数据,包括燃料成分、燃烧参数、排放物等。
然后,利用改进的K-means聚类算法对数据进行聚类分析,找出不同工况下的燃烧特性。
通过对聚类结果的分析,我们可以找出影响燃烧效率的关键因素和参数范围。
在此基础上,我们进一步利用优化算法对锅炉的运行参数进行优化调整,以实现高效、低耗、低排放的目标。
聚类算法在制造业设备状态监测中的应用研究一、引言随着制造业的不断发展,如何确保设备的正常运行以及预防设备故障已经成为了制造业中的一个重要问题。
在过去,大多数制造企业都是人工进行设备状态监测,这种人工监测方式存在着很大的局限性,例如盲目性强、效率低下等问题。
现在,随着聚类算法的不断发展和使用,越来越多的制造企业开始应用聚类算法进行设备状态监测,这种方法极大地提高了设备状态监测的效率和准确性。
本文将探讨聚类算法在制造业设备状态监测中的应用。
二、聚类算法概述聚类算法是一种常用的数据挖掘技术,它试图将相似的数据样本归为一类,不同的数据样本归为不同的类。
聚类算法通常分为硬聚类和软聚类。
硬聚类指的是将数据样本完全分到某个类别中,而软聚类则是将数据样本分到不同的类别中,以概率表示数据样本属于某个类别的可能性。
聚类算法的原理很简单,首先需要选择合适的相似度度量方法。
然后将所有样本点看做一个个初始聚类中心,然后根据相似度度量方法计算每个数据点与每个聚类中心的相似度,根据相似度将数据点分配到离它最近的聚类中心所在的类别中。
最后,根据每个类别的聚类结果重新计算聚类中心,直到每个聚类中心稳定不变或达到预设的迭代次数为止。
三、聚类算法在制造业设备状态监测中的应用制造业中的设备状态监测可以通过采集设备传感器的原始数据来实现,对于这些原始数据,聚类算法可以进行有效的数据挖掘。
聚类算法可以根据设备的不同特征将其分为不同的状态,例如正常状态、预警状态和故障状态等。
具体应用过程如下:1. 设备状态特征提取在进行聚类算法之前,需要先对设备状态特征进行提取。
设备状态特征可以是许多方面的,例如振动信号、温度、电流、电压等等。
这些特征可以通过各种传感器进行采集,并通过数据处理算法进行提取。
2. 聚类算法应用聚类算法可以应用于对设备状态进行分类,例如将设备分为正常状态、预警状态和故障状态等。
在聚类算法中,需要设置相应的参数,例如聚类数目、相似性度量方法、聚类算法类型等。
聚类算法的使用方法及其在市场分析中的应用聚类算法是一种常见的数据分析方法,它可将数据集中的样本根据相似性进行分组,使得同一组内的样本具有较高的相似性,而不同组的样本之间相似性较低。
在市场分析中,聚类算法可应用于多个领域,例如市场细分、目标市场定位以及市场调研等。
本文将介绍聚类算法的使用方法,并说明其在市场分析中的具体应用。
聚类算法的使用方法分为以下几个步骤:数据预处理、选择合适的聚类算法、确定距离度量和聚类数目、执行聚类和结果分析。
第一步:数据预处理数据预处理是聚类分析的重要步骤,它包括数据清洗、数据变换和数据归一化等。
首先,需要对原始数据进行清洗工作,删除缺失值和异常值。
然后,根据实际需求对数据进行变换,例如对数据进行对数变换或标准化处理,以消除数据之间的差异性。
最后,为了保证不同属性之间的权重一致,需要对数据进行归一化处理。
第二步:选择合适的聚类算法选择合适的聚类算法取决于数据的特点和实际需求。
常用的聚类算法包括K均值聚类、层次聚类、DBSCAN等。
K均值聚类是一种划分聚类算法,它将样本划分到预先指定的聚类数目中。
层次聚类通过自底向上或自顶向下的方式递归地组合样本,形成聚类层次结构。
DBSCAN是一种基于密度的聚类算法,它根据样本点周围的密度将它们划分为核心点、边界点和噪声点。
第三步:确定距离度量和聚类数目选择合适的距离度量方法是聚类算法的关键之一。
常用的距离度量包括欧氏距离、曼哈顿距离、闵可夫斯基距离等。
在确定聚类数目时,可以使用肘部法则、轮廓系数等方法进行评估和选择。
第四步:执行聚类和结果分析当确定了聚类算法、距离度量和聚类数目后,便可以执行聚类算法进行分析。
根据选定的算法,将样本进行分组,并生成聚类结果。
然后,通过可视化和统计分析等方法对聚类结果进行解读和分析。
最后,根据分析结果进行市场细分、目标市场定位和市场调研等相关工作。
聚类算法在市场分析中具有广泛的应用,以下是几个典型的应用案例:1. 市场细分聚类算法可根据不同的市场特征将潜在消费者分为若干个独立的群体,从而实现市场细分。
聚类分析算法在工业大数据分析中的应用研究随着工业化进程的不断推进,工业生产中产生的数据规模也越来越大。
如何从这些数据中挖掘出有价值的信息,成为了现代工业领域需要解决的一个重要问题。
聚类分析算法是其中一种经典的数据挖掘手段,具有较为广泛的应用前景。
本文将探讨聚类分析算法在工业大数据分析中的应用研究。
一、聚类分析算法简介聚类分析算法是指依据一定的距离度量或相似度,将数据点分组的一种方法。
其目的是将相似的数据点划分到同一组中,不相似的数据点则划分到不同组中。
聚类分析主要分为层次聚类和非层次聚类两种类型。
(1) 层次聚类:层次聚类是将数据点以一定的层次结构进行分组。
其优点是易于理解和解释,缺点是对于大规模数据计算量较大。
(2) 非层次聚类:非层次聚类又称为划分式聚类。
其基本思想是将数据点划分到不同的类别中,每个类别代表着一类数据点。
该算法常采用K-means算法,其计算快,但需要合理选择聚类簇的个数。
二、聚类分析算法在工业大数据分析中的应用能否找到一种有效的数据挖掘方法,对于工业生产的管理和运营至关重要。
聚类分析算法可应用在各种类型的工业大数据中。
其具体应用范围包括但不限于以下几个领域。
(1) 工业生产重点领域的数据分析钢铁、煤炭、电力等工业生产的数据规模十分庞大。
据此通过聚类分析算法,可将工业生产中的数据进行分类分析,达到对工业生产中多个方面进行深入分析的目的。
如通过对消耗能源的类型和数量聚类,可以合理统计出能源使用的情况;通过对物料的种类进行聚类,可以分辨出不同的物料使用情况;通过对重要操作的数据分析,可以判断出操作是否正常。
聚类分析算法应用在工业生产领域的数据分析中,不仅有助于诊断和预测可能的生产问题,更能在改进生产方法及提高资源利用率等方面发挥重要作用。
(2) 工业大数据的分类与预测工业大数据的分类与预测是聚类分析算法的两个重要应用。
数据可以通过聚类分析的方法进行分组,以便进行深入分析,从而预测未来可能出现的相关情况。
《基于改进的K-means聚类算法的火电厂锅炉燃烧优化研究》篇一一、引言随着工业化的快速发展,火电厂作为重要的能源供应来源,其运行效率和环境影响引起了广泛的关注。
其中,锅炉燃烧过程的优化对于提高电厂效率和减少污染排放具有重要意义。
传统的火电厂锅炉燃烧控制主要依赖于人工操作和经验调整,难以实现精确和自动化的控制。
因此,本研究提出了一种基于改进的K-means聚类算法的火电厂锅炉燃烧优化方法,以提高锅炉的燃烧效率并减少污染物排放。
二、K-means聚类算法的改进K-means聚类算法是一种常用的无监督学习方法,通过迭代优化将数据划分为K个不同的簇,使得每个簇内部的数据尽可能相似,而不同簇之间的数据尽可能不同。
然而,传统的K-means 算法在处理大规模数据时存在计算量大、易陷入局部最优等问题。
因此,本研究对K-means算法进行了以下改进:1. 初始化优化:引入了一种基于密度的初始化方法,使得初始簇中心更加合理,减少了算法陷入局部最优的可能性。
2. 距离度量优化:采用了多种距离度量方式,如欧氏距离、马氏距离等,以更好地适应不同数据的特点。
3. 迭代策略优化:引入了早停机制和自适应调整簇数量的策略,提高了算法的效率和准确性。
三、火电厂锅炉燃烧数据的处理与分析本研究收集了某火电厂的锅炉燃烧数据,包括燃料类型、空气流量、炉膛温度、烟气成分等。
首先,对数据进行预处理,包括去噪、归一化等操作。
然后,利用改进的K-means算法对数据进行聚类分析,得到不同燃烧状态下的数据特征。
通过对聚类结果的分析,可以找出锅炉燃烧过程中存在的问题和优化方向。
四、燃烧优化策略的制定与实施根据聚类分析的结果,可以制定相应的燃烧优化策略。
具体包括:1. 调整燃料类型和比例:根据聚类结果,选择更合适的燃料类型和比例,以提高燃烧效率和减少污染物排放。
2. 优化空气流量控制:通过调整空气流量,使燃料在炉膛内充分燃烧,提高燃烧效率。
3. 控制炉膛温度:根据聚类结果,调整炉膛温度的控制策略,以实现最佳的燃烧效果。
基于模糊C均值聚类算法的锅炉燃烧诊断方法王锡辉;陈厚涛;彭双剑;朱晓星;寻新【期刊名称】《热力发电》【年(卷),期】2018(047)009【摘要】锅炉燃烧诊断对燃烧调整具有重要意义.本文提出采用表征炉膛燃烧状况的火检信号平均值、标准差、均匀度、变异系数、峰峰值为特征量,使用模糊C均值聚类算法进行燃烧诊断,分析被选特征量应具备的属性,同时对诊断过程中样本的采集周期进行了详细的研究.结果表明:采用本文所选的特征量,其聚类中心在数值上的变化规律能准确反映实际燃烧状况;采集周期对燃烧状况诊断的正确性有较大影响,当采集周期为5s时,各聚类中心在数值上的变化规律与实际燃烧状况的变化规律不完全吻合,其诊断正确率为80%,当采集周期为10s和30 s时,诊断正确率为100%;当求取聚类中心时样本的采集周期和待诊断样本的采集周期不同时,有可能引发误诊断.在实际应用中,应保持样本采集周期一致.【总页数】7页(P27-33)【作者】王锡辉;陈厚涛;彭双剑;朱晓星;寻新【作者单位】国网湖南省电力有限公司电力科学研究院,湖南长沙410007;湖南省湘电试验研究院有限公司,湖南长沙410007;国网湖南省电力有限公司电力科学研究院,湖南长沙410007;湖南省湘电试验研究院有限公司,湖南长沙410007;国网湖南省电力有限公司电力科学研究院,湖南长沙410007;国网湖南省电力有限公司电力科学研究院,湖南长沙410007;湖南省湘电试验研究院有限公司,湖南长沙410007;国网湖南省电力有限公司电力科学研究院,湖南长沙410007【正文语种】中文【中图分类】TK323【相关文献】1.基于免疫遗传算法的模糊C均值聚类算法应用研究 [J], 李鹏松;石卓;刘欣2.基于模糊C均值聚类算法与隶属算法的容差电路软故障诊断 [J], 黄亮;侯建军;骆丽3.基于遗传算法和模糊C均值聚类的WSN分簇路由算法 [J], 董发志;丁洪伟;杨志军;熊成彪;张颖婕4.基于模糊C均值聚类的电站锅炉燃烧在线诊断 [J], 王锡辉; 陈厚涛; 朱晓星; 刘帅; 盛锴; 肖刚5.基于自适应局部迭代滤波和模糊C均值聚类的滚动轴承故障诊断方法 [J], 张超;何闯进;何玉灵因版权原因,仅展示原文概要,查看原文内容请购买。
聚类算法在大型企业数据分析中的应用研究随着企业数据量的不断增加,为了更好地理解和利用数据,企业需要寻找一些高效的数据分析方法。
而聚类算法就是一种常用的分析方法之一。
本文将从什么是聚类算法,聚类算法的应用场景,聚类算法在大型企业数据分析中的应用研究三个方面进行阐述。
一、什么是聚类算法聚类算法是一种用于分类、模式识别和实现聚类分析的数学算法,其目的是用统计方法将一组相似的样本聚集在一起。
聚类算法将输入数据(N个数据)分为K 组,每一组称为一个簇。
聚类算法根据相似性或距离度量将数据分成不同的簇,每个簇与其他簇之间的距离是最大的,而每个簇内部的数据之间的距离是最小的。
二、聚类算法的应用场景聚类算法可以应用于多个领域,如图像处理、人工智能、机器学习、市场营销、医学诊断等领域。
在市场营销中,聚类分析可以针对不同的受众群体进行精细化运营;在医学领域,聚类分析可以帮助医生快速了解患者的健康状况。
三、聚类算法在大型企业数据分析中的应用研究大公司通常有很多不同的业务部门,每个部门都有大量的数据。
如果没有一个好的数据分析方法,这些数据就只是数值而已,很难被利用起来。
因此,聚类算法在大型企业数据分析中具有很高的价值。
3.1 人力资源管理企业在管理人力资源时,需要考虑员工的能力、工作经验、工作态度等多个方面,同时也要看到员工之间的相似之处。
聚类分析可以帮助企业从企业数据中发现一些群体,进一步分析为什么这些人会被聚在同一群组中,通过分析群组的特点从而更好地管理团队。
3.2 产品分类企业经营的产品非常多,每种产品都有一些共性和特点,聚类算法可以帮助企业将这些产品分类,从而从中发现一些规律性。
3.3 社交网络随着互联网的发展,社交网络也成了人们沟通的重要方式。
在社交网络中,人们之间有着复杂的关系,而聚类算法可以帮助企业构建出一个基于社交媒体的用户关系图谱,分析出用户之间的相似性和联系程度。
结论:聚类算法是一种实用的数据分析方法,广泛应用于各种领域。
浅析聚类分析方法在食堂消费数据中的应用论文浅析聚类分析方法在食堂消费数据中的应用全文如下:【摘要】:以聚类分析方法为基础,研究学校食堂消费数据,从而分析出男女生消费特点的不同,以帮助食堂改进经营策略。
【关键词】:聚类分析消费数据 SPSS1 聚类分析方法聚类分析cluster analysis是一组将研究对象分为相对同质的群组clusters的统计分析技术。
聚类分析方法具有简单、直观的特点,主要应用于探索性的研究,其中变量的选择有较大的影响。
2 聚类分析基本思想以学生的消费记录为研究对象,使用聚类分析知识进行研究,主要使用K-Means 算法:输入:聚类个数k 以及包含n 个数据对象的数据集;输出:满足目标函数值最小的k 个聚类。
1计算任意两个数据对象间的距离dxi,xj;2计算每个数据对象的密度参数,把处于低密度区域的点删除,得到处于高密度区域的数据对象的集合D;3把处于最高密度区域的数据对象作为第1 个中心z1;4把z1 距离最远的数据对象作为第2 个初始中心z2,z2∈D;5令z3 为满足maxmindxi,z1, dxi,z2, i =1,2,…,n 的数据对象xi,z3∈D;6令z3 为满足maxmindxi,z1, dxi,z2, dxi,z3, i =1,2,…,n 的数据对象xi,z4∈D;7令zk 为满足maxmindxi,zj , i =1,2,…,n, j =1,2,…,k -1 的xi,zk∈D;8从这k 个聚类中心出发,应用k-means 聚类算法,得到聚类。
一般采用均方差作为目标测度函数:其中E 是数据集中所有对象的均方差之和;p 是代表对象的空间中的一个点。
3 聚类分析方法在食堂消费数据中的应用本文主要使用SPPS 工具来进行聚类分析与研究。
SPSSStatistical Product and Service Solutions,统计产品与服务解决方案,是一种实现数据分析的多功能软件。
第27卷第23期中国电机工程学报V ol.27 No.23 Aug. 20072007年8月Proceedings of the CSEE ©2007 Chin.Soc.for Elec.Eng. 文章编号:0258-8013 (2007) 23-0071-04 中图分类号:TK222 文献标识码:A 学科分类号:470⋅20聚类算法在锅炉运行参数基准值分析中的应用钱瑾1,王培红1,李琳2(1.东南大学能源与环境学院,江苏省南京市 210096;2.山东省电力咨询院,山东省济南市 250013)Application of Clustering Algorithm in Target-value Analysis for Boiler Operating ParameterQIAN Jin1, WANG Pei-hong1, LI Lin2(1. College of Energy and Environment Southeast University, Nanjing 210096, Jiangsu Province, China;2. Shandong Provincial Electric Power Consult Institute, Jinan 250013, Shandong Province, China)ABSTRACT: Complicated nonlinear relationships exist among many data in the real-time control-process of large power plant. And data-mining technology could find knowledge, analyze parameters and regulate them. This paper ascertained target-value by means of data-mining, which supported energy-loss analysis. The paper introduced relative theory on data mining, studied and applied target-value model of thermal supervised parameters in the way of clustering algorithm. k-means arithmetic was utilized to analyze real-time operating data of thermal units, and mined target values of pressure loss in reheater and exhaust-gas temperature from boiler. The target-value models for main supervised parameters of boiler were received, which was proved to be effective. And the results supply a new idea and effective method for target-value models.KEY WORDS: target-value; clustering algorithm; exhaust temperature; k-means摘要:大型火力发电厂的实时控制过程中,许多数据之间呈现复杂的非线性关系,而数据挖掘技术能从数据中发现知识或规则,及时分析、调整参数。
该文利用数据挖掘方法确定监控参数的基准值,为火电机组耗差分析提供重要依据。
介绍了数据挖掘方法的相关理论,研究并应用聚类算法确定热力设备监控参数的基准值模型。
采用k-means法分析实时运行数据,分别挖掘再热器压损和锅炉排烟温度的基准值,所得锅炉运行主要监控参数的基准值模型经样本图证实效果良好。
为基准值模型的确定提供了一个新的思路和有效方法。
关键词:基准值;聚类算法;排烟温度;k-means0 引言基于热力设备的特性及其效率响应模型,通过基金项目:国家自然科学基金项目(50376011);高等学校博士学科点专项科研基金(20060286033)。
Project Supported by National Natural Science Foundation of China (50376011). 一定的数学手段,可以建立该设备的耗差分析模型(诸偏差因子与其参数偏差乘积之和),分析诸监控参数发生偏差时引起的运行能耗偏差[1-3]。
根据锅炉效率计算模型求出各项监控参数的偏差因子,再乘以该参数的实际运行值与基准值的偏差值,即可进行耗差分析。
基准值的定义是,在某一负荷、煤种和环境参数下,锅炉效率最高时所对应的锅炉工况为最佳工况,在最佳工况下,锅炉效率及相关运行监控参数称为参数基准值。
本文探讨基准值建模的新方法。
以锅炉耗差分析为例,需要确定排烟温度、排烟氧量和飞灰含碳量等监控参数的基准值,它们随着锅炉机组负荷等外部条件的改变而变化。
通常确定参数基准值[4]的方法有以下几种:①以设计数据为基础,建立基准值模型;②运用锅炉设备的变工况等特性知识,建立基准值模型;③通过锅炉热力性能试验确定基准值模型。
上述方法各具特色:方法①简单,但由于设计数据的代表性不高,准确性较差;方法②计算量较大,变化趋势合理,但计算精度仍不高;方法③具有较高的准确性,但热力试验耗时、费力,同时计算周期长仍会影响其精度。
本文采用数据挖掘的方法,从大量历史数据中发现机组运行的特点,找出其运行最佳工况,并确定其基准值模型。
对数据进行关联分析、时序模式、聚类、分类、偏差检验、预测等分析是数据挖掘的典型方法。
这些方法都得到了广泛的应用[5-13],其中关联规则曾在火电厂被用于确定应达值[14]、考核人员运行水平和寻找最优操作模式。
但也存在对建模人员的专业知识要求高等缺点。
本文用聚类算法中的k-means 算法在海量数据中寻找锅炉高效数据集(簇),利用72 中 国 电 机 工 程 学 报 第27卷各聚类中心点(簇的重心点)与负荷的对应关系建立基准值模型。
1 聚类算法介绍将物理或抽象对象的集合分组为由类似的对象组成的多个类的过程被称为聚类。
数据聚类正在蓬勃发展,由于数据库中收集了大量的数据,聚类分析[15]已成为数据挖掘研究领域中的一个非常活跃的研究课题。
(1)主要的聚类算法。
目前,在文献中存在大量的聚类算法。
算法的选择取决于数据的类型、聚类的目的和应用。
大体上,主要的聚类方法可以划分为如下几类:①划分方法,绝大多数应用中采用了k -means 算法,k -中心点算法和模糊聚类算法[16];②层次的方法,可以分为凝聚的和分裂的方法;③基于密度的方法,代表性的算法有DBSCAN 和OPTICS 方法;④基于网格的方法,STING 法是一个典型的例子;⑤基于模型的方法,通过为每个簇假定模型,寻找数据对其的最佳拟合。
其中以k -means ,k -中心点方法[17]及其变种[18]最著名。
(2)k -means 算法。
k -means 算法以k 为参数,把n 个对象分为k 个簇,以使簇内具有较高的相似度,而簇间的相似度较低。
相似度的计算根据一个簇中对象的平均值(重心)来进行。
k -means 算法的处理流程如下:首先随机选择k 个对象,每个对象代表了一个簇的初始平均值或中心。
对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇。
然后重新计算每个簇的样本的平均值,作为新的簇的中心。
这个过程不断重复,直至k 个簇的中心不再发生变化或者准则函数收敛。
通常采用平方误差准则,其定义如下:21k i i p CiE p m =∈=−∑∑(1)式中:E 是数据库中所有对象的平方误差的总和;p是空间中的点,表示给定的数据对象;m i 是簇C i 的平均值(p 和m i 都是多维的)。
该准则可以使生成的结果簇尽可能的独立和紧凑。
k -means 算法过程:划分的k -means 算法基于簇中对象的平均值。
算法输入为簇的数目k 和包含n 个对象的数据库,输出为k 个簇,使平方误差准则最小。
任意选择k 个对象作为初始的聚类中心,之后根据簇中对象的平均值,将每个对象(重新)赋给最类似的簇;且更新簇的平均值,即计算每个簇中对象的平均值;重复这个过程直至平均值不再发生变化。
这个算法尝试找出使平方误差函数值最小的k 个划分。
当结果簇是密集的,而簇与簇之间的区别明显时,它的效果较好。
对于处理大数据集,该算法是相对可伸缩的和高效率的,因为它的复杂度是O(nkt),其中,n 是所有对象的数目,k 是簇的数目,t 是迭代的次数。
通常k <<n ,且t <<n 。
k -means 方法只有在簇的平均值被定义的情况下才能使用,不适用于具有分类属性的数据[19]。
2 应用实例2.1 再热器压损基准值的挖掘本文根据离线数据分析结果,确定了对象目标值有差异的类间距离阈值,保证在线应用的快速性和准确性。
在进行数据挖掘前对原始数据进行了数字滤波和机理关联检查。
此外,为简化模型,文中仅考虑影响所挖掘参数的主要因素——机组负荷。
河南某电厂共4台125MW 的机组,其再热器压损的设计值为10%,但运行数据表明实际再热器压损远小于10%。
因此,进行耗差分析需要使用实际运行中的基准值。
下面采用聚类算法对再热器压损进行分析,挖掘再热器压损的基准值。
对1#机组的再热器压损与机组功率数据进行聚类分析,结果如表1。
从表1看出,cluster-3支持度太小,属于噪声数据,应剔除。
由于机组经常是满负荷运行,故取用cluster-4的d Prh =0.038作为再热器压损的基准值。
表1 1#机组再热器压损聚类结果表Tab. 1 Clustering results for unit 1 reheater pressure loss再热器压损/MPa 功率/MW 类标号 记录个数平均值标准差平均值标准差cluster-11770 0.037 0.002 112.692 5.01 cluster-29083 0.031 0.002 74.301 2.614 cluster-3 1 0.143 0.0 103.37 0.0 cluster-435313 0.038 0.001 124.903 1.679 cluster-519295 0.033 0.002 82.252 2.7552.2 锅炉排烟温度基准值的挖掘 2.2.1 挖掘方法的确定以河南某电厂1#机组为例,由于其运行时间较长,故用设计数据作为其排烟温度的基准值不准确。