基于动态模糊聚类的输出数据一致表决容错方法

格式：pdf
大小：205.39 KB
文档页数：4

下载文档原格式

模糊C均值聚类算法及实现(最新整理)

模糊C均值聚类算法及实现摘要：模糊聚类是一种重要数据分析和建模的无监督方法。

本文对模糊聚类进行了概述，从理论和实验方面研究了模糊c均值聚类算法，并对该算法的优点及存在的问题进行了分析。

该算法设计简单，应用范围广，但仍存在容易陷入局部极值点等问题，还需要进一步研究。

关键词：模糊c均值算法；模糊聚类；聚类分析Fuzzy c-Means Clustering Algorithm and ImplementationAbstract: Fuzzy clustering is a powerful unsupervised method for the analysis of data and construction of models.This paper presents an overview of fuzzy clustering and do some study of fuzzy c-means clustering algorithm in terms of theory and experiment.This algorithm is simple in design,can be widely used,but there are still some problems in it,and therefore,it is necessary to be studied further.Key words: fuzzy c-Mean algorithm；fuzzy clustering；clustering analysis1 引言20世纪90年代以来，随着信息技术和数据库技术的迅猛发展，人们可以非常方便地获取和存储大量的数据。

但是，面对大规模的数据，传统的数据分析工具只能进行一些表层的处理，比如查询、统计等，而不能获得数据之间的内在关系和隐含的信息。

为了摆脱“数据丰富，知识贫乏”的困境，人们迫切需要一种能够智能地、自动地把数据转换成有用信息和知识的技术和工具，这种对强有力数据分析工具的迫切需求使得数据挖掘技术应运而生。

模糊综合评价法及其应用

模糊综合评价法及其应用陈勇（新华学院）摘要：模糊综合评价法是一种基于模糊数学的综合评标方法。

该综合评价法根据模糊数学的隶属度理论把定性评价转化为定量评价，即用模糊数学对受到多种因素制约的事物或对象做出一个总体的评价。

它具有结果清晰,系统性强的特点,能较好地解决模糊的、难以量化的问题,适合各种非确定性问题的解决。

模糊集合理论(fuzzy sets)的概念于1965 年由美国自动控制专家查德（L．A． Zadeh）教授提出，用以表达事物的不确定性。

关键字：模糊评价法、应用、评价因素、评价值、特点正文：为了便于描述，依据模糊数学的基本概念，对模糊综合评价法中的有关术语定义如下：1．评价因素（F）：系指对招标项目评议的具体内容（例如，价格、各种指标、参数、规范、性能、状况，等等）。

为便于权重分配和评议，可以按评价因素的属性将评价因素分成若干类（例如，商务、技术、价格、伴随服务，等），把每一类都视为单一评价因素，并称之为第一级评价因素（F1）。

第一级评价因素可以设置下属的第二级评价因素（例如，第一级评价因素“商务”可以有下属的第二级评价因素：交货期、付款条件和付款方式，等）。

第二级评价因素可以设置下属的第三级评价因素（F3）。

依此类推。

2．评价因素值（Fv）：系指评价因素的具体值。

例如，某投标人的某技术参数为120，那么，该投标人的该评价因素值为120。

3．评价值（E）：系指评价因素的优劣程度。

评价因素最优的评价值为1（采用百分制时为100分）；欠优的评价因素，依据欠优的程度，其评价值大于或等于零、小于或等于1（采用百分制时为100分），即0≤E≤1（采用百分制时0≤E≤100）。

4．平均评价值（Ep）：系指评标委员会成员对某评价因素评价的平均值。

平均评价值（Ep）=全体评标委员会成员的评价值之和÷评委数 5．权重（W）：系指评价因素的地位和重要程度。

第一级评价因素的权重之和为1；每一个评价因素的下一级评价因素的权重之和为 1 。

基于模糊逻辑的图像处理算法研究

基于模糊逻辑的图像处理算法研究随着图像的广泛应用，图像处理技术成为了越来越重要的领域。

在图像处理过程中，要对一张图像进行分析、处理、抽取特征等多个环节。

为了更准确、高效地处理图像，研究者们不断地探索各种新的算法，其中，基于模糊逻辑的图像处理算法是其中一种值得探究的算法。

模糊逻辑是一种将模糊性或不确定性引入逻辑的思想。

在图像处理中，应用模糊逻辑可以解决一些传统算法难以处理的问题，例如由于光照、阴影等原因引起的图像变形。

下面将介绍一些基于模糊逻辑的图像处理算法。

一、模糊聚类算法模糊聚类算法是指将相似的图像像素聚类到一起的算法。

传统的聚类算法会将像素分为不同的类别，而模糊聚类算法则将像素划分到不同的群体中，且这些群体之间并没有明显的边界。

模糊聚类算法被广泛应用于图像分割和目标识别等领域。

在模糊聚类算法中，模糊度是非常重要的概念。

模糊度可以描述一个像素点归属于某个群体的程度，也可以描述某个群体的特征。

在实际处理中，可以通过调整模糊度来控制聚类的精准度和效率，以达到最优的结果。

二、模糊神经网络算法模糊神经网络算法是指在神经网络中加入模糊逻辑，从而更加适应图像处理中的模糊性问题。

模糊神经网络算法具有自学习和自适应的特点，可以在处理过程中不断调整感知器的权值，以达到更优的分类结果。

模糊神经网络算法广泛应用于图像处理中的分类、检测和识别等方面。

例如，在人脸识别中，通过学习一定数量的样本数据，可以构建出一个高度泛化的模型，并且可以将这个模型应用于不同光照、角度、表情等情况下的人脸识别中。

三、模糊遗传算法模糊遗传算法是指将模糊理论引入到遗传算法中，以优化图像处理中的各种问题。

模糊遗传算法主要应用于图像的分割和特征抽取等问题，例如通过调整阈值，实现图像的二值化。

模糊遗传算法和传统遗传算法的不同之处在于，它能够处理具有模糊性的问题，并且能够自适应地调整变异概率和交叉概率，以达到最优的结果。

在实践中，模糊遗传算法被广泛应用于图像特征的抽取和匹配，例如在车牌识别中，可以通过模糊遗传算法来提取出车牌中的字符串和颜色信息。

模糊聚类方法

模糊聚类方法模糊聚类是一种基于模糊集合理论的聚类算法，它在数据分析和模式识别中得到广泛应用。

与传统的硬聚类方法相比，模糊聚类能够更好地处理数据中的不确定性和模糊性，能够给出每个数据点属于不同聚类的概率，从而更全面地描述数据的特征。

一、模糊聚类的基本原理模糊聚类的基本原理是根据数据点之间的相似性将它们分成不同的聚类。

与传统的硬聚类方法不同，模糊聚类允许数据点属于多个聚类，且给出每个数据点属于不同聚类的权重。

通过引入隶属度函数，模糊聚类能够更好地处理数据的模糊性，给出更丰富的聚类结果。

二、模糊聚类的算法步骤模糊聚类的算法步骤一般包括以下几个方面：1. 初始化隶属度矩阵：隶属度矩阵用于描述每个数据点属于每个聚类的概率，一般通过随机初始化或者根据先验信息进行初始化。

2. 计算聚类中心：根据隶属度矩阵计算每个聚类的中心点，一般采用加权平均的方式计算。

3. 更新隶属度矩阵：根据当前的聚类中心，更新隶属度矩阵，使得每个数据点更准确地属于不同聚类。

4. 判断停止条件：根据一定的准则（如隶属度矩阵的变化程度或者目标函数的收敛性）判断是否达到停止条件，如果未达到，则返回第2步继续迭代。

5. 输出聚类结果：根据最终的隶属度矩阵，确定每个数据点最可能属于的聚类，输出聚类结果。

三、模糊聚类的优势相比传统的硬聚类方法，模糊聚类具有以下优势：1. 能够更好地处理数据的模糊性和不确定性。

在现实世界的数据中，往往存在一些边界模糊或者属于多个类别的情况，传统的硬聚类无法很好地处理这种情况，而模糊聚类能够给出每个数据点属于不同聚类的概率。

2. 能够更全面地描述数据的特征。

传统的硬聚类方法只能将数据点划分为一个聚类，而模糊聚类能够给出每个数据点属于不同聚类的权重，从而更全面地描述数据的特征。

3. 能够适应不同的聚类形状和大小。

传统的硬聚类方法通常假设聚类的形状是凸的，并且假设聚类的大小相等，但在实际应用中，聚类的形状和大小往往是不确定的，而模糊聚类能够更好地适应不同的聚类形状和大小。

基于在线模糊聚类的故障检测和容错控制

Ａｂｓｒｃ：Ａｏｅａｔｄｔｃｉｎａａｔｔｌｒｔｃｔｏｃｅａｅｎｏｌｎｄｎｉｃｔｏｆｔａｔｎｖｌｆｕｌｅｅｔｏｎｄｆｕｌ．ｏｅａｏｎｒｌｓｈｍｅｂｓｄｏｎｉｅｉｅｔｆａｉｎｏｎｉＴ— ｕｚｄｌｉｒｐｏｅＳｆｚｙｍｏｅｓｐｏｓｄ．Ｉｌｓｄ—ｏｐｃｎｒ１ｈＳｆｚｙｍｏｄｌｉｄｎｉｅｈｏｇｅｎｃｏｅｌｏｏｔｏ．ｔｅＴ— ｕｚｅｓｉｅｔｆｄｔｒｕｈｔｉｈｏｆｎｅｅａｅｔｆａｎｎｉｅｒｐａｔｎｅｇｎｒｔｄｄａａｏｏｌｎａｌｎ．Ｗｈｎａｆｕｔｏｃｒ．ｔｅｏｌｎｕｚｙｃｕｓｅｉｇｆｇｒｔｍｉｅａｌｃｕｓｈｎｉｅｆｚｌｔｒｎｏｈｌｉ
心的潜力值需要更新，推公式如下：递
Ｐ（ｆ）＝Ｚ
ｋ２Ｐｚ）Ｐｚ）（。一＋（＋Ｈ（ ∑ ），ｆ）
Ｊ＝１
（）６
（）２
ＴＥ＝０】ｉｌ＋ … ＋ＯｘＨＮｆ＋Ｏｌ【ｉｎ
式中，，示第条模糊规则， ∈ ［，；尺表ｉ１Ｎ］ Ⅳ是模糊规则总数；＝［，Ｘ］是输入向量；表Ｘ， …，Ｍ示前件模糊集，［，］表示第ｆ ∈ １ｎ；个线性子系统的输出；是系统的后件参数．取高斯函数作为０选输入变量的隶属度函数，即

模式识别与机器学习思考题及参考答案

模式识别与机器学习期末考查思考题1:简述模式识别与机器学习研究的共同问题和各自的研究侧重点。

机器学习是研究让机器(计算机)从经验和数据获得知识或提高自身能力的科学。

机器学习和模式识别是分别从计算机科学和工程的角度发展起来的。

然而近年来,由于它们关心的很多共同问题(分类、聚类、特征选择、信息融合等),这两个领域的界限越来越模糊。

机器学习和模式识别的理论和方法可用来解决很多机器感知和信息处理的问题,其中包括图像/视频分析、(文本、语音、印刷、手写)文档分析、信息检索和网络搜索等。

近年来,机器学习和模式识别的研究吸引了越来越多的研究者,理论和方法的进步促进了工程应用中识别性能的明显提高。

机器学习:要使计算机具有知识一般有两种方法;一种是由知识工程师将有关的知识归纳、整理,并且表示为计算机可以接受、处理的方式输入计算机。

另一种是使计算机本身有获得知识的能力,它可以学习人类已有的知识,并且在实践过程中不总结、完善,这种方式称为机器学习。

机器学习的研究,主要在以下三个方面进行:一是研究人类学习的机理、人脑思维的过程;和机器学习的方法;以及建立针对具体任务的学习系统。

机器学习的研究是在信息科学、脑科学、神经心理学、逻辑学、模糊数学等多种学科基础上的。

依赖于这些学科而共同发展。

目前已经取得很大的进展,但还没有能完全解决问题。

模式识别:模式识别是研究如何使机器具有感知能力,主要研究视觉模式和听觉模式的识别。

如识别物体、地形、图像、字体(如签字)等。

在日常生活各方面以及军事上都有广大的用途。

近年来迅速发展起来应用模糊数学模式、人工神经网络模式的方法逐渐取代传统的用统计模式和结构模式的识别方法。

特别神经网络方法在模式识别中取得较大进展。

理解自然语言计算机如能“听懂”人的语言(如汉语、英语等),便可以直接用口语操作计算机,这将给人们带来极大的便利。

计算机理解自然语言的研究有以下三个目标:一是计算机能正确理解人类的自然语言输入的信息,并能正确答复(或响应)输入的信息。

模糊算法的原理与基本思想

模糊算法的原理与基本思想在计算机科学和人工智能领域中，模糊算法是一种能够应对模糊或不确定性问题的智能算法。

模糊算法的基本思想是将模糊的输入进行模糊化处理，得到对应的模糊输出。

本文将介绍模糊算法的原理与基本思想。

一、模糊算法的定义模糊算法是一种基于模糊逻辑的推理算法，它可以处理那些在描述中存在模糊性的问题，例如天气预报、金融预测、控制系统、人工智能、模式识别等等。

模糊算法的核心是将模糊或不确定性问题转化为在各种可能的情况下具有各自相应的概率的问题。

通过模糊化处理，模糊算法可以将任意变量转化为一组模糊的量，然后通过合适的规则进行推理，得到对应的模糊输出。

与传统方法相比，模糊算法能够更好地处理不确定性和复杂性问题，同时也具有更好的适应性、鲁棒性和容错性。

二、模糊算法的原理模糊算法的核心是模糊化处理。

模糊化处理的目的是将输入的不确定量转化为一个或多个模糊量。

采用模糊处理的好处在于，它允许处理那些不适合明确描述的变量。

例如，假设我们希望掌握人们对某个城市天气的感觉。

这个问题很难用精确的数值描述。

我们可以使用模糊处理将这个问题转化为模糊量。

比如我们可以考虑将“温度适宜”与“湿度舒适”这两个条件作为判断标准之一，然后将这两个条件分别用模糊量来描述。

这样，我们就可以得到一个模糊输出，这个输出反映了城市天气的整体感觉。

模糊算法的处理过程可以分为以下几个步骤：1.建立模糊集首先，我们需要将输入量转化为模糊集。

每个模糊集包含了一个或多个值，这些值与有关的定性变量有关。

这些模糊集按照它们的界限被定义。

每个模糊集都有一个函数，用于将变量的值映射到一组隶属度值。

2.定义规则根据模糊集，需要建立一组规则集合。

每个规则需要声明一个前提条件和一个结论。

规则的前提条件是模糊集合，规则的结论也是一个模糊集合。

3.模糊推理到了这一步，我们需要根据建立的规则集合对输入数据进行推理。

根据前提条件的模糊集的隶属度确定每个规则的权重，然后再用这些权重来计算每个模糊集的输出隶属度。

模糊决策的三种方法

模糊决策的三种方法模糊决策是一种基于模糊理论的决策方法，其目标是针对现实生活中的不确定性和模糊性进行决策。

模糊决策的核心思想是将决策问题中的模糊信息和不确定性进行数学建模和分析，以求得合理的决策结果。

常见的模糊决策方法有模糊集合理论、模糊数学和模糊逻辑。

下面将详细介绍这三种方法。

1.模糊集合理论模糊集合理论是模糊决策的基础，它通过引入模糊概念来描述现实世界中的模糊性和不确定性。

在模糊集合理论中，一个元素可以同时属于多个集合，并以一些隶属度来描述其在各个集合中的程度。

这使得模糊集合能够更好地处理复杂的、模糊的决策问题。

在模糊集合理论中，最常用的模糊决策方法是模糊综合评价和模糊层次分析。

模糊综合评价通过将决策问题转化为模糊评价问题，然后利用模糊集合运算来对待选方案进行评价和排序。

模糊层次分析将决策问题转化为多层次的模糊子问题，然后通过对每个子问题进行模糊比较和模糊一致性检测来确定权重和评价方案。

2.模糊数学模糊数学是将模糊理论应用于数学方法和技术的一门学科，它通过引入模糊集合和模糊逻辑等概念，对模糊决策问题进行建模和分析。

在模糊数学中，模糊数是一种介于0和1之间的数值，用来描述元素在一些模糊集合中的隶属度。

对于模糊决策问题，模糊数学提供了一系列有效的方法，如模糊规划、模糊优化和模糊最优化等。

模糊规划通过引入模糊目标和模糊约束，对决策变量进行模糊处理，从而求解满足一定模糊要求的最优方案。

模糊优化通过引入模糊目标函数和模糊约束条件，以及模糊偏导数和模糊梯度等概念，对决策变量进行模糊处理和优化，以求得最优解。

模糊最优化是模糊优化的一种特殊情况，它在模糊目标函数和模糊约束条件下求解最优解。

3.模糊逻辑模糊逻辑是一种能够处理模糊命题和模糊推理的逻辑系统，它通过引入模糊命题和模糊规则，对决策问题进行描述和推理。

在模糊逻辑中，命题的真值不再是0或1，而是一个介于0和1之间的模糊数，用来表示命题的隶属度。

对于模糊决策问题，模糊逻辑提供了一系列有效的方法，如模糊推理、模糊控制和模糊识别等。

动态模糊PLS法实现废水处理出水指标预测

动态模糊PLS法实现废水处理出水指标预测张昊;杨冲;刘鸿斌;黄明智【摘要】针对废水处理过程普遍存在的时变性和非线性特征,提出动态模糊偏最小二乘法(DFPLS)实现废水出水指标预测.分别采用线性偏最小二乘(LPLS)、模糊偏最小二乘(FPLS)和DFPLS方法对比分析.结果表明:DFPLS方法预测均方误差相较于LPLS和FPLS分别下降了88.61％和77.50％;DFPLS在第3潜变量下的输出累计方差贡献率相较于FPLS提升了38.51％,显著提高了废水处理过程预测的准确性,验证了该方法的有效性.【期刊名称】《化工自动化及仪表》【年(卷),期】2019(046)006【总页数】5页(P485-489)【关键词】废水处理过程;动态过程;偏最小二乘;TSK模糊模型;FCM聚类算法【作者】张昊;杨冲;刘鸿斌;黄明智【作者单位】南京林业大学林业资源高效加工利用协同创新中心;南京林业大学林业资源高效加工利用协同创新中心;南京林业大学林业资源高效加工利用协同创新中心;华南理工大学制浆造纸工程国家重点实验室;华南师范大学环境研究院环境理论化学教育部重点实验室【正文语种】中文【中图分类】TP29随着现代工业的不断发展，生产过程开始逐步趋向于连续化和大型化。

在过程监测中所采集的数据样本存在非线性、时变性等特征[1，2]，使得系统难以构建精确模型，从而对传统的静态监测方法提出了较大的挑战[3]。

因此建立以偏最小二乘为基础的动态模糊模型对废水处理过程进行准确描述。

偏最小二乘法(PLS)模型质量与潜变量个数相关，通过选取合适的潜变量个数可有效降低数据维度，用以保留更多质量相关的信息并摒弃冗余信息。

但PLS作为线性回归方法在解决非线性问题时存在较大局限性，针对该问题许多学者相继提出非线性偏最小二乘(NLPLS)[4]、二次型多项式偏最小二乘(QPLS)[5]及样条偏最小二乘(SPLS)[6]等方法，通过在PLS模型中加入非线性结构来建模，但这在很大程度上仍依赖于具体模型结构[7]。

大数据的常用算法（分类、回归分析、聚类、关联规则、神经网络方法、web数据挖掘）

⼤数据的常⽤算法（分类、回归分析、聚类、关联规则、神经⽹络⽅法、web数据挖掘）在⼤数据时代，数据挖掘是最关键的⼯作。

⼤数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的⼤型数据库中发现隐含在其中有价值的、潜在有⽤的信息和知识的过程，也是⼀种决策⽀持过程。

其主要基于，，模式学习，统计学等。

通过对⼤数据⾼度⾃动化地分析，做出归纳性的推理，从中挖掘出潜在的模式，可以帮助企业、商家、⽤户调整市场政策、减少风险、理性⾯对市场，并做出正确的决策。

⽬前，在很多领域尤其是在商业领域如、电信、电商等，数据挖掘可以解决很多问题，包括市场营销策略制定、背景分析、危机等。

⼤数据的挖掘常⽤的⽅法有分类、回归分析、聚类、关联规则、⽅法、Web 数据挖掘等。

这些⽅法从不同的⾓度对数据进⾏挖掘。

数据准备的重要性：没有⾼质量的挖掘结果，数据准备⼯作占⽤的时间往往在60%以上。

(1)分类分类是找出数据库中的⼀组数据对象的共同特点并按照分类模式将其划分为不同的类，其⽬的是通过分类模型，将数据库中的数据项映射到摸个给定的类别中。

可以应⽤到涉及到应⽤分类、趋势预测中，如淘宝商铺将⽤户在⼀段时间内的购买情况划分成不同的类，根据情况向⽤户推荐关联类的商品，从⽽增加商铺的销售量。

分类的⽅法：决策树——是最流⾏的分类⽅法特点：a、它的每次划分都是基于最显著的特征的；b、所分析的数据样本被称作树根，算法从所有特征中选出⼀个最重要的，⽤这个特征把样本分割成若⼲⼦集；c、重复这个过程，直到所有的分⽀下⾯的实例都是“纯”的，即⼦集中各个实例都属于同⼀个类别，这样的分⽀即可确定为⼀个叶⼦节点。

在所有⼦集变成“纯”的之后，树就停⽌⽣长了。

决策树的剪枝：a、如果决策树建的过深，容易导致过度拟合问题（即所有的分类结果数量基本⼀样，没有代表性）；b、剪枝通常采⽤⾃上⽽下的⽅式。

每次找出训练数据中对预测精度贡献最⼩的那个分⽀，剪掉它；c、简⾔之，先让决策树疯狂⽣长，然后再慢慢往回收缩。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

ａｔ
ｄａｔａｆｒｏｍｆａｕｌｔ－ｔｏｌｅｒａｎｔｃｏｍｐｕｔｅｒ，ｔｈｅ
ｅｖｅｒｙ
ｍｅｔｈｏｄｐｒｏｄｕｃｅｓｕｎｉｔａｒｙｄａｔａｔａ．Ａｃｃｏｒｄｉｎｇ
ｔｏ
ｆｉｒｓｔ，ａｎｄｔｈｅｎｃａｌｃｕｌａｔｅｓｔｈｅｄｅｇｒｅｅｏｆｍｅｍｂｅｒｓｈｉｐｂｅｔｗｅｅｎ
ｓｅｔ
ｔｗｏｄａ—
５７２
仪器仪表学报
第２８卷
设在论域Ｕ上给定了一个映射：
肌：¨［ｏ，１］
“怖＝脚（“）
计，将“模糊（Ｆｕｚｚｙ）”记为“Ｆ”，“模糊集”写为“Ｆ集”。当朋（“）只能取０、１两值时，则任意的元素“或者不是Ａ的成员，或者是，非此即彼，此时的模糊集Ａ就是普通子集，因此，普通子集是模糊子集的特例，模糊子集是普通子集的扩展。在普通集合中只有当隶属度ｍ（ｚ）＝１时，才认为ｚ是集合Ａ中的元素，在模糊集中，我们使用了Ａ截集的概念，对于给定的实数Ａ（ｏ≤Ａ≤１），定义：Ａｚ＝｛ｚＩＭ（ｚ）≥Ａ｝为Ａ的截集，当：Ａ≤ｍ（ｚ）≤１时，称ｚ∈Ａｚ，又称为置信水平。
产
Ａ＝＝
生革上
Ｐ‘
Ｐ掣
ｋｏ
ｇ‘
ｅ叫ｅ掣…ｅ掣
ｆ１∥…ｇ掣１
一ｌＰ串１
由于此矩阵中：
垒二吐
口≠７音ｚ
扎
，厂—■——了——————一
７ｔ
…
Ｐ掣ｌ
（９）
ｂ
ｙｅ口一．Ｖ／再与善（ｚ７ｔ一７）２７咒一１：ｊ
【ｅ掣∥…１Ｊ
啪２％。Ｐ‘
（５）
为了利用多次运算的结果产生一个正确输出，求取的过程不仅要进行取粗存精，而且要进行数值的比较，这一过程对于人工判断来讲，有时并不困难，但是对于计算
１
Ｏ
．。厂■—Ｆ——————一
ｚ２吉薹√ｔ
Ｊｔ＝
ｌ６３．１＝２）７一ｔ／（蚤吉√一艿８３・９
２
Ｖ
Ｊ：一１
１１１
１
１ｉ
分别为变量的平均值和标准差。求得而＝一１．９７，ｚ２一Ｏ．３１，－２：３一ｏ．８２，Ｘ４＝ｏ．３８，ｚ５一ｏ．４６。利用下面的公式使用ａ值轮换方法求各值之间的模糊隶属度：
是判断ｚ７。一ｚ７：一・＝ｚ７。是否成立，对于布尔变量和整
型数据，我们可以根据相等关系采用多数一致的表决方式来判断结果是否一致，但对于浮点型数据来说，由于计算机中采用二进制运算，数据的精度有限，而且各版本运
＊基金项目：ＩⅡｔ）ｑ省教育厅自然科学基金重点项目（２００６Ａ０８８），四川省重点科技项目（０５ＪＹ０２９－－１３６）
算所使用的算法也可能互有差异，不可能使用这一等式
１引
言
进行判断［引。即使几个版本算法完全一致，使用相等关系判断也有可能不能正确判断数据是否一致，甚至可能得不到一个正确输出结果，而计算机程序设计语言中，也没有ｚ７，≈ｚ７２≈…≈ｚ７。这样的等式是否成立的判断，因此需要针对浮点数据设计相对应的数据一致性比较算法，以得出正确的输出结果。本文提出使用动态模糊聚类方法来得到表决器的正确输出。在普通集合论中，只能表达非此即彼的现象，而不能表达现实中的模糊隶属现象。为了表达现实世界的这种模糊隶属现象的共性，我们将普通集合论里特征函数的取值范围由布尔值范围｛０，１）推广到闭区间［ｏ，１］，于是便可以得到模糊集的定义Ｌ４Ｊ：
因而可取下三角矩阵（也可取上三角矩阵）表示各值之间的隶属度。即：
第８期增刊
１
王平等：基于动态模糊聚类的输出数据一致表决容错方法
５７３
矩阵外的行和列为对应行和列的值，矩阵中的每一
１（１０）
Ｆ掣
Ａ：＝
个元素代表对应行值和列值之间的模糊隶属度，求此矩阵的等价模糊度隶属矩阵，得：
１０．０７４￡（Ａ）一
１
一１．９７
Ｏ．３１Ａ：０．８２Ｏ．３８
间的一致性，获得正确的输出结果。
关键词：动态聚类；一致表决；模糊隶属度
Ｃｏｎｓｅｎｓｕｓｄａｔａｖｏｔｉｎｇｆａｕｌｔ—ｔｏｌｅｒａｎｔｍｅｔｈｏｄｂａｓｅｄ．
ｏｎ
ｄｙｎａｍｉｃｆｕｚｚｙｃｌｕｓｔｅｒｉｎｇ
Ｗａｎｇ
Ｐｉｎｇ
（ＥｌｅｃｔｒｉｃａｎｄＩｎｆｏｒｍａｔｉｏｎＣｏｌｌｅｇｅ，ＸｉｈｕａＵｎｉｖｅｒｓｉｔｙ，Ｃｈｅｎｇｄｕ６１００３９，Ｃｈｉｎａ）
１
０１０
（２）设定最小Ａ值，对于大于此值的模糊隶属度，根．据等价模糊隶属度矩阵中的元素值的大小排列，依次将其设为Ａ，利用动态聚类方法进行聚类。（３）若聚类数据其中一聚类中心集聚数据个数达到１／２以上，则停止聚类，以此聚类中心集聚数据的平均值作为结果输出。（４）若没有一个聚类中心集聚数据个数达到１／２以上。说明这些输出结果不一致，一致性比较不能得出正确的输出结果，输出错误信息，转入故障应对程序。下面对数据聚类过程举例进行说明，设一个五版本程序的输出结果被送入模糊数据一致性比较器，五个输出数据分别为ｚ７１—６．７，，２７７２＝９．８，ｚ７３—１０．５，Ｘ７４—９．９，ｚ７。＝１０．０。根据上述过程，我们首先对这些数据使用标准差方法进行标准化，由于：ｔ，一７
ｅｌｉｍｉｎａｔｅｔｈｅｉｎｃｏｒｒｅｃｔｄａｔａ，ａｎｄ
ｊｕｄｇｅｔｈｅ
ｃｏｎｓｅｎｓｕｓ
ｂｅｔｗｅｅｎｄａｔａ，ｔｈｅｎ
ｇｅｔｃｏｒｒｅｃｔｏｕｔｐｕｔ．
Ｋｅｙｗｏｒｄｓ：ｆｕｚｚｙｃｌｕｓｔｅｒｉｎｇ；ｃｏｎｓｅｎｓｕｓｖｏｔｉｎｇ；ｄｅｇｒｅｅｏｆｍｅｍｂｅｒｓｈｉｐ
Ａｏ．９３７＝
ＯＯＯ
０．９３７≤奠＜１
１１
１
１
１
ｌ
脚（ｚ）：ｅ呼
将这些数据之间的模糊隶属度写成下三角矩阵形式，得：
—１．９７０．３１０．８２０．３８
０．４６
可将【，分为两类：｛ｚ１），｛ｚ２，ｚ３，丑，ｚ５）。当２＝０．９９７时，由于以｛．２７：，ｚ。）为聚类中心集聚的数据已经达到了３／５＞１／２，故动态聚类过程结束，即：经过模糊数据一致性比较器比较后认为｛Ｘ２，函，，２７５）数据比较一致，输出数据应采纳此三个数据所对应的原始数据｛．２７７：，ｚ７。，ｚ７。）进行一定处理后（如取平均值、取中间
Ｏ
Ａｏ．９９８：。
００Ｏ
１
ＯＯ
０．９９８≤ａ＜１
１
Ｏ
１
Ｏ
ｌ
可将【，分为四类：｛ｚ。），｛ｚ：，ｚ。），｛ｚ。），｛码）。当Ａ—Ｏ．９９７时：
１Ｏ
１
０
Ａｏ．９９７２
００Ｏ
１
ＯＯ
０．９９７≤Ａ＜１
１１ｌ
１１
Ｘｆ一三｝（ｉ＝１，２，…，户）
其中：
（１２）
可将【，分为三类：｛ｚ１），｛ｚｚ，飘，ｚ５），｛ｚ３）。当２＝０．９３７时：
将求得的隶属度写为矩阵形式，即：
（８）
出（ｚ，）一Ｐ掣６≠ｏ
对于口值，我们采用轮换方式，即分别对口取ｚ。，ｚ。，
（４）
…，．２７。来进行运算，求取其他各值相对于ｎ的隶属度。
由于在多个的运算结果中，有可能出现运算或程序设计错误导致的较大的误差值，因此，不能直接取这些数据的平均值为输出结果，否则可能由于存在偏差很大的数据而改变正确输出值，导致严重后果，如假设五次运算得到的数据分别为８６４５、１２．３、１２．４、１２．４、１２．３，很明显第一个数据是错误数据，若对四个数取平均值为输出则会导致错误。故而也不能在上述分布公式中取竹个数据的平均值为口，同样也不能取竹个数据的标准差作为ｂ，即：
（３）（２）（１）
机来讲，就需要作出准确的描述：在什么情况下，应该剔除数据，什么情况应保留数据，什么情况数据应进行平均处理，等等，这些情况都需要仔细考虑。虽然对于各次运算输出的聍个数据，我们不能确切地知道哪一些数据是正确的，但是我们可以利用动态聚类方法分析输出值集中于哪个数据，然后决定其输出结果。由于测量数据中，各个变量单位和量级可能是不一样的，有些变量的绝对值大一些，有些变量的绝对值又小一些；因此，直接用原始数据进行计算就会突出了那些绝对值大的变量而压低了那些绝对值小的变量。所以，一般在进行聚类分析之前，需要将原始数据进行标准化处理。为此我们采用下面的标准差标准化方法：设Ｘ７，＝（ｚ７１ｉ，ｚ７２ｉ＇．一，ｚ７妊）（ｉ一１，２，…，扎）是具有ｐ维变量的样品，现对第ｋ个变量进行标准化，就是将数据ｚ７ｈ变成Ｘ蔚，且：
０．０７４０．０７４０．０７４
Ｐ掣Ｐ孕…１
这里主对角线的元素为１，表示元素隶属于本身的隶属度为１３７０．９９８０．９９７
１
０．９９７
（１４）１
３动态模糊聚类的数据一致性比较方法
为了利用聚类方法找出正确的聚类输出结果，我们利用下面的动态聚类方法来对这些隶属度进行分析，求取结果的聚类过程如下：（１）利用隶属度矩阵Ａ使用传递闭包方法求出其等价模糊隶属度矩阵：
ｔｈｅｄｅｇｒｅｅｏｆｍｅｍｂｅｒｓｈｉｐ，ｔｈｅＸ－ｃｕｔ
ｃｏｎｓｅｎｓｕｓ
ｉｓｐｒｏｄｕｃｅｄｗｉｔｈｄｙｎａｍｉｃｆｕｚｚｙｃｌｕｓｔｅｒａｌｇｏｒｉｔｈｍ，
ｃａｎ
ａｎｄｔｈｅｆｉｎａｌｏｕｔｐｕｔｉＳｄｅｃｉｄｅｄｂｙｔｈｅ
ｖｏｔｉｎｇ．Ｔｈｅｍｅｔｈｏｄ
ｆ（Ａ）一Ａ强（１１）
在进行数值比较的过程中，我们设定最小的Ａ值为０．７，也就是认为在０．７以上隶属度的值我们认为这两个值才有可能相近，对于小于０．７的值，我们认为其两个值之间的距离已经太大，不必纳入聚类分析（根据运算的不同类型，以及精度要求的不同，我们可以设定不同的Ａ值）。根据求出的等价模糊隶属度矩阵，我们可取的Ａ值有：１，０．９９８，０．９９７，０．９３７。当Ａ一１时，将【，分为五类：｛ｚ－），｛ｚｚ｝，｛ｚ。），｛丑），｛西）。当２＝０．９９８时：