2010年9月第17卷95期
控制工程
ControlEngineeringofChina
Sep.2
010
V01.17.No.5
文章编号:1671-7848(2010}05-0632-04
模糊粗糙集方法在样本归一化中的应用
庞清乐
(山东工商学院信息与电子工程学院.山东烟台264005)
摘要:提出了基于模糊粗糙集理论的样本归一化方法,用于解决因神经网络分类器在
不同类样本间距离较近时训练速度较慢的问题。将神经网络的输入作为粗糙集信息系统的条
件属性,神经网络的输出作为决策属性,构建决策表。利用粗糙集理论对训练样本离散化,根
据离散化样本与两类不同样本间的距离差和两类样本的能量差,利用模糊集理论对该原始样
本进行伸缩处理,然后,对伸缩预处理后的样本进行归一化,最后,用归一化处理后的样本对
神经网络进行训练。以配电网故障选线为例.对该方法进行了分析和验证。仿真实验结果表
明,经模糊粗糙集理论样本归一化处理后的神经网络训练时间明显缩短。因此,该方法正确、
有效。
关键词:归一化;粗糙集理论;模糊集理论;神经网络;故障选线
中图分类号:TP27文献标识码:A
ApplicationofFuzzyRoughSetTheorytoSampleNormalization
PANGQing.1e
(SchoolofInformationandElectronicEngineering,ShandongInstituteofBusinessandTechnology,Yantai264005,China)
Abstract:AsamplenormalizationalgorithmbasedonfuzzyroughsettheoryisproposedtOavoidthelon殍imetrainingofneuralnetworkclassifiercausedbythesmallerdistancesbetweensamplesofdifferentclasses.Theinputsofneuralnetworkaretakenastheconditionattributesandtheoutputasthedecisionattribute,andtheinformationsystemisestablished.Thesamplesarcdiscretizedbyusingroughsettheory.Accordingtothedistancedifferencesbetweenthediscretizedsamplesandtwoclassofsamplesandtheenergydifferencesbe‘tweenthetwoclassofsamples,theoriginalsamplesareextendedorcontractedbasedonfuzzysettheory.Theextendedorcontractedsamplesayenormalized.Thenormalizedsamplesayeusedtotraintheneuralnetwork.Themethodisanalyzedandverifiedwithanex—ampleoffaultylinedetectionfordistributionnetwork.Thesimulationresultsshowthatthetrainingtimeofneuralnetwork
withprepro—cessedsamplesbyusingfuzzyroughsettheoryisshortermarkedly.Sotheproposedalgorithmiscorrectandeffective.
Keywords:normalization;roughsettheory;fuzzysettheory;neuralnetwork;faultlinedetection
1引言
基于BP算法的前馈神经网络广泛应用于模式分类中¨J。但是,在应用中存在很多问题,其中,一个最重要的问题就是BP算法的训练时间长,而且,当不同类样本间距离较近时训练时间会更长。为了克服这一缺点,许多学者做了大量的工作,并提出了多种改进该算法“¨。粗糙集理论。“是一种处理模糊和不确定问题的新工具,它已成功地应用到很多领域。将粗糙集理论应用于神经网络,主要用于知识发现、数据预处理和基于知识的神经网络建模¨’9j。模糊集理论也是处理不确定性和不精确性问题的工具,将粗糙集和模糊集理论融合一直是人们感兴趣的话题、10’11|。本文提出了基于模糊粗糙集理论的神经网络样本归一化方法,用于缩短神经网络的训练时间,并将该算法成功地应用到基于神经网络的配电网故障选线中‘121。
2基于模糊粗糙集理论的归一化方法原理
1)基于粗糙集理论的样本预处理假设样本归一化信息系统K=(U,A),其中,u是神经网络样本的集合;A=CnD,C是条件属性集,D是决策属性集,神经网络的输入和输出作为条件属性,对样本预处理方法作为决策属性。
定义1对于信息系统K=(U,A),A=CnD,决策属性集定义为:D={d},n=l,2,…,r,规定不同的决策属性值%对应于不同的分类结果。
定义2对于信息系统K=(u,A),A=CnD,条件属性集定义为:C={C,,C:,…,C。},规定P
收稿日期:2009-02-20;收修定稿日期:200%04-08
基金项目:国家自然科学基金资助项目(60673153);山东省自然科学基金资助项目(Z2006F95)
作者简介:庞清乐(1969.),男,山东聊城人,副教授,博士,主要从事计算机先进控制与智能系统等方面的教学与科研工作。万方数据