当前位置:文档之家› 一种改进的字符串模式匹配算法

一种改进的字符串模式匹配算法

第23卷第1期2010年2月

模式识别与人工智能

PR&AI

V01.23No.1

Feb2010一种改进的字符串模式匹配算法

胡金柱熊春秀舒江波周星程文涛

(华中师范大学计算机科学系武汉430079)

摘要提出一种改进的字符串模式匹配算法.该算法对文本串进行预处理,即对文本串中不存在于模式串中的字符以及文本串中剩下的出现次数最少的字符分别进行标记,再通过匹配模式串的首尾字符来减少出现次数最少的字符的标记个数.发生匹配失败时,将模式串直接滑动到标记了的出现次数最少的字符处.通过实验证明,该算法的移动次数和比较次数有较大减少,耗费的额外空间的大小也不超过模式串的长度,进一步提高模式匹配的效率.

关键词模式匹配,文本串,模式串,预处理

中图法分类号TP391

AnImprovedCharacterStringPatternMatchingAlgorithm

HUJin-Zhu,XIONGChun—Xiu,SHUJiang-Bo,ZHOUXin,CHENGWen-Tao

(DepartmentofComputerScience,HuazhongNormalUniversity,Wuhan430079)

ABSTRACT

Byanalyzingavarietyofimprovedpatternmatchingalgorithms,anpatternmatchingalgorithmis

improved.Firstly,thetextstringispreprocessed.Twokindsofcharactersaremade

up.Onedoesnotexist

inthepatternstring,andtheotheristhecharactersthatappeartheleast.Secondly,throughmatchingboththefirstcharacterandthelastcharacterofthepatternstring,thenumberofthemarkedcharacterswhich

appeartheleastisreduced.Ifthematchingfails,thepatternstringdirectlyslidestothenextmarkedcharacterwhichappearstheleast.Finally,experimentalresultsshowthatthefrequenciesofthemovement

andthecomparisondecreasedgreatlybytheimprovedalgorithm,andtheadditionalcostofspaceislessthanthelengthofthepatternstring.Moreover,theefficiencyofthepatternmatchingisimproved.

KeyWordsPatternMatching,Text

String,PatternString,Preprocessing

l引言

随着网络信息的迅速膨胀,字符串模式匹配的应用越来越广泛.在网络安全入侵检测系统…、计算机病毒特征码匹配、搜索引擎、DNA序列匹配、拼写检查、文本编辑‘2|、信息检索、数据处理、数据压缩‘31和

水国家教育部重点研究基地重大研究项目(No.07JJD740063)、湖北省科技攻关项目(No.2007AAl01e49)资助

收稿日期:2009—04—06

作者简介胡金柱,男,1947年生,教授,主要研究方向为软件工程与分布式信息系统.E-mail:xiongchunxiu@126.com.熊春秀,女,1984年生,硕士研究生,主要研究方向为软件工程与分布式信息系统.舒江波,男,1982年生,博士研究生,主要研究方向为软件工程、中文信息处理.周星,女,1985年生,硕士研究生,主要研究方向为软件工程与分布式信息系统.程文涛,男,1982年生,硕士研究生,主要研究方向为软件工程与分布式信息系统.

万方数据

相关主题
文本预览
相关文档 最新文档