基于频繁项集的互补替代关系挖掘算法_柴玉梅
- 格式:pdf
- 大小:498.19 KB
- 文档页数:9
基于频繁模式树的关联分类规则挖掘算法
朱玉全;宋余庆;杨鹤标;陈健美
【期刊名称】《江苏大学学报(自然科学版)》
【年(卷),期】2006(027)003
【摘要】构建精确而有效的分类器是数据挖掘和机器学习中的一个重要任务.提出了一种基于频繁模式树的关联分类规则挖掘算法,该算法同时考虑所有属性,并对现有关联分类规则挖掘算法中内存要求高、类别属性处理难、I/O访问次数多等问题提出了相应的解决方案.试验结果表明,该方法可以取得比同样基于关联规则的分类算法CMAR更高的执行效率以及基于规则的决策树分类算法C4.5更好的分类效果.
【总页数】4页(P262-265)
【作者】朱玉全;宋余庆;杨鹤标;陈健美
【作者单位】江苏大学,计算机科学与通信工程学院,江苏,镇江,212013;江苏大学,计算机科学与通信工程学院,江苏,镇江,212013;江苏大学,计算机科学与通信工程学院,江苏,镇江,212013;江苏大学,计算机科学与通信工程学院,江苏,镇江,212013
【正文语种】中文
【中图分类】TP311
【相关文献】
1.基于层次频繁模式树的关联分类规则数据挖掘算法 [J], 杜永生
2.一种基于频繁模式树的正负关联规则挖掘算法 [J], 屈百达;陈莉平
3.基于频繁模式树的负关联规则挖掘算法 [J], 朱玉全;孙蕾;杨鹤标;宋余庆
4.基于垂直频繁模式树带有负载均衡的分布关联规则挖掘算法 [J], 冯勇;尹洁娜;徐红艳
5.基于频繁模式树的一种关联规则挖掘算法及其在铁路隧道安全管理中的应用 [J], 徐维祥;苏晓军
因版权原因,仅展示原文概要,查看原文内容请购买。
基于FSG的最大频繁子图挖掘算法
郭景峰;柴然;张伟
【期刊名称】《计算机应用研究》
【年(卷),期】2010(027)009
【摘要】图挖掘已成为数据挖掘领域研究的热点,然而挖掘全部频繁子图很困难且得到的频繁子图过多,影响结果的理解和应用.可通过挖掘最大频繁子图来解决挖掘结果数量巨大的问题,最大频繁子图挖掘得到的结果数量很少且不丢失信息,节省了空间和以后的分析工作.基于算法FSG提出了最大频繁子图挖掘算法FSG-MaxGraph;结合节点的度、标记及邻接列表来计算规范编码,提出两个定理来减少子图同构判断的次数,并应用改进后的决策树来计算支持度.实验证明,新算法解决了挖掘结果太多理解困难的问题,且提高了挖掘效率.
【总页数】4页(P3303-3306)
【作者】郭景峰;柴然;张伟
【作者单位】燕山大学,信息与工程学院,河北,秦皇岛,066004;燕山大学,信息与工程学院,河北,秦皇岛,066004;燕山大学,信息与工程学院,河北,秦皇岛,066004
【正文语种】中文
【中图分类】TP311
【相关文献】
1.最大频繁子图挖掘算法研究 [J], 李继腾;骆志刚;丁凡;田文颖;赵琦
2.加权最大频繁子图挖掘算法的研究 [J], 王映龙;杨珺;周法国;唐建军
3.改进的最大频繁子图挖掘算法 [J], 柴然;郭彦颖
4.最大频繁子图挖掘算法DMFS [J], 柴然;刘媛媛;郭彦颖
5.一种基于极大完全子图的最大频繁项集并行挖掘算法 [J], 杨仕博;贺彦琨;马志新因版权原因,仅展示原文概要,查看原文内容请购买。
一种高效的最大频繁项集挖掘算法DFMFI-Miner
陈慧萍;王建东;王煜
【期刊名称】《计算机仿真》
【年(卷),期】2006(023)007
【摘要】分析最大频繁项集和完全频繁项集的关系,提出了一个挖掘最大频繁项集的高效算法DFMFIMiner(The Miner Based on Depth-First Searching for Mining Maximal Frequent Itemsets),采用深度优先方法搜索项集空间,采用垂直位图及一定的压缩方法对表示事务数据库并进行约简,并采用多种有效剪枝策略和优化策略,提高了算法的效率.在多个数据集上进行了实验,实验结果表明该算法特别适于挖掘具有长频繁项集的数据集.
【总页数】5页(P79-83)
【作者】陈慧萍;王建东;王煜
【作者单位】南京航空航天大学信息科学与技术学院,江苏,南京,210016;河海大学计算机及信息工程学院,江苏,常州,213022;南京航空航天大学信息科学与技术学院,江苏,南京,210016;河海大学计算机及信息工程学院,江苏,常州,213022
【正文语种】中文
【中图分类】TP311
【相关文献】
1.一种基于M-Bisearch的最大频繁项集挖掘算法研究 [J], 李宝林;周坤;李仕伟
2.一种改进的数据流最大频繁项集挖掘算法 [J], 胡健;吴毛毛
3.基于改进FP-Tree的最大频繁项集高效挖掘算法 [J], 纪怀猛
4.一种基于M-Bisearch的最大频繁项集挖掘算法研究 [J], 李宝林;周坤;李仕伟;
5.一种基于邻接表的最大频繁项集挖掘算法 [J], 殷茗;王文杰;张煊宇;姜继娇因版权原因,仅展示原文概要,查看原文内容请购买。
基于同层节点集划分的模糊概念格并行构造算法孙佳;柴玉梅【摘要】形式概念分析理论在诸多计算机领域得到广泛应用.模糊概念格的构造仍是其在应用过程中的一个主要问题.为提高模糊概念格的构造效率,对串行算法进行并行化改造,提出模糊概念格的并行构造算法.该算法对节点进行层次划分,给出了同层节点的定义,得出同层节点构造任务相互独立的重要性质,并引入映射函数简化搜索空间的遍历,提高搜索模糊概念格的效率,并行构造模糊概念格,达到了提高构造效率的目的.实验表明该算法在面对大规模的构造任务时,具有良好的性能.【期刊名称】《计算机应用与软件》【年(卷),期】2016(033)007【总页数】6页(P261-265,286)【关键词】模糊概念格构造;模糊集;节点分层;并行算法【作者】孙佳;柴玉梅【作者单位】郑州大学信息工程学院河南郑州450001;郑州大学信息工程学院河南郑州450001【正文语种】中文【中图分类】TP311形式概念分析FCA(Formal Concept Analysis)由德国学者Wille提出的一种基于形式背景表示形式概念的模型,即概念格[1]。
这种概念层次结构是数据分析及规则提取的有效工具,已被广泛应用于文本处理,知识表达,知识挖掘,专家系统等领域[2-6]。
但是在许多应用中,大多数信息都是模糊的、复杂的,传统的形式概念分析很难表达这些模糊的、不确定的信息。
为解决这个问题,Burusco等人提出了L-模糊形式背景[7],并将Zadeh的模糊集合理论与形式概念分析相结合,构造模糊形式概念分析FFCA(Fuzzy formal concept analysis),这一新研究领域[7,8]。
在L-模糊形式背景规模较大时,从L-模糊形式背景构造模糊概念格通常会引起组合爆炸,模糊概念格的构造效率是其在应用过程中的一个主要问题。
对基本算法的并行化改造被用来作为提高构造效率的有效途径,多名研究人员通过这种方法取得了并行构造算法的研究成果。
基于FP树的极大频繁项集的挖掘方法石芹芹【摘要】Proposes an algorithm for mining maximum frequent itemsets based on frequent pattern tree. The algorithm is an algorithm in the process of building FP-tree by pruning children-set and storing maximum frequent itemsets, thereby saves time mining again FP-tree than exist-ing algorithms during mining Maximum frequent itemsets. It is a new algorithm to search association rules.%提出一种基于FP树的极大频繁项集的挖掘算法,该算法在构建FP树的过程中,通过子项集剪枝的方法,将挖掘到的极大频繁项集存储起来,从而节省再次挖掘FP树的时间,较已有的算法在挖掘极大频繁项集时简化挖掘过程。
该算法的提出,为关联规则的精简提供新的解决办法。
【期刊名称】《现代计算机(专业版)》【年(卷),期】2015(000)024【总页数】4页(P7-10)【关键词】极大频繁项集;FP树;关联规则【作者】石芹芹【作者单位】四川大学计算机学院,成都 610065【正文语种】中文数据挖掘是20世纪90年代兴起的一项新技术,是知识发现的关键步骤。
数据挖掘是多门学科和多门技术相结合的产物,是指从数据库中抽取隐含的、潜在的、先前未知的、有用的信息(如知识、规则、约束和规律等)的一个非平凡过程[1]。
其中挖掘关联规则是一个非常重要的研究内容,而挖掘频繁项集是研究关联规则的基本和关键步骤。
频繁项集导致发现大型事务或关系数据集中项之间有趣的关联或相关性,发现的这些相关联系,可以为分类设计、交叉销售和顾客购买习惯分析等许多商务决策过程提供帮助,故受到业界人士的青睐。
关联规则中FP-tree的最大频繁模式非检验挖掘算法
惠亮;钱雪忠
【期刊名称】《计算机应用》
【年(卷),期】2010(030)007
【摘要】基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP .该算法改进了FP-tree的结构,使挖掘过程中不需要生成条件频繁模式树也不需要超集检验.算法采用的预测剪枝策略减少了挖掘的次数,采用的求取公共交集的方式保证了挖掘结果的完整性.实验结果表明在支持度相对较小情况下,NCMFP的效率是同类算法的2~5倍.
【总页数】4页(P1922-1925)
【作者】惠亮;钱雪忠
【作者单位】江南大学,信息工程学院,江苏,无锡,214122;江南大学,信息工程学院,江苏,无锡,214122
【正文语种】中文
【中图分类】TP311.13
【相关文献】
1.基于改进的 FP-tree 最大频繁模式挖掘算法 [J], 宁慧;王素红;崔立刚;郭笑语;徐丽
2.关联规则中改进FP-tree的最大频繁模式挖掘算法 [J], 钱雪忠;惠亮
3.基于FP-tree最大频繁模式超集挖掘算法 [J], 王君;任永功
4.基于有序FP-tree结构和二维表的最大频繁模式挖掘算法 [J], 王利军; 唐立
5.基于有序FP-tree结构和投影数据库的最大频繁模式挖掘算法 [J], 王利军; 唐立因版权原因,仅展示原文概要,查看原文内容请购买。