关键字:apriori 关联规则数据挖掘可视化

1 引言





过程可视化实现起来相当复杂。主要有两种方法- 一种是在采矿过程中可视化地呈现中间结果,并使用户根据中间结果的反馈方便地调整参数和约束。另一种方法是以图标和流程图的形式保持整个数据挖掘过程,根据用户可以观察数据源,数据集成,清理和预处理过程以及采矿结果的存储和可视化等等。




目前,视觉数据挖掘技术的研究在国内外都处于起步阶段,如何使用可视化技术来显示利用各种数据挖掘算法生成后的模型。该方向的主要研究内容是通过一些特殊视觉图形中的关联规则、决策树和聚类等算法向用户显示生成的结果,以帮助用户更好地了解结果数据挖掘模型。典型的业务应用程序是IBM SPSS Modeler,开源工具包括Weka、Orange、GGobi 和KNIME,以及Google Visual Public Platform:Public Data Explorer。视觉数据挖掘工具是一种很好的数据分析工具,在行业应用中,使用可视化数据挖掘工具显示数据挖掘更为明确,结合数据挖掘技术,更有利于分析的数据挖掘结果。



3 基于APRIORI协会规则的可视化采矿的基本理念





表1 数学分数变换规则







4 APRIORI协会规则的视觉采矿实施




图2 数据预处理可视化




B 视觉挖掘过程





C 采矿结果可视化






其中a为阈值,λ为操作者的对应值,Hλ为定量描述模糊值的操作符。设置A的模糊值,定义Hλ,对于HλA = Aλ,并且λ的值的相应语义含义应该是“很可能”,λ= 4; “可能”,λ= 2; “更可能”,Aλ= 0.5; “可能”,λ= 0.25。




例如,符号规则:B2 -->F3转换成:中等职业成就-->方向(就业)

表3 挖掘结果的可视化过程



图4 原始数据的预处理

图5 数据挖掘结果

5 结论



基于自然语言的Apriori关联规则的视觉 挖掘方法 摘要:抽象-可视化数据挖掘技术可以以图形方式向用户展示数据挖掘过程,从而使用户更易于理解挖掘过程及其结果,而且在数据挖掘中也非常重要。然而,现在大多数视觉数据挖掘都是通过可视化的结果而进行的。同时,它不适用于关联规则的可视化处理的图形显示。鉴于上述缺点,本文采用自然语言处理方法,以自然语言视觉地进行Apriori关联规则的整体挖掘过程,包括数据预处理,挖掘过程和挖掘结果的可视化显示为用户提供了一套具有更多感知和更易于理解的特征的集成方案 关键字:apriori 关联规则数据挖掘可视化 1 引言 视觉数据挖掘技术是可视化技术和数据挖掘技术的结合。使用计算机图形、图像处理技术等方法将数据挖掘的源数据,中间结果和最终挖掘结果转换成易于理解的图形或图像,然后进行贯穿的理论,方法和技术交互式处理。根据数据挖掘应用中可视化的不同阶段,数据挖掘的可视化可以分为源数据可视化,挖掘过程可视化和结果可视化。 (1)源数据可视化 源数据可视化方法在数据挖掘之前,以可视化的形式将整个数据集呈现给用户。目的是使用户能够快速找到有趣的地区,从而实现挖掘目标和目标的下一步。 (2)过程可视化 过程可视化实现起来相当复杂。主要有两种方法- 一种是在采矿过程中可视化地呈现中间结果,并使用户根据中间结果的反馈方便地调整参数和约束。另一种方法是以图标和流程图的形式保持整个数据挖掘过程,根据用户可以观察数据源,数据集成,清理和预处理过程以及采矿结果的存储和可视化等等。 (3)结果可视化 数据挖掘结果可视化是指在采矿过程结束时以图形和图像的形式描述挖掘结果或知识,以提高用户对结果的理解,并使用户更好地评估和利用采矿结果。


