Web数据挖掘综述.
- 格式:doc
- 大小:138.00 KB
- 文档页数:8
分析Technology AnalysisI G I T C W 技术136DIGITCW2021.021 决策树分类算法1.1 C 4.5分类算法的简介及分析C4.5分类算法在我国是应用相对较早的分类算法之一,并且应用非常广泛,所以为了确保其能够满足在对规模相对较大的数据集进行处理的过程中有更好的实用性能,对C4.5分类算法也进行了相应的改进。
C4.5分类算法是假如设一个训练集为T ,在对这个训练集建造相应的决策树的过程中,则可以根据In-formation Gain 值选择合理的分裂节点,并且根据分裂节点的具体属性和标准,可以将训练集分为多个子级,然后分别用不同的字母代替,每一个字母中所含有的元组的类别一致。
而分裂节点就成为了整个决策树的叶子节点,因而将会停止再进行分裂过程,对于不满足训练集中要求条件的其他子集来说,仍然需要按照以上方法继续进行分裂,直到子集所有的元组都属于一个类别,停止分裂流程。
决策树分类算法与统计方法和神经网络分类算法相比较具备以下优点:首先,通过决策树分类算法进行分类,出现的分类规则相对较容易理解,并且在决策树中由于每一个分支都对应不同的分类规则,所以在最终进行分类的过程中,能够说出一个更加便于了解的规则集。
其次,在使用决策树分类算法对数据挖掘中的数据进行相应的分类过程中,与其他分类方法相比,速率更快,效率更高。
最后,决策树分类算法还具有较高的准确度,从而确保在分类的过程中能够提高工作效率和工作质量。
决策树分类算法与其他分类算法相比,虽然具备很多优点,但是也存在一定的缺点,其缺点主要体现在以下几个方面:首先,在进行决策树的构造过程中,由于需要对数据集进行多次的排序和扫描,因此导致在实际工作过程中工作量相对较大,从而可能会使分类算法出现较低能效的问题。
其次,在使用C4.5进行数据集分类的过程中,由于只是用于驻留于内存的数据集进行使用,所以当出现规模相对较大或者不在内存的程序及数据即时无法进行运行和使用,因此,C4.5决策树分类算法具备一定的局限性。
数据挖掘隐私保护综述作者:李詹宇朱建明来源:《信息安全与技术》2012年第09期【摘要】随着社会信息化和电子商务与电子政务的不断发展,数据成为社会的重要资源,数据挖掘技术的应用逐渐深入。
与此同时,隐私保护方面的问题已经成为数据挖掘研究的热点问题之一。
本文介绍了数据挖掘隐私保护的发展现状,阐述了相关的概念、特征、分类和研究成果,并从数据扰动和多方安全计算两个方面介绍了数据挖掘隐私保护的相关技术,提出了未来的研究方向。
【关键词】隐私保护;数据挖掘;数据扰动;多方安全计算A Survey of Privacy Preserving Data MiningLi Zhan-yu Zhu Jian-ming(School of Information, Central University of Finance and Economics Beijing 100081)【 Abstract 】 With the development of E-commerce and E-government, and deepening use of the data mining technology, the problem of privacy preservation becomes one of the key factors in data mining. In this dissertation, we briefly introduce the history and current situation of Privacy Preserving Data Mining (PPDM). Some basic concepts, characters, classifications and research results related to PPDM are presented. In addition, we exhibit PPDM technology in data perturbation and secure multi-party computation respectively, pointing out the research area in the future.【 Keywords 】 privacy preservation; data mining; data perturbation; secure multi-party computation1 引言数据挖掘隐私保护(Privacy Preserving Data Mining,简称PPDM)是关于隐私和安全研究的热点问题之一。
浅谈模式识别、数据挖掘、机器学习、人工智能以及它们与数据融合的联系与区别 目录 一.模式识别: ...............................................................................
1.1定义与简介: .......................................................................... 1.2发展史: ................................................................................ 1.3研究方向: ............................................................................ 1.4主要方法: ............................................................................ 1.5具体应用: ............................................................................ 1.6未来发展: ............................................................................ 二.数据挖掘: ............................................................................... 2.1定义与简介: .......................................................................... 2.2发展史: ................................................................................ 2.3研究方向: ............................................................................. 2.4主要方法: ............................................................................. 2.5十大经典算法: ........................................................................ 2.6具体应用: ............................................................................. 2.7未来发展: ............................................................................. 三.机器学习: ............................................................................... 3.1定义与简介: .......................................................................... 3.2发展史: ................................................................................ 3.3研究方向: ............................................................................. 3.4主要方法: ............................................................................. 3.5具体应用: ............................................................................. 3.6未来发展: ............................................................................. 四.人工智能: ............................................................................... 4.1定义及简介: .......................................................................... 4.2发展史: ................................................................................ 4.3研究方向: ............................................................................. 4.4主要方法: ............................................................................. 4.5具体应用: ............................................................................. 4.6未来发展: ............................................................................. 五,与多源数据融合的联系及区别 ............................................................. 参考文献 .................................................................................... 一.模式识别:
数据挖掘在⼤数据中的应⽤综述数据挖掘在⼤数据中的应⽤综述***(上海海事⼤学上海 201306)摘要: ⾯对⼤规模多源异构的数据,数据挖掘的⽅法不断的得到改善与发展,同时对于数据挖掘体系的完善也提出了新的挑战。
针对当前数据挖掘在⼤数据⽅⾯的应⽤,本⽂从数据挖掘的各个阶段进⾏了⽅法论的总结及应⽤,主要包括数据准备的⽅法、数据探索的⽅法、关联规则⽅法、数据回归⽅法、数据分类⽅法、数据聚类⽅法、数据预测⽅法和数据诊断⽅法。
最后还指出类数据挖掘在鲁棒性表达⽅⾯的进⼀步研究。
关键词: 数据挖掘;⽅法论;⼤数据;鲁棒性Application of Data Mining in Large Data***(Shanghai Maritime University,Shanghai 201306)Abstract: In the face of large-scale multi-source heterogeneous data, data mining methods continue to improve and develop, at the same time for the improvement of data mining system also put forward new challenges. In this paper, the method of data mining, the method of data exploration, the association rule method, the data regression method, the data classification method, the data classification method, the data classification method, the data classification method, the data classification method, the data classification method, the data classification method, the data classification method, Data clustering method, data prediction method and data diagnosis method. Finally, it also points out the further research on the robustness of class data mining.Key words: Data mining; methodology; large data; robustness随着⼈类⽣活⽅式的多样化,由此产⽣的数据的规模和复杂性也在急速增长,对于数据的各种分析也应运⽽⽣。
文本数据挖掘综述陈光磊(专业:模式识别与智能系统)摘要:作为从浩瀚的信息资源中发现潜在的、有价值知识的一种有效技术,文本挖掘已悄然兴起,倍受关注。
目前,文本挖掘的研究正处于发展阶段,尚无统一的结论,需要国内外学者在理论上开展更多的讨论。
本文首先引出文本挖掘出现的缘由,再对文本挖掘的的概念、组成及其具体实现过程。
着重分析了文本挖掘的预处理、工作流程与关键技术。
关键词: web挖掘,文本挖掘1引言面对今天浩如烟海的文本信息,如何帮助人们有效地收集和选择所感兴趣的信息,如何帮助用户在日益增多的信息中自动发现新的概念,并自动分析它们之间的关系,使之能够真正做到信息处理的自动化,这已经成为信息技术领域的热点问题。
有数据表明,一个组织80%的信息是以文本的形式存放的,包括WEB页面、技术文档、电子邮件等。
由于整个文本集合不能被方便地阅读和分析,而且由于文本经常改变,要跟上变化的节奏,就要不停地回顾文本的内容,处理数量巨大的文本变得越来越来困难。
人们迫切需要能够从大量文本集合中快速、有效地发现资源和知识的工具。
在这样的需求驱动下,文本挖掘的概念产生了。
2文本挖掘的概述2.1文本挖掘的定义文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。
1998年底,国家重点研究发展规划首批实施项目中明确指出,文本挖掘是“图像、语言、自然语言理解与知识挖掘”中的重要内容。
文本挖掘是数据挖掘的一个研究分支,用于基于文本信息的知识发现。
文本挖掘利用智能算法,如神经网络、基于案例的推理、可能性推理等,并结合文字处理技术,分析大量的非结构化文本源(如文档、电子表格、客户电子邮件、问题查询、网页等),抽取或标记关键字概念、文字间的关系,并按照内容对文档进行分类,获取有用的知识和信息。
文本挖掘是一个多学科混杂的领域,涵盖了多种技术,包括数据挖掘技术、信息抽取、信息检索,机器学习、自然语言处理、计算语言学、统计数据分析、线性几何、概率理论甚至还有图论。
2008年第6期牡丹江教育学院学报N o.6,2008 (总第112期)J ouR N A L oF M uD A N J I A N G co L L E G EoF E D ucA T I oN s e“aI N o.112数据挖掘技术综述高翔侯小静(洛阳理工学院,河南洛阳471003)[摘要]在对数据仓库与数据挖掘的概念及数据挖掘的功用与分类进行介绍的基础上.阐述了串行关联规则算法和并行关联算法的目标与内容.详细分析了A pr i or i算法、神经网络、遗传算法等数据挖掘算法。
[关键词]数据挖掘f关联规则I apr i ori算法;神经网络l遗传算法[中图分类号]T P31[文献标识码]A[文章编号]1009—2323(2008)06一0109一02数据挖掘是信息技术自然进化的结果。
自上世纪六十年代以来,信息技术已经从原始的文件处理发展到复杂的、功能强大的数据库系统。
而数据仓库是近年来数据库研究领域中迅速发展起来的新技术。
利用数据仓库技术可以将现实中的海量数据存放在异构的数据库中。
为了从数据中有效地提取和发现知识.需要对数据仓库中存储的数据进行“挖掘”。
数据挖掘是从大量数据中抽取出未知的、有价值的模式或规律等知识的复杂过程。
数据挖掘技术由数据清理、数据集成、数据选择、数据交换、数据挖掘、模式评估六个步骤组成。
通过这六个步骤的提纯与处理向用户提供有价值的信息。
数据挖掘提供的数据模式有概念描述、关联规则、分类与预测、聚类分析、异类分析、演化分析等六类。
1.数据仓库与数据挖掘数据仓库系统在数据分析和决策方面为用户和“知识工人”提供服务。
这种系统与传统的联机事务处理(0L TP)系统不同.它可以用不同的格式组织和提供数据,以满足不同用户的形形色色需求.这种系统称为联机分析处理(oL A P)系统。
数据仓库和oL A P工具均基于多维数据模型.这种模型可以以星形模式、雪花模式或事实星座模式等形式存在。
信息抽取研究综述一、本文概述随着信息技术的快速发展,信息抽取技术已经成为自然语言处理领域中的一个研究热点。
本文旨在对信息抽取技术进行全面的研究综述,包括其定义、发展历程、主要方法、应用领域以及当前面临的挑战和未来发展趋势。
信息抽取是指从非结构化或半结构化的文本数据中提取出结构化信息的过程,它是自然语言处理的一个重要分支。
通过信息抽取技术,我们可以将大量的文本数据转化为结构化的信息,从而方便人们进行检索、分析和利用。
本文将首先介绍信息抽取的定义和基本任务,然后回顾其发展历程,分析不同阶段的研究特点和主要成果。
接着,我们将详细介绍信息抽取的主要方法,包括规则方法、统计方法、深度学习方法等,并比较它们的优缺点和适用场景。
我们还将探讨信息抽取在各个领域的应用,如智能问答、信息检索、机器翻译等,并分析其在实际应用中的效果。
本文将总结当前信息抽取技术面临的挑战,如数据稀疏性、领域适应性等问题,并展望未来的发展趋势,如多模态信息抽取、知识图谱构建等。
通过本文的综述,读者可以对信息抽取技术有一个全面而深入的了解,为相关研究和应用提供有益的参考。
二、信息抽取技术概述信息抽取(Information Extraction,简称IE)是从自然语言文本中抽取结构化信息的技术,旨在将非结构化的文本数据转化为结构化或半结构化的形式,以便于信息的存储、管理和利用。
作为自然语言处理(NLP)领域的一个重要分支,信息抽取技术近年来得到了广泛的关注和研究。
信息抽取的核心任务包括命名实体识别(Named Entity Recognition,NER)、关系抽取(Relation Extraction,RE)和事件抽取(Event Extraction,EE)等。
命名实体识别是指从文本中识别出具有特定意义的实体,如人名、地名、组织名等;关系抽取则是识别实体间的关系,如“张三是李四的老师”中的师生关系;事件抽取则是从文本中识别出事件及其相关元素,如事件的类型、时间、地点、参与者等。
Web2.0的研究与应用综述Web2.0的研究与应用综述引言:Web2.0是指第二代互联网技术,其与第一代互联网的主要区别在于强调用户参与和互动,成为信息的共享和创造平台。
自2004年Web2.0概念被提出以来,其在互联网领域的研究和应用取得了显著的进展。
本文旨在对Web2.0的研究和应用进行综述,介绍其基本概念、特点及相关领域的应用。
一、Web2.0的基本概念与特点:Web2.0是由著名美国科技专栏作家O'Reilly在2004年提出的概念。
其基本概念包括:用户参与、用户生成内容、社交网络、富媒体应用等。
Web2.0强调用户需要和参与,通过各种技术手段,鼓励用户主动创造内容、共享信息。
与传统的Web1.0相比,Web2.0更加注重互动性和个性化。
Web2.0的主要特点包括:用户参与度高、数据的共享与互通、社交网络的形成、个性化定制服务、富媒体内容的应用等。
这些特点使得Web2.0成为一个充满活力的互动平台。
用户可以通过Web2.0平台进行信息共享,通过社交网络了解和交流,享受个性化定制服务。
二、Web2.0的研究进展:Web2.0的研究主要关注于用户行为模式、社交网络、用户生成内容、个性化推荐等方面。
在用户行为模式方面,研究者通过分析用户在Web2.0平台上的活动,了解用户需求和行为规律,从而为用户提供更好的服务。
社交网络研究主要关注于社交关系的建立、发展和演化,揭示社交网络的特点和规律。
用户生成内容的研究主要关注用户如何创造和共享内容,以及内容的质量评估和推荐算法的研发。
个性化推荐研究主要关注于如何根据用户的个性化需求,为其推荐合适的信息、产品、服务等。
在Web2.0的研究中,数据挖掘、机器学习和社会网络分析等方法得到广泛应用。
研究者通过挖掘大规模用户数据,探索用户需求和行为规律。
机器学习方法被应用于个性化推荐、内容质量评估等任务中。
社会网络分析可以帮助识别社交网络的核心节点、社群结构等。
Web数据挖掘综述摘要:过去几十年里,Web的迅速发展使其成为世界上规模最大的公共数据源,因此如何从Web庞大的数据中提取出有价值的信息成为一大难题。
Web数据挖掘正是为了解决这一难题而提出的一种数据挖掘技术。
本文将从Web数据挖掘的概念、分类、处理流程、常用技术等几方面对Web数据挖掘进行介绍,并分析了Web 数据挖掘的应用及发展趋势。
关键词:Web数据挖掘;分类;处理流程;常用技术;应用;发展趋势Overview of Web Data MiningAbstract:Over the past few decades,the rapid development of Web makes it becoming the world’s largest public data sources.So how to extract valuable information from the massive data of Web has become a major problem.Web data mining is the data mining technology what is in order to solve this problem.This article introduces the Web data mining from its concept, classification,processing,and common techniques,and analyzes the application and the development tendency of Web data mining.Key words:Web Data Mining;Classification;Processing;CommonTechniques;Application; Development Tendency0.引言近些年来,互联网技术的飞速发展,带来了网络信息生产和消费行为的快速拓展。
电脑、手机、平板电脑等终端的普及,SNS、微博等Web2.0应用的快速发展,促进了互联网信息数量的急剧增长,信息资源前所未有的丰富。
但同时,海量级、碎片化的信息增加了人们获取有效信息的时间和成本[1]。
因此,迫切需要找到这样的工具,能够从Web上快速有效地发现资源,发现隐含的规律性内容,提高在Web上检索信息、利用信息的效率,解决数据的应用问题,Web数据挖掘正是一个很好的解决方法。
1.Web数据挖掘概念Web数据挖掘,简称Web挖掘,是由Oren Etzioni在1996年首先提出来的[2]。
Web数据挖掘是数据挖掘在Web上的应用,它利用数据挖掘技术从与Web相关的资源和行为中抽取感兴趣的、有用的模式和隐含信息,涉及数据库技术、信息获取技术、统计学、机器学习和神经网络等多个研究领域的技术[3]。
2.Web数据挖掘分类Web上包括三种类型数据:Web页面数据、Web结构数据和Web日志文件[4]。
依据在挖掘过程中使用的数据类别,Web数据挖掘可以分为Web内容挖掘,Web 结构挖掘,Web 使用挖掘三类。
2.1Web内容挖掘Web内容挖掘是从文档内容或其描述中抽取有用信息的过程。
Web内容挖掘有两种策略:直接挖掘文档的内容和在其他工具搜索的基础上进行改进。
根据挖掘出来的数据可以将Web内容挖掘分为文本挖掘和多媒体挖掘两个部分。
2.2Web结构挖掘Web结构挖掘是从Web组织结构和链接关系中推导知识、挖掘页面的结构和Web结构,可以用来指导页面采集工作,提高采集效率。
Web结构挖掘可以分为Web 文档内部结构挖掘和文档间的超链接结构挖掘。
2.3Web使用挖掘Web使用挖掘是从服务器端记录的用户访问日志或从用户的浏览信息中抽取感兴趣的模式。
通过分析这些数据可以帮助理解用户隐藏在数据中的行为模式,做出预测性分析,从而改进站点的结构或为用户提供个性化服务[5]。
这方面的研究主要有两个方向:一般的访问模式追踪和个性化的使用记录追踪。
图1Web数据挖掘分类示意图3.Web数据挖掘处理流程与传统数据和数据仓库相比,Web上的信息具有高度异构和半结构化特性[6],并且是动态的,所以很难直接以Web网页上的数据进行数据挖掘,而必须经过必要的数据处理,典型的Web数据挖掘的处理流程如下[7]:3.1查找资源任务是从目标Web文档中得到数据,值得注意的是有时信息资源不仅限于在线Web文档,还包括电子邮件、电子文档、新闻组或者网站的日志甚至是通过Web形成的交易数据库中的数据。
3.2信息选择和预处理任务是从取得的Web资源中剔除无用信息和将信息进行必要的整理。
例如从Web文档中自动去除广告链接,去除多余格式标记、自动识别段落或者字段,并将数据组织成规整的逻辑形式甚至关系表。
3.3模式发现对预处理后的数据进行挖掘,自动进行模式发现,从Web站点间发现普遍的模式和规则。
3.4模式分析对发现的模式进行解释和评估,必要时需返回前面处理中的某些步骤以反复提取,最后将发现的知识以能理解的方式提供给用户。
可以是机器自动完成,也可以是与分析人员进行交互来完成。
图2Web数据挖掘处理流程示意图4.常用的Web数据挖掘技术4.1路径分析技术我们通常采用图的方法来分析Web页面之间的路径关系。
G=(V,E,其中V是页面的集合,E是页面之间的超链接集合,页面定义为图中的顶点,而页面间的超链接定义为图中的有向边。
顶点v的入边表示对v的引用,出边表示v引用了其他的页面,这样形成网站的结构图,从图中可以确定最频繁的访问路径。
路径分析技术常用于改进站点的结构[8]。
4.2关联规则挖掘技术关联规则挖掘技术主要用于从用户访问序列数据库的序列项中挖掘出相关的规则,就是要挖掘出用户在一个访问期限(Session,从服务器上访问的页面文件之间的联系,这些页面之间并不存在直接的参引(Reference关系。
使用关联规则可以发展很多相关信息或产品服务。
例如:某信息A和B,同时被很多用户浏览,则说明A和B有可能相关。
同时点击的用户越多,其相关度就可能越高。
系统就可以利用这种思想为用户推荐相关信息或产品服务。
4.3序列模式挖掘技术序列模式挖掘技术就是挖掘出交易集之间的有时间序列关系的模式。
它与关联规则挖掘技术都是从用户访问下的日志中寻找用户普遍访问的规律,注重事务内的关系,而序列模式挖掘技术则注重事务之间的关系。
发现序列模式,便于预测用户的访问模式,有助于开展基于这种模式的有针对性的广告服务。
依赖于发现的关联规则和序列模式,能够在服务器方动态地创立特定的有针对性的页面,以满足访问者的特定需求。
4.4分类、聚类技术分类规则可挖掘出某些共同的特性,而这一特性可对新添加到数据库中的数据项进行分类。
在Web数据挖掘中,分类技术可根据访问用户而得到个人信息,共同的访问模式以及访问某一服务器文件的用户特征。
而聚类技术则是对符合某一访问规律特征的用户进行用户特征挖掘[9]。
发现分类规则可以识别一个特殊群体的共有属性的描述,这种描述可以用于分类新的检索。
聚类可以从Web访问信息数据库中聚集出具有相似特性的用户群。
在Web事务日记中聚类用户信息或数据项能够便于开发和执行未来的市场战略。
5.Web数据挖掘的应用5.1在社交网络上的应用近年来,在线的社交网络成为Web2.0时代最广泛的应用实例。
社交网络允许用户在Web的环境里进行自由的沟通交互。
一些社交网站已经成为网络上最受欢迎的网站。
Web 内容挖掘可以对社交网站的文档进行分类或分级,特别是针对博客、微博或是以文字内容为主的论坛。
Web结构挖掘可以对社交网站的结构进行分析,为网站的改进建设提供有价值的建议。
Web使用挖掘可以用来分析用户的阅读兴趣和习惯,为用户推送最新的阅读内容[3]。
5.2在电子商务上的应用网络的发展使得电子商务成为了人们生活与企业发展中不可分割的一部分。
电子商务平台是一个拥有海量数据信息资源的大型数据库,利用Web使用挖掘可以提高用户满意度,发现潜在的消费者,提供个性化的服务等。
利用Web结构挖掘可以优化网站结构,为用户提供更加有效且快速的访问渠道,帮助商家制定更准确的市场营销策略[10]。
5.3在远程教育上的应用现代远程教育站点是采用多种媒体手段进行远程系统教学的教育形式。
它是随着现代信息技术的发展而产生的一种新型教育形式,是构筑知识经济时代人们终身学习体系的主要手段。
使用Web数据挖掘,站点页面之间的链接得到优化,极大方便学习者学习,知识点之间的关联变得更为密切。
同时,日常教学管理能更好地以学习者为中心[11]。
5.4在搜索引擎上的应用通过Web数据挖掘,对网页上的一些相关内容以及用户的搜索习惯进行挖掘和采集,提高用户的检索效率,同时提高搜索引擎的准确性。
6.Web数据挖掘的发展趋势Web数据挖掘处理的是海量数据,且数据量以指数级增长,同时所涉及的挖掘算法相当复杂。
有的算法需要多次扫描数据库,当数据量增加时会增加扫描的代价;有的算法需要存储各系列的相关信息,当信息量很大时,会带来存储上的问题。
与传统Web数据挖掘相比,基于云计算的Web数据挖掘通过“云”中多个资源完成原来由一个节点承担的挖掘工作,使资源得到了充分利用,提高了数据挖掘的效率,因此,将云计算融入Web数据挖掘中将具有非常重要的现实意义,可以解决Internet上广域分布的海量数据挖掘问题[12]。
通过云计算,Web数据挖掘的代价将大大降低,所以有理由相信云计算挖掘是Web数据挖掘今后的趋势。
7.结束语人类的发展离不开信息的传播和使用,在数据量急剧增长的当今社会,如何快速有效地检索有价值的信息显得更为重要,Web数据挖掘正是由于满足了这方面的需要才能获得如此迅速的发展。
随着网络技术的发展以及网络用户的增加,Web数据挖掘技术将成为重要的研究课题和方向。
参考文献[1]全巧梅.云计算环境下WEB数据挖掘的研究[J].信息技术与信息化,2012,05:96-99+105.[2]Etzioni O.The World-Wide Web:quagmire or gold mine?[J].Communications of the ACM,1996, 39(11:65-68.[3]高华.Web挖掘技术在社交网络分析的应用研究[J].科技信息,2013,09:91-92.[4]薛鸿民.Web数据挖掘技术研究[J].现代电子技术,2006,15:99-101.[5]Pierrakos D,Paliouras G,Papatheodorou C,etal.Web usage mining as a tool for personalization:A survey[J].User modeling and user-adapted interaction,2003,13(4:311-372.[6]由海涌,姜达.浅谈Web数据挖掘技术的应用[J].电子技术与软件工程,2013,06:55-56.[7]曹聪聪,康耀红.Web数据挖掘研究[J].现代电子技术,2007,04:92-94+97.[8]潘正高.Web数据挖掘技术综述[J].电脑知识与技术,2009,15:3852-3853+3858.[9]王少茹.基于Web数据挖掘的探索[J].电子世界,2014,04:11-12.[10]王芳.电子商务平台中的Web数据挖掘应用探讨[J].科技创新与应用,2014,10:44.[11]张舰.基于Web挖掘的远程教育站点设计[J].软件导刊,2014,05:132-134.[12]程苗.基于云计算的Web数据挖掘[J].计算机科学,2011,S1:146-149.。