基于Web的数据挖掘技术
- 格式:pdf
- 大小:157.99 KB
- 文档页数:3
基于Web服务的数据挖掘系统算法的设计作者:刘佳来源:《电脑知识与技术》2013年第13期摘要:与传统的数据挖掘系统的算法库相比,在数据挖掘系统算法库中引入Web服务可以实现数据、算法和接口的分离,极大的缩减了算法库开发的复杂性并为动态管理算法库提供了便利。
此外,从标准的平台无关性的角度来看,采取Web服务的设计的系统具有了平台无关性和语言无关性的特点。
我们可以通过任何语言来实现将挖掘算法封装到Web服务中,并从程序设计语言中分离出来,这样就为算法设计提供了最大的自由度,提高了维护性能。
因此,基于Web服务技术的数据挖掘系统对于提高数据挖掘的效率具有非常重要的意义。
关键词:Web服务;数据挖掘;算法库中图分类号:TP311.13 文献标识码:A 文章编号:1009-3044(2013)13-2951-04数据挖掘是一个从大量不完整的、冗余的、模糊的并且随机的实际应用的数据中提取潜在的有用的信息和未知知识的一个过程[1]。
随着信息技术在社会中各个领域中的广泛应用,可以用数据挖掘进行提取的最初的数据也转变为较复合的、有组织结构或者半组织结构的内容,比如文本、图标、图片数据,甚至是网络中混杂的分布式数据[2]。
在数据外挖掘系统中,挖掘算法具有非常重要的作用。
一个有效的数据挖掘系统必须有各种各样的挖掘算法。
通常来说,这些挖掘算法不能同时被开发,但是通过算法的发展和对应用的要求,它们也都不断地得到相当大的改进。
通过最新的数据挖掘算法的研究,在数据挖掘系统中不但要有专用的、可共享的和动态维护的算法库,而且还要在现存的算法中增加新的算法来改进系统[3]。
难点在于传统的数据挖掘系统越来越适应于需求以至于很难再提升算法库。
因此,研究如何根据不同的算法动态添加挖掘算法和自动生成输入输出接口,从而实现数据挖掘算法的自动调用是本文的重点。
Web服务的结构本质上是面向服务的架构(SOA),SOA框架被专门用于解决应用整合领域里的两个难题——异质性数据和易变性数据。
基于Web的数据挖掘及其应用摘要:web数据挖掘,就是利用数据挖掘技术自动地从网络文档以及服务中发现和抽取信息的过程。
本文笔者首先对web数据挖掘的涵义、产生原因、特点以及其特殊的要求做了具体的介绍,然后以其在网络教育和电子商务中的应用重点阐述web数据挖掘的应用价值。
关键词:web数据挖掘;信息;网络教育;电子商务中图分类号:tp274 文献标识码:a 文章编号:1007-9599 (2012)19-0000-021 引言数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机数数据中提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。
包括存储和处理数据,选择处理大数据集的算法、解释结果、使结果可视化。
数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。
利用功能强大的数据挖掘技术,可以使企业把数据转化为有用的信息帮助决策,从而在市场竞争中获得优势地位。
随着信息技术的飞速发展,网络信息搜集的需求与收集结果低效性的矛盾迫切需要对网络资源的整序与检索。
所以传统数据挖掘掘技术不断完善和应用。
web挖掘就是时代发展的典型产物。
web数据挖掘采用数据挖掘等信息处理技术,从web信息资源及web使用记录中发掘对特定用户感兴趣的、有用的信息或知识的过程,其结果可以为用户决策所使用。
这里所讲的web信息,从广义上讲,包括web文本,web图片,web动画(如flash广告,视频信息)等。
换言之,基于web数据挖掘,就是利用数据挖掘技术自动地从网络文档以及服务中发现和抽取信息的过程。
有学者认为其是在大量已知数据样本的基础上得到数据对象间的内在特性,并以此为依据在web中进行有目的的信息提取过程。
同时,也有学者将网络环境下的数据挖掘归入网络信息检索与网络信息内容的开发等等。
总之,基于web的数据挖掘(web mining)正是从万维网(world wide web)上获取原始数据而从中挖掘出隐含其中且潜在可用的知识最终应用于商业运作以满足管理者的需要。