Web数据挖掘在电子商务中的应用
- 格式:docx
- 大小:775.07 KB
- 文档页数:14
Web数据挖掘在电子商务中的应用孙祥1 张宏山2*(河南科技大学经济管理学院河南洛阳471003)【摘要】Web数据挖掘是目前信息技术中的研究热点, 它是数据库技术、统计学、人工智能、知识学习等多个领域和技术相互渗透融合的必然结果。
本文首先介绍了Web数据挖掘的含义和Web 数据挖掘的类型,重点讨论了Web数据挖掘所使用的一些相关技术及其在电子商务中的应用,最后对WEB数据挖掘所存在的问题进行了探讨。
【关键字】Web数据挖掘电子商务应用The applications of Web Dataming in the E- CommenceSunXiang1 ZhangHongshang2(School of Economics And ManagementHenan University of Technology and Science, Henan Luoyang 471003) Abstract:Web Dataming is a hotpoint of the information technology, it is database technology, statistics, artificial intelligence, knowledge and other fields of mutual infiltration of the inevitable outcome of integration.In this paper,athoer introduce what the dataming is and the tape of the dataming at first ,then focused on some of the relevant technology of Web Datamining and its applications in E-Commence, some exist problems were discussed in the end.Keyword:Web Dataming E-Commence Application1.引言随着网络技术和数据库技术的成熟,全球传统商务正向着电子商务全速挺进。
浅谈Web数据挖掘技术在电子商务中的应用随着互联网的快速发展,电子商务已经成为人们日常生活中不可或缺的一部分。
随之而来的是海量的网络数据,这些数据蕴含着大量有用的信息,对于电子商务企业来说,如何利用这些数据挖掘出有用的信息并将其应用到实际业务中成为了一项重要的课题。
Web数据挖掘技术在电子商务中的应用变得越来越重要。
一、Web数据挖掘技术的基本概念Web数据挖掘技术是指利用数据挖掘技术处理网络数据,从中发现有用的信息和规律。
它可以帮助电子商务企业更好地理解消费者的需求和行为,提高产品推荐的准确性,改善营销策略,并提高销售和利润。
Web数据挖掘技术主要包括数据预处理、模式发现、模型评估和应用等环节。
二、Web数据挖掘技术在电子商务中的应用领域1. 用户行为分析通过对用户在网站上的行为数据进行挖掘,可以了解用户的偏好、兴趣、行为习惯等信息,为电子商务企业提供精准的用户画像。
通过分析用户行为数据,企业可以进行个性化推荐、精准营销、精细管理、预测用户行为等,从而提高用户满意度和企业销售转化率。
2. 产品推荐系统基于用户行为分析的结果,可以建立个性化的产品推荐系统。
通过分析用户的浏览历史、购买记录、喜好和评价等数据,可以为用户推荐其可能感兴趣的产品,提高购物体验和销售额。
3. 营销策略优化利用Web数据挖掘技术分析用户行为和购买数据,可以更好地了解用户的需求和购买动机,从而优化营销策略。
通过精准的目标市场定位、个性化的营销活动和定制化的服务,可以提高营销效果,提升客户满意度和忠诚度。
4. 价格预测和调整通过对市场需求和竞争对手价格的分析,可以利用Web数据挖掘技术预测市场价格趋势,从而对产品定价进行调整,提高市场竞争力。
5. 竞争情报分析通过对竞争对手的网站数据进行挖掘分析,可以了解竞争对手的产品定价、促销活动、市场份额等信息,为企业制定竞争策略提供数据支持。
三、Web数据挖掘技术在电子商务中的挑战和发展趋势1. 数据规模的挑战随着互联网的普及,网络上产生的数据规模呈现出爆炸式增长。
Web数据挖掘在电子商务的应用1电子商务中的数据挖掘简介电子商务中的数据挖掘即Web挖掘,是利用数据挖掘技术从www的资源(即 Web 文档)和行为(即Web服务)中自动发现并提取感兴趣的、有用的模式和隐含的信息,它是一项综合技术,涉及到Internet技术学、人工智能等多个领域。
当电子商务在企业中得到应用时,企业信息系统将产生大量数据,并且迫切需要将这些数据转换成有用的信息,为企业创造更多潜在的利润,数据挖掘概念就是从这样的商业角度开发出来的。
2Web数据挖掘的流程Web数据挖掘是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取商业决策的关键性数据,可以使企业把数据转化为有用的信息帮助决策,从而在市场竞争中获得优势地位。
在电子商务环境下,Web数据挖掘主要分为以下儿步:(1)数据收集。
首先数据收集主要针对web数据中的服务器数据、用户数据。
其中服务器数据是Web挖掘中的主要对象。
服务器中承载着用户访问时产生的对应的服务数据,其中包括了:日志文件、cookie文件、数据流。
将这些数据进行初步收集,再针对这些数据进行深度分析挖掘。
(2)数据选择和预处理。
通过数据收集将数据进行分类,根据所需的信息主题对收集的数据进行选择,通过选择相关的数据项缩小数据处理的范用,挑选其中的有效数据进行数据预处理。
数据预处理能够提高挖掘效率,为之后的数据分析提供有效的数据。
Web数据中大多数都是半结构或非结构化的,所以对web数据进行直接处理是不可行的。
数据预处理能够把半结构或非结构化的数据处理成标准的数据集方便后期处理。
(3)模式发现。
模式发现是运用各种方法,发现数据中隐藏的模式和规则。
通过模式发现技术对预处理之后的数据进行处理得到相应的事务数据库,利用模式发现对数据进行初步挖掘,将预处理下的事务数据转换成可被挖掘的存储方式,通过数据挖掘模式算法对其中有效的、新奇的、有用的及最终可以理解的信息和知识进行挖掘与总结。
2016年8期总第815期仓的模式。
2.支付问题及对策中线企业要开展跨境电商业务必须要使用第三方跨境支付。
目前,我国还没有制定一部对于第三方跨境支付的管理规范制度,有关部门对跨境电商的支付监管较为宽松,这将增加中小企业的支付风险,严重阻碍了中小企业跨境电商业务的开展。
另外,由于我国目前的第三方跨境支付平台较多,这使得一些欺骗和违规操作的现象出现,这将对中小企业造成极大的风险损失。
针对第三方跨境支付问题,国家应尽快对第三方跨境支付制定一部管理规范制度,规范跨境电商的支付环境,建立专职机构,使得跨境电商健康发展。
第三方支付平台应该加强安全建设,要求完善客户注册信息,将交易双方的信息充分的让其互交,使得监管部门对信息能够及时的检测和统计,并做出规范。
同时监管部门还应该加大惩治力度,对违反第三方支付规则的企业、第三方支付平台以及客户给予一定的惩罚力度,使得其能够形成自我约束。
3.人才队伍问题及对策中小企业在开展跨境电商业务的过程中,人才队伍的缺乏一直是其一个巨大的问题。
跨境电商作为一个新生的事物,对于中小企业来说还没有经验如何出很好地开展业务。
另外,中小企业对开展跨境电商业务中法规方面了解甚少,使得中小企业蒙受不必要的法律纠纷已经损失赔偿。
不少企业在开展跨境电商的过程中,因为对知识产权的了解甚少,导致出售的商品侵犯了他人知识产权,赔偿金额巨大,使得一部分中小企业面临了破产的边缘。
对于人才队伍落后,中小企业应该搭建一批跨境电商人才团队,团队的成员要懂得跨境电商的一系列操作,并且熟知法律法规。
中小企业人才队伍建立后,将对其开展跨境电商业务起到很好的作用。
人才队伍建成后,企业还应该对人才队伍的成员进行定期的培训,让他们及时了解行业动态以及客户新的追求点,将产品更好的通过跨境电商平台出售出去。
在企业发展到一定的程度后人才队伍还可以建立自己的跨境电商平台服务自身,降低成本与风险。
四、结语当前,跨境电商正处于蓬勃发展的时期。
Web数据挖掘在电子商务中的应用电子商务网站每天都会产生大量的数据,运用数据挖掘技术可以从这些数据中发现对市场分析及预测非常有益的信息。
本文讨论了Web数据挖掘技术在电子商务中的应用。
标签:数据挖掘Web数据挖掘电子商务网络技术和数据库技术飞速发展,电子商务显示出越来越强大的生命力,同时各种基于互联网的商业Web站点也面临越来越激烈的竞争。
如何了解到顾客尽可能多的爱好和价值取向,为顾客提供更优质的服务成为电子商务发展迫切要解决的问题。
而电子商务网站的顾客在Web上的行为都会产生大量数据信息,不仅包括本次交易信息而且还有利用搜索引擎,以及在站点内进行浏览的相关数据。
利用数据挖掘技术可以有效地帮助企业分析这些数据,优化Web站点拓扑结构,指导企业调整营销策略,给客户提供动态的个性化的高效率服务。
一、Web数据挖掘Web数据挖掘(Web Data Mining),是数据挖掘技术在Web环境下的应用,是从大量的Web文档集合和在站点内进行浏览的相关数据中发现潜在的、有用的模式或信息。
它是一项综合技术,涉及到Internet技术、人工智能、计算机语言学、信息学、统计学等多个领域。
对应于不同的Web数据,Web挖掘也分成三类:Web内容挖掘、Web结构挖掘和Web使用模式挖掘。
Web使用模式挖掘(Web Usage Mining)是对用户访问Web时在服务器方留下的访问记录进行挖掘,它通过挖掘Web日志文件及客户交易数据来发现有意义的用户访问模式和相关的潜在用户群。
其主要特点是对用户信息数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。
尽管Web挖掘的形式和研究方向层出不穷,但随着电子商务的兴起和迅猛发展,Web挖掘的一个重要应用方向将是电子商务系统。
电子商务是数据挖掘技术最恰当的应用领域,因为电子商务可以很容易满足数据挖掘所必需的因素:丰富的数据源、自动收集的可靠数据,并且可将挖掘的结果转化成商业行为,商业投资可以及时评价。
浅谈web数据挖掘在电子商务领域中的应用摘要:本文通过对数据挖掘技术在电子商务领域的应用现状进行调研,让更多的人了解数据挖掘技术,通过数据挖掘技术给企业带来经济效益,促进社会的发展。
关键词:数据挖掘技术;电子商务;载体中图分类号:tp311.13 文献标识码:a 文章编号:1006-3315(2013)02-173-001web数据挖掘在电子商务中的研究和应用,已经越来越受到人们的重视和关注,它的前景广阔,势头良好。
并且经过各类电子商务网站的实践以及经验的证明,电子商务的优点突出,它不仅价格低廉,而且交易方便,它吸引着无数的消费者。
对于电子商务网站来说,要了解到顾客的购买意向、吸引顾客的活动、了解顾客的购物行为心理。
这些都是当前需要研究的问题。
通过数据的挖掘技术的应用,我们就能够从海量的数据信息当中提取出那些相对来说比较有用的信息,来帮助商家对客户进行进一步的理解,才能够推出更多更为实惠的商业服务。
并且通过数据的挖掘,瞄准一个客户群体,通过一些比较特殊的信息手段来进行一次宣传工作,以此来更大的对广告的预算以及增加收入进行减少,从而让这一切都能够自行完成。
一、数据挖掘流程web数据挖掘就是利用数据挖掘技术,从网络文档和服务中发现和提取信息。
与传统数据和数据仓库相比,web上的信息是非结构化或半结构化的、动态的、并且是容易造成混淆的,所以很难直接以web网页上的数据进行数据挖掘,而必须经过必要的数据处理。
web挖掘有以下几个过程:1.资源发现。
任务是从目标web文档中得到数据,值得注意的是有时信息资源不仅限于在线web文档,还包括电子邮件、电子文档、新闻组,或者网站的日志数据,甚至是通过web形成的交易数据库中的数据。
2.信息选择和预处理。
任务是从取得的web资源中剔除无用信息和将信息进行必要的整理。
例如从web文档中自动去除广告连接、去除多余格式标记、自动识别段落或者字段并将数据组织成规整的逻辑形式甚至是关系表。
Web数据挖掘在电子商务中的应用作者:郭鹏来源:《科技经济市场》2016年第03期摘要:Web页面结构复杂但所含信息极为丰富,将Web数据挖掘技术应用到电子商务平台中,能够挖掘大量的知识,提供决策参考。
本文论述了Web数据挖掘的概念、特点和分类,并阐述了Web数据挖掘在电子商务的应用。
关键词:电子商务;数据挖掘;Web数据挖掘Internet在世界范围内普及的同时,人们在互联网上各个方面的需求也越来越大,基于Web的商业交易成为电子商务迅猛发展的重要因素,海量的Web页面也蕴含了大量反映用户需求的知识,而Web数据挖掘也将大有用武之地。
1 Web数据挖掘1.1 Web数据挖掘概述数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、以前未知并具有潜在可用知识的过程。
Web页面复杂,数据量巨大、无结构、动态的、样式繁多,大多数传统数据挖掘方法已不太适用,因此一种新的技术应运而生——Web 数据挖掘。
1.2 Web数据挖掘特点Web挖掘技术使用方便、信息量大、内容丰富、应用分布范围广,其最大的特点就是适用半结构化的Web文档。
而传统的数据库中数据是完全结构化的数据。
但相比单个数据库的数据挖掘,Web数据挖掘会面临很多具体问题。
主要有:(1)与传统的数据挖掘和数据仓库来比,Web数据量巨大,增长速度快,诸多企业和团体一并把自己大量的可访问的信息放在互联网上,这样很难构造一个数据库来复制、存储或集成Web上的所有数据。
(2)与传统文本文档相比,Web页面相对复杂。
其主要原因在于Web页面呈现半结构化数据,数据不规则或不完整,数据结构隐含,模式变化快,模式信息量大。
(3)Web页面无时无刻不在变化、增长与更新,是动态性极强的信息源。
它没有固定模式,仅用传统关键字检索方式来实现Web页面上那些几乎都是隐藏的、潜在的未知知识的发现是很难实现的。
(4)由于Web数据所包含的客户信息具有多样性特点,所以用户访问的内容和使用目的千奇百怪。
结课论文课程名称:数据仓库与数据挖掘授课教师:***论文题目:Web数据挖掘在电子商务中的应用学生姓名:***学号:********北京交通大学2022年4月Web 数据挖掘在电子商务中的应用摘要:大数据时代已然来临,在各种信息数据都呈现出爆炸式增长的今天,不同规模的电商都在奋力追赶“大数据”发展的速率和步伐。
一个全新的以信息为中心,以洞察力为导向的电商生存环境已经出现,而智慧的分析能力成为在该环境下成功的关键,以大数据为导向的效率提升,客户需求快速响应,风险把控和商业模式优化,都将成为提高商业流转速率的利器,数据挖掘和分析领域技术型、产品型的创业公司将有可能成为全新的创业机会和投资热点。
数据挖掘在电子商务的发展中占有越来越重要的作用,本文重点论述Web 数据挖掘在电子商务的相关应用。
关键字:Web 数据挖掘,电子商务,内容挖掘随着Internet 的快速发展,互联网上的各种信息飞速增长,电子商务已经成为当代经济不可或缺的重要组成部分。
面对电子商务网站产生的海量信息和数据,通过Web 数据挖掘技术可以从这个庞大的信息数据集合中提取有用的信息,找到提供数据管理和使用的平台;可以合理的组织网站建设,更加人性化的给用户提供服务;可以从无限量的网络信息中迅速找到用户最为需求的信息,从而更好的有针对性的销售自己的产品。
电子商务中的Web 数据挖掘,主要是从其中挖掘出有效的、新颖的、有价值的,潜在的有用的市场信息,从而进行正确的商业决策。
1 概述1.1Web 数据挖掘技术Web 数据挖掘技术是随着电子商务的发展应运而生的技术,是指从海量的Web 信息仓库中进行浏览的相关数据中发现潜在有用的、隐含的模式或关联信息。
Web 数据挖掘技术在电子商务中有广泛的应用,能对客户的访问方式、订单详情等进行挖掘,获取其购买行为特点,跟踪发现用户的访问习惯,以此来改进网页设计机构,实现智能化、个性化的用户界面。
11.2Web 数据挖掘的分类Web 挖掘通常基于Web 数据类型的分类进行划分。
Web 数据类型主要包含三种:一类是Web内容数据,例如一般的Web文档;二类是Web结构数据,例如在Web页面类存在的超链接;最后一类是Web日志,其中主要包含了用户的访问信息。
Web挖掘分为Web内容挖掘、Web结构挖掘、Web日志挖掘,如图1-1。
22图1-1 Web数据挖掘分类1.Web内容挖掘Web内容挖掘指从Web文档、内容、数据及其描述中发现有用的知识。
Web文档文件挖掘以及基于概念索引或Agent技术的资源搜索也归于此类。
Web信息资源类型众多,目前www信息资源已经成为网络信息资源的主体,然而除了大量的人们可以直接从网上抓取、建立索引、实现查询服务的资源之外,相当一部分信息是隐藏着的据(如由用户的提问而动态生成的结果,存在于数据库系统中的数据,或是某些私人数据)无法被索引,从而无法提供对它们有效的检索方式,这就迫使我们把这些内容挖掘出来。
若从信息资源的表现形式来看,Web信息内容是由文本、图像、音频、视频、多媒体和其他各种类型的数据组成的,因此,Web内容挖掘也是一种针对多媒体数据的挖掘。
2.Web结构挖掘Web结构挖掘是指从Web的组织结构链接关系中推导知识的过程。
大量的Web超链接信息提供了关于Web页面内容相关性、质量和结果方面的信息,反映了文档之间的超链接结构进行分析,发现网页的结构有用的模式,找出权威页面。
它又可以分为外部结构挖掘、内部结构挖掘和URL 挖掘。
3. Web 使用挖掘Web 使用挖掘,也称为Web 日志挖掘。
它通过分析客户使用浏览器浏览的信息和页面链接信息记录,来发现用户的访问模式,分析它们的规律。
进而可以识别用户的需求和兴趣,改进站点界面结构,增强其服务竞争力,为用户提供实用的1.3Web 数据挖掘的基本过程电子商务中的Web 数据挖掘过程主要有以下几个阶段。
1. 准备数据准备数据在Web 数据挖掘过程中主要分为有目的的收集数据、选择数据和预处理数据等三个阶段。
Web 数据挖掘通过收集Web 服务器端的所有用户的访问行为数据,对其进行选择和处理,去掉无用的数据。
预处理数据,是为了除去Web 目志文件中与所需数据重复的冗余性数据和模糊性数据。
2. 数据预处理由于本地缓存、代理服务器和防火墙的影响,Web 日志中的数据通常不完整以及不一致,直接进行数据挖掘较困难,因此,必须进行数据预处理。
即从Web 数据中剔除无用信息和将信息进行必要的整理。
主要包括以下步骤:➢ 数据净化:删除数据冗余项,确定用户真实访问意图相关的记录。
➢ 用户识别:识别出每一个用户变得很复杂,一般通过相同IP 在一定时间范围进行识别,误差较大。
目前已有一些精确识别一个用户的方法,如利用Cookie 、让用户进行注册等。
➢ 会话识别:将用户在一段时间内的请求页面分解成能获取用户的访问路径、数量等信息。
➢ 路径补充:如果有重要的访问信息被遗漏而没有被日志记录,填充这些遗失的页面增加到会话中。
3. 模式分析模式分析的基础数据是订单数据库和Web 服务器日志。
模式分析器运用数据挖掘技术分析Web 服务器日志数据,可以获得物品相对于页面、相对于用户聚类的权值模式,以及用户聚类的模式。
从对用户购买记录的数据库分析,可以找到物品在被购买时,它们之间存在的关联相似模式。
模式分析器除了分析产生模式外,还需要进行模式的更新,以保证模式的实效性。
2 电子商务与数据挖掘2.1电子商务中Web 数据挖掘技术1. 路径分析技术用路径分析技术进行Web 数据挖掘就是通过对Web 服务器的日志文件中判定最频繁访问的路径,及其它的有关路径的信息。
利用这些信息,可以改进页面及网站的设计结构。
2. 关联规则挖掘技术关联规则挖掘技术主要用于找到用户访问对网站上各种文件之间访问的相互联系与规则。
利用关联模型,可以更好地组织站点内容,实施有效合理的市场策略。
常用的算法是Aprior 算法。
3. 序列模式挖掘技术序列模式挖掘是指发现事务序列之间的模式,即一组数据项的出现在时间顺序上伴随产生另外一组数据项。
在Web 服务器日志中记录的是每个用户在一段时间范围内的访问情况。
因此,与该用户事务相关联的时间戳是在指在数据项处理过程中确定并从属于用户事务的一段时间间隔。
该技术就是要挖掘出交易集之间的有时间序列的模式。
在特定网站服务器日志里,特定用户的访问是以一段时间为单位记载的。
在某一指定的时问段内,分析其产生的数据信息,可以帮助管理者找出其感兴趣的规则,例如有助于帮助商家印证其产品所处的生命周期阶段,常用的技术是周期分析法。
4. 分类分析技术数据分类是将数据项的某些属性的值进行划分的。
数据分类技术很多,常用的有贝叶斯分类和贝叶斯网络、遗传算法、判定树归纳等,近年来较流行的是神经网络分类分析技术。
5. 聚类技术数据聚类技术是一个将物理或者抽象对象的集合分组成由类似的对象组成的多个类或簇的过程。
聚类分析能作为一个独立的工具来获得数据分布的情况,观察每个簇的特点,集中对某些簇做进一步的分析。
常用的聚类算法大体上可以划分为几类:基于模型方法、基于网格方法、基于密度方法、基于层次方法、基于划分方法等。
32.2Web 数据挖掘技术在电子商务中的应用1. 制定优质个性化服务为顾客提供优质的个性化服务,一方面能使顾客避免“信息选择迷失”的困境,另一方面还能拉近企业和客户的距离,使其关系变得友好。
通过对客户有目的访问信息的挖掘,就能知道客户的购买行为特征,从而识别客户的兴趣、需求、满意度、忠实度,动态地调整Web 页面,以满足客户的需要。
在客户交易集之间有一个时间序列集,可运用数据挖掘中的序列模式发现技术来对其进行挖掘。
2. 优化站点设计在超市里把有联系的物品摆放在一起有助于销售,Web 站点结构安排类似于超市,页面的内容安排和链接可以按大多数访问者的浏览模式进行设计;对密切联系的网页之间增加链接,方便用户使用;把重要的商品信息放在最频繁的访问页面中,增强对顾客的吸引力,提高销售量。
3. 聚类客户通过分类把具有相似浏览行为的客户聚成一类,并分析同类客户的相同特征,可以帮助企业更多的了解客户,向客户提供更适合更全面更满意的服务。
如有一些客户经常浏览“玩具”,“奶粉”,经过分析将这些客户聚类为一组,他们可能是刚生有小孩的客户。
Web 应及时调整页面及页面内容,针对不同的分类客户进行不同的广告宣传和产品介绍等,这样,商务活动能够在一定程度上分辨出客户的行为模式,采取与之对应的营销方案,使电子商务活动更具现实意义。
4. 广告效益评价利用Web 数据挖掘对大量消费行为进行综合分析,可精确地评价各种广告手段的效益增长率,并设计出最佳的商品广告宣传组合方案,根据关心某产品的访问者的访问模式来决定广告的位置,增加广告针对性,提高广告的收益。
5. 网络安全电子商务活动中网络欺诈现象屡见不鲜,通过对电子银行,网上商店交易的用户日志进行分析,可有效防范非法密码获取,黑客攻击,恶意诈骗。
2.3电子商务中Web 数据挖掘特点从前述的基于电子商务Web 数据挖掘的数据源可以看出,面向电子商务Web 数据挖掘相比于传统的Web 挖掘具有自身的特点,主要表现在三大方面。
41.更方便的数据准备。
电子商务本身具有系统性,它在应用过程中所收集到的数据通常就储存在电子商务系统的数据库中。
用户能非常方便的收集到这些原数据,从而简化了数据挖掘准备阶段的工作。
2.挖掘的目的在于自身的改进。
在电子商务领域中,数据挖掘的最终目的是获得消费者的认可,“消费者所想”是电子商务系统改进的方向,提高浏览量,增加顾客忠诚度。
例如,为消费者做出个性化推荐,提供给用户的总是感兴趣的信息。
3.强大的客户关系管理。
大多数的商业站点已经具备了“会员注册”功能,实际上,在传统的企业经营模式中,会员对于企业的生存与发展具有极为重要的意义。
在网络时代,INTERNET 为企业和消费者之间搭建了一个“非常方便”的信息沟通桥梁。
越来越多的企业和消费者都更加重视这种沟通,通过挖掘,对客户进行区分和聚类,更有利于客户关系的管理。
从以上三方面可以看出,面向电子商务的Web 挖掘的数据源虽然相对容易获取,但是由于数据类型的多样性,待设计的数据模型更为复杂,同时由于电子商务处于INTERNET 大环境中,系统必须适应网络环境。
3 Web 数据挖掘关键问题面向电子商务的Web 挖掘与传统的面向单个数据仓库的数据挖掘相比要复杂许多,从前面的分析我们可以了解到,面向电子商务Web 挖掘的数据呈现半结构化的特点,数据的结构没有严格的模式,数据种类多样,包含文本、声音、图像、动画、视频等,在挖掘过程中,这些内容以html 文本的形式存在,无法区分数据确切类型,主要表现为以下两个方面。