Web日志挖掘的数据预处理研究

格式：pdf
大小：267.47 KB
文档页数：4

下载文档原格式

Web日志挖掘中数据预处理技术的研究

ＮＴ．５０：Ｉｔｒｅｐｏｅ６．ｎｅｎｔＥｘｌｒｒ０”
的图片、声音和脚本代码一起被下载到了客户端。
当挖掘的目的是用户访问模式时，片和声音文件图显然用处不大。可以把后缀为ＪＥＭＰ，Ｉ，ＰＧ，３ＧＦＷＭＶ等的记录删除。但是，当挖掘的目的是为了进行网络流量分析时，些信息又会显得非常的重要，这
典型的日志记录形式如下：
次客户连接请求完所要的网页后，服务器会自动与客户断开连接，同时被申请的网页文件连同文件上
２２１２９．６一［２：３５８６２０］一０．９．４６１２：５２／／０６
“ＧＴｄｙｌｇｈｌ．ｔｌ／．１” 一１０ — Ｅ／ｒ／ｏ／ｅｐｈｍｌＨｒＴＰ１０１０１一 “ ｔ／ｗｗ．ｅｐｅｕｃ ” 一 “ ｉｄｗｓ１２ｈｔ／ｗｈｌ．ｄ．ｎｐ：Ｗｎｏ
理，包括删除无关紧要的数据，合并某些记录，对用户请求页面时发生错误的记录进行适当的处理等等。只有当服务器日志中的数据能够准确地反映用户访问Ｗｅ点的情况时，过挖掘得到的关ｂ站经
联规则才是真正有用的。由于Ｈｒ议是一个面向非连接的协议，ＴＰ协每
表１ＥＬ日志格式ＣＦ
雷ＨＨＨＨ簦Ｈ
图１Ｗｅｂ日志挖掘的预处理过程
２１数据清理．
数据预处理的第一步是数据清理，，据清 ’数］理是指根据实际需求，ＷＥ日志文件进行处对Ｂ

基于Web日志的数据预处理研究

关键。
③ 用户请求页面的日期和具体时间；
④用户请求的方法、用户所请求的页面以及传输
使用的协议版本：
⑤ 服务器状态码，０２表示请求成功；０ ⑥ 发送给客户端的总字节数： ⑦ 用户代理。
１数据的来源
Ｗｅ用记录的数据除了服务器的日志记录外．ｂ使还包括代理服务器１志、览器端１志、册信息、３浏３注用
０引言
数据预处理是Ｗｅｂ１挖掘的关键技术．其主３志要任务是从Ｗｅ志文件中有效地识别用户访问会ｂ１３话。预处理的输入是原始１志文件，出的是用户会３输
① 访问用户的Ｉ址或用户使用的代理服务器Ｐ地
＼
竺
基于Ｗｅｂ日志的数据预处理研究
金述强．蒋外文
（南大学信息科学与工程学院，沙４０８）中长１０３
摘
要：详细介绍Ｗｅ日志挖掘的数据预处理过程。通过对预处理的结果用户会话文件进行处ｂ
理，造出扩展有向树模型，从每个用户会话文件中发现该用户所有的最大向前ｇ用构并ｌ路径，实施ｗｅ志挖掘算法提供数据基础。为ｂ１３关键词：数据预处理；用户会话；扩展有向树；最大向前引用路径

Web日志挖掘中的数据预处理研究

ｐｅｒａｍｅｔｒｔｔｎ．Ａｎｕｇｓｓａｆｃｉｅｍｅｈｄｆｒｅｌｇｗｉｅａｌｄｐｒ，ｉｅｄｔｓｎ，ａａｃｅｎｎ，ｅｄｉｓｇｅｔｎｅｆｔｔｏａｉｔｄｔｉａｔｌａａｆｉｔｅｖｏｄｎｈｅｓｋｕｏｄｔｌａｉｇｕｅｄｎｉｃｔｎ，ｓｓｉｎｉｅｔｃｔｎ，ｅｃｓｒｉｅｔａｉｉｆｏｅｓｏｄｎｉａｉｉｆｏｔ．Ｔｅｖｌｉｆｔｉｔｏｓｖｒｅｙｔｅｅｐｒｎａａａｈａｉｔｏｓｍｅｈｄｉｅｉｄｂｈｘｅｉｄｙｈｉｆｍｅｔｌｔ．ｄ
ｉｇｎ．Ｔｈｓｐｐｒｃｍｐｅｅｙｃｍｂｈｏｅｐｏｅｓｏａａｐｅｒａｍｅｔｉｅｍｓｏｂｌｇｆｌｎｎａａｉａｅｏｌｔｌｏｓｔｅｗｈｌｒｃｓｆｄｔｒｔｅｔｎｎｔｒｆｗｅｏ－ｅｍｉｉｇＳｄｔｉ
中图分类号：Ｐ９Ｔ３１文献标志码：Ａ文章编号：１７４０７２１）１０８ — ５６３— ８，０２０ — ０１０（
ＤａａｐｒｐｒｃｓｉｏｅｏｆｌｉｎｇｔｅｏｅｓｎｇｆｒＷｂｌｇ－ｉｍｎｉｅ
Ｖｏ．６Ｎｏ１１２．
Ｆｂ２１ｅ．０２
Ｗｅ日志挖掘中的数据预处理研究ｂ
卢健，刁雅静
（江苏科技大学经济管理学院，江苏镇江２２０）］０３；

改进的Web日志挖掘数据预处理方法研究

改进的Web日志挖掘数据预处理方法研究摘要Web日志挖掘中的数据预处理按处理流程，分为数据收集、数据清洗、用户识别、会话识别、路径补充、事务识别6步。

本文对会话的特点对预处理算法进行改进，直接由会话得到事务，不需要经过路径补充，从而简化处理过程，增强后期挖掘的正确性。

关键词Web日志挖掘；预处理；事务Web日志挖掘属于数据挖掘的一种，它是对用户访问Web时在服务器端留下的访问记录（即Web日志）进行分析处理，从中得到用户感兴趣的信息或模式。

并以此作为依据来改善网站结构，更好的满足不同用户的需求。

数据挖掘对数据的格式是要求严格的，而Web日志往往达不到该标准，直接处理会产生错误或无意义的工作，因此在挖掘前必须进行预处理，必须将Web日志转化为传统的数据挖掘方法能够处理的数据。

1 传统的方法Web日志挖掘的对象是Web日志，挖掘的主要目的是进行用户聚类，聚类的依据是页面访问序列，因此只考虑用户请求的页面，在请求方法当中只选取GET方法的。

日志中请求错误的、无用的信息记录在进行挖掘时都应该删除。

对数据整合，规范化，形成事务数据库，为挖掘做准备。

按处理的先后顺序，分6步来完成，它们分别是：数据收集、数据清洗、用户识别、会话识别、路径补充、事务识别。

2 改进的方法通过分析上述方法，同时结合实际情况：用户访问网站中的页面可以从网站根目录进来，也可能从历史纪录直接进入到某个页面，不难发现，能够反映用户真实兴趣的会话序列往往需要将路径补充完整，然后进行分割才能得到，过程较为复杂，而且补充路径的过程也比较费时。

若是简化过程，直接由会话序列得到事务则将大大提高算法的效率。

2.1 设计思想通过分析网站的结构，不难发现它是一棵有向树，为了处理方便可以看成一棵普通的树，而树中的一个结点就相当于一个页面。

当浏览到网站时就相当于从树根出发去遍历树中的结点，当到达分枝的叶子结点时，就认为已经浏览到了边界，这时要再访问别的页面就需要回退，即可认定新的会话开始了；或者当出现页面序列不连续，也可作同样的处理。

Web日志挖掘数据预处理研究

是ｗｅｂ使用分析的一个基本先决条件。
１１ｗｂ日志文件．ｅ
考虑到普遍性和代表性，文那仅以Ｉ本Ｉ务器日志文Ｓ服件［为例，论Ｗ３２］讨Ｃ扩展日志记录ＥＦ（ｘｅｄｄＬｇＦｒＬＥｔｅｏｏ— ｎ
＃Ｆｉｌｓｅｄ：Ｃ— ｉｔｍｅＣ — ｍｅｈｄＣ－ｕｉｓｅｓ－ｓａｕｐＤａｅＴｉＳｔｏＳｒ — ｔｍｃｔｔｓ
用户浏览的前一个网址，
ＵｅｎｍｅＳｒａｍｅｈｄｔｏｕｌｔｍｒ—ｓｅ接过来的ｕｅ—ａｅｔＹｅｓｒ— ｇｎｓｐｏｏｏｒｔｃｌｓａｕｔｔｓｂｔｓｙｅＹｅｓＹｅｓＹｓｅ客户所用的浏览器使用的Ｉｔｒｅ协议，ＨＴｎｅｎｔ如ＴＰ，ＴＦＰ用ＨＴＴＰ或者ＦＰ术语所描述的动作状态Ｔ传输的字节数
微型电脑应用
２００７年第２卷第１期３０
Ｗｅｂ日志挖掘数据预处理研究
夏成文，韩坚华，梁乘铭
摘要：详细介绍ＥＦ日志文件格式的基础上定义了会话表，对预处理过程中几个主要步骤进行深入讨论，结已有在Ｌ并总
表１Ｗ３扩展日志格式部分域Ｃ
域标识符是否需要前缀描
述
ｄｔａｅｔｉｍｅＩｐ
－
ＮＯＮＯＹｅｓＹｅＳＹｅｓＹｅｓ

Web日志挖掘中的数据预处理技术研究

Web日志挖掘中的数据预处理技术研究杨玉梅【摘要】Preprocessing is the key of Web log mining, the result of preprocessing has a great influence on rules and pattern produced by mining algorithm, which is key ensuring the quality of Web mining. This paper presents DUI technology, enhance the preprocessing technology. It is proved by experiments, advanced data preprocessing technology may enhance the result quality of data preprocessing .%预处理是Web日志挖掘的重点，预处理的结果对挖掘算法产生的规则与模式有很大的影响，是保证 Web 日志挖掘质量的关键。

本文提出了DUI技术，增强了预处理技术。

并通过实验证明，先进的数据预处理技术可以提高数据预处理的结果质量。

【期刊名称】《科技视界》【年(卷),期】2014(000)012【总页数】3页(P24-25,20)【关键词】Web日志挖掘;数据预处理;用户识别【作者】杨玉梅【作者单位】川北医学院图书馆，四川南充 637000【正文语种】中文0 介绍Web挖掘是数据挖掘在Web上的应用，它利用数据挖掘技术从与WWW相关的资源和行为中抽取感兴趣的、有用的模式和隐含信息，涉及Web技术、数据挖掘、计算机语言学、信息学等多个领域，是一项综合技术。

Web使用挖掘能提供网站设计的支持，提供个性化服务和其他的商业决策等。

根据挖掘对象不同，大致有三个知识发现领域涉及到Web挖掘：Web内容挖掘、Web结构挖掘和Web使用挖掘，如图1所示。

Web日志数据挖掘的数据预处理方法研究

Web日志数据挖掘的数据预处理方法研究张娥，郑斐峰，冯耕中（西安交通大学管理学院，陕西西安710048）摘要：主要介绍了Web用户访问日志数据挖掘数据预处理过程，综述了国际上的研究现状，流行的预处理方法。

在对用户访问行为的合理假定基础上，最后提出了基于综合最大前向参引模型和时间窗口模型的新方法。

关键词：Web用户访问日志数据挖掘；数据预处理方法中图法分类号：TP274+.2文献标识码：A文章编号：1001-3695（2004）02-0058-03Study on Web Usage Data Mining Preparation MethodsZHANG E，ZHENG Fei-feng，FENG Geng-zhong（School of Management，Xi’an Jiaotong Uniuersity，Xi’an Shanxi710048，China）Abstract：This paper introduces Web usage data mining preparation process.Summarize studies aIready did in this area.Based on the reasonaI hypothesis，it brought out a new method to set server session which based on time window moduIe and maximaI forward reference moduIe.Key words：Web Usage Data Mining；Data Preparation Method1Web日志数据挖掘数据预处理介绍由于互联网传输协议HTTP的无状态性、客户端和代理服务器端缓存的存在，用户访问日志分别存在于服务器、代理服务器和客户端。

同时，这分布在不同地方的访问日志数据集也分别记载了用户使用网络资源的不同模式，比如，客户端浏览器日志记录了单个用户访问多个网站的模式；Web服务器的日志则记录了多个用户访问一个网站的模式；代理服务器日志跟踪记录了多个用户访问多个网站的情况。

一种WEB日志挖掘的数据预处理方法

１引言
当前已经有很多科研工作者和研究机构发现网站
日志数据具有很大的利用价值，希望通过对ｗｅｂ日志
挖掘算法的输入直接影响日志挖掘的质量。一个ｗｅｂ服务器是重要的数据来源，因为它明确记录了所有访问此网站的客户的浏览动作。它记录了多个用户对一个站点的访问信息。Ｗｅｂ使用记录的数据除了服务器的日志记录外，还包括浏览器端日志代理服务器日志、代理服务器日志、注册用户信息、登录信息、用户会
ｓｐｌｍｅｔｇｐｔ．Ａｆｒｔｅｕｅｄｎｉｃｔｎｈｒｅｏｅｐｇｅｕｅｅｅｃｅｃｆｄｔｕｐｅｎｉａｎｈｔｓｒｉｅｔａｉ，ｔｅｆｅｈｉｆｏｍａｆｔａｅｒｄｃｓｔｆｉｙｏａｈｈｉｎａ
下：
部分，将有价值的模式提取出来。数据预处理是ｗｂｅ日志挖掘的关键技术，主要任务是从ｗｅ其ｂ日志文件中有效地识别用户访问会话。数据预处理的结果作为
① 基于项目：国家科技攻关计划（０３ａ４）２０ｂｌｃ０
话信息、交易信息、ｏｋｅ中的信息、Ｃｏｉ用户查询信息、
的研究来进一步改善网站设计，使用户在更短的响应时间内找到他所需要的资源，增进用户体验，了解用户的兴趣和真正动机等。Ｗｅｂ访问日志挖掘过程一般
分为三个步骤：（）１数据预处理：对原始的ｗｅ日志ｂ
Ａｂｓｒｃ：Ｗｅｏｎｎｓａｍｐｏｔｎｓａｃｉｅｔｏｂｏｔｂｍｉｎ．ｔｒｐｏｅｓｎｓａｋｙｔｃｎｌｇｔａｔｂｌｇｍｉｉｇｉｎｉｒｔｅｅｒｈｄｒｃｉｎａｕａｒｗｅｎｉｇＤａａｐｅｒｃｓｉｇｉｅｈｏｏｙｅｉｂｏｉｉｇｎｗｅｌｇｍｎｎ．Ｔｈｒｉｌｅｃｉｓｔｅｐｅｒｃｓｉｇｆｍｉｉｇｌｇｎｄｔｉｅａｔｃｅｄｓｒｂｅｈｒｐｏｅｓｎｏｎｎｏｓｉｅｌａ．Ｄａａｐｅｏｅｓｎｔｒｐｒｃｓｉｇｉｃｕｅｄｔｃｅｎｉｅｔｆｎｕｅ，ｒｃｇｉｉｇｅｓｏ，ｃｅｎｉｇｐｈｆａｏｅａｅｎｎｌｄｓａａｌａ，ｄｎｉｇｓｒｅｏｎｚｎｓｓｉｎｌａｎｕｔｅｌｍｅｆｔｐｇａｄｙｉｈ

Web日志挖掘中的数据预处理研究

１Ｗｅｂ日志格式
图１Ｗｅｂ日志挖掘的过程
表１
＃Ｆｉｅｌｄｓ：ｄａｔｅｔｉｍｅｃ￣ｉｐｃｓ－ｕｓｅｍａｍｅｓ－ｉＰｓ．ｐｏｒｔｃｓ＊ｍｅｔｈｏｄ－ｕｌｆ－ｓｔｅｍｃｓ — ｕｒｌ－ｑｌｌｅｒｙｓｃ－ｓｔａｔｕｓ
ＭｏｚｉＩｌａ１４．０＋（ｃｏｎｐｒａｔｉｂｌｅ；＋ＭＳｌＥ＋６．０．＋Ｗｉｎｄｏｗｓ＋ＮＴ＋５．０）
ቤተ መጻሕፍቲ ባይዱ
２扣１４ — ０ｌ－１２０１：２０：３４１７２．１６．６２－３－２１ｉＪ５６．１８４．３ｓ８０ＧＥＴ／ｉｎｃｅｘ．ａｓｐ－２００ＭｏｚｉＩｌａ４．１Ｏ＋（ｃｏｍｐａｔｉｂｌｅＭＳｌＥ＋６．０．＋Ｗｉｎｄｏｗｓ＋ＮＴ＋５．１）
ｃｓ（Ｕｓｅｒ－Ａｇｅｎｔ）
１加１４－０１－１２０１：２０：３３１７２．１５．ｇ４．４４ — ２ｌ１．６６．１８４．３５８０ＧＥＴ／ｉｎｄｅｘ．ａｓｐ一２００
信息技术
・１９５・
Ｗｅｂ日志挖掘中的数据预处理研究
黄宏涛（广东外语外贸大学思科信息学院，广东广州５１０００６）

基于Web日志挖掘中的数据预处理

是数据挖掘技术在Ｗｂｅ环境下的应用．集Ｗｅ是ｂ技术、据挖掘技环节的任务、在的主要问题和实现技术展开分析。数存术、息科学等多个领域的一项技术。Ｗｅ信ｂ挖掘对传统的数据挖掘
的相关数据中发现蕴涵的、知的、潜在应用价值的、平凡的模日志文件：未有非式．访问者、点经营者以及基于网络的商务活动提供决策支持。为站简单的平面文本文件，含了一些不完整的、余的、误的数据，包冗错需的基础和实施有效挖掘算法的前提。Ｗｅ志挖掘首先要对挖掘数据进行预处理。始１志文件是请求。ｂ１３原３２）息错误１志（ｒｒｌ，取请求失败的数据，如：失信３Ｅｒｏｏｇ）存例丢３）奇１志（ｏｋｅｌｇ）Ｃｋｅ是由Ｗｅ曲３Ｃｏｉｏｓ，ｏｉｂ服务器产生的用于自要进行处理，则将会直接影响挖掘的效果。据预处理是整个过程连接。权失败，超时。否数授或本文论述了Ｗｅ日志挖掘基本概念、骤和主要任务，点分动标记和跟踪站点的访问者的记号．ｏｋｅ由客户端持有，务器方ｂ步重Ｃｏｉ服析了Ｗｅｂ１挖掘中的数据预处理问题．结合对某汽修网站Ｗｅ可采用Ｃｋｅ方式跟踪单个用户。３志ｂｏｉ日志挖掘的数据预处理具体过程．析了数据预处理的具体步骤和剖

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

① 中间缓存保存了最近从ｗ出服务器传来的所有页面，
在一段时间内，这些缓存的页面可以直接下传给多个通过代
理发出Ｗｅ请求的用户而％ｂ服务器完全不知道这些行为，ｂ
作者简介：方成效（９ｍ）男，１８，江西都昌人，华东交通大学信息工程学院硕士研究生，研究方向：ｂＷｅ挖掘；袁可风（４，１５）男，９
（）１本地缓存。为了减少数据传输量以提高网络性能，大部分的浏览器都将最近访问的页面缓存在本地硬盘上，以所当用户点击“ ＡＫ按钮，次访问这些已访问过的页面时，ＢＣ ” 再浏览器首先检查本地是否存在该页面，如果有，就检查Ｗｅ服ｂ务器上对应的页面有没有更新，己经更新，若则从Ｗｅ服务器ｂ
（ｃｏｌｆ珊ｏｎｉｅｎ，ａｔｈａＪｏｎｎｅｉ，日ｃａｇ３０３Ｃｉ）ＳｈｏｏＩｎＥｇｅｒｇＥｓＣｉａｔｇＵｉｒｔＮＩＩｎ３０１，ｈａｎｉｎｉｏｖｓｙＪ】ｎ
Ａｈ￣．ｈａｅｎｌｓｓｄｔＩａｒＴｉｐｐｒａａｙｅａＰｑｍ）ＢＢｇ删ｓａｏＢｉｎｆｒｅｏｏＷｂｌｇｍｉｉｇｐｏｏｅｈｎｎ，ｒｐｓｓｔｅ嘲ｉｅｔｃｔｎａｉｍｅｃｂｓｄＯｌｏｕｔｄｎｉａｉｒｈｔａｅｉｌｇｑｏｅｉｆｏｔｉ
方成效，袁可风
（东交通大学信息工程学院，华江西南昌３０１）３０３摘要：分析了ｗｅｂ日志挖掘的数据预处理过程，出了基于日志引用页的用户识别算法，提并对其性能进行分析，最后给出
了应用实例。
关键词：ｅ志挖掘；Ｗｂ日数据预处理；用户识别算法
本传输协议ＩＴ及版本号、回码（－Ｐｌｆ返请求的状态，成
收稿日期：０５０－３２０．６１
上取回页面；若没有更新，则直接从本地取出该页，这时Ｗｂｅ
服务器就不会记录本次请求。（）２代理服务器。它为用户提供了中间缓存，而产生了从
两方面的问题：
讨的基础上，提出了基于日志引用页的用户识别算法。
１Ｗｅｂ日志的不精确性
Ｗｂｅ服务器响应用户请求时，在将请求的文件下传给用户的同时把这次请求的相关信息写入日志。典型的Ｗｂｅ服务器日志包括以下信息：地址、请求时间、方法（ＧＴＰｓ．被请求文件的ＵＬ超文如Ｅ、ｏＩ、）Ｒ、
ｐｇｓａａｙｅｈｅｏｍｒｏｈｒｎｅｃａｄｆａｙｖｓａＩｎｔｎｅ．ａｅ，ｎｌｓｓｔｅｐｆｎ￣ｆｔｅａｉｎｆ，ｎｎｌｅｒｉｓｃｌｆｉｉｌａ
Ｋｅｙｗｏｄ：ｅｌｒｓＷｂ０ｇｍｉｉｇｄｔＩｐｎｎ；ａａｐｅ加啷ｉｇｌｒｉｅｔ￣ｔｎａｉｕｅｉｎ；ｔｅｄｎｉｉｒｎｔｔｌｉｆｏｄｃ
中图分类号：Ｐ１．３Ｔ３１１文献标识码：Ａ
ＲｅｅｒｈｏｔｅｒｃｓｉｇｏｅｇＭｉｉｓａｃｎＤａａＰｒｐｏｅｓｎｆＷｂＬｏｎｎｇ
ＦＮＧｈｎ－ｉｏＹＵｅｆｎＡＣｅｇｘａ，ＡＮＫ－ｅｇ
维普资讯
计算机与现代化
２ＯＯ６年第４期
文章编号：０６４５２０）４０７－３１０－７（０６０－０９０２
ＪｓＡＩＵ Ⅻ
ＹＸＡＤ咖『ＵＩＮＡＡ
总第１８期２
Ｗｅｂ日志挖掘的数据预处理研究
Ｏ引言
Ｗｅ志挖掘就是从Ｗｅ服务器的日志中发现ｂ日ｂ
用户的访问模式，析站点的使用情况。通过对Ｗｅ分ｂ
功或错误码）传输字节数、、引用页的ＵＬ指向被请Ｒ（求的页面）和代理（用户使用的浏览器和操作系统的类型）。但是，由于以下一些因素的影响，ｂＷｅ服务器经常不能精确地记录用户的所有请求。直接对其挖掘并不能反映用户的实际浏览行为。所以Ｗｅｂ日志挖掘必须对日志文件进行复杂的预处理，日志中分解从出一个个用户会话。导致Ｗｅｂ日志不准确的因素有以下几个方面：
江西南昌人，硕士生导师，教授。
维普资讯
８Ｏ
计
算
机
与
现
代
化
２０年第４０６期
导致多个用户的多次请求没有被记录下来。
②多个使用不同地址的用户通过代理服务器发出Ｗｂｅ请求时。次请求在日志中记录的都是相同的标识符，每即代理服务器的Ｉ地址。日志文件失去了正确的用户标识信息。Ｐ使
日志的挖掘，可以发现用户访问页面的模式，改进ｗｂｅｌ
站点的性能和结构，提高查找信放性、ｂ动态性及瑚协议的
不确定性，使得丰富的Ｗｅｂ日志信息用于挖掘必须
经过数据预处理，才能保证挖掘结果的有效和准确。所以，ｂ日Ｗｅ志挖掘过程中，数据预处理是挖掘过程的基础，它直接影响着挖掘成败。本文在对Ｗｅｂ日志挖掘预处理过程进行详细探

Web日志挖掘的数据预处理研究

合集下载

Web日志挖掘中数据预处理技术的研究

基于Web日志的数据预处理研究

Web日志挖掘中的数据预处理研究

改进的Web日志挖掘数据预处理方法研究

Web日志挖掘数据预处理研究

Web日志挖掘中的数据预处理技术研究

Web日志数据挖掘的数据预处理方法研究

一种WEB日志挖掘的数据预处理方法

Web日志挖掘中的数据预处理研究

基于Web日志挖掘中的数据预处理

文档推荐

最新文档