信息检索综合报告

  • 格式:docx
  • 大小:968.75 KB
  • 文档页数:11

下载文档原格式

  / 11
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课题综合报告

信息管理学院《信息检索》课程综述报告

课题名称:基于用户行为分析的个性化推荐系统综述

院系:信息管理学院

姓名:许

学号:2011213935

指导老师:张自然

华中师范大学

课题综合检索报告

一:课题名称:

(中文)基于用户行为分析的个性化推荐系统

(英文)An e-commerce personalized recommendationservice on context-aware

二:课题分析:

随着时代的进步,科学技术日新月异,与此同时,人们面临的信息也越来越多。时下较为热门的一个词“大数据时代”较为形象的刻画了,现代化信息时代人们面对的数据量的巨大。在这样一种背景下,如何利用已有的信息,如何在大量的信息中获得用户需要的信息,如何将这些信息迅速的反馈到用户就成为了时下急需解决问题。利用计算机及网络资源,尽可能多的分析用户的信息需求,根据用户的行为分析用户可能的需求是一种较为有效是方法。个性化推荐是一种新兴的信息过滤技术。它从用户的历史行为数据中发现用户的兴趣偏好,采用“推送”的方式,将用户感兴趣的信息从大量数据中过滤出来,并根据用户对信息“感兴趣”的程度,按一定的方式将相关信息呈现在用户面前。对于电子商务平台而言,使用个性化推荐技术,有助于提升平台的优势,增加利益攸关方的收益。而为了提供个性化推荐,情境感知技术必不可少,情境感知是实现针对用户的个性化推荐服务的基础,如何对用户产生的信息碎片进行分析与筛选,进而分析并提供个性化推荐信息是国内外学者们都研究的热点,也是研究个性化的用户服务的首要任务。

三:关键词:

用户行为、个性化推荐;

(英文)Users Behavior、Personalized Recommendation

用户行为:在数字图书馆的系统环境下,网络用户行为就是指浏览、检索、下载、定制、保存,同时还结合一些用户的特殊信息,比如用户的需求、偏好、知识背景,研究方向等等。

个性化推荐:对用户行为分析完成之后,推荐模式与情境信息建立关联,如果同时考虑用户在使用网络过程中喜好的偏差问题,不同的平台需要不同的信息,如何根据最大化

四:检索策略:

拟定的检索式:

用户行为and个性化推荐

(用户行为OR用户偏好)AND(个性化推荐OR信息服务)AND系统

英文:“user behavior”and “PersonalizedRecommendation” and “system”

实际检索时再根据需要对单词进行截词等扩检。

五:选择数据库

以中国知CNKI、Elsevier,中国学术会议在线,dialog信息检索平台,并利用Google 等搜索引擎工具以辅助检索。

六:检索步骤

由于dailog数据库资源限制及网络限制, 所以外文文献的原文全文参考相对较少。由于检索目的是综述用,故检索过程更加注重查准率。

1.首先进入CNKI搜索引擎,选择高级检索,主题检索并输入“用户行为”and“个性化推

荐”为关键字,选择精确匹查找,得到127条结果;观察结果发现前两页相关度不错,

但是结果较多不便于选择,于是加入“系统”这个关键词,结果变为105条。其中第7条显示为:web页面访问模式研究,貌似不相关。鉴于结果数比较多,所以限制条件改变为:主题输入“用户行为”and“个性化推荐”并且篇名限制输入“系统”不含“算法”,检索得到7条结果,其中前面五条相关度极高。但是如此一来漏检率也似乎太高了,于是取消不含“算法”的限制,即以SU=用户行为*个性化推荐 TI=系统进行检索,结果为40条前面20条相关度很高,下载文献备用。

考虑到严谨性,尝试了如下检索

其结果为120条其中相关度高的结果差别不明显。

2.在已经检索到的文献中已经显示最新发表文献结果日期为2013年3月,不过考虑到到

可能有更新研究成果发表,所以时效性不容忽视,进入了中国学术会议在线网站,除几次显示无响应外,均毫无动静,未发现与相关的文献。

3.进入Elsevier,选择高级检索,利用user behav*和personal* recommendation进行

主题、关键词搜索,限制文献的领域为computer science,限制时间为2000-当前,得到结果222叶相关结果记录;如此多的结果,显然需要缩小范围,而不是扩捡,所以限制检索范围到关键字,题名,摘要,于是得到27条结果,选择专家检索

输入“user behavior” and “PersonalizedRecommendation” and “system”

得到大于100条的结果,在右侧复选框中选择限制年份为最近5年得到3页共计69条结果

如图,可见相关度很高,数量合适,且大多为最近发表的文献。

4.其他检索平台,进入dialog进行检索,由于资源限制无相关发现,google学术搜

索显示乱码,无法检索,顺便以百度搜索检索得到记录32,200,000条。但是其结果除了部分学位论文(且很多重复)外大多不具有学术性。

七:部分检索结果:

八:简单综述

随着时代的发展,在当今这个信息时代,网络已进入千家万户,信息技术更是日新月异。各种信息服务系统不断地被应用到不同的领域,如电子商务系统已逐渐成熟并不断地为用户提供更多的服务,又如搜索引擎可以根据用户浏览记录改变提供针对性的广告推送,在搜索引擎优化方面,可以根据众多用户的检索行为定制相应的词条,为后来的检索用户提供参考。

但是随着信息量的增加,以及用户对系统的要求不断提高,各种新技术的应用使其结构也变得更加复杂。面对海量的信息用户经常会迷失在信息的汪洋大海中,无法快速方便的到自己需要的信息。于是基于用户行为的个性化推荐系统在这种情况下应运而生,它可以利用协同过滤等新兴技术,分析用户网络行为中潜在的信息倾向,分析用户检索偏好,进而在用户再次检索时根据分析的结果提供相应的服务,优化检索结果,为用户检索提供方便,而且这些分析结果还有更多的用处,比如在电子商务平台上根据用户的资料与行为向用户推荐商品,帮助用户找到所需商品,减少步骤,缩短用户检索的时间。

由此可见,研究基于用户行为的个性化推荐系统的必要性,因此本综述从检索所得的众多中外文学术期刊论文中选取数篇进行讨论分析、综合,以求自己的知识得到进步完善。纵观这些文献,发现可以发现在基于用户行为的个性化推荐系统的研究中,以下几个方面应用被众多学术论文广泛提及:

1.如何分析用户行为(协同过滤技术,兴趣度模型等)

为分析用户行为,前人提出了很多相关的模型,以下是比较具有代表性的一些模型与方法。

协同过滤推荐(collaborative filtering recommendation)是推荐策略中最成功的策略,它于20世纪90年代开始研究并促进了整个推荐系统研究的繁荣。大量论文和研究都属于该类别。比如Grundy书籍推荐系统、Tapestry邮件处理系统,Grou-plens、Ringo 等推荐系统都属于该类推荐。协同过滤推荐的基本思想借鉴了日常在选购商品、选择用餐饭店、选择看哪部电影等等的方法。如果自己身边的很多朋友都选购某种商品,那么自己就会很大概率的选择该商品。或者用户喜欢某类商品,当看到和这类商品相似商品并且其他用户对此类商品评价很高时,则购买的概率就会很大。协

基于用户行为的兴趣度模型(PersonalizationInterestDegreeModelbasedon consumer’sbehavior,PIDModel),用于发现、记录并分析用户行为,从而得到兴趣度模型,为利用用户的兴趣度产生推荐集合提供基础。PIDModel,是通过建立用户集、资源集,结合用户的行为特点及权重创建的。由于它具备个性化服务的特点,因此描述用户兴趣信息的准确、完整的收集至关重要。本文采用将服务器日志和客户端数据相结合的方法,用于挖掘包含用户兴趣的信息,通过Web日志挖掘获取用户浏览过和购买过的商品记录,从而得到用户感兴趣的商品类别;通过挖掘客户端数据分析用户进入网站的浏览行为记录,从而得到用户对浏览过和购买过的商品的兴趣度。

Web日志挖掘

Web日志分为服务器日志和客户端日志,Web挖掘系统可以通过对日志数据的挖掘得到用户兴趣数据。Web站点的服务器上每天产生大量的Web日志数据,详细记录了用户访问站点的数据,每当站点上的页面被访问一次,Web服务器就在日志中增加一条记录,其中包括以下属性:用户IP、用户名、请求时间、请求页面的URL、相应状态等信息。Web日志分析包括数据准备和兴趣模式挖掘。迄今为止,已有一些Web日志分析工具可以提供一些简单的统计功能

通过Web日志挖掘和用户行为分析来获取描述用户兴趣的数据,进而建立用户的兴趣度模型,并采用贝叶斯网络(BayesianNetwork)将用户兴趣度模型的创建问题转化成后验概率的可计算预测描述。

而另一篇文献提到:通过对Web日志的挖掘,可以得到如下的用户兴趣消息,如:哪些用户正在访问网站、用户的访问路径、访问页面的时间、请求的文件名、请求结果(即请求是否成功)等。由于通过服务器日志文件获得的信息会出现失真,而