电子商务协同推荐技术研究综述分析
- 格式:pdf
- 大小:250.86 KB
- 文档页数:3
AP PLICATION_ ●
电子商务协同推荐技术研究综述分析
文/张莉
摘要:随着社会化网络服务和电子商务的发展,用户的消
费内容和形式日趋多样化,且具有一定的时变性,这对电子商
务系统的协同推荐技术提出了更高的要求。本文从三个方面综
述了电子商务协同推荐技术研究现状:一是传统的协同推荐技
术;二是基于用户兴趣变化的协同推荐技术;三是社会网络视
角下的协同推荐技术。接着分析了电子商务协同推荐技术研究
存在的问题和进一步研究方向,希望为国内相关学者研究提供
参考。
关键字:社会网络分析;电子商务;协同推荐;社区结构
中图分类号:TP391
引言
随着社会化网络服务的发展,用户的个性日益彰显,消
费内容和形式日趋多样化,且具有一定的时变性,如何利用网
络的社会化属性促进商品的发现、推荐、分享和共购,提升用
户的在线购物体验,对电子商务的个性化服务提出了更高的要
求。推荐技术被认为是继搜索技术之后,解决“信息过载”问
题、为用户提供个性化服务最具价值的技术。而协同过滤技术
因为不需要分析推荐对象的内容特征属性,对推荐对象没有特
殊要求,成为了实现个性化推荐服务中比较成功的方法…,许
多大型电子商务系统, ̄.1]Amazon、eBay、淘宝网等不同程度
使用了协同推荐技术。近几年国内外学者在协同推荐技术方面
进行了大量研究,特别是随着社会网络服务的发展,一批学者
将社会网络特性融入到协同过滤技术中,取得了许多有价值的
成果。
本文对目前协同推荐技术的研究从三个方面进行了综述分
析,一是传统的协同过滤技术;二是基于兴趣变化的协同推荐
技术;三是社会网络视角下的协同过滤技术;最后对现有研究
进行了评述。
传统的协同推荐技术研究
协同过滤(推荐)也称社会过滤,主要基于用户过去的行
为获得其对商品偏好信息,据此计算用户间偏好的相似性,然
后在相似用户偏好的基础上为目标用户推荐感兴趣商品。其依
据是具有相同或相似价值观、知识水平和兴趣偏好的用户,对
信息的需求也是相似的。传统的协同推荐算法一般分3步实现
(见图1)。
! :竺! 里兰 兰竺F !!兰竺! 竺! 兰兰Pl兰兰 ! 兰!l
图1协同过滤推荐步骤
即根据用户一项目评分矩阵R= “) (其中m X,z表示用 户、项目数量,尺 表示第f个用户对第.7个项目的评分),查找
目标用户的近邻用户(即相似用户),通过近邻用户对项目的评价
产生目标用户对项目的评分或者是Top—k个项目,实现推荐 。
协同过滤技术分为两种类型:基于内存的协同过滤
(Memory—based CF)和基于模型的协同过滤方法(Model—
based CF),而基于内存的协同过滤方法又分为Use r—based
和ltem—based协同过滤两种形式 。User—based方法的基本思
想是在评分矩阵上利用相似性度量找到与目标用户 兴趣偏好相
似的近邻用户集合,然后再根据各近邻用户对未知项目.7的评分
来预测用户f对/的评分值,并最终形成Top—k个推荐目标。然而
若两个用户没有对相同的项目进行打分,即使这两个用户的兴
趣爱好都相同,该方法也无法得出他们之间的相似度。Item—
based方法是通过计算项目之间的相似性来代替用户之间的相似
性,解决了上述问题,并且发现基于项目相似性比基于用户相
似性推荐的效果更好。然而又产生了新问题:如果两个相似项
目没有被同一个用户评分过,那么这两项目之间的相似度也无
法计算。因而许多学者考虑将用户和项目结合起来,产生混合
推荐算法,解决上述问题。
随着电子商务用户数量和项目数量急剧增长,评分矩阵存
在严重的数据稀疏问题,导致了推荐质量低下;另外随着数据
规模的不断增加,Memory—based算法在计算量上和实时性上
面临严峻挑战。因而-- ̄LL学者提出基于模型(Model—based)
的推荐算法,多种不同的数据挖掘方法被采用:贝叶斯网络、
聚类、降维技术、因子分解、回归模型等以及多种方法的混合
模型。这些模型在一定程度上缓解了数据稀疏带来的问题,获
得了不错的推荐精度 “3_ 。但是,由于这些模型计算的复杂性
和实施难度,目前还没有被成功地运用到实际推荐系统中。
国内学者更多还是侧重具体协同推荐方法的研究…,针对
缩小相似用户搜索范围、数据稀疏、相似性评价等问题,提出
了一些改进方法。邓爱林等(2003)提出了基于项目聚类的
协同过滤算法,根据用户对项目评分的相似性生成不同的项目
子集,通过衡量目标项目与各个类中心的距离指定项目的类
别归属,从而对项目产生推荐 】;吴湖等(2O1O)将联合聚类
技术运用到协同过滤中,从用户和物品两个维度对评分矩阵
进行联合聚类产生推荐,降低了数据稀疏的影响 ;邢哲等人
(201 1)基于用户、项目以及用户评论的相似性计算,将观点
挖掘技术运用到协同过滤推荐算法中,并通过动态方法自动确
定三个维度的权重产生最终推荐,有效缓解了用户评分数据稀
疏带来的不良影响 。
2、基于用户兴趣变化的协同推荐技术研究
为了让协同推荐结果更好地反映用户兴趣变化,提高推荐
己口1己.D7 :j: i:1
65  ̄APPLICATION才 刀、, I
;隹确度,Nathan等人(201 0)在用户相似性计算时增加时间权
重,让历史评分数据的作用随时间衰减 J,该思想虽然在一定
程度上反映了用户兴趣的变化,但不能区分用户的短期和长期
兴趣,也没有解决数据实时更新问题。Cheng等人(201 1)基 于时间戳计算用户对每一项目组的偏好值,而所有项目组的偏
好值组成用户兴趣向量,利用兴趣向量寻找协同过滤算法中的 最近邻,取得了比较好的效果0lo];Yehuda Koren(2009)将基
于主题的概念漂移模型应用到协同推荐系统… ,上述这些研究
共同之处是通过用户行为在固定时间窗表现和当前短暂时间表
现,识别用户兴趣变化。
3、社会网络视角下的协同推荐技术研究
Web2 oa?代的一个最大特色是利用集体的智慧,当更多网
络用户加入到这个集体,个体属性的重要性逐渐被淡化,这与
协同过滤的思想不谋而合。另外,随着社会网络服务的发展,
推荐服务也将突破简单信息获取的技术身份,成为人与其它对
象粘合的有效手段。所以社会网络视角的协同推荐研究引起了
国内外学者关注。
(1)利用社会网络关系属性改进相似性计算
一批学者利用社会网络关系调整用户相似性度量方式,如
(1)式。
weight(i.j)=asim(i.j)+【l—a)TD(i.j)L、1 其中,weight(i, 是综合相似度、sim(i,_『J表示用户(项
目) ,/相似度、TD(i,.『J表示基于社会网络得到的用户间(项目
间)的关系度。
Yuan,Q.{2009)首先分析了社会网络的朋友关系和会
员关系对协同过滤算法性能的影响,然后将两种社会关系采用
不同的权重和用户评分结合起来计算用户的相似性,取得了比
较好的推荐效果 ,其最大问题是权重设置是通过实验获取的
最佳值;而P Massa&P Avesani(2004)将用户间信任度融
66 E :'E”:U :II :21:H I甚::l芑口1己.口1 入到相似性计算 ,认为信任度高的用户,其相似性越大,而
Young等(2007)直接利用用户间的信任度代替相似度 】。上
述方法最大问题是用户间的信任是不对称的,而相似性是对称 的。R.Zheng等(2007)基于社会网络关系图计算两个用户间
的距离,然后用距离修正用户相似性计算,认为关系图上两个
用户距离越近,其相似性越大_| 。但是随着网络用户量增加,
用户间距离计算的复杂度也很大。王卫平等(201 1)将社会
网络的标签数据出现的关键词的相似性融入到用户相似性计算
中,取得了比较好的效果 。
(2)利用网络社区改进协同推荐算法
一个社会网络可以分解为若干个社区,网络社区为商品
的可信推荐、知识共享等提供了新的研究空间,一些学者从
“社区”视角研究协同推荐。Pham,M C等人(201 0)利用
用户社会关系通过聚类技术得到不同的网络社区,识别目标 用户所在的社区,在社区范围内寻找最近邻进行推荐m】,上
述算法思想与传统的use r—based协同推荐类似,只是通过社
区减少最近邻的搜索范围,并且采用社会关系属性进行聚类
的距离计算,算法并没有真正利用社区的结构特点,也没有
考虑在社区中所谓的最近邻是否就是对目标用户影响最大的
结点。周涛等(2007)用二部分图(bipa rtite network)建立
用户一产品关系,利用网络结构提出了基于资源分配的推荐算 法【 :刘兆兴等(201 1)将传统的协同过滤算法和二部图的网
络结构相结合,同时考虑项目的度对项目相似性的影响,得到
改进的推荐算法 】。
4、相关研究评述
基于上述文献梳理与分析,笔者发现:传统的协同推荐和
基于兴趣变化的协同推荐技术都是尽量从用户一项目(商品)评
分数据出发,发掘评价数据的内在关系,在解决数据稀疏性、
相似性评价、缩小相似用户搜索范围以及用户兴趣变化等问 题,取得了很好的效果,然而没有深入挖掘用户和项目的关系
特征信息。基于社会网络视角的协同推荐方法,将社会网络关
系融入到推荐技术中,增加了许多参数,而这些参数最优值多
是通过实验获得的,实验数据不同,参数取值也不同。因而还
需要探讨更好的参数设置方法。
其次,目前协同推荐算法的评价普遍采用预测;隹确度
(如:MAE、MSE、RMSE)和分类准确度(如:precision、 recall、ROC) j,而推荐的本质是项目排序问题。目前项目排
列准确度的评价方法研究相对较少。另一方面,用户之间、项
目之间、用户与项目之间的社会网络是典型的异质信息网络,
聚类或者分类的依据会严重影响排序结果,因而还需要进一步
研究异质信息网络下的协同推荐算法。
另外,国内外学者基于社会网络视角研究了协同推荐方
法,但没有充分利用网络社区结构特性,如:中心度、结点的
度、中间性、紧密度等。Rasim AIguliev等(201 1)发现采用不
同网络结构特性得到的结点相似性差异很大 ,所以基于不同
网络结构特性的推荐结果差异也会很大。另一方面,新用户或 AP PLICATION_ ■
新产品刚进入系统时没有任何选择或被选信息,无法与其他用
户或产品建立关联网络,因此无法启动基于网络结构的推荐算
法,目前缺少这方面的研究。
最后,随着网络用户和商品的快速增长,计算复杂性越来
越大,需要更多、更好的模型和算法来适用用户兴趣的变化,
区分用户的长期兴趣和短期兴趣。网络“社区”结构随时间变
化的特性在一定程度上反映了用户兴趣的迁移和协同推荐服务
效果,目前还缺少这方面的研究。
5、结论
技术的推动与商业需求的牵引决定了协同推荐技术是电子
商务中一个方兴未艾的研究领域,特别是国内对在线社会网络
领域研究起步较晚,基于社会网络分析的协同推荐的研究还存
在很多的理论和实证研究空白。本文从三个方面综述了目前电
子商务协同推荐技术的研究进展,并分析了相关研究的不足和
进一步的研究方向,期望为国内的相关研究提供参考。
参考文献
【1]G.Adomavicius&A.Tuzhilin.Toward the next generation of recommender systems:A survey of the state—of—the—art and
possible extensions[J].IEEE Transactions On Knowledge And Data Engineering,2005,17(6):734—749. [2】Xiaoyuan Su&Taghi M.K.A Survey of Collaborative Filtering Techniques[J】.Advances in Artificial Intelligence,
2009,2009:Article ID 421425.
[3]FIDEL C.,V’ICTOR C.,DIEGO F.&VREIXO O.Comparison of Collaborative Filtering Algorithms:Limitations of
Current Techniques and Proposals for Scalable,High-Performance Recommender Systems[J】.ACM Transactions on the Web,
201l,5(1):2-33. [4]4李聪.电子商务协同过滤可扩展性研究综述【J】.现代图书情报技术,2010,(11):37-44.
【5]张光前,雷彩华,吕晓敏.电子商务推荐的研究现状及其发展前景[J】.情报杂志,201l,30(12):60-65,21.
[6】邓爱林,朱杨勇,施伯乐.基于项目评分预测的协同过滤算法[J].软件学报,2003,14(9):1621-1628.
[7】吴湖,王永吉,王哲.两阶段联合聚类协同过滤算法[J】.软件学报,2010,21(5):1042-1054.
(8】邢哲,梁竞帆,朱青.多维度自适应的协同过滤推荐算法[J].小型微型计算机系统,2011,32(11):2210-2216. 【9】Nathan N.Liu,Min Zhao,Evan Xiang,and Qiang Yang.Online evolutionary collaborative filtering[A].In 4th ACM ConI.
on Recommender Systems,2010,95—102.
[10]Tsang-Hsiang Cheng,Hung-Chen Chen,Wen-Ben Lin&Yen-Hsien Lee.Col1aborative Filtering with User Interest
Evolution[A].In Pacific Asia Conference on Information Systems,201 1,Paper 45.
【11】Yehuda Koren.Collaborative filtering with temporal dynamics[A】.In 15th ACM international conference on Knowledge discovery and data mining,2009:447-456.
[12]Yuan,Q.et a1.Augmenting collaborative recommender by fusing explicit social relationships[A].In proceedings of the
ACM Workshop on Recommender Systems&the Social Web.2009.49-56.
【1 3】P.Massa&P.Avesani.Trust—aware collaborative filtering for recommender systems[J】.Lecture Notes in Computer Science,2004,3290:492-508. 【14】Young Ae Kim&Jaideep Srivastava.Impact of Social Influence in E—Commerce Decision Making[A].In proceedings of the
9th international conference on E-commerce.2007.293—3O2.
[1 5]R.Zheng,F.Provost&A.Ghose.Social Network Collaborative Filtering:Prefiminary Results[A】.In proceedings of the 6th Workshop on eBusiness,2007,47-55. [16]王卫平,张丽君.SNS背景下基于Tag和Rating相似度融合的协同过滤【J].计算机系统应用,2011,20(10):78-81.
【1 7]Pham,M,C.,Cao,Y.,Klamma,R.&Jarke,M,A Clustering Approach for Collaborative Filtering Recommendation
Using Social Network Analysis[J】.Journal Of Universal Computer Science,2010,l7:1-21.
【18]Zhou T,Ren J,Medo M,et a1.Bipartite network projection and personal recommendation[J].Physical Review E,
2007,76:046115. [19]刘兆兴,张宁,李季明.基于协同过滤和网络结构的个性化推荐算法【J].复杂系统与复杂性科学,2011,8(2):45—50. [20】Rasim Alguliev,Ramiz Aliguliyev&Fadai Ganjaliyev.Investigation of the role of similarity measure and ranking
algorithm in mining social networks[J1.Journal o11 Information Science,201 1,37(3):229-234.
作者简介:张莉,博士,副教授,对外经济贸易大学信息学院。研究方向:智能信息技术、电子商务。
己口1己.口1 : : 葛 :
67