基于加权二部图的个性化推荐算法_张新猛
- 格式:pdf
- 大小:336.38 KB
- 文档页数:5
基于加权二部图的个性化推荐算法张新猛;蒋盛益【期刊名称】《计算机应用》【年(卷),期】2012(32)3【摘要】针对网络推断(NBI)算法的二部图实现算法忽略二部图权重而导致实际评分值高的项目没有得到优先推荐这一问题,提出加权网络推断(WNBI)算法的加权二部图实现算法.该算法以项目的评分作为二部图中用户与项目的边权,按照用户-项目间边权占该节点权重和的比例分配资源,从而实现评分值高的项目得到优先推荐.通过在数据集MovieLens上的实验表明,相比NBI算法,WNBI算法命中高评分值项目数目增多,同时在推荐列表长度小于20的情况下,命中项目的数量和命中高评分项目数量均有明显增加.%In Network-Based Inference (NBI) algorithm, the weight of edge between user and item is ignored; therefore, the items with high rating have not got the priority to be recommended. In order to solve the problem, a Weigted Network-Based Inference (WNBI) algorithm was proposed. The edge between user and item was weighted with item's rating by proposed algorithm, the resources were allocated according to the ratio of the edge's weight to total edges' weight of the node, so that high rating items could be recommended with priority. The experimental results on data set MovieLens demonstrate that the number of hit high rating items by WNBI increases obviously in contrast with NBI, especially when the length of recommendation list is shorter than 20, the numbers of hit items and hit high rating items both increase.【总页数】5页(P654-657,678)【作者】张新猛;蒋盛益【作者单位】广东外语外贸大学思科信息学院,广州510006;广东外语外贸大学思科信息学院,广州510006【正文语种】中文【中图分类】TP181;TP301.6【相关文献】1.基于增加相似度系数的加权二部图推荐算法 [J], 李镇东;罗琦;施力力2.基于随机森林修正的加权二部图推荐算法 [J], 李玲;李晋宏3.基于改进加权二部图和用户信任度的协同过滤推荐算法 [J], 邓小燕;张晓彬4.基于加权二部图的个性化方案推荐 [J], 杨珍;耿秀丽5.基于加权二部图的Slope One推荐算法 [J], 王冉;徐怡;胡善忠;何明慧因版权原因,仅展示原文概要,查看原文内容请购买。
基于二部图(Bipartite Network)的推荐算法不必考虑用户和项目的内容信息,它是一种结合物质扩散(Massive Diffusion)理论的推荐算法。
周涛[1]等人研究了一些物理学的知识,比如热传导理论以及物质扩散理论等,并将它们应用在推荐算法中,提出了这种基于二部图的推荐算法。
二部图是一种特殊的网络,它包含有两类不同类型节点,并且仅允许不同类型的节点之间可以有连线。
自然界许多问题可以利用二部图进行解决,比如性别关系、边着色问题等。
在二部图的应用中,同一类型节点之间的合作相互关系成为了研究领域的热点。
比如,可以利用由演员节点和演出剧目节点组成的二部图来研究演员之间在演出中的合作关系。
在一个具体的推荐系统中,可以把用户看作是一类节点,把项目看作是另一类节点。
通过由用户节点和项目节点组成的二部图,我们可以利用相邻的用户为目标用户推荐可能感兴趣的项目。
物质扩散类似于在复杂网络中的随机游走的概念。
它假设在一个系统中有着固定数量的“物质”在传递,并且在传递的过程中这些“物质”的总量始终保持守恒。
最后系统稳定状态的结果与节点的度数成正比。
在推荐系统中,我们认为目标用户所选择过的项目能够提供一定的推荐能力信息。
在操作过程中,首先为每个项目赋予初始资源1。
根据物质扩散的理论,物质的传递过程分两步走。
第一步,每个项目将自己的资源通过二部图的边均匀地分配给选择过该项目的每个用户,这样资源就从项目节点传递到了用户节点。
第二步,每个用户再将自己分配到的资源通过二部图的边平均分配给他选择过的项目,这样资源又传回到了项目节点。
虽然资源的总量在传递过程中是守恒的,但通过两次传递,每个项目所具有资源的分配状态发生了改变。
系统最后可以根据项目所拥有的资源的分布状态来计算它们之间的相似度,并确定最近邻集。
(引入具体的公式,并将改进的论文附上)文献[2]将物质扩散理论运用到了Item-based协同过滤推荐算法。
算法将选选项目的资源初始值都设为1,用稳定状态时两个项目的资源传递总量来表示它们之间的相似程度,最后利用这个相似度来计算目标用户的预测评分,并把评分较高的项目推荐给他。
基于项目属性与数据权重的协同过滤推荐算法
张新猛;李松
【期刊名称】《自动化与仪表》
【年(卷),期】2016(031)009
【摘要】传统的基于项目的协同过滤(IBCF)算法存在相似性计算方法忽略项目属性在相似性度量中的重要参考价值和不能反映用户意向的变化的不足.基于以上不足该文提出了一种新的基于项目的协同过滤算法.此种算法分别基于评分与项目属性因素度量项目相似性,最后通过自适应平衡因子协调处理两方面的相似性结果来度量项目相似,并结合反映项目与用户意向相关程度的数据权重进行预测与推荐.试验结果表明,改进后的算法,对传统算法中存在的2个弊端进行了改善,在推荐准确度上有所提高.
【总页数】5页(P69-73)
【作者】张新猛;李松
【作者单位】天津市体育彩票管理中心,天津300074;河北工业大学计算机科学与软件学院,天津300401
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于用户项目属性偏好的协同过滤推荐算法 [J], 吕成戍
2.基于项目属性权重的协同过滤推荐算法 [J], 李转运;孙翠敏
3.基于矩阵分解和项目权重的协同过滤推荐算法 [J], 许吴宁; 梁燕
4.基于项目属性权重的协同过滤推荐算法 [J], 李转运[1];孙翠敏[1]
5.基于项目权重的协同过滤推荐算法研究 [J], 王保
因版权原因,仅展示原文概要,查看原文内容请购买。
电子技术与软件工程Electronic Technology & Software Engineering电力电子Power Electronic 动态电能质量治理装置实时相位补偿虞坚阳(国网江苏省电力有限公司常州供电分公司江苏省常州市213000 )摘 要:本文分析了电能质量治理装置在跟踪指令波形存在的相位延迟问题,分别采用了固定相位校正和实时相位两种方法进行分析,通过仿真和试验对比了两种方法的补偿效果。
关键词:电能质量治理装置;固定补偿;实时补偿随着配网智能化水平的快速提升,大量电能质量治理装置得到了广泛的应用,以有源电力滤波器(APF)、静止无功补偿装置(SVG)为代表的电能治理设备基本原理是通过检测系统或负载电流中的待 补偿成份,控制全控型开关器件(IGBT)实时产生所需的反向补 偿电流并注入电网,以控制系统电流功率因数或谐波畸变率。
在实时补偿中,装置实际发出电流与指令电流(或负载等治理电流)之间的误差将决定最终的补偿效果,而在实时跟踪过程中,具体表现 为补偿电流能否准确跟踪指令电流。
通过大量的工程实际发现,补 偿电流与指令电流间往往存在一定的相位延迟,这导致了设备的电能质量治理能力达不到设计要求。
1电能质量治理设备工作原理1APF/SVGAPFSFG图1:电能质量治理装置基本补偿原理1. 1基本原理通用型电能质量治理装置(APF/SVG)的系统接入与补偿原理程图,可以将推荐算法建模过程分成两个部分:用户-商品关系建模和推荐实现建模,在用户•商品关系建模过程中,首先釆集用户- 商品的评分数据,分别构建用户和商品的二部图拓扑结构,建立用户■商品分类模型,然后搭建用户■商品二部图模型;在推荐系统建模过程中,首先根据二部图模块函数计算用户和商品间的相似值,构建用户-商品相似矩阵,应用改进的协同过滤推荐算法生成推荐 列表,将预测得到的商品评分值进行从高到低排序,并对邻居用户推荐商品评分最高的商品,完成商品个性化推荐。
科技与创新┃Science and Technology&Innovation ·92·2021年第20期文章编号:2095-6835(2021)20-0092-02基于二部图的推荐算法研究综述高迎,刘正(首都经济贸易大学,北京100070)摘要:随者互联网的不断发展,如何对网络上海量的信息数据进行分析,已经成为一个热点问题。
推荐系统能够在用户没有明确的需求时也能够为其进行商品与服务的个性化推荐,因此如何在大数据背景下准确预测用户偏好是值得研究的。
推荐系统中用户和项目二者之间的关系可以构成明显的二部图网络结构,研究表明,通过复杂网络结构和推荐算法的融合可以有效改善个性化推荐过程中存在的问题。
首先对推荐算法进行简单概述,总结了推荐算法与二部图推荐算法的发展历程,最后对相关领域未来的发展方向进行简述。
关键词:个性化推荐;协同过滤;网络结构;信息过载中图分类号:TP391.3文献标志码:A DOI:10.15913/ki.kjycx.2021.20.040当今时代是信息网络时代,因此不同行业产生的数据信息数量已经达到ZB级别,这为企业带来了很多挑战。
互联网用户数量以一种十分迅猛的趋势发展,对于各企业来说,庞大的信息数据量为其提出了难题,他们难以很快确定哪些信息与特定的用户是相关的,即产生了“信息过载”的问题。
各界学者逐渐开始研究个性化推荐这一先进的技术手段以改善这一问题,而其中协同过滤已被广泛应用在各种类型的企业中。
由于该算法仅通过用户评分信息预测用户偏好,推荐效果有待提高。
图是一种表达节点及其关系的基本结构,而二部图以直观的方式表达了用户及项目之间的关系,因此学者逐渐将复杂网络的方法与推荐算法进行结合。
随者相关领域研究的不断发展,对于网络结构与推荐算法的研究仍存在许多挑战需要探索。
因此,本文对相关领域的理论、研究现状和关键技术进行总结与分析,希望能帮助其他学者了解该领域的研究进展与发展方向。
个性化推荐算法的研究和使用教程随着互联网信息爆炸式增长,用户面对海量的数据和内容,如何找到适合自己的信息成为一个重要的问题。
个性化推荐算法应运而生,它能根据用户的兴趣和偏好,为用户提供个性化的推荐内容,提高用户的满意度和体验。
本文将介绍个性化推荐算法的研究和使用教程。
一、个性化推荐算法的研究1. 协同过滤算法协同过滤算法是最经典的个性化推荐算法之一。
它通过分析用户行为数据,找到与目标用户兴趣相似的其他用户,推荐这些用户喜欢的物品给目标用户。
常见的协同过滤算法有基于用户的协同过滤和基于物品的协同过滤。
基于用户的协同过滤算法通过比较用户之间的相似度,找到相似兴趣用户,并根据这些用户的喜好推荐给目标用户。
基于物品的协同过滤算法则是通过分析物品之间的关联性,找到目标用户喜好的物品。
2. 内容过滤算法内容过滤算法是根据物品的属性和用户的偏好进行匹配推荐的算法。
它通过分析物品的属性,比如标题、标签、关键词等,和用户的兴趣偏好进行匹配,从而得到个性化的推荐结果。
常见的内容过滤算法有基于关键词的匹配和基于推荐系统的主题模型。
3. 混合算法混合算法是将多种推荐算法结合起来使用的方法。
它可以充分利用多个算法的优势,提高推荐的准确性和多样性。
常见的混合算法有基于模型的混合、基于规则的混合和基于加权的混合等。
二、个性化推荐算法的使用教程1. 数据收集个性化推荐算法需要大量的用户行为数据作为基础,因此首先需要收集用户的行为数据。
可以通过用户注册信息、访问记录、购买记录等方式来获取用户的行为数据。
2. 数据预处理在进行个性化推荐算法之前,需要对数据进行预处理。
包括数据清洗、数据转换、数据融合等步骤。
清洗数据是为了删除噪声数据和无效数据,提高数据的质量。
数据转换是将原始数据转换为个性化推荐算法所需的格式。
数据融合是将不同来源的数据进行整合,形成更完整的用户行为数据。
3. 算法选择根据具体的推荐需求和数据情况,选择合适的个性化推荐算法。
基于知识图谱的个性化推荐算法研究随着互联网的普及和应用场景的增多,人们在日常生活中接收到的信息量越来越大,选择的复杂度也越来越高。
在这种情况下,推荐算法逐渐成为了解决选择困难和信息过载的有效手段。
在推荐算法中,个性化推荐算法是最为常见的一种,因为它可以针对用户的历史行为和偏好,为用户推送个性化的信息和内容。
而知识图谱则是推荐算法的重要基石,它能够将海量的数据节点有机地连接起来,形成一个庞大而丰富的知识网络,帮助推荐算法更好地理解和挖掘用户真正的需求。
一、个性化推荐算法的基本思路个性化推荐算法的基本思路是利用用户的历史行为、偏好和相关信息,通过特定算法模型挖掘和分析这些数据,进而为用户推荐最匹配的信息和内容。
具体来说,个性化推荐算法可以分为基于内容和基于协同过滤两大类。
基于内容的推荐算法是通过分析用户对某些内容的兴趣特征,根据这些特征来推荐相似的内容给用户,适用于新闻、电影等纯内容型的推荐场景。
而基于协同过滤的推荐算法则是通过分析用户和物品之间的关系,从而预测用户对物品的偏好,适用于商品、音乐等物品型的推荐场景。
二、基于知识图谱的个性化推荐算法基于知识图谱的个性化推荐算法是将知识图谱的知识结构和用户历史行为结合起来,从而更准确地了解用户需求和兴趣,提供更具针对性和个性化的推荐服务。
具体来说,这种算法可以分为三个部分:知识图谱的构建、实体推荐和关系推荐。
首先,知识图谱的构建是算法的第一步。
知识图谱是一个庞大而复杂的数据结构,它可以包含各种类型的实体和关系,包括人、地、物、事等。
为了构建一个完整而准确的知识图谱,需要结合多种数据源和知识库,如百度百科、维基百科、Freebase等。
在构建过程中,需要将每个实体和关系进行标识和规范化,以确保整个知识图谱的可靠性和一致性。
其次,实体推荐是知识图谱推荐算法的核心部分。
在实体推荐中,算法会通过用户的历史行为和知识图谱中实体之间的关系,对用户的兴趣和需求进行深入把握,挖掘用户可能感兴趣的实体,然后将这些实体推荐给用户。
二分图个性化推荐算法的改进及应用的开题报告一、研究背景和意义随着互联网技术的发展,个性化推荐在各种应用场景中得到了广泛的应用。
传统的个性化推荐算法主要是基于用户对物品的评价数据进行推荐。
然而,在一些特定场景中,用户的评价可能并不容易获取,此时如何进行个性化推荐就成为了一个难题。
二分图模型被广泛应用在推荐系统中,其中用户和物品分别构成一个二分图的两个部分,用户和物品之间存在边,表示用户对物品的偏好关系。
传统的二分图模型使用了基于相似度的方法进行推荐,即通过计算用户与物品之间的相似度来得到推荐结果。
然而,在一些特定场景中,如音乐推荐、电影推荐等领域中,这种方法往往效果不佳,因为用户与物品之间的相似度难以计算。
因此,本研究将探索基于二分图的个性化推荐算法的改进及应用。
通过研究二分图的结构特征和用户行为特征,提出一些新的推荐算法,使得推荐结果更加准确和个性化。
同时,将该算法应用于音乐推荐系统中,验证算法的效果和可行性。
二、研究内容和方法1. 研究基于二分图的个性化推荐算法的优缺点,分析现有算法的局限性和不足之处。
2. 分析二分图的结构特征和用户行为特征,探索新的推荐算法。
如通过引入社交网络信息,利用用户间的关系构建二分图,解决传统二分图推荐算法中的冷启动问题。
3. 针对音乐推荐领域中存在的较大的音乐库和稀疏的用户评价问题,提出基于二分图的音乐推荐算法与处理方法。
4. 通过实验证明新算法在准确度和个性化上的优势,并结合案例探讨算法的实际应用问题。
5. 结合实验结果和用户反馈优化算法,使其更加符合用户需求。
三、研究基础和条件本研究所需的基础知识包括机器学习、推荐系统、图论等。
需要运用Python等编程语言进行算法实现与实验。
研究所需的设备和软件条件:计算机、较大的音乐库。
四、预期结果通过本次研究,预期得到以下成果:1. 提出一种基于二分图的新型个性化推荐算法,并分析其在准确度和个性化上的优劣。
2. 将改进后的算法应用于音乐推荐系统中,验证其效果和可行性。
一种结合遗忘机制与加权二部图的推荐算法刘晓光;谢晓尧【摘要】为了解决因用户兴趣漂移而导致推荐质量下降的问题,本文引入了用户对产品的遗忘因子.通过分析用户的浏览记录和打分情况,建立用户的动态兴趣模型;并计算用户对产品的遗忘因子,利用遗忘因子作为加权二部图的权值,通过二部图的资源分配方法产生用户的推荐列表.在数据集MovieLens上的实验表明:该算法能有效地处理用户兴趣漂移的问题,提高推荐列表的推荐质量.【期刊名称】《河南科技大学学报(自然科学版)》【年(卷),期】2015(036)003【总页数】6页(P48-53)【关键词】兴趣漂移;遗忘机制;加权二部图;资源分配;推荐算法【作者】刘晓光;谢晓尧【作者单位】贵州大学计算机科学与技术学院,贵州贵阳550000;贵州师范大学信息与计算科学重点实验室,贵州贵阳550000;贵州师范大学信息与计算科学重点实验室,贵州贵阳550000【正文语种】中文【中图分类】TP3随着现代电子商务和网络技术的快速发展,互联网的规模不断扩大,信息不断膨胀,世界上的信息处于大爆炸的状态,用户所面对的信息数量大、质量差、信息价值低,给用户带来了信息超载的问题。
为了解决信息超载问题,推荐系统应运而生[1]。
随着Web2.0技术趋于成熟,推荐系统在网络上的应用也迅速发展,如TaoBao、Amazon、Youtube等网站,它们都拥有自己的推荐系统。
在实际的应用中,用户的数量庞大,产品资源的数量巨大,用户很少能一次就找到自己想要的信息。
设计一个准确高效的推荐系统不仅可以发现用户潜在的兴趣对象,还可以针对不同用户提供个性化的服务[2],以帮助用户更好地获取想要的信息。
2012年,文献[3]提出了加权网络推断算法(WNBI),即加权二部图推荐算法,该推荐算法解决了高评分值的产品不能优先推荐的问题,提高了推荐质量。
但是在现实生活中,随着新的产品(选择)的出现,产品的感知和受欢迎程度不断发生变化,同样,用户的倾向也是不断变化的,这种用户偏好随着时间变化的情况,称为用户“兴趣漂移”问题[4]。
基于增强二部图网络结构的推荐算法张岐山;文闯【摘要】协同过滤推荐算法的数据稀疏性与冷启动问题影响和制约了推荐的质量.基于用户-项目二部图的信任计算可以有效的利用用户间的潜在联系提高推荐性能.提出一种融合基于二部图的增强繁殖信任与JMSD相关系数的推荐方法,包括对改进的加权用户-项目自适应繁殖信任度的计算,在此基础上融合用户偏好的增强信任度机制,以及线性加权JMSD相关系数,两组数据集下的对比实验表明,与三种基准算法对比改进的算法模型具有更低的平均绝对误差(MAE),更高的召回率(Recall),提高了推荐质量.【期刊名称】《计算机系统应用》【年(卷),期】2019(028)004【总页数】6页(P151-156)【关键词】协同过滤;稀疏性;冷启动;信任;二部图网络;用户偏好【作者】张岐山;文闯【作者单位】福州大学经济与管理学院,福州 350108;福州大学经济与管理学院,福州 350108【正文语种】中文引言人工智能时代背景下产生了许多信息过载[1]问题,协同过滤算法是当今电子商务以及各种个性化推荐中应用最广泛的推荐技术,协同过滤算法存在冷启动问题,同时算法存在需要获取大量用户历史数据,存在稀疏性等问题.为解决以上问题,国内外许多专家学者提出并完善了基于信任的推荐系统[2],Guo[3]根据信任的来源将信任分为显性信任(Explicit Trust 和隐性信任(Implicit Trust),显性信任是指用户网络之中主体之间的直接交互,主动表达的信任关系,隐性信任是指根据用户网络中主体之间的直接交互关系挖掘出信任关系,根据用户的某些行为(如评分)来推测用户之间的信任关系,显性信任具有很强可靠性和准确性,而隐性信任更好的区分信任度,能显著提高覆盖率,缓解冷启动问题.Massa 等人[4,5]提出一种使用显示信任的推荐系统,用信任权重代替传统推荐系统的相似度进行推荐,相比传统算法,提高了精度,增加了覆盖范围,可预测的评分总数,同时也能规避恶意用户虚假评分降低推荐质量的隐患.Jamali[6]也考虑了信任问题,采取随机游走的方法利用显性信息,在用户网络中随机选取信任邻居,把用户看成网络中的节点,连接的边即为信任关系,其强度代表了两个用户间信任度.文献[7]引入了全局变量,融合用户间局部信任度和全局信任度,从海量用户历史数据中,挖掘出用户潜在的信任关系,缓解了数据的稀疏性问题,提高了推荐的准确性.Ray 等[8]设定了相似性阈值,提出了当用户间相似度低于设定阈值则舍去,重构信任网络之后再预测评分,此法提高了算法精确度,但是牺牲了数据的覆盖率,也无从缓解冷启动问题.Moradi 等[9]提出了RTCE 模型,该模型首先基于显性信任机制为目标项目进行打分,同时设定信任阈值,对于评分可靠性低于阈值的用户,通过综合考虑积极因子,消极因子重构信任度.文献[10]创建了用户间信任繁殖算法以此拓宽信任网络,通过信任繁殖得到了更多有效邻居用户,提高了算法的覆盖率,缓解了推荐算法中的数据稀疏性和冷启动问题.Zhou 等[11]利用动力学传播原理构建用户-项目二部图网络结构,用户将自己的资源均衡分配给关注的项目,从而计算用户与用户的资源相关信任值,该算法提高了推荐预测精度,减少了算法的复杂度.针对推荐算法的相关问题,本文在已有的研究成果上聚焦于用户显性信任关系以及通过设定阈值衍生繁殖隐性信任关系,充分考虑了信任关系的主观性,非对称性,传播性,弱传递性,以及适应性,同时融合用户偏好,依据评分相似性选择目标用户的最优近邻集合,从而进行预测.本文的主要创新点主要体现在以下方面:1)在基于加权用户项目二部图[12]的信任繁殖[13]模型过程中加入对直接信任的阈值筛选控制,降低了推荐系统的噪声,同时构建用户信任与用户偏好关系融合的强化模型,具有一定现实合理性,最后设计与不融合用户偏好的算法模型进行自身对比,对比结果证明了融合用户偏好信任的优越性.2)计算得到的信任度最后融合实验下表现更加优异的基于MSD 和Jaccard 相似性的JMSD 相似系数[14],在Movielens 数据集和Last.FM 数据集下的实验表明与基准算法相比较,本文提出基于二部图的增强繁殖信任推荐算法模型以下简称BTUCF 算法模型,缓解了了推荐算法的数据稀疏性和冷启动问题,提高了算法结果召回率,降低了算法的平均绝对误差.下一节本文对传统协同过滤以及传统加权二部图推荐算法性能特点及局限性进行分析,第二节对本文提出增强的自适应繁殖信任模型进行描述,第三节讨论分析了本文得到实验模型结果.1 相关工作1.1 传统协同过滤基于用户的协同过滤算法基础流程如下:1)基于用户的协同过滤算法,输入数据集为用户-项目的评分矩阵,记为Rum,用户u 对项目m 的评分记为rum,未评分项目即rum=0,用户-项目评分矩阵共有m 行n 列,每一行都分别代表用户u 依次对各项目的评分,每一列都分别代表某个项目受到各用户的评分数据,形式如下:协同过滤算法主要通过构建相似度矩阵来预测目标用户对该项目的喜好程度,相似度计算方法是协同过滤算法推荐的关键因素,相似度的度量方法主要分为四种:修正的Pearson 相关系数,均方偏差(MSD),Jaccard 相似度和斯皮尔曼等级相关(Spearman’s rank correlation).显式用户评分矩阵非常稀疏,相比其它相似度量本文采用的Jaccard 相似度能一定程度的从全局角度利用用户间的交互关系,但是缺少了用户与用户之间的直接信任交互与间接信任用户间的交互信息,只考虑传统协同过滤缺少了对这些必要信息的有效补充.1.2 传统加权二部图推荐算法二部图中定义用户集合U ={u1,u2,u3,···,ui} 定义项目集合为 O={m1,m2,m3,···,mj}将i 个用户节点和j 个项目的关系转化为一种选择关系,当用户Ui 评价过项目mj 就连接此用户与项目,对每一条用户与项目的连接线都赋予权重Wi,特别的当用户对项目的评分大于等于3 时Wi=1;当用户对项目的评分小于3 时Wi=β 通过实验证明当β=0.5 时推荐结果最优[13],本文中亦使用该最优值. 1)用户-项目关系图构造如图1所示.图中用户对项目的关注度如式(4)所示:其中,Aij 为项目mj 受到用户Ui 关注项目总数,len(ui)为用户ui 评价过的项目权重总和,eij 为用户ui 是否对项目mj 有评价的布尔类型,有即为1 没有即取0.2)项目-用户有向图类似于用户-项目有向网络图构建,将项目得到的用户关注度重新反馈给用户如图2所示.图1 用户—项目模型图2 用户—项目模型图中项目对用户的反馈表达式如式(3)所示:其中,f(ui)为项目反馈给用户ui 的关注度,len(mji)为用户ui 评价过项目mj 的项目权重总和,eji 为项目mj 是否对用户ui 有评价的布尔类型,有即为1 没有即取0,Aij 为项目mj 受到用户ui 关注项目总数.最后结合用户-项目,项目-用户的有向网络图,从而可以得到用户-用户的有向网络图,结合式(4)和(5)推导出用户与用户之间的推导信任,推导信任取值范围为0 与1 之间.0 表示无评价历史,无信任交互,信任值越大信任程度越高,如式(7)所示:Guo[3]阐述的衡量主体与主体之间的信任关系5 个重要特性:主观性:不同的主体有不同的兴趣偏好,判断标准,所以主体对于其他主体可能会有不同的信任值;非对称性:主体对主体的信任都是单方面的,一般是不对称的,在实际中A 对B 的信任度一般不等于B 对A 的信任值;弱传递性:信任是具有传递性的,在A 信任B,B 信任C 的前提下,t rustAB 和 t rustBC足够大时,A 对C 的信任值是有显著意义的;传播性:主体之间的直接信任关系以及其变化会影响其他主体之间的信任关系,特别是当一个主体的兴趣或者发生不诚信行为时,与其有信任关系的其余主体评估水平就会发生变化,这样通过该主体获得推荐的信任关系也会发生相应变化;适应性:主体之间的信任关系会随着时间函数的变化,上下文环境的变化而变化,由于信任的动态性,推荐系统中的信任建立之后,要根据系统内各种要素的变化不断调整调和参数.对比五种特性,传统加权二部图法在主观性上一分为二的权重考虑没有充分考虑用户偏好,没有在用户之间建立不对称的可适应性传递信任,没有充分挖掘非直接交互的用户间的潜在信任信息,同时没有设定阈值的广泛信任关系加入了不存在的信任关系,降低了系统的抵抗恶意攻击能力,增加了系统噪声.2 一种增强的自适应繁殖信任模型2.1 增强的二部图网络信任机制(1)传统加权二部图基础上的信任繁殖.利用传统加权二部图得到直接信任,但是直接信任只反映了有相互交互的用户之间的关注度程度,实际数据中许多用户之间并没有直接互动,根据信任的可传递性与传播性,用户A 信任B,用户B 信任用户C,则存在用户A 信任用户C,挖掘潜在的间接信任可以拓宽信任关系,信任繁殖可以极大的提高算法的覆盖率与算法精度.根据文献[13]创建的信任进行了拓展,同时设定阈值d,本文只对直接信任大于0.01 才计算ITrust 间接信任计算公式如下:(2)综合信任度.结合用户间直接信任DTrust 与间接信任ITrust,可计算用户间综合信任度,计算公式如下:自适应性因子∂ 表达式如下:(3)结合用户偏好的信任增强机制.增强的信任加权的二部图在用户-项目关系连接线上考虑了权重Wi 当评分大于3 时Wi=1,当评分小于3 时Wi=0.5,加入权重后的二部图模型具有较为明显的优势,但仍存在一个问题,加入权重的推荐系统降低了系统抵抗恶意攻击的能力,没有考虑用户的评分偏好问题,乐观用户偏向于打高分,消极用户偏向于打低分,传统加权二部图中假设三个用户对四个项目的评分值分别为(1,1,1,1),(2,2,2,2)和(1,2,2,3),计算得到的信任关系u1 与u2,u3 与u4 是相同的,这显然不符合不符合实际情况,根据信任特性u1 与u2 用户的信任度应该大于u1 与u3,用户针对此问题,本文提出了一种偏好的调整信任度,其公式为:基于以上,本文在第一种模型上提出一种新的偏好调整用户信任度度量方法构建第二种模型,增强信任公式表现如下:2.2 结合JMSD 相关系数推荐本文采用的是实验下性能更加优异的基于MSD 和JMSD 相似性的JMSD 系数,基于用户共同评分项的个数来度量的JMSD 系数中作为一种补充的全局信任信息结合二部图网络信任机制全面的挖掘了用户之间信任关系.均方偏差MSD 公式为:MSD 无法处理用户共同评分项过少这个问题,而Jaccard 相似度是基于用户共同评分项的个数来度量,其公式如下:JMSDuv 其公式如下:基于相似度与偏好调整信任度的研究,对于目标用户ui 的未知评分预测,给出综合相似系数Sim 如公式:(12)根据计算的相似系数Sim,对于用户未进行评分的项目,可采用如下预测公式预测:3 实验结果和分析3.1 实验数据集为检验算法的合理性,本文使用Grouplens 提供组供的Movielens 数据集和在线音乐系统Last.FM 提供的Last.FM 数据集对算法模型进行验证,Movielens 由美国Minnesota 大学计算机科学与工程学院的Grouplens项目组创办,本文选择其中的Ml100k 数据集,数据集包括了943 个用户的100 000 条评价数据,评分范围1-5,每个用户至少对20 部电影项目作出评价,分值越大喜好越大;Last.FM 数据集包含了1892 个用户对17 632 张音乐专辑的收听信息,实验中与基准对比算法一致将收听数量转化成收听评分用于对比.两个数据集均按照4:1 划分训练集和测试集,Movielens 数据集和Last.FM 数据集根据数据稀疏性定义计算分别为:3.2 度量标准本文采用推荐系统的度量标准是广泛应用于评价协同过滤推荐算法的平均绝对误差(MAE),以及召回率(Recall)定义如下:1)平均绝对误差和均方根误差通过训练集计算用户的预测评分和测试集的实际真实评分之间的偏差来度量算法的推荐准确性,所以MAE 和RMSE 越小,推荐的结果越准确.2)召回率(Recall)又叫查全率,主要指通过算法可以预测出来的评分数与所有待测分数之间的比值.其中m 表示通过算法模型得到的测试集预测评分数,n 表示测试集中待测评分数.3.3 算法推荐性能比较本文提出JMSDuv 相关系数与增强信任繁殖模型构建BTUCF 算法模型,在Python3.6 环境下,为了评价推荐算法的精度,对提出的模型算法进行试验验证,在相同的实验环境下,对不同数据集首先对算法模型进行敏感性分析,然后与三种基准算法进行实验对比和分析,参照的基准算法包括了主流的基于用户的协同过滤推荐TraCF 算法[15],基于信任模型的协同过滤推荐Tru_1CF 算法[16]以及一种改进的基于信任的改进算法Tru_2CF[17]. 第一种基准对比算法是基于用户推荐的经典推荐算法,第二种基准对比算法是经典的采用构建信任网络上的局部和全局信任构建信任矩阵引入信任模块和相似度模块不同权重推荐算法,第三种基准改进算法设置了通信信任,相似信任,和传递信任三个信任度构建信任矩阵.最后为了证实本文引入用户偏好的合理性,设置了JMSDuv 相关系数与信任繁殖模型构建算法模型,即没有融合用户偏好的算法模型(以下简称BTCF 算法模型)作为另外一组对比算法进行自身对照.3.3.1 敏感性分析敏感性实验主要分析在Movielens 数据集和Last.FM 数据集下参数λ 对本文提出的BTCF 和BYUCF 推荐精度MAE 的影响,实验结果分别如图3和图4.图3 Movielens 数据集下MAE 分析图4 Last.FM 数据集下MAE 分析从图3图4中中我们可以看到JMSD 系数和融合用户偏好的信任在推荐结果中的影响力是不一样的,Movielens 数据集下λ=0.8 时取得了最好的结果.Last.FM 数据集下中λ=0.8 时取得最优结果.基于二部图的自适应性繁殖信任推荐算法其评分预测结果主要来源于两个部分:评分相似系数和偏好信任系数,当λ=0.0 时表示在算法模型中融合用户偏好的信任对最后的推荐结果起唯一作用,当λ=1.0 时表示在算法模型中JMSD 系数对最后的推荐结果起唯一作用,相比于传统信任算法推荐,比较从λ=0.0 和λ=1.0的变化,采用用户之间的评分数据其推荐质量高于采用用户之间的融合用户偏好的信任,这表明在推荐模型中,信任必须来源于用户的评分,这符合信任的定义和特点,同时也表明了本文基于融合用户偏好的信任挖掘了用户之间的潜在信任联系,提高了推荐质量. 3.3.2 性能对比分析不同数据及下本文提出的BTUCF 算法模型与基于用户的协同过滤推荐TraCF 模型,基于信任模型的协同过滤推荐Tru_1CF 算法,一种改进的基于信任的改进算法Tru_2CF 以及本文提出的没有融合用户偏好BTCF 算法对比如下:表1 Movielens 数据集最佳点推荐精度比较指标 TraCF Tru_1CF Tru_2CF BTUCF MAE 0.805 0.778 0.774 0.768 Recall 0.112 0.190 0.250 0.797表1可知Movielens 数据集下BTUCF 算法模型有较大改进,对比试验结果,在参数K=7,λ=7 时(算法最佳点)具有更低的MAE 值和更高的召回率.表2 Last.FM 数据集最佳点推荐精度比较指标 TraCF Tru_1CF Tru_2CF BTUCF MAE 0.810 0.775 0.760 0.760 Recall 0.130 0.211 0.268 0.789由表2可知Last.FM 数据集下BTUCF 算法模型在MAE 指标表现上优于传统协同过滤算法和经典信任算法,但是与对比算法一种改进的基于信任的改进算法处于相同水平,召回率表现还是更加优异,MAE 在Movielens 数据下系统更加优秀是因为推荐系统采用的是在较小邻居域表现更好的JMSD 相似系数,Last.FM 数据集相比Movielens 数据集更加稀疏推荐系统的优势被相对稀释,进一步说明了本模型对数据稀疏性的反应程度.图5、图6给出了五种算法在不同数据集和不同邻居数量下的MAE 和Recall 值,我们可以直观的发现,结合JMSD 系数的推荐模型算法与结合皮尔逊以及改进的皮尔逊算法模型有较大差异,在K 较小的区间内结合JMSD 系数的推荐模型算法具有更好的表现.这也验证了文献[17]的结论和本文引入JMSD 系数的合理性,在算法结果对比下本文提出的BTUCF 算法模型在召回率的变现上更好,同时具由较低的平均绝对误差.图5 Movielens 数据集下的MAE 对比图图6 Movielens 数据集下的Recall 对比图同时对比BTCF 算法模型和TUCF 算法模型,前者因为算法模型引入了繁殖信任融合JMSD 系数,改进算法的同时也增加了数据噪声对推荐系统的影响,引入用户偏好的BTUCF 算法模型可以缓解噪声数据的影响,使得系统在K 较小值范围能更取得更低的MAE,但是作为引入用户偏好的模型也降低了系统的召回率.参考文献【相关文献】1 刘建国,周涛,汪秉宏.个性化推荐系统的研究进展.自然科学进展,2009,19(1):1-15.2 张富国,徐升华.基于信任的电子商务推荐多样性研究.情报学报,2010,29(2):350-355.3 Guo GB.Integrating trust and similarity to ameliorate the data sparsity and cold start for recommender systems.Proceedings of the 7th ACM Conference on Recommender Systems.Hong Kong,China.2013.451-454.4 Massa P,Avesani P.Trust-aware collaborative filtering for recommendersystems.Proceedings of OTM Confederated International Conferences on the Move to Meaningful Internet Systems.Agia Napa,Cyprus.2004.492-508.5 Massa P,Avesani P.Trust-aware bootstrapping of recommender systems.Proceedings of ECAI 2006 Workshop on Recommender Systems.Amsterdam.2006.29-33.6 Jamali M,Ester M.TrustWalker:A random walk model for combining trust-based and item-based recommendation.Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Paris,France.2009.397-406.7 郭艳红,邓贵仕,雒春雨.基于信任因子的协同过滤推荐算法.计算机工程,2008,34(20):1-3.8 Ray S,Mahanti A.Improving prediction accuracy in trustaware recommender systems.Proceedings of the 2010 43rd Hawaii International Conference on System Sciences.Honolulu,HI,USA.2010.1-9.9 Moradi P,Ahmadian S.A reliability-based recommendation method to improve trust-aware recommender systems.Expert Systems with Applications,2015,42(21):7386-7398.10 Cao ZR,Tureli U,Yao YD.Deterministic multiuser carrierfrequency offset estimation for interleaved OFDMA uplink.IEEE Transactions on Communications,2004,52(9):1585-1594.11 Zhou T,Ren J,Medo M,et al.Bipartite network projection and personal recommendation.Physical Review E,2007,76(4):046115.12 王茜,段双艳.一种改进的基于二部图网络结构的推荐算法.计算机应用研究,2013,30(3):771-774.13 吴应良,姚怀栋,李成安.一种引入间接信任关系的改进协同过滤推荐算法.现代图书情报技术,2015,31(9):38-45.14 Bobadilla J,Serradilla F,Bernal J.A new collaborative filtering metric that improves the behavior of recommender systems.Knowledge-Based Systems,2010,23(6):520-528.15 Goldberg D,Nichols D,Oki BM,et ing collaborative filtering to weave an information munications of the ACM,1992,35(12):61-70.16 Massa P,Avesani P.Trust-aware recommender systems.Proceedings of 2007 ACMConference on Recommender Systems.Minneapolis,MN,USA.2007.17-24.17 郑孝遥,鲍煜,孙忠宝,等.一种基于信任的协同过滤推荐模型.计算机工程与应用,2016,52(5):50-54,56.。
基于增加相似度系数的加权二部图推荐算法
李镇东;罗琦;施力力
【期刊名称】《计算机科学》
【年(卷),期】2016(043)007
【摘要】基于二部图的推荐算法是个性化推荐领域的一个研究热点,其中,如何科学地利用用户的评分资源,在评分数据不全的情况下对目标用户进行准确高效的推荐是研究难点,也因此受到众多学者的关注.因此,提出了一种以单调饱和函数为权,利用目标用户和其他项目共同评分个数相对用户总数均值的正切值作为传统相似度系数的推荐算法;同时,对调整系数后的相似度进行降序排列,利用前K个最近邻居集对目标用户进行推荐.实验结果表明,改进后的算法提高了推荐的准确性,降低了复杂度.【总页数】6页(P259-264)
【作者】李镇东;罗琦;施力力
【作者单位】南京信息工程大学信息与控制学院江苏省气象能源利用与控制工程技术研究中心南京210044;南京信息工程大学信息与控制学院江苏省大气环境与装备技术协同创新中心南京210044
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于加权二部图匹配的中文段落相似度计算 [J], 张绍阳;曹家波;王子凡;曲卫东
2.基于加权二部图的个性化推荐算法 [J], 张新猛;蒋盛益
3.基于随机森林修正的加权二部图推荐算法 [J], 李玲;李晋宏
4.基于改进加权二部图和用户信任度的协同过滤推荐算法 [J], 邓小燕;张晓彬
5.基于加权二部图的Slope One推荐算法 [J], 王冉;徐怡;胡善忠;何明慧
因版权原因,仅展示原文概要,查看原文内容请购买。
基于改进二部图与专家信任的混合推荐算法黄熠姿;杨金鑫;孙维【期刊名称】《价值工程》【年(卷),期】2017(036)019【摘要】针对传统协同过滤算法出现的稀疏数据、用户冷启动等问题以及复杂网络结构的广泛应用,本文提出结合改进的二部图与改进的专家信任算法来提高推荐准确度.基于普通二部图算法,将用户对项目的评分作为节点之间的分配资源权重,不仅关注用户与项目之间的联系,同时体现用户对项目的喜好程度;其次,本文根据用户的评论数和与该用户对项目评分相同的数目来判断该用户的专家信任度,改进传统系统过滤算法.为了提高推荐准确度,改进缺点,我们将两者算法进行加权混合,加权因子根据实验中最小MAE值对应的权值来确定,形成混合推荐算法.最后针对基于用户的协同过滤、传统二部图以及本文提出的混合算法计算MAE值和平均Hamming距离,对比分析本文算法的推荐准确度与多样性,实验表明本文方法推荐效果较好,准确率高,个性化强,有研究和应用价值.%In view of the limitations like data sparseness, new users with little record of traditional collaborative filtering recommendation algorithm and the wide application of complex network structure, this paper argues to coalesce the recommendation algorithm based on expert trust and the modified bipartite graph recommendation algorithm. First of all, we proposed an improved recommendation algorithm based on weighted networks, not only pay attention to the connection between users and projects, but also reflect the users' preferences in projects. Secondly, the degree of expert trust isdetermined by user comments and project reviews. And in order to improve the accuracy of recommendation, we coalesce this two kinds of algorithm and give them weight. Finally, we determine the weights and calculate MAE and the average Hamming distance of the traditional collaborative filtering, the traditional bipartite graph and the hybrid recommendation algorithm through experiments, which shows that the hybrid recommendation algorithm has higher accuracy, stronger individuation, and more research and application value.【总页数】5页(P160-164)【作者】黄熠姿;杨金鑫;孙维【作者单位】东北大学工商管理学院,沈阳110169;东北大学工商管理学院,沈阳110169;东北大学工商管理学院,沈阳110169【正文语种】中文【中图分类】TP391.3【相关文献】1.改进的基于二部图网络结构的推荐算法 [J], 关雲菲2.融合信任关系和用户项目二部图的推荐算法 [J], 陈平华;杨凯3.一种改进的基于二部图网络结构的推荐算法 [J], 王茜;段双艳4.基于改进加权二部图和用户信任度的协同过滤推荐算法 [J], 邓小燕;张晓彬5.基于专家信任的协同过滤推荐算法改进研究 [J], 刘国丽; 白晓霞; 廉孟杰; 张斌因版权原因,仅展示原文概要,查看原文内容请购买。