当前位置:文档之家› 推荐系统调研报告及综述

推荐系统调研报告及综述

推荐系统调研报告及综述
推荐系统调研报告及综述

推荐系统调研报告及综述

张永锋

清华大学计算机系人工智能研究所

zhangyf07@https://www.doczj.com/doc/0415601622.html,

一、推荐系统概述

1.1 什么是推荐系统

推荐系统(Recommender System)的发展已经经历了近20年的时间,但是迄今为止仍没有人试图对推荐系统给出一个精确的定义。

广义上的推荐系统可以理解为是主动向用户推荐物品(Item)的系统,所推荐的物品可以是音乐、书籍、餐厅、活动、股票、数码产品、新闻条目等等,这依赖于具体的应用领域,推荐系统所推荐的物品或者对用户有帮助,或者用户可能感兴趣[1]。

随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐提出了更高的要求。由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统(Personalized Recommender System)应运而生[1]。目前所说的推荐系统一般指个性化推荐系统。

1.2 推荐系统的发展历史

如果追根溯源,推荐系统的初端可以追溯到函数逼近理论、信息检索、预测理论等诸多学科中的一些延伸研究。

推荐系统成为一个相对独立的研究方向一般被认为始自1994年明尼苏达大学GroupLens研究组推出的GroupLens系统[2]。该系统有两大重要贡献:一是首次提出了基于协同过滤(Collaborative Filtering)来完成推荐任务的思想,二是为推荐问题建立了一个形式化的模型(见1.4)。基于该模型的协同过滤推荐引领了之后推荐系统在今后十几年的发展方向。

GroupLens所提出的推荐算法实际上就是目前人们时常提及的基于用户的协同过滤推荐算法(User-based Collaborative Filtering Algorithms),虽然论文本身并没有使用这样一个名字。在之后的十几年中,其它一些著名的协同过滤算法逐渐被提出,主要的有基于物品的协同过滤算法(Item-based Collaborative Filtering Algorithms)[3],基于矩阵分解的协同过滤算法(SVD-based/NMF-based, etc.)等等。当然,基于其它方法而非协同过滤的推荐算法也在不断地发展,这些方法之间的互补、融合也成为一个重要的研究方向,这些会在本文第二部分(推荐方法的分类)和第三部分(典型推荐算法概述及优缺点)中详细阐述。

目前,推荐算法已经已经被广泛集成到了很多商业应用系统中,比较著名的有Netflix在线视频推荐系统、Amazon网络购物商城等。实际上,大多数的电子商务平台尤其是网络购物平台,都不同程度地集成了推荐算法,如淘宝、京东商城等。Amazon发布的数据显示,亚马逊网络书城的推荐算法为亚马逊每年贡献近三十个百分点的创收。

1.3 推荐系统的输入输出

1.3.1 推荐系统的输入数据

推荐系统可能的输入数据多种多样,但是归纳起来可以分为用户(User)、物品(Item)和评价(Review)三个层面,它们分别对应于一个矩阵中的行、列、值。

1.3.1.1 物品(Item)

用来描述一个Item的性质,也经常被称为Item Profile。根据item的不同,Item Profile也是不尽相同的。比如对于图书推荐,Item Profile有可能包括图书所属类别、作者、页数、出版时间、出版商等;对于新闻推荐,Item Profile则有可能是新闻的文本内容、关键词、时间等;而对于电影,可以是片名、时长、上映时间、主演、剧情描述等。

1.3.1.2 用户(User)

用来描述一个用户的“个性”,也就是User Profile。根据不同的应用场景以及不同的具体算法,User Profile可能有不同的表示方式。

一种直观且容易理解的表示方式与Item Profile类似,比如该用户的性别、年龄、年收入、活跃时间、所在城市等等。但是在推荐系统中,这样的profile很难集成到常见的算法中,也很难与具体的item之间建立联系(比如我们很难断定某商品一定不会被某年龄段的人喜欢,这样的判断过于粗糙),因此这种User Profile在推荐系统中虽然也经常会被使用,但是很少直接用在推荐算法中,而是用于对推荐结果进行过滤和排序。

由于在很多推荐算法中,计算User Profile和Item Profile之间的相似度是一个经常会用到的操作,另一种使用更为广泛也更有实际意义的User Profile应运而生[4]。它的结构与该系统中的Item Profile的结构一样,为了更清楚地说明其结构,我们以一种典型的构建User Profile的方法为例来进行说明:考虑该User打过分的所有Item,将这些Item的Item Profile的每一项分别进行加权平均,得到一个综合的Profile,作为该用户的User Profile。这种User Profile的优点是非常容易计算其与Item之间的相似度,同时比较准确地描述了该用户在Item上的偏好,巧妙地避开了用户私人信息这一很难获得的数据,具有保护隐私的能力,进一步,如果加入时间因素,还可以研究用户在Item上偏好的变化等等,因此受到广泛应用。

1.3.1.3 评价(Review)

评价是联系一个User与一个Item的纽带,最简单的Review是User对某一Item的打分(Rate),表示了该User对该Item的喜好程度。在常见的推荐算法中,这是一个1~5的整数。当然,用户对物品或信息的偏好,根据应用本身的不同,还可能包含很多不同的信息,比如用户对商品的评论文本、用户的查看历史记录、用户的购买记录等,这些信息总体上可以分为两类:一是显式的用户反馈,这是用户对商品或信息给出的显式反馈信息,评分、评论属于该类;另一类是隐式的用户反馈,这类一般是用户在使用网站的过程中产生的数据,它们也反映了用户对物品的喜好,比如用户查看了某物品的信息,用户在某一页面上的停留时间等等。

虽然目前大多数的推荐算法往往都是基于用户评分矩阵(the Rating Matrix)的,但是基于用户评论、用户隐式反馈数据的方法来完成推荐越来越受到人们的关注,这些方面的研究长期以来受到文本挖掘、用户数据收集等方面的难点的制约,没有得到充分的研究,但是它们在解决推荐系统的可解释性、冷启动问题等方面确实具有重要的潜力[5][6][7]。

1.3.2 推荐系统的输出数据

对于一个特定的用户,推荐系统给他的输出是一个“推荐列表”,该推荐列表按照优先级的顺序给出了对该用户可能感兴趣的物品。

对于一个实用的推荐系统而言,仅仅给出推荐列表往往是不够的,因为用户不知道为什么系统给出的推荐是合理的,进而也就不太会采纳系统给出的推荐。为了解决这个问题,推荐系统另一个重要的输出是“推荐理由”,它表述了系统为什么认为推荐该物品是合理的,如“购买了某商品的用户有90%也购买了该商品”等等。

为了解决推荐合理性的问题,推荐理由在产业界被作为一个重要的吸引用户接受推荐物品的方法,在学术届也受到越来越多的关注[9]。

1.4. 推荐问题的形式化

这里给出推荐问题一个最典型的形式化,如上所述,该形式化方法来最早自于GroupLens [2],并在[12]中做了进一步的阐述。

首先我们拥有一个大型稀疏矩阵,该矩阵的每一行表示一个User,每一列表示一个Item,每一个数值表示该User对该Item的打分,这是一个0~5的分值,0表示该User未曾对该Item 打分,1表示该User对该Item最不满意,5表示该User对该Item最满意。视具体情况,对于每一个User,可能有其对应的User Profile,对于每一个Item,可能有其对应的Item Profile,如上所述。

我们现在解决这样一个问题:给定该矩阵之后,对于某一个User,向其推荐哪些他没有打过分的Item最容易被他接受,这里的“接受”根据具体的应用环境有所不同,有可能是查看该新闻、购买该商品、收藏该网页等等。

对于推荐算法,还需要一系列的评价指标来评价推荐的效果,这些评价方法和评价指标将在第四部分具体说明。

1.5. 推荐系统的两大核心问题

有了如上的形式化描述之后,推荐系统所要解决的具体问题总体有两个,分别是预测(Prediction)和推荐(Recommendation)

“预测”所要解决的主要问题是推断每一个User对每一个Item的喜好程度,其主要手段是根据已有的信息来计算User在他没打分的Item上可能的打分,计算结果当然是越准确越好,至

于如何来描述和评价预测的准确度,将会在后面的第四部分说明。

“推荐”所要解决的主要问题是根据预测环节所计算的结果向用户推荐他没有打过分的Item。由于Item数量众多,用户不可能全部浏览一遍,因此“推荐”的核心步骤是对推荐结果的排序(Ranking)。当然,按照预测分值的高低直接排序确实是一种比较合理的方法,但是在实际系统中,Ranking要考虑的因素很多,比如用户的年龄段、用户在最近一段时间内的购买记录等,第一类User Profile往往在这个环节派上用场。

虽然人们早就意识到“预测”和“推荐”作为推荐系统的两大核心问题都具有重要的作用,但是目前绝大多数的推荐算法都把精力集中在“预测”环节上,多数论文在给出对预测效果的评估后就结束了。“推荐”作为重要的后续环节需要更多的研究,这与搜索引擎的发展非常类似。目前,推荐多样性[8]、推荐界面等很多方面的研究也在受到越来越多的关注。

二、推荐方法的分类

按照不同的分类指标,推荐系统具有很多不同的分类方法,常见的分类方法有依据推荐结果是否因人而异、依据推荐方法的不同、依据推荐模型构建方式的不同等。

2.1 依据推荐结果是否因人而异

主要分为大众化推荐和个性化推荐。大众化推荐往往与用户本身及其历史信息无关,在同样的外部条件下,不同用户获得的推荐是一样的。大众化推荐一个典型的例子是查询推荐,它往往只与当前的query有关,而很少与该用户直接相关。个性化推荐的特点则是不同的人在同样的外部条件下,也可以获得与其本身兴趣爱好、历史记录等相匹配的推荐,前面已经有所介绍,这里不再详细阐释。

2.2 依据推荐方法的不同

也就是考虑如何发现数据的相关性:大部分的推荐系统其工作原理还是基于物品或用户的相似性进行推荐,大致上可以分为如下几种:基于人口统计学的推荐(Demographic-based Recommendation)[10],基于内容的推荐(Content-Based Recommendation)[11],以及基于协同过滤的推荐(Collaborative Filtering-Based Recommendation),以及混合型推荐系统(Hybrid Recommendation)[16]。

其中基于协同过滤的推荐被研究人员研究的最多也最为深入,它又可以被分为多个子类别,分别是基于用户的推荐(User-Based Recommendation)[2],基于物品的推荐(Item-Based Recommendation)[3],基于社交网络关系的推荐(Social-Based Recommendation)[13],基于模型的推荐(Model-based Recommendation)等。

基于模型的推荐是指利用系统已有的数据,学习构建一个模型,进而利用该模型进行推荐,这里的模型可以是SVD,NMF等矩阵分解的结果[14],也可以是利用贝叶斯分类器、决策树、人工神经网络等模型转化为分类问题,或者基于Co-Clustering等聚类技术对数据进行预处理的结果[15]等等。

这些方法会在后面的第三部分加以介绍和讨论。

2.3 依据推荐模型构建方式的不同

可以分为基于用户或物品本身的启发式推荐(Heuristic-Based,又称为Memory-Based Recommendation)、基于关联规则的推荐(Association Rule Mining for Recommendation)[17],基于模型的推荐(Model-based Recommendation),以及混合型推荐系统(Hybrid Recommendation)。

三、典型推荐算法概述及优缺点

3.1 基于人口统计学的推荐(Demographic-Based Recommendation)

虽然这种方法已经很少被单独使用,但是理解这种方法的工作原理对于深入理解推荐系统有很大帮助。

Demographic-Based方法对应于之前提到的第一种User Profile,也就是每一个用户的User Profile中记录了该用户的性别、年龄、活跃时间等元数据。该方法所基于的基本假设是“一个用户有可能会喜欢与其相似的用户所喜欢的物品”。当我们需要对一个User进行个性化推荐时,利用User Profile计算其它用户与其之间的相似度,然后挑选出与其最相似的前K个用户,之后利用这些用户的购买和打分信息进行推荐。一种简单且常见的推荐方法就是将这些User所覆盖的Item作为推荐列表,并以Item在这些User上得分的平均值作为依据来进行排序,并将该排好序的推荐列表提供给用户。

这种Demographic-Based推荐方法的优点是计算简单,由于User Profile相对比较固定,因此用户相似度的计算可以线下完成,便于实现实时响应。但是它也有诸多的问题,一个主要的问题是计算可信度比较低,其根本原因在于即便是性别、年龄等属性都相同的用户,他们也很有可能在物品上有截然不同的偏好,因此这种计算用户相似度的方法并不能真正与物品之间建立联系。另一个主要的缺点在于推荐结果的可解释性不够,该方法对于推荐结果的解释方法为“与你具有相似属性的用户也购买了该物品”,但这显然难以让用户信服——我怎么知道他和我具有相似的属性?Demographic-Based方法是一种非协同过滤式的方法,但是它与后面基于内容的推荐(User-Based)这一协同过滤方法很相似,将在后面介绍。

3.2 基于内容的推荐(Content-Based Recommendation)

前面基于人口统计学的推荐对应于第一种User Profile,而基于内容的推荐则对应于第二种User Profile。Content-Based方法所基于的基本假设是“一个用户可能会喜欢和他曾经喜欢过的物品相似的物品”。这里“曾经喜欢过的物品”就是利用该用户的历史记录计算出来的Profile,作为该用户的User Profile来使用。

典型的Content-Based方法的第一步是构建User Profile,一种较为简单的构建方法是:考虑该User曾经打过分的所有Item,将这些Item的Item Profile做一个加权平均,作为该User的User Profile。当然,构建User Profile的策略可以很复杂,比如可以考虑时间因素,计算User在不同时间段内的Profile,从而了解User在历史数据上所表现出来的偏好的变化等等。有了User Profile 之后,我们就可以开始推荐了,最简单的推荐策略就是计算所有该用户未尝试过的Item与该用

户的User Profile之间的相似度,并按照相似度由大到小的顺序生成推荐列表,作为结果输出。当然,推荐策略也可以很复杂,比如在数据源上考虑本次用户交互过程中所收集到的即时交互数据来决定排序,在模型上使用决策树、人工神经网络等等,但是这些方法最核心的环节都是利用User Profile和Item Profile之间的相似度计算。

其实在很多Content-Based的推荐算法中,并不把User Profile显式地计算出来,而是利用User打过分的Item,直接计算推荐列表,一种直观的方法是:对于一个该User未尝试过的Item,计算它与该User尝试过的所有Item之间的相似度,并将这些相似度根据User的打分进行加权平均。这本质上也是Content-Based方法,只是绕过了计算User Profile的环节。实际上,很多具体的应用表明,绕过User Profile的计算,直接利用Item Profile计算相似度,往往更灵活,推荐效果更好,因为在计算User Profile的过程中,一些有用的信息被丢掉以至于无法在后面的环节中被利用。

Content-Based方法也是一种非协同过滤式的方法,同样,它与后面Item-Based这种协同过滤式的方法很相似,后面将做具体介绍。

Content-Based方法的优点主要有:对新加入的物品没有冷启动(Cold-Start)的问题,因为只要有该物品的Item Profile,就可以直接计算它与其它Item之间的相似度,不受打分数据稀疏的限制;推荐结果具有较好的可解释性,一种显然的推荐理由是“该物品与你之前曾经喜欢过的某物品相似”。

但是Content-Based方法也有一些缺点,首先是系统需要复杂的模块甚至手工来预处理物品信息以得到能够代表它们的特征,然后受信息获取技术的制约、处理对象的复杂性高等因素,这样工作难以达到较好的效果;其次,这种方法无法用户并不熟悉但是具有潜在兴趣的物品,因为该方法总是倾向于向用户推荐与其历史数据相似的物品;另外就是可扩展性不好,需要针对不同的领域构建几乎完全不同的Profile,针对一个数据集合训练的模型未必适合其它的数据集合,并且随着新物品的加入,模型的可用性也值得商榷。

3.3 基于协同过滤的推荐(Collaborative Filtering-Based Recommendation)

是指收集用户过去的行为以获得其对产品的显式或隐式信息,即根据用户对物品或者信息的偏好,发现物品或者内容本身的相关性、或用户的相关性,然后再基于这些关联性进行推荐。根据前文所述,基于协同过滤的推荐可以分基于用户的推荐(User-based Recommendation),基于物品的推荐(Item-based Recommendation),基于模型的推荐(Model-based Recommendation)等子类。用户对物品的喜好或评分矩阵往往是一个很大的稀疏矩阵,为了减少计算量,可采用对物品或用户进行聚类(Clustering items for Collaborative Filtering)[18]。

3.3.1 memory-based推荐

User-Based方法和Item-Based方法都属于memory-based方法类别,即基于系统中的历史记录(如所有被打过分的物品)进行预测。

3.3.1.1 基于用户的推荐(User-Based Recommendation)

User-Based方法是最早的一种基于协同过滤的推荐算法[2],它所基于的基本假设与Demographic方法类似,也是“用户可能会喜欢和他具有相似爱好的用户所喜欢的物品”,与之不同的是,这里的“相似用户”,不是用User Profile计算出来的,而是用用户的打分历史记录计算出来的。这里的基本想法是,具有相似偏好的用户,他们在所有Item上的打分情况(哪些打了份,哪些没打分;打分的分值是多少等)也是相似的。

User-Based推荐方法的第一步是执行最近邻搜索,我们把每一个User看成一个行向量,对于一个User,我们计算其它所有的User行向量与他的相似度。这里的相似度计算有很多不同的指标,比如Pearson相关性系数、余弦相似度等,这些指标及其比较将在后面第五部分给出。当我们拥有了每一个用户与该User的打分相似度之后,就可以执行预测和推荐了,最常见的方法是选取与该用户相似度最高的前K个用户,用这K个用户的打分情况对该User的打分进行预测,进而进行推荐。

最常见也最简单的推荐方法有两种,分别为Top-N推荐和关联推荐。Top-N推荐是统计在这前K个用户中,统计出现频率最高且在目标用户的向量中未出现的物品,将这些物品构建成推荐列表作为输出。关联推荐的基本思想是,利用这前K个用户的购买或打分记录进行关联规则挖掘,利用挖掘出的关联规则,结合目标用户的购买记录完成推荐,典型的推荐结果就是我们常见的“购买了某物品的用户还购买了什么物品”。

在User-Based方法中,“个性化”的体现方式是对于不同的User,其最近邻是不同的,进而得到的推荐列表也不一样;“协同过滤”的体现方式是,对一个用户进行推荐时,使用其它用户在物品上的观点来寻找和他相似的用户,这是与Demographic方法不同的地方。

User-Based方法的优点在于,在数据集完善、内容丰富的条件下,能够获得较高的准确率,而且能够避开物品Item Profile上的挖掘进行推荐,能够对物品的关联性、用户的偏好进行隐式透明的挖掘。

其缺点在于,随着系统用户数量的增大,计算Top-K Relevance User的时间会显著增长,使得该方法难以胜任用户量变化巨大的系统,限制了系统的可扩展性。另外新用户的问题也是User-Based方法难以处理的问题:当新用户加入系统时,由于他的打分历史记录很少,难以准确计算真正与之对应的Top-K Relevance User,这也进一步引出数据稀疏性的问题对系统可扩展性的限制。

3.3.1.2 基于物品的推荐(Item-Based Recommendation)

鉴于User-Based协同过滤方法随着用户数增加,计算时间显著增长,Sarwar等人在WWW 2001上提出了基于物品的推荐[3],Item-Based方法是亚马逊网络商城的专利算法,目前也是亚马逊网络商城推荐系统的底层核心算法。Item-Based方法所基于的基本假设与Content-Based方法类似,也就是“用户可能会喜欢与他之前曾经喜欢的物品相似的物品”。比如喜欢《长尾理论》的人,也很有可能去看《世界是平的》。与Content-Based方法不同的是,这里的“相似物品”不是通过Item Profile来计算的,而是通过物品被打分的历史记录来计算的。

Item-Based推荐方法的第一步与User-Based一样,也是执行最近邻搜索,我们把每一个Item 看成一个列向量,对于一个Item,我们计算其它所有的Item列向量与它的相似度。有了Item之

间的两两相似度之后,就可以进行预测和推荐了。

最简单的线上推荐是,当用户购买了某一商品后,直接向其推荐与该物品相似度最高的前K 个商品。稍微复杂一点的推荐方法考虑了该用户所有的打分历史记录[3]:对于一个User行向量中的0值(用户未购买的物品),我们需要去预测该用户在该物品(记为I)上可能的打分,预测方法是,考虑所有该用户已经打过分的Item,以它们与I的相似度为权重,对它们的分值进行加权平均,作为对I的预测打分,最终以预测打分的高低为顺序给出推荐列表。

Item-Based方法总体上来说是一种启发式的方法(Heuristic-Based),对目标的拟合能力是有限的,但是当把多个启发式方法结果(以及其他的特征)结合起来,也可以有很好的拟合能力[3]。

Item-Based方法的优点主要有以下几点:一是计算简单,容易实现实时响应,由于在常见的系统中,Item被打分的变化剧烈程度要比User低得多,因此Item相似度的计算一般可以采用离线完成、定期更新的方式,从而减少了线上计算,实现实时响应,提高效率,尤其对于用户数远大于商品数的情况下效果更加显著,比如用户新添加了几个感兴趣的商品之后,可以立即给出新的推荐;二是可解释性好,用户可能不了解其他人的购物情况,但是对自己的购物历史总是很清楚的,另外用户总是希望自己有最后的决定权,如果系统推荐的商品不满意,需要有办法让用户改进它,Item-based方法很容易让用户理解为什么推荐了某个商品,并且当用户在兴趣列表里添加或删除商品时,可以调整系统的推荐结果,这也是其他方法最难做到的一点。

Item-Based方法的缺点主要有:以物品为基础的系统过滤较少考虑用户之间的差别,因此精度较User-Based方法稍微逊色一点;另外还有许多其它的问题有待解决,最典型的就是数据稀疏性(Sparsity)和冷启动(Cold-Start)的问题,对于Cold-Start问题的解决,目前有了最新的进展,SIGIR2011的一篇论文[19]对此进行了深入的讨论。

3.3.1.3 User-Based vs Item-Based

这里将对User-Based和Item-Based两种最基本的协同过滤方法进行对比:

计算复杂性:User-Based是最早的协同过滤方法,如前所述,在1994年的论文[2]中被提出,当时还没有User-Based和Item-Based的概念,人们很自然地首先想到了基于User的方法。Item-Based方法是从Amazon 的论文和专利发表之后(2001 年)开始流行的,且它被提出的一个主要背景就是解决User-Based方法在线计算量大,难以实时响应的问题。对于一个用户数量大大超过物品数量而物品数据相对稳定的应用,往往Item-Based方法从性能和复杂度上都比User-Based方法更优,这是因为计算物品的相似度不但计算量较小,而且不必频繁更新;而对于诸如新闻,博客或者微内容等物品数量巨大且更新频繁的应用中,User-Based方法往往更具优势,推荐系统的设计者需要根据自己应用的特点选择更加合适的算法。

适用场景:在非社交网络的网站中,内容内在的联系是很重要的推荐原则,它比基于相似用户的推荐原则更加有效。比如在购书网站上,当用户看一本书的时候,推荐引擎会给用户推荐与其相关的书籍,这个推荐的重要性远远超过了网站首页对该用户的综合推荐。可以看到,在这种情况下,Item-Based的方法成为了引导用户浏览的重要手段。同时Item-Based方法便于为推荐做出解释,在一个非社交网络的网站中,如果给某个用户推荐一本书时给出的解释是某个和你有相似兴趣的人也看了这本书,是很难让用户信服的,因为用户可能根本不认识那个人;但如果解

释为这本书和你以前看的某本书相似,用户就更有可能会觉得而采纳该推荐。相反,在社交网站中,User-Based方法,以及基于User Network和Influence Network的User-Based方法,则是更不错的选择,因为User-Based方法加上社会网络信息,可以大大增加用户对推荐解释的信服度。

推荐多样性和精度:研究人员在相同的数据集合上分别用User-Based和Item-Based方法计算推荐结果,发现在得到的推荐列表中,只有约50%是一样的,还有约50%完全不同,但是这两个算法却有相似的精度,可以说这两个算法是很互补的。关于推荐的多样性,有两种度量方法:一是从单个用户的角度来看,就是说给定一个用户,查看系统给出的推荐列表是否多样,也就是比较推荐列表中的物品之间两两的相似度。对于这种度量方法,Item-Based的多样性显然不如User-Based好,因为Item-Based推荐本身就是和该用户的历史记录最相似的;第二种度量方法是考虑系统的多样性,也就是覆盖率(Coverage,有的论文也称召回率),它是指一个推荐系统是否能够提供给所有用户丰富的选择(从整个系统的角度来看)。在这种指标下,Item-Based方法的多样性要远远好于User-Based方法,因为User-Based方法总是倾向于推荐热门的物品,而从Item-Based方法有较好的新颖性,擅长推荐长尾里的物品(只要有那么一些用户,它同时购买了两个冷门的物品,这两个冷门物品之间就有较高的相似度)。所以,尽管大多数情况下Item-Based 方法的精度略小于User-Based,但如果考虑多样性,Item-Based却比User-Based好很多。

用户对推荐算法的适应度:User-Based方法推荐的原则是假设用户会喜欢那些和他有相同喜好的用户所喜欢的东西,但如果一个用户没有相同喜好的朋友,那么User-Based算法的效果就会比较差,所以一个用户对的User-Based算法的适应度和他有多少共同喜好用户正相关;Item-Based方法的基本假设是用户会喜欢和他以前喜欢的东西相似的东西,我们可以计算一个用户所喜欢的物品的自相似度,一个用户喜欢物品的自相似度大,就说明他的偏好相对比较单一、稳定,也就是说他比较符合Item-Based方法的基本假设,那么他对Item-Based方法的适应度就比较好,相反,如果自相似度小,就说明这个用户的偏好并不单一,那么Item-Based方法对他做出好的推荐的可能性就比较低,这种情况下,一般用对该用户所喜欢的物品进行聚类进而进行分层推荐的方法来解决。

在一个综合的推荐系统中,一般很少只用一种推荐策略,考虑到User-Based和Item-Based 方法的互补性,很多推荐系统将两者结合起来作为系统的基础推荐算法。

3.3.2. 基于模型的推荐(Model-Based Recommendation)

User-Based或Item-Based方法共有的缺点是资料稀疏,难以处理大数据量下的即时结果,因此发展出以模型为基础的协同过滤技术:先用历史数据训练得到一个模型,再用此模型进行预测。

以模型为基础的协同过滤广泛使用的技术包括Latent Semantic Indexing、Bayesian Networks 等,收集打分数据进行分析和学习并推断出用户行为模型,进而对某个产品进行预测打分(e.g.

以Item Profile和User Profile中的各个特征的得分为输入,用户打分为输出,作为一个函数,用拟合或回归的方法来学习出一个模型,或者将打分作为类别转化为一个多分类器的问题等等)。这种方式不是基于一些启发规则进行预测计算,而是对于已有数据应用统计和机器学习得到的模型进行预测。

这种方法的优点在于快速相应:只要训练出了模型,就可以对新用户或新物品进行实时快速计算,其问题在于如何将用户实时或者近期新增的喜好信息反馈给训练好的模型,从而提高推荐的准确度,也就是模型的增量训练问题。

3.3.3 混合型推荐方法(Hybrid-Based Recommendation)

混合推荐系统是推荐系统的另一个研究热点,它是指将多种推荐技术进行混合相互弥补缺点,从而可以获得更好的推荐效果。最常见的是将协同过滤技术和其他技术相结合,以克服Cold-Start的问题。常见的混合方法有如下几种[20]:

加权融合(Weighted):就是将多种推荐技术的计算结果加权混合产生推荐,最简单的方式是基于感知器的线性混合,首先将协同过滤的推荐结果和基于内容的推荐结果赋予相同的权重值,然后比较用户对物品的评价与系统的预测是否相符,进而不断调整权值。

切换(Switch):根据问题背景和实际情况采用不同的推荐技术。比如,使用基于内容推荐和协同过滤混合的方式,系统首先使用基于内容的推荐技术,如果它不能产生高可信度的推荐,然后再尝试使用协同过滤技术。因为需要各种情况比较转换标准,所以这种方法会增加算法的复杂度和参数化,当然这样做的好处是对各种推荐技术的优点和弱点比较敏感。

混合(Mix):将多种不同的推荐算法推荐出来的结果混合在一起,其难点是如何重排序。

特征组合(Feature Combination):将来自不同推荐数据源的特征组合起来,由另一种推荐技术采用。一般会将协同过滤的信息作为增加的特征向量,然后在这增加的数据集上采用基于内容的推荐技术。特征组合的混合方式使得系统不再仅仅考虑协同过滤的数据源,所以它降低了用户对物品评分数量的敏感度,相反,它允许系统拥有物品的内部相似信息,其对协同系统是不透明的。

级联型(Cascade):用后一个推荐方法优化前一个推荐方法。它是一个分阶段的过程,首先用一种推荐技术产生一个较为粗略的候选结果,在此基础上使用第二种推荐技术对其作出进一步精确地推荐。级联型允许系统对某些项避免在后面低优先级的推荐器中被过滤掉,这些项可能是通过第一种推荐技术被较好的予以区分了的,或者是很少被用户评价从来都不会被推荐的物品。因为级联型的第二步,仅仅是集中在需要另外判断的项上。

特征递增(Feature Augmentation):前一个推荐方法的输出作为后一个推荐方法的输入,它与级联型的不同之处在于,这种方法上一级产生的并不是直接的推荐结果,而是为下一级的推荐提供某些特征。一个典型的例子是将聚类分析环节作为关联规则挖掘环节的预处理:聚类所提供的类别特征,被用于关联规则挖掘中,比如对每个聚类分别进行关联规则挖掘。

元层次混合(Meta-level hybrid):将不同的推荐模型在模型层面上进行深度的融合,而不仅仅是把一个输出结果作为另一个的输入。比如,User-Based方法和Item-Based方法的一种组合方式是,先求目标物品的相似物品集,然后删掉所有其它的物品(在矩阵中对应的是列向量),在目标物品的相似物品集上采用User-Based协同过滤算法。这种基于相似物品的邻居用户协同推荐方法,能很好地处理用户多兴趣下的个性化推荐问题,尤其是候选推荐物品的内容属性相差很大

的时候,该方法性能会更好。

四、推荐系统的评价方法和指标

4.1 评价方法

总体来讲,评估推荐系统的实验方法有三种,分别是离线评测、在线评测和用户调研。

离线评测通过把数据集分成训练集和测试集,在训练集上学习和调整模型参数,在测试集

上进行测试,计算精确度、运行效率等指标,达到评测的目的。这种方法实施简单方便,只需要收集数据,不需要与用户的交互。但能说明的问题较少,比如不能评估出推荐系统对用户行为的影响。这种方法一般用以衡量推荐算法在预测环节中的能力,淘汰掉预测不准确的算法。离线评测的具体评价指标在后面介绍。

推荐系统的实际效果依赖于多种因素,如用户意图、用户背景知识、对系统的熟悉度、信

任度、用户界面等,这些因素在离线评中不易重现,需要线上评测来完成,一般线上评测可以使用AB test的方法。

线上评测和用户调研的方法在人机交互领域对推荐系统的研究中比较常用。

4.2 评价指标

所谓评价指标主要包括“技术评价指标”和“业务指标”。技术评价指标包括诸如RMSE、NDCG、MAP、Recall、Precision等,业务指标如成交转化率、用户点击率等,这里主要对技术评价指标进行总结概括[21]。

一个比较有意思的事情是,Hulu在实验报告“Do clicks measure recommendation relevancy”中讨论了点击率是否适用于评测推荐系统,报告认为在搜索领域被广泛认可或验证了的Position Bias假设(排在靠前位置的搜索结果得到的点击会比靠后位置的结果多得多)并不适用于推荐系统,他们的实验表明推荐产品的排列位置对点击影响甚微,因此在以NDCG为指标的离线测评

中性能好的算法,在在线测评中点击率有可能反而比较低。

目前评估推荐系统的指标可分为“准确度(accuracy)”与“可用性(usefulness)”两种。其中准确度衡量的是推荐系统的预测结果与用户行为之间的误差,还可以再细分为“预测准确度(Prediction Accuracy)”和“决策支持准确度(Decision-Support Accuracy)”。而预测准确度

又可分为“评分预测准确度”、“使用预测准确度”、“排序准确度”等,以MAE、NMAE、RMSE、ARMSE等为常用的统计指标,计算推荐系统对消费者喜好的预测与消费者实际的喜好间的误差平均值;而决策支持准确度则以Correlation(关联度,包括:Pearson、Spearman、Kendall Tau等)、Reversal Rate 、Precision、Recall、F-measure、ROC curve(Receiver Operating Characteristic)、SwetA指标(曲线下面积比例)、AVS(Average Ranking Score,平均排序分)等为主要工具。

4.2.1 评分预测准确度(Ratings Prediction Accuracy)

RMSE(Root Mean Squared Error,根均方差)是最流行的度量,预测的是用户对每个商品感兴趣的程度,优化RMSE,实际上就是要预测用户对每个商品的评分。

比如Netflix Prize 竞赛,就是以RMSE为度量,竞赛者比Netflix公司之前使用的推荐系统CineMatch 低百分之十,就可获得百万大奖(团队BPC,BellKor's Pragmatic Chaos获奖)。

另一个比较常用的度量是MAE(Mean Absolute Error,平均绝对误差)

两者相比,RMSE对大误差比较敏感。

与之类似的有NMRSE(Normalized RMSE)和NMAE(Normalized MAE):两者的归一化版本,例如可以除以MaxRate-MinRate进行归一化。针对物品或用户在测试集中分布不均的情况可以使用Average RMSE和Average MAE,例如对于物品分布不均时,单独计算每个物品的RMSE然后再平均;对于用户分布不均时单独计算每个用户的RMSE然后再平均。

RMSE、MAE仅度量误差幅度,容易理解且计算方式也不复杂,但其缺点也正是失之于简单,过度简化事实,在有些场合可能不能说明问题。例如用户打分1、2的差别和打分4、5的差别都是1,但意义不一样。在这种情况下可以定义适当的扭曲程度度量distortion measure d来代替差值以改进度量度量方法。

与之类似的还有MAP(平均准确率,Mean Average Precision),评估用户期望的相关结果是否尽可能排在前面。MAP是信息检索中解决PRF指标的不足而提出的,单个主题的平均准确率是每篇相关文档检索出后的准确率的平均值,主集合的平均准确率(MAP)是每个主题的平均准确率的平均值。MAP是反映系统在全部相关文档上性能的单值指标。系统检索出来的相关文档越靠前(rank 越高),MAP就可能越高。

4.2.2 使用预测准确度(Usage Prediction)

对评分类的应用可以使用Reversal Rate:首先选择High 和Low 两个基准数值,然后比较推荐预测与消费者所给的评分,如果消费者的评分大过High 这个参考基准,但是推荐系统的预测是小于Low ,我们叫这种情况是High Reversal ;反之,则称这种情况为Low Reversal 。计算Reversal Rate 可以反映这个系统产生的预测的准确程度。

而对于选择类的应用,可以使用源自信息检索(Information Retrieval)中的Precision-Recall。评分类的应用也可将评分按某阈值分为“选择”与“不选择”后应用此度量方法。

对于推荐数量预定的场合可使用P@N(Precision at N)度量,而推荐数量未指定的使用PR 曲线或ROC曲线,描述的是喜好的物品被推荐的比例。其中PR(Precision-Recall)曲线强调推

荐的物品有多少是喜好的,ROC(Receiver Operating Characteristic)曲线则强调有多少不喜好的物品却被推荐的。与其对应的曲线有AUC(Area Under the ROC Curve)等(AUC越大,表示系统能够推荐出越多的好的物品)。

已经有研究人员验证,大部分状况下计算ROC和Precision-Recall时,会得到相同的Confusion Matrix,而且从其中一个曲线可以推演出另外一种曲线的状况。不过PR曲线比较适合于数据分布高度不平均(highly-skewed)的情况,因此在实际应用中要根据推荐系统选择相应的评估方式。

4.2.3 可用性(Usefulness)

推荐系统的预测准确度当然是评估的重要指标,但是“准确度”不是唯一的标准。推荐系统的可用性一般用覆盖率(召回率)来描述,包括用户覆盖率和物品覆盖率。为了描述推荐效果的多样性(Diversity),也经常采用Gini Index或Shannon Entroy等常见的指标,这里不再详述。

除此之外,推荐系统也考虑很多其它的可用性指标,这些指标对于推荐系统的用户体验具有重要的意义。主要有:新颖性novelty,惊奇性Serendipity,实用性Utility,风险Risk,鲁棒性Robustness,隐私性privacy,自适应性Adaptivity(例如item的时效性等),可扩展性Scalability,推荐效率Efficiency,可解释性Explanation等等。

五、典型商业推荐系统浅析

5.1 典型的实用推荐系统

电子商务领域:

Amazon、eBay、淘宝、dangdang、京东商城等

百分点科技为别人做推荐系统

网页标签:

Fab、https://www.doczj.com/doc/0415601622.html,、Foxtrot等

新闻与阅读:

GroupLens、PHOAKS、Zite、Flipboard、Trap.it等

国内:指阅、牛赞网、无觅网(专门为各大博客和论坛提供相似文章推荐的网站)等

电影:

MovieLens、Moviefinder、Netflix、Hulu、豆瓣、猜道等;

国内的一些影视类网站大都有自己的推荐系统,比如奇艺,优酷,土豆等;

音乐:

Pandora、Ringo、CDNOW、last.fm、豆瓣电台、新浪音乐等;

5.2 Amazon商用推荐系统调研

在amazon的商城系统中多处应用了推荐算法,例如:

今日推荐(Today's Recommendation For You):通常是根据用户的近期的历史购买或者查看记录,并结合时下流行的物品给出一个折中的推荐。

新产品的推荐(New For You):采用了基于内容的推荐机制(Content-based Recommendation),将一些新到物品推荐给用户。在方法选择上由于新物品没有大量的用户喜好信息,所以基于内容的推荐能很好的解决这个“冷启动”的问题。

捆绑销售(Frequently Bought Together):采用数据挖掘技术对用户的购买行为进行分析,找到经常被一起或同一个人购买的物品集,进行捆绑销售,这是一种典型的基于物品的协同过滤推荐机制。

别人购买/浏览的商品(Customers Who Bought/See This Item Also Bought/See):这也是一个典型的基于物品的协同过滤推荐的应用,通过社会化机制用户能更快更方便的找到自己感兴趣的物品。

Amazon在做推荐时,设计和用户体验也做得特别独到:Amazon利用有它大量历史数据的优势,量化推荐原因;基于社会化的推荐,Amazon会给你事实的数据,让用户信服,例如:购买此物品的用户百分之多少也购买了那个物品;基于物品本身的推荐,Amazon也会列出推荐的理由,例如:因为你的购物框中有XX,或者因为你购买过XX,所以给你推荐类似的XX;Amazon 很多推荐是基于用户的Profile计算出来的,用户的Profile中记录了用户在Amazon上的行为,包括看了那些物品,买了那些物品,收藏夹和wish list里的物品等等;Amazon 里还集成了评分等其他的用户反馈的方式,它们都是Profile的一部分;Amazon提供了让用户自主管理自己Profile 的功能,通过这种方式用户可以更明确的告诉推荐引擎他的品味和意图是什么。

据VentureBeat统计,Amazon的推荐系统为其提供了35%的销售额。另外,亚马逊早期推荐系统的主要贡献者Greg Linden 在博文《YouTube uses Amazon's recommendation algorithm》中讨论了YouTube在RecSys2010上的一篇论文,该文报告YouTube的推荐算法主要采用Item-based方法和Ranking方法。

六、推荐系统目前面临的问题

6.1 数据稀疏性Data Sparsity

表现在:冷启动问题,新物品问题、新用户问题等;Reduced Coverage问题,rating相对于item来说太少了;Neighbour Transitivity Problem,因为数据量过小,没有用户对相同的item进行过评价,因此没法计算他们之间的相似性(例如在电影推荐系统中,有很多电影只被小部分用户评级,而且这些电影会很少被推荐,即使那小部分用户给予很高评级。同样,对于那些有着不同品味的小众群体,找不到相同特定同口味的用户,也导致较差的推荐结果了)。

解决方法:降维技术(Dimensionality Reduction),通过奇异值分解(SVD, Singular Value Decomposition)来降低稀疏矩阵的维度,为原始矩阵求的最好的低维近似,但是存在大数据量运算成本及对效果的影响等问题(因为经过了SVD变化之后,一些insignificant用户或者物品被扔掉了,对这类用户或者物品的推荐效果就要打折扣,小众群体的存在体现不出来);使用Hybrid

方法,混合使用多种推荐方法能弥补其中某种方法的问题,弥补其造成的冷启动问题;Demographic filtering,解决数据稀疏性问题的另一种方法是通过使用用户资料信息来计算用户相似度,也就是两个用户会被认为相似不只单在相同的电影评级类似,而且也有可能属于同一个人口统计区块(demographic),比如用户的性别、年龄、居住地、教育情况、工作信息等,这样的做法会降低推荐精度,但是在数据非常稀疏的情况下也可以考虑使用。

6.2 同义词问题Synonymy

问题表现为推荐系统中同一类物品有时被归为不同的名字(这也进一步导致了数据稀疏性),解决方法可以有同义词挖掘、利用SVD进行语义分析等。

6.3 Gray Sheep问题

问题表现为有些人的偏好与任何人都不同(Black Sheep是那些偏好与正常人完全相反,根本没有办法向他们推荐的人群,因为在现实中也很难解决这个问题,因此这一般被认为是acceptable failure)。一般采用Hybrid(结合Content-based和CF)方法解决该问题。

6.4 Shilling Attack

实际上是AntiSpam的问题,有些人对于自己的东西或者对自己有利的东西打高分,竞争对手的东西打低分,这会影响协同过滤算法的正常工作。被动的解决办法可以是采用Item-Based (在shilling attack这个问题上,Item-based的效果要比User-based的效果好,因为作弊者总是较少数,在计算Item相似度的时候影响较小),Hybrid(hybrid方法能够在部分的解决bias injection problem);主动的解决办法是采用AntiSpam的技术识别和去除作弊者的影响。

6.5 其它一些问题和挑战

隐私问题、噪声问题、解释性问题、合理性、新颖性、对推荐系统的第二个核心问题recommendation的研究等等。

七、推荐系统潜在的发展方向

7.1 基于User Reivew的推荐

长期以来,推荐系统的各种算法和研究都是基于[2]所提出的形式化模型,均以用户打分为基础,少有基于用户评论语料的研究。基于User Review的个性化推荐被很多论文提到,但是研究并不深入,这一方面限于Text Mining和Sentiment Analysis 方面的研究遇到很多难点,另一方面限于之前网络上所积累的Review 信息还不够多。

2006年WI的一篇论文[22]首次尝试利用用户评论文本语料来进行推荐,但是其系统更像是一个检索系统而非推荐系统(从评论文本中手工挖掘Item的属性,构建Item Profile,当用户查询他所关心的Feature时,推荐在这些Feature上表现比较好的Item)。2007年,同样是该论文的作者在推荐系统的核心期刊Recommender Systems上发文,将手工挖掘Item属性的步骤实现了自动完成,其它环节未作改变。User Comment的文本挖掘及情感分析技术在个性化推荐系统中的

应用尚有很多工作要做。

7.2 可解释性

推荐系统作为人工智能领域的一个重要产品,要想受到广泛接受和应用,最核心的是要提高推荐结果的合理性,也就要求推荐结果具有较好的可解释性,虽然这一点人们早就意识到,但是针对可解释性的专门研究还很欠缺[9],当前的研究中,对推荐算法可解释性讨论一般是算法评估之后的选作环节。随着用户要求的提高,“推荐理由”的研究在产业界和学术界都受到越来越高的重视。

7.3 用户交互

一些研究表明,即便是同样的打分和评价系统,如果展示给用户的方式不同,也会对用户的使用、评价、效果产生一定的影响。比如MovieLens小组的论文[27]第一次研究了用户打分区间、连续打分还是离散(如星标)打分、推荐系统主动欺骗等对用户使用推荐系统造成的影响。向搜索引擎一样,推荐系统的界面设计和交互方式也越来越受到研究人员的关注。

7.4 长尾效应

一个推荐系统的好坏不能直接以预测评分的精确度来测量,而应该以用户的满意度来考虑。推荐系统应该以“发现Discovery”为核心终极目标。而现在存在的一些推荐技术通常会倾向于推荐流行度很高的,用户已经知道的Item。这样,存在长尾中的Item也就不能很好的推荐给相应的用户。但是,这些长尾中的Item通常也标注了用户的兴趣偏好。所以,在推荐系统的设计过程中,不仅要考虑预测的精度,而且还要考虑用户真正的兴趣点在哪里。

最近,有很多人也开始考虑长尾在推荐系统设计过程中的应用,开始考虑怎样将长尾中的Item推荐给用户。根据[24],可以将Item聚类成几个small cluster,然后对每个cluster中的item 运用协同过滤。利用这一思想,在文章[25]中,作者将Item分成head和tail两部分,而针对tail 中的Item,作者提出了Clustered Tail算法来做推荐。另外[26]利用Diffusion理论来解决推荐问题。

参考文献

[1] G. Adomavicius, “Towards the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions”, IEEE Transactions on Knowledge and Data Engineering, 2005.

[2] P. Resnick, N. Iacovou, etc. “GroupLens: An Open Architecture for Collaborative Filtering of Netnews”, Proceedings of ACM Conference on Computer Supported Cooperative Work, CSCW 1994. pp.175-186.

[3] B. Sarwar, G. Karypis, J. Konstan, J. Riedl, “Item-Based Collaborative Filtering Recommendation Algorithms”, Proceeding of the 10th international conference on World Wide Web, WWW 2001.

[4] K. Sugiyama, K. Hatano, M. Yoshikawa, Adaptive Web Search based on User Profile Constructed without Any Effort from Users. Proceeding of the 13th international conference on World Wide Web, WWW 2004.

[5] R. Wietsma, F. Ricci, “Product Review in Mobile Decision Aid Systems”, Proceeding of Workshop

Pervasive Mobile Interaction Devices. Pervasive 2005.

[6] F. Ricci, R. Wietsma, “Product Reviews in Travel Decision Making”, Information and Communication Technologies in Tourism: Proc. Int’I Conf.

[7] S. Aciar, D. Zhang, S. Simoff, J. Debeham. Informed Recommender: Basing Recommendations on Consumer Product Reviews. Recommender Systems. 2007.

[8] C Ziegler, S. M. McNee, etc. Improving Recommendation List Through Topic Diversification. Proceeding of the 15th international conference on World Wide Web. WWW 2005.

[9] N. Tintarev, J. Masthoff, A Survey of Explanations in Recommender Systems, Proceedings of the 2000 ACM conference on Computer supported cooperative work, CSCW 2000.

[10] M. J. Pazzani, “A framework for Collaborative, Content-Based and Demographic Filtering”, Artificial Intelligence Review, Springer, 1999

[11] A. Gunawardana, G. Shani, A Survey of Accuracy Evaluation Metrics of Recommendation Tasks. Journal of Machine Learning, Volume 10, pp.2935-2962

[12] J. L. Herlocker, J. A. Konstan, Al Borchers, J. Riedl, An algorithmic framework for performing collaborative filtering, Proceedings of the 22nd international SIGIR conference on Research and development in information retrieval, SIGIR 1999.

[13] H. Kautz, B. Selman, M. Shah, Referral Web: combining social networks and collaborative filtering, Communications of the ACM, Volume 40 Issue 2, March 1997

[14] B. M. Sarwar, G. Karypis, etc, Application of Dimensionality Reduction in Recommender System – A Case Study, DTIC Document, 2000

[15] T. George, S. Merugu, A Scalable Collaborative Filtering Framework based on Co-clustering, Proceedings of the Fifth IEEE International Conference on Data Mining, ICDM 2005

[16] P. Melville, R. J. Mooney, R. Nagarajan, Content-Boosted Collaborative Filtering for Improved Recommendations, Proceedings of American Association for Artificial Intelligence, AAAI 2002 [17] B. M. Sarwar, G. Karypis, J. Konstan, J. Riedl, Analysis of Recommendation Algorithms for E-Commerce, Proceedings of the 2nd ACM conference on Electronic commerce, ACM EC 2000 [18] M. O’Cornor, Jon Herlocker, Clustering Items for Collaborative Filtering, Proceedings of the ACM SIGIR Workshop, SIGIR 1999

[19] K. Zhou, S. Yang, H. Zha, Functional Matrix Factorizations for Cold-Start Recommendation, Proceedings of the 34th Annual International ACM SIGIR Conference, SIGIR 2011

[20] B. Burke, Hybrid Recommender Systems: Survey and Experiments, User Modeling and User-Adapted Interaction, 12: 331-370, 2002

[21] 刘建国,周涛等,个性化推荐系统评价方法综述,复杂系统与复杂性科学第6卷第3期,2009

[22] S. Aciar, D. Zhang, S. Simoff, J. Debenham,Recommender System Based on Consumer Product Reviews, Proceedings of the 2006 IEEE/WIC/ACM International Conference on Web Intelligence, WI 2006

[23] S. Aciar, D. Zhang, S. Simoff, J. Debenham, Informed Recommender: Basing Recommendations on Consumer Product Reviews, Recommender Systems, June 2007

[24] Truong, K.Q., Ishikawa, F., Honiden, S.Improving Accuracy of Recommender System by Item Clustering, IEICE TRANSACTIONS on Information and Systems, E90-D-I, 2007

[25] Y. Park, A. Tuzhilin, The long tail of recommender systems and how to leverage it, RecSys, 2008.

[26] M. Ishikawa, P. Geczy, N. Izumi, T. Yamaguchi, Long Tail Recommender Utilizing Information Diffusion Theory, In WI-IAT, 2008

[27] D. Cosley, S. K. Lam, I. Albert, J. A. Konstan, J. Riedl, Is Seeing Believing? How Recommender Interfaces Affect Users’ Opinions, Proceedings of the 2003 International Conference on Human Factors In Computing Systems, CHI 2003

2018全球汽车市场(V2X)市场调研报告目录—英文版

2018全球汽车市场(V2X)市场调研报告目录—英文版 Published by QYResearch Mar. 2018

Global Automotive Vehicle to Everything (V2X) Market Research Report 2018 Hard Copy: 2900 USD PDF Copy (single user): 2900 USD Enterprise wide License: 5800 USD Pages: 142 Tables and Figures: 139 Published Date: Jan 2018 Publisher: QYR Automotive Research Center Summary This report studies the Vehicle to Everything (V2X) market status and outlook of global and major regions, from angles of manufacturers, regions, product types and end industries; this report analyzes the top manufacturers in global and major regions, and splits the Vehicle to Everything (V2X) market by product type and applications/end industries. The major players in global Vehicle to Everything (V2X) market include Delphi (Aptiv) Continental AG Denso Cohda Kapsch Qualcomm ETrans Savari Autotalks Arada (Lear) Geographically, this report is segmented into several key Regions, with production, consumption, revenue, market share and growth rate of Vehicle to Everything (V2X) in these regions, from 2012 to 2022 (forecast), covering North America EU China Japan On the basis of product, the Vehicle to Everything (V2X) market is primarily split into V2V V2I V2P On the basis on the end users/applications, this report covers

文献调研报告格式

cad/cam技术及应用文献阅读报告 指导教师:梅益 引言 模具cad/cae/cam是改造传统模具生产方式的关键技术,是一项高科技、高效益的系统工程。它以计算机软件的形式,为企业提供一种有效的辅助工具,使工程技术人员借助于计算机对产品性能、模具结构、成形工艺、数控加工及生产管理进行设计和优化。模具cad/cae/cam技术能显著缩短模具设计与制造周期、降低生产成本和提高产品质量已成为模具界的共识。 模具cad/cam技术现状 模具cad/cam是cad/cam技术的一个重要分支和组成部分。模具cad/cam技术发展很快,应用范围日益广泛。在冲压模、锻造模、挤压模、注塑模和压铸模等方面都有比较成功的cad/cam/cae系统,并且涌现了大量的文献资料。采用cad/cam技术是模具生产革命化的措施,也是模具技术发展的一个显著特点。 1、国外模具cad/cam技术的发展现状 国外模具cad/cam技术的研究始于上世纪60年代末,当时美国、日本、德国、加拿大等发达国家开始对冲模cad进行研究。进入70年代,出现了面向中小企业的cad/cam的商品软件,如日本机械工程实验室成功研制的冲裁级进模cad系统,美国diecdmp公司成功地研制出计算机辅助设 计级进模的pddc系统。但仅限于二维图形的简单冲裁级进模,其主要功能如条料排样、凹模布置、工艺计算和nc编程等。80年代,弯曲级进模cad/cam系统开始出现,美国、日本等工业发达国家的模具生产绝大多数采用了cad/ cam技术。为了能够适应复杂模具的设计,富士通系统采用了自动设计和交互设计相结合的方法,在该系统中除毛坯展开、弯曲回弹计算和工步排序为自动处理外,其余均需要设计人员的参与。这些系统均具备实体造型和曲面造型的强大功能,能够设计制造汽车零部件的模具。进入90年代后,国外cad/cam技术向着更高的阶梯迈进。在80年代的基础上,从软件结构,产品数据管理,面向目标的开发技术,产品建模和智能设计,质量检测等方面都有所突破,为实现并行工程提供了更完善的环境。印度学者yk.d.v.prassad、s.som sundoram等开发了普通冲裁模cad/cam系统(cadds),美国striker-system:公司开发了冷冲模设计软件系统ss-die professional等。另外ug、proe、caxa等软件的成功开发,使得模具cad/ cam的功能更加完善,应用也更加广泛。 2、国内模具cad/cam技术的发展现状 我国的计算机技术起步较晚,模具cad/cam的开发始于20世纪70年代末,但发展也相当迅速。到目前为止,通过国家有关部门鉴定的有精冲模、普通冲裁模、辊锻模、锤模和注塑模等cad/cam系统,它们在生产中发挥着重要的示范作用 并产生巨大的经济效益。80年代中、后期,我国的冲模cad研制工作进入了全面发展阶段,不少企业、科研院所大专院校都开发了面向中国制造的cad软件,强调软件产品的专业化和本地化。如天津大学的td系统和一汽、二汽企业用的模具cad/cam系统。从上世纪90年代开始,华中科技大学、西安交通大学和北京机电研究院等相继开展了级进模cad/cam系统的研究和开发。如华中科技大学模具技术国家重点实验室在autocad软件平台上开发出基于特征的级进模cad/cam系统hmic,包括饭金零件特征造型、基于特征的冲压工艺设计、模具结构设计、标准件及典型结构建库工具和线切割自动编程5个模块;西安交通大学开发出多工位弯曲级进模cad系统等。近年来,国内一些软件公司也竞相加入了模具cad/cam系统的开发行列,如深圳雅明软件制作室开发的级进模系统cmcad、富士康公司开发的用于单冲模与复合模的cad系统fox-cad、北航研发的caxa等。 模具cad/cam技术发展存在的主要问题

学校教学质量调研报告

学校教学质量调研报告 在今年这些次深入学习实践科学发展观活动中,通过聆听领导、专家的讲座和学习上级有关文件精神,我深刻认识到,抓好学校教学工作,提高教学质量,必须坚持以科学发展观为统领,必须不断解放思想,转变观念,深化改革,创新思路,必须坚持以人为本,促进学生全面发展。为了掌握情况,寻找差距,谋求发展良策,根据县局《关于开展深入学习实践科学发展观活动方案》第一阶段的要求,我和几位教研员一起,深入到具有代表性的几个镇初中,开展“如何提高教学质量”的调研活动,现将调研情况报告如下: 一、基本情况 1、调研对象:用八天时间对xx中学、xx一中、xx中学、xx 中学、xx中学、xx中学、xx中学、xx中学等初中开展视导调研。这些学校对我县中小学校具有一定的代表性。 2、调研方法:一是听校长汇报学校工作。主要了解校长是否有明晰的办学思路,是否落实切合学校实际提高教学质量的措施。二是深入课堂听课。主要抽查课堂教学中教师基本功,新课程理念的贯穿,教学方法的使用,学生学习方法的指导和双基的落实情况。三是走访师生。主要了解学校管理、常规教学管理、教师管理、各项制度的落实、教学工作状况、教师工作责任心、

学校对学生的管理等。五是查阅各类资料。重在掌握过程管理是否精细化。 二、存在问题 通过调研发现,这几所学校在提高教学质量方面积累了不少好经验,有许多值得肯定的做法。但也存在许多不足,这些不足也是我县中小学校目前存在的主要问题。 1、教师队伍人事管理改革滞后 我县教师人事管理机制跟不上时代发展的要求,教师职业终身制、教师岗位“金饭碗”,没有被打破。竞聘上岗、择优聘用、优胜劣汰的人事管理体制没有形成。造成部分教师安以现状,不思进取,缺少主人翁意识,敬业精神差,没有危机感。在调研中发现:有的老师只满足于“出满勤”,不关注教学效果;有的小病装大病,请假在家,工资分文不少;有的评上高级职称,涨了工资,就不想上课;有的不愿当班主任等等。而学校领导对这些老师也只能是听之任之,其它奈何不了他。现阶段大家都觉得老师难管。 2、教师教学观念转变不彻底 部分教师对推进新课程改革认识不够,加上平时不主动学习,不积极参加活动,对新课程理论了解甚少,对新课程标准掌握不全面,新的教学观、教师观、学生观没有真正树立起来,教学方法还是老一套。“满堂灌”、“填鸭式”还有一定市场。影响了教学质量的提高。

海底探测技术调研报告

海底探测技术调研报告 课程名称海洋地质概论 课程学期12-13第1学期 课程教师广雪徐继尚马妍妍 学生专业2010级信息与计算科学 学生文波 学生学号 1 2012年12月02日

海底探测技术调研报告 文波1摘要:人类用科学方法进行海洋科学考察已有100余年的历史,而大规模、系统地对世界海洋进行考察则仅有30年左右。海底探测技术汇集了各科领域的最高技术成果,它包括了调查平台、海上定位、海底地形探测、地球物理探测、海底取样、海底观测、遥感技术等几大类。一艘先进的海洋地质考察船实际上是一个综合海底探测系统。本文主要总结现代海底探测技术以及其分类,国外海底探测技术的对比,并进行总结分析。 关键字:调查平台科学考察船海上定位海底地形探测地球物理探测海底取样海底观测遥感技术 0引言 探索海底对人类而言是如此神秘而又诱人,只有发展了海底探测技术,这种渴望才能变成现实。人类对海底认识的每一次飞跃,都必然得到新技术和新方法的支持。回声探测技术的应用导致对海底认识的第一次飞跃;用于反潜作战的磁力仪改装成的海洋磁力仪之后,发展了海洋磁测技术,终于识别出洋中脊两侧互为镜像的线性地磁异常带,为海地扩找到了证据,吹响了地质学革命的号角;集现代石油钻探之大成及海洋定位与船舶稳定性于一体的深海钻探技术,全面证实了板块学说,保证了地学革命的成功;采用深海钻探技术和长柱状岩芯新技术,揭示了海洋沉积物中包含的丰富古海洋环境信息,导致了新兴的交叉学科----古海洋学的形成,成为世纪之交地球科学中最有活力的领域,是“全球变化研究”

的重要组成部分。 目前,海洋地质调查和技术手段主要有:利用人造卫星导航和全球定位系统(GPS),以及无线电导航系统来确定调查船或观测点在海上的位置;利用回声测深仪,多波束回声测深仪及旁测声纳测量水深和探测海底地形地貌;用拖网、抓斗、箱式采样器、自返式抓斗、柱状采样器和钻探等手段采取海底沉积物、岩石和锰结核等样品;用浅地层剖面仪测海底未固结浅地层的分布、厚度和结构特征。用地震、重力、磁力及地热等地球物理办法,探测海底各种地球物理场特征、地质构造和矿产资源,有的还利用放射性探测技术探查海底砂矿。 1 调查平台 包括科学考察船、HOV、AUV、ROV等,这里主要介绍科考船。 海洋科学调查船担负着调查海洋、研究海洋的责任,是利用和开发海洋资源的先锋。它调查的主 要容有海面与高空气象、 海洋水深与地貌、地球 磁场、海流与潮汐、海水 物理性质与海底矿物资源(石油、天然气、矿藏等)、海 水的化学成分、生 物资源(水产品 等)、海底地震等。其中极地考察和大洋调查等活动,为世界各国科学家所瞩目。大型海洋调查船可对全球海洋进行综合调查,它的稳性和适航性能好,能够经受住大风大浪的袭击。船上的机电设 备、导航设备、通讯 系统等十分先进,燃料 及各种生活用品的装载量大,能够长时间坚持在海上进行调 查研究。同时,这类船 还具有优良的操纵性 能和定位性能,以适应 各种海洋调查作业的

推荐系统调研报告及综述

推荐系统调研报告及综述 张永锋 清华大学计算机系人工智能研究所 zhangyf07@https://www.doczj.com/doc/0415601622.html, 一、推荐系统概述 1.1 什么是推荐系统 推荐系统(Recommender System)的发展已经经历了近20年的时间,但是迄今为止仍没有人试图对推荐系统给出一个精确的定义。 广义上的推荐系统可以理解为是主动向用户推荐物品(Item)的系统,所推荐的物品可以是音乐、书籍、餐厅、活动、股票、数码产品、新闻条目等等,这依赖于具体的应用领域,推荐系统所推荐的物品或者对用户有帮助,或者用户可能感兴趣[1]。 随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐提出了更高的要求。由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统(Personalized Recommender System)应运而生[1]。目前所说的推荐系统一般指个性化推荐系统。 1.2 推荐系统的发展历史 如果追根溯源,推荐系统的初端可以追溯到函数逼近理论、信息检索、预测理论等诸多学科中的一些延伸研究。 推荐系统成为一个相对独立的研究方向一般被认为始自1994年明尼苏达大学GroupLens研究组推出的GroupLens系统[2]。该系统有两大重要贡献:一是首次提出了基于协同过滤(Collaborative Filtering)来完成推荐任务的思想,二是为推荐问题建立了一个形式化的模型(见1.4)。基于该模型的协同过滤推荐引领了之后推荐系统在今后十几年的发展方向。 GroupLens所提出的推荐算法实际上就是目前人们时常提及的基于用户的协同过滤推荐算法(User-based Collaborative Filtering Algorithms),虽然论文本身并没有使用这样一个名字。在之后的十几年中,其它一些著名的协同过滤算法逐渐被提出,主要的有基于物品的协同过滤算法(Item-based Collaborative Filtering Algorithms)[3],基于矩阵分解的协同过滤算法(SVD-based/NMF-based, etc.)等等。当然,基于其它方法而非协同过滤的推荐算法也在不断地发展,这些方法之间的互补、融合也成为一个重要的研究方向,这些会在本文第二部分(推荐方法的分类)和第三部分(典型推荐算法概述及优缺点)中详细阐述。 目前,推荐算法已经已经被广泛集成到了很多商业应用系统中,比较著名的有Netflix在线视频推荐系统、Amazon网络购物商城等。实际上,大多数的电子商务平台尤其是网络购物平台,都不同程度地集成了推荐算法,如淘宝、京东商城等。Amazon发布的数据显示,亚马逊网络书城的推荐算法为亚马逊每年贡献近三十个百分点的创收。

2018年全球监测市场研究报告目录—英文版

2018年全球监测市场研究报告目 录—英文版 Published by QYResearch Mar. 2018

Global Surveillance Market Research Report 2018 Hard Copy: 3800 USD PDF Copy (single user): 3800 USD Enterprise wide License: 7600 USD Pages: 137 Tables and Figures: 138 Published Date: Jan.2018 Publisher: QYR Electronics Research Center Summary This report focuses on surveillance system used for residential and commercial. This report studies the Surveillance market status and outlook of global and major regions, from angles of manufacturers, regions, product types and end industries; this report analyzes the top manufacturers in global and major regions, and splits the Surveillance market by product type and applications/end industries. The global Surveillance market is valued at 22308 million USD in 2016 and is expected to reach 43672 million USD by the end of 2022, growing at a CAGR of 11.85% between 2016 and 2022. The major players in global Surveillance market include Hikvision Dahua Technology Axis Communications AB Panasonic Honeywell Security Hanwha United Technologies Tyco Bosch Security Systems Pelco Huawei Technologies Siemens AG Avigilon Corporation Uniview Flir Systems, Inc Geographically, this report is segmented into several key Regions, revenue, market share and growth rate of Surveillance in these regions, from 2012 to 2022 (forecast), covering North America Europe

研究报告-参考文献

篇一:调查报告参考文献 一、基本情况 近年来,我区加快了社区建设步伐,将46个社区(村)整合为23个社区,新建了3个社区服务中心,改扩建12个社区办公服务场所,进一步完善了社区综合服务功能,提升了为民便民服务水平。 (一)社区基础设施得到提升。2009年,我区建设了新达佳苑、爱民佳苑、滨海佳苑3个社区综合服务中心,总投资达2775万元,占地面积19600平方米,建筑面积12900平方米,均为框架结构,内部设计合理、设施齐全。同时采取多种措施,下大力气改扩建了12个社区办公服务场所,内部设施基本完善,外部完成了绿化美化,社区办公服务环境得到了根本改观。(二)社区服务功能得到完善。在新建的3个社区综合服务中心内,均设置了综合服务大厅,内设社会保障、民政救助、人口计生、法律咨询、残疾人康复、物业管理等服务功能,爱民佳苑服务大厅还设置了移动、联通、水电、天然气等营业服务点。其他社区也设置了“一站式”服务大厅,方便了群众办事。同时加强社区文化建设,满足群众文化需求,如每个社区都有图书阅览室、棋牌室、书画室,滨海服务中心设置了550多平米的体育活动大厅、近200平米的电化教室、音乐舞蹈室,爱民服务中心设置了戏曲活动室、社区健身房等,兴华东路社区还设置了矿区今昔风貌展厅,各社区健身活动器材完善,为社区群众接受各类教育、参与文体活动提供了良好的平台。 (三)社区干部队伍建设得到强化。在社区调整合并时,社区工作者采取派一批、留一批、招聘一批的方式配备,社区干部队伍向年轻化、知识化方向转变,工作能力相对较强,基本上都有一定的理论基础,部分社区工作者基层工作经验较丰富,为有效开展社区各项工作提供了人力资源保障。社区党建的覆盖面不断扩大,设立了党建活动室,党员教育管理得到加强。扩大了居民对社区事务的选择权、知情权、参与权、监督权,促进了社区民主决策、民主管理、民主监督。 二、存在的问题 (一)社区服务功能有待进一步整合。从为民便民考虑,社区服务中心、服务场所在运作初期设置的服务功能多而广,但从运作情况看,一些服务功能尚不能完全发挥作用,如残疾人康复室、儿童乐园等,因此应根据各自的实际情况进行功能调整。同时,随着棚户区改造、沉陷区搬迁工程的进一步推进,以及人口的搬迁转移,一些社会服务和管理功能也需要整合,如在梁家沟街道办事处内有2个卫生院、2个环卫所、2个派出所。 (二)管理体制尚未理顺。现有的社区管理体制工作职责不明确,条块关系不顺畅,责、权、利不配套,一些部门对社区是“自我管理、自我教育、自我服务、自我监督”的群众性自治组织的认识比较模糊,把社区当成政府的延伸机构,社区工作“行政化”倾向比较明显。目前有107项工作进社区,工作多,任务重,压力大,社区工作者有一种忙于应付,疲于奔命的感觉。随着社区调整合并、社区服务功能的完善,工作量大和人员不足的矛盾更加突出,尤其是在矿区的社区,服务范围大,工作量大的情况尤为突出。 (三)社区干部待遇偏低。社区日常工作量大、各种检查多,但社区干部工资偏低,只达到我市的最低工资标准。虽然区人事劳动和社会保障局关于提高社区居委会、村委会干部待遇的实施意见对社区干部交纳养老保险作出了明确规定,但由于社区干部来源不同,有的是矿务局买断职工,已经交纳养老保险,有的未就业没有交纳过养老保险,因此在实际操作中存在一些不足,相关规定未落实到位。这些问题的存在一定程度上影响了社区干部的工作积极性。 三、建议 (一)加大投入,促进运转。拓展以政府投入为主,多元化筹资为辅的社区建设资金投入机制,增强社区运转能力的有效保障。要根据财政收入增长情况,增加社区工作经费和社区干

教学质量调研报告

教学质量调研报告 教师要转变教育观念,要遵循学生认知规律和教育教学规律,下面是小编为大家收集的教学质量调研报告,欢迎大家参考借鉴。 为了贯彻20**年《东西湖区政府工作报告》提出的"深化教育制度改革,大力实施素质教育,切实提高教学水平,促进义务教育均衡优质发展"的有关精神,全面落实《教育部义务教育学校管理标准(试行)》,以促进义务教育优质均衡发展为抓手,以创新学校管理机制为动力,以提高教育教学质量为目标,满足人民群众对优质教育的需求,实现从"学有所教"到"学有优教"的转变,全面推进我区义务教育段教育教学质量的稳步提升。 一、调研的工作目标 通过调研,将了解我区小学、初中两个学段的基本情况,总结被调研学校的教育教学质量提升的经验、方法,查找教育教学过程中存在的问题,共同研究解决问题的方法,改进学校管理措施,促进教育教学常规管理科学化、规范化、精细化,全面提升我区义务教育段教育教学质量。 通过调研,寻找激励教师主动发展的途径和方法,营造浓厚的研究氛围,深钻教材、精选教法、因材施教,不断总结经验、不断反思不足、不断改革创新,寻求破解我区义务教育段教育教学质量提升瓶颈的方法和策略。 二、调研的基本情况 1. 选取样本学校。

本次调研,为了使样本校抽样具有代表性,调研工作小组在全区小学、初中两个学段中选取了具有代表性的12所学校进行调研,其中小学7所,初中5所。 2. 调研主要内容。 这次调研,主要是围绕我区义务教育段的教育教学质量问题,对学校的教育教学管理、课堂教学有效性及教育资源的利用等问题进行调研,具体涉及"办学行为","学校特色","教学改革","教学质量","队伍建设","学校机制"等六大方面。 3. 调研具体形式。 根据区教育局要求,调研活动采取"实地巡查—问卷调查—随机听课—干群访谈"等形式进行,并设计了学生问卷调查单(问卷项目8项)、教师访谈问题单(访谈问题15个)、中层干部访谈问题单(访谈问题12个)、校级干部访谈问题单(访谈问题13个)。在本次调研活动中,调研小组全体成员,随机听课53节,学生问卷调查240余人次,教师一对一访谈80余人次,中层干部一对一访谈60余人次,校级干部一对一访谈60余人次。 三、特色与亮点 通过这次调研活动,从整体上看,在方略项目的引领下,在全区的共同努力下,学校教育教学重过程、重实效、重改革、重创新,区教育局关于"提升教育教学质量工程"的文件精神得到了较好的贯彻落实,全区不少学校在"坚持和落实质量形成过程的管理"、"重视学科建设,加强校本教研"、"立足课堂,全面推进课堂教学改革"、"打

中国北斗导航终端市场调研报告

中国北斗导航终端市场调研报告

前言 北斗卫星导航系统,到2015年相关产值将达到2000亿元,2020年有望达到4000亿元。随着“北斗”系统逐渐向民用方面转化,投资机会显现。中国预计于2012年建成北斗亚太区域卫星导航系统,2020年左右建成由35颗卫星组成的北斗全球卫星导航系统。今明两年是中国北斗卫星导航系统区域系统建设和应用发展非常关键的两年,这两年将陆续发射多颗北斗导航组网卫星,并开始在各个领域大量推广应用。北斗卫星导航系统已成功发射了13颗卫星,系统建设当前已进入密集发射组网阶段。北斗卫星导航系统是中国独立发展、自主运行,又要与世界其他卫星导航系统兼容互用的全球卫星导航系统,也是中国航天史上迄今为止规模最大、系统性最强、涉及最广、技术最复杂和建设周期最长的航天基础工程。这个系统能提供高精度高可靠的定位、导航、授时和短报文服务,它是中国国家安全、经济和社会发展不可缺少的重大空间信息基础设施。 本报告数据主要来源于互联网和个人经验,仅作参考,请公司同事修改补充。

前言 (1) 第一章北斗导航系统应用行业发展分析 (4) 一、军用领域 (4) 二、民用功能 (5) 三、其它应用领域参考资料 (8) 第一节北斗导航系统全球地位 (10) 一、美国GPS系统(产业链成熟,应用广泛) (10) 二、欧洲GALILEO 系统(定位精度高、还未组网完成) (11) 三、俄罗斯GLONASS 系统 (12) 四、中国北斗系统 (13) 第二节北斗导航系统发展规划 (14) 一、发展路线图 (14) 第三节北斗导航系统优势 (15) 第二章中国北斗导航行业市场发展环境分析 (16) 第一节国内北斗导航经济环境分析 (16) 一、2012年中国北斗导航经济发展预测分析 (16) 第二节中国北斗导航行业政策环境分析 (18) 一、相关标准 (18) 二、相关政策 (19) 三、标准及相关分析 (19) 第三章国内导航产业现状分析 (20) 第一节GNSS产业链分析 (20) 第四章北斗卫星导航市场应用分析 (36) 第一节北斗卫星导航定位系统运行 (36) 第二节北斗卫星导航产业链 (36) 一、北斗导航产业链 (36) 二、北斗导航竞争态势 (37) 第五章应用重点市场—高精度GNSS市场 (38) 第六章应用重点市场—车载导航市场 (38) 第一节中国车载导航产业动态分析 (38) 一、首款3D导航GPS登陆重庆 (38) 二、GPS汽车导航进入宽屏时代 (38) 三、PND拓宽汽车导航仪市场 (39) 四、个人导航设备席卷汽车导航系统市场 (43) 第二节中国车载导航产业运行格局 (56) 一、中国汽车导航市场尚处于市场启动初期 (56) 二、GPS上下游合作模式改变 (60) 三、我国车载导航市场已经进入规模发展 (61) 四、电子地图成车载GPS“瓶颈” (65) 五、前装和后装市场发展不均衡 (68) 第三节中国汽车导航企业运行现状 (68) 一、千家厂商混战车载定位 (68)

科技文献调研报告范文

科技文献调研报告范文 篇一:文献检索报告范文 科技信息检索检索报告 级专业班学号姓名 说明 利用所学的文献信息检索知识和检索方法,结合自己的专业,自定检索课题,从多方面广泛收集有关资料,并完成该课题的综合检索报告。 一、数据库选择要求 1.中文数据库:cnKI中国知网、万方信息资源系统、维普科技期刊数据库、超星数据图书馆或读秀学术搜索。 2.外文数据库:eicompenDex、scI、scIenceDIRecT、ebsco、springerlink、AbpsT等。 3.搜索引擎:google、百度等。 4.专利数据库:国家知识产权局(中、美、欧、日)。 二、条目解释

1.“检索年限”:范围限定在最近十年以内,各种数据库(检索工具)尽量选用同等年限,以便之后根据检索结果进行比较,从而加深对各类数据库(检索工具)的认识。 2.“检索词”:列出与课题内容相关的关键词或主题词。 3.“检索式”:运用布尔逻辑运算符来表达检索词与检索词之间逻辑关系,以及检索项(如:题名、主题、关键词、摘要、作者、作者单位、来源、全文、参考文献、基金等)。如:题名=汽车and尾气and排放and控制。请注意各数据库检索式不一定相同。 4.每种检索系统检索完毕后,记录检索结果(检出文献篇数),按规定条数列出与课题密切相关的文献(只需列出5条最相关的,不足5条请注明原因),注:中外文数据库列出题名、作者、出处、摘要;专利列出专利名称、申请号、申请人和摘要;搜索引擎列出标题、网址、摘要。 三、其它要求 按时、按质、按量完成 示例 1、检索课题名称(中英文) 计算机在中学物理中的应用 Theapplicationofcomputertophysicsinmiddleschool 2、分析研究课题 随着计算机技术的不断发展,计算机在教育中的作用愈

个性化推荐算法概述与展望

Hans Journal of Data Mining 数据挖掘, 2019, 9(3), 81-87 Published Online July 2019 in Hans. https://www.doczj.com/doc/0415601622.html,/journal/hjdm https://https://www.doczj.com/doc/0415601622.html,/10.12677/hjdm.2019.93010 Overview and Prospect of Personalized Recommendation Algorithm Xinxin Li Dalian University of Foreign Languages, Dalian Liaoning Received: Jun. 19th, 2019; accepted: Jul. 2nd, 2019; published: Jul. 9th, 2019 Abstract In recent years, the word “information overload” frequently appears in people’s vision, it has be-come a hot word in the field of computer, and it is also an important problem that researchers ur-gently need to solve. In order to solve the problem of information overload, researchers in the field of computer constantly optimize the personalized recommendation algorithm, strive to re-duce the difficulty of information retrieval for users, to provide users with the best personalized recommendation results. This paper gives a brief overview of the personalized recommendation methods which are widely used and common. Combined with the experience of using personalized recommendation algorithm to generate results in daily life, the author puts forward expectations for the development of personalized recommendation algorithm in the future. Keywords Personalized Recommendation, Collaborative Filtering, Hybrid Recommendation 个性化推荐算法概述与展望 李鑫欣 大连外国语大学,辽宁大连 收稿日期:2019年6月19日;录用日期:2019年7月2日;发布日期:2019年7月9日 摘要 近年来,“信息过载”一词频繁出现在人们的视野中,它成为了计算机相关领域中的热门词汇,同时它也是研究人员急待解决的重要问题。为解决信息超载的问题,计算机领域研究人员不断优化个性化推荐

全球化妆品市场调查分析报告

2005年度:球化妆品市场调查报告 全球化妆品行业的零售额达253亿美元,而且持续5年强劲而稳定的增长趋势,尤其从1997-2000年,以每年11.7%的增长率递增。另一方面,据分析家预测,尽管化妆品行业近几年来销售业绩节节上升,但就整个行业来讲缺乏革新的观念,因此不管是生产者依旧销售者都面临不能满足消费者日益提高的消费品位的危机。 尽管近5年来化妆品行业不断涌现新品,但大多数只是在原有产品的基础上加入护肤的成分而不是在配方上有所突破,因此,在全球化妆品市场日益成熟的今天,生产商和销售商也面临着越来越大的挑战。各式各样女性美容时尚杂志及广告也成为推动化妆品行业革新的一个重要因妆品牌争先恐后推出其新品牌,其中脸部化妆品表现最为出众,占全球销售市场35%的份额,比较闻名的品牌有露华浓的Skin lights 和Shin-brightening系列,LVMH旗下的纪梵希也预备推出两到三款星级产品以巩固其在行业中的地位。 口红又是整个脸部化妆品中占有率最大的一部分,达30%,市场投资力度的加大以及各品牌相继推出的各式口红是市场蓬勃进展的重要因素。为了提升销售业绩,许多生产商还选定了中老年消费群,推出抗衰老口红,取得了相当不错的反响。使用及携带方便是另一个重要的市场因素,许多二合一及三合一的化妆品是近5年来市场的热卖品,表现出众的有妮维雅含维他命E及芦荟的三合一彩妆品。一些外形小巧的化妆品迎合了年轻消费者的口味,成为化妆品市场的又一类畅销品。如2000年和2001年,化妆品厂商们把目标集中在20岁以下和20-25岁的年轻顾客,如Arcancil、Debby、Bourjois等。

关于学校调研报告

关于学校调研报告 教学质量是学校的生命线,提高教学质量是家长及社会的迫切要求,下面是XX为大家搜集的学校调研报告,供大家参考,欢迎大家借鉴。 在今年这些次深入学习实践科学发展观活动中,通过聆听领导、专家的讲座和学习上级有关文件精神,我深刻认识到,抓好学校教学工作,提高教学质量,必须坚持以科学发展观为统领,必须不断解放思想,转变观念,深化改革,创新思路,必须坚持以人为本,促进学生全面发展。为了掌握情况,寻找差距,谋求发展良策,根据县局《关于开展深入学习实践科学发展观活动方案》第一阶段的要求,我和几位教研员一起,深入到具有代表性的几个镇初中,开展如何提高教学质量的调研活动,现将调研情况报告如下:基本情况 调研对象:用八天时间对XX中学、XX一中、XX中学、XX中学、XX中学、XX中学、XX中学、XX中学等初中开展视导调研。这些学校对我县中小学校具有一定的代表性。 存在问题 通过调研发现,这几所学校在提高教学质量方面积累了不少好经验,有许多值得肯定的做法。但也存在许多不足,这些不足也是我县中小学校目前存在的主要问题。

教师队伍人事管理改革滞后 我县教师人事管理机制跟不上时代发展的要求,教师职业终身制、教师岗位金饭碗,没有被打破。竞聘上岗、择优聘用、优胜劣汰的人事管理体制没有形成。造成部分教师安以现状,不思进取,缺少主人翁意识,敬业精神差,没有危机感。在调研中发现:有的老师只满足于出满勤,不关注教学效果;有的小病装大病,请假在家,工资分文不少;有的评上高级职称,涨了工资,就不想上课;有的不愿当班主任等等。而学校领导对这些老师也只能是听之任之,其它奈何不了他。现阶段大家都觉得老师难管。 教师教学观念转变不彻底 部分教师对推进新课程改革认识不够,加上平时不主动学习,不积极参加活动,对新课程理论了解甚少,对新课程标准掌握不全面,新的教学观、教师观、学生观没有真正树立起来,教学方法还是老一套。满堂灌填鸭式还有一定市场。影响了教学质量的提高。 课堂教学效益不高 部分教师向45分钟要质量的有效教学意识不强。课前准备不足,教案简单,对教材拓展不够,补充不足,挖掘不深;课中教师包办代替多,师生互动少,联系学生实际少,有效训练的时间和内容不足,没能激发学生学习兴趣,甚至教学过程偏离教学目标,教学效果差;课后学生练习量

武汉国际广场调研报告

武汉国际广场调研报告

项目简介
武商集团旗下武汉国际广场购物中心立足城市核心解放大道黄金商圈,毗邻交 通动脉,连接轻轨与地铁,捷运通畅。按照国际标准打造的武汉国际广场总营业面积 达32万平方米,是未来中国定位最高、规模最大、品牌最全的顶级购物中心。全新 的武汉国际广场分为A、B、C、D四馆,四方四座,构建超大规模商业新景观。

项目区位

项目定位规划平面及定位
A馆时尚之馆:热点名品汇聚,成 熟品牌聚集,将时尚尽收眼底; B馆奢华之馆:搜罗全球顶尖奢华 名品,畅享精致生活全新概念; C馆潮流之馆:拉阔年龄界限,引 领城市潮流风尚; D馆立体停车楼:9层立体停车楼, 层层楼层,尽享便捷泊车购物体验。

项目楼层分布
武汉国际广场购物中心超越寻常摩尔,打造12层全新高度,包括地下三层与陆上9层,是 一个集购物、餐饮、娱乐、休闲,融汇时尚、奢华、潮流于一体的现代高端购物中心。整 个店内设计现代时尚,富丽堂皇,为您全方位展现国际时尚名品的魅力风情。 陆上9层 缔造完美购物 休闲 娱乐 美食空间; 1-2F国际奢品馆:云集LV、GUCCI、DIOR、LOEWE等百大国际奢华名品;3-4F时尚名 品馆:80大优雅时尚女装及魅力鞋包云集,打造全新焕彩空间; 5F潮流魅力馆:50大经典男装汇聚地,联袂演绎潮流新风尚; 6F家居生活馆 &超级儿童城:诠释生活新概念; 7-9F畅享乐活馆:购物之余,尽享美食、娱乐、休闲多层次的乐活享受; 地下3层 演绎都市生活快时尚; 地下负1层:武商超级生活馆,汇聚各式都市便利店、速食馆;A座专设贵宾泊车专区; 地下负2-3层:提供3500个标准泊车位,24小时全天开放。

个性化推荐系统研究综述

个性化推荐系统研究综述 【摘要】个性化推荐系统不仅在社会经济中具有重要的应用价值,而且也是一个非常值得研究的科学问题。给出个性化推荐系统的定义,国内外研究现状,同时阐述了推荐系统的推荐算法。最后对个性化推系统做出总结与展望。 【关键词】推荐系统;推荐算法;个性化 1.个性化推荐系统 1.1个性化推荐系统的概论 推荐系统是一种特殊形式的信息过滤系统(Information Filtering),推荐系统通过分析用户的历史兴趣和偏好信息,可以在项目空间中确定用户现在和将来可能会喜欢的项目,进而主动向用户提供相应的项目推荐服务[1]。传统推荐系统认为推荐系统通过获得用户个人兴趣,根据推荐算法,并对用户进行产品推荐。事实上,推荐系统不仅局限于单向的信息传递,还可以同时实现面向终端客户和面向企业的双向信息传递。 一个完整的推荐系统由3个部分组成:收集用户信息的行为记录模块,分析用户喜好的模型分析模块和推荐算法模块,其中推荐算法模块是推荐系统中最为核心的部分。推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。 1.2国内外研究现状 推荐系统的研宄开始于上世纪90年代初期,推荐系统大量借鉴了相关领域的研宄成果,在推荐系统的研宄中广泛应用了认知科学、近似理论、信息检索、预测理论、管理科学以及市场建模等多个领域的知识。随着互联网的普及和电子商务的发展,推荐系统逐渐成为电子商务IT技术的一个重要研究内容,得到了越来越多研究者的关注。ACM从1999年开始每年召开一次电子商务的研讨会,其中关于电子商务推荐系统的研究文章占据了很大比重。个性化推荐研究直到20世纪90年代才被作为一个独立的概念提出来。最近的迅猛发展,来源于Web210技术的成熟。有了这个技术,用户不再是被动的网页浏览者,而是成为主动参与者[2]。 个性化推荐系统的研究内容和研究方向主要包括:(1)推荐系统的推荐精度和实时性是一对矛盾的研究;(2)推荐质量研究,例如在客户评价数据的极端稀疏性使得推荐系统无法产生有效的推荐,推荐系统的推荐质量难以保证;(3)多种数据多种技术集成性研究;(4)数据挖掘技术在个性化推荐系统中的应用问题,基于Web挖掘的推荐系统得到了越来越多研究者的关注;(5)由于推荐系统需要分析用户购买习惯和兴趣爱好,涉及到用户隐私问题,如何在提供推荐服务的

国内外海底探测技术调研报告

国内外海底探测技术调研报告 摘要:21世纪是海洋开发和利用的时代。各国均加大了对海洋的关注和投资,深海探测技术得到迅速发展。空中的定位系统,海上的调查平台,各类探测仪器和设备领域取得一系列重大进展和新发现。本文将主要从大众关注的定位系统、海洋调查船、测深技术、钻探技术、深潜技术阐述,并对比国内外的发展状况。 关键词:深海探测技术;定位系统;海洋调查船;钻探技术;测深技术;深潜技术 1.海上定位系统 准确的导航定位对于建立海底地形、沉积物正确的空间关系和准确的动图是必不可少的。现今全球四大核心卫星导航系统分别是美国的GPS系统、欧洲的伽利略系统、俄罗斯的格洛纳斯系统以及中国的北斗导航系统。 美国的全球定位系统(Global Positioning System)简称GPS,是由美国陆海空三军于二十世纪七十年代联合研制的定位系统。它由24颗卫星组成(图1),军民两用。民用精度约为10米,军用精度为1米。不论任何时间,任何地点,至少有 4 颗以上的卫星出现在我们的上空。4颗卫星可以确定三维坐标,三颗卫星可以确定平面坐标。 俄罗斯的“格洛纳斯”系统,目前有24颗卫星正常工作,军民两用,组网时间比GPS 更早,由于苏联解体建设进度大大减慢。如今精度在10米左右,“格洛纳斯”系统完成全部卫星的部署后,其卫星导航范围可覆盖整个地球表面和近地空间,定位精度将达到1.5米以内。 欧洲的“伽利略”系统,中国于2003年参与投资研制。有30颗卫星组成,定位误差不超过1米,主要为民用。预计将会于2014年开始运作,但由于欧盟内部分歧与资金问题,完工时间尚不能确定。 中国的“北斗”系统,是中国自行研制的全球卫星定位与通信系统(BDS),是继美全球定位系统(GPS)和俄GLONASS之后第三个成熟的卫星导航系统。由5颗静止轨道卫星和30颗非静止轨道卫星组成(图2)。“北斗一号”精确度在10米之内,而“北斗二号”可以精确到“厘米”之内。2011年12月27日起,开始向中国及周边地区提供连续的导航定位和授时服务。2012年12月27日起,向亚太大部分地区正式提供连续无源定位、导航、授时等服务,然后逐步扩展为全球卫星导航系统。 可见,在定位方面,我国已经处于国际领先地位。 图1 GPS卫星系统图2 “北斗”系统 2.海上探测平台 海洋调查船是进行科学调查的平台和必要工具,它的建设、管理与一个国家海洋事业的

相关主题
相关文档 最新文档