PageRank算法应用在文献检索排序中的研究及改进_汪志伟_邹艳妮_吴舒霞
- 格式:pdf
- 大小:339.86 KB
- 文档页数:6
基于PageRank算法的搜索引擎优化策略探析作者:徐新阳郜攀攀来源:《速读·中旬》2014年第08期摘要:PageRank算法是由谷歌公司创始人拉里·佩奇于1998年提出的,它以“从优质网页链接过来的网页必然是优质网页”为基本依据,以此来判断网页的重要程度。
如今,PageRank 算法已成为一种非常重要的搜索引擎技术,网站专业人员可以以PageRank算法为基础进行搜索引擎优化,以提高网站的PR值,提升网站的排名和点击率。
关键词:PageRank算法;搜索引擎;优化策略据有关机构统计,截止2014年9月中旬,全球互联网站数量已突破十亿大关,仍以前所未有的速度增长。
爆炸式的信息增长为人们带来了无穷无尽的信息量,同时也给信息检索提出了许多新挑战。
如今,搜索引擎是仅次于电子邮件的网络工具,也是网民获取网络信息的基本手段。
对于企业而言,如何将企业网站推销出去,如何让网民能通过搜索引擎找到企业网站,成了企业不得不面对的问题。
因而,许多企业会针对搜索引擎的数据采集、标引算法进行网页设计优化,以求企业网页能处于搜索引擎关键词检索的前列。
但是,搜索结果排序算法与组织技术是搜索引擎的关键技术,也是搜索引擎企业的商业秘密,外人很难知晓。
一般情况下,搜索引擎会根据关键字词频、位置等进行搜索结果排序,网络专业人员可以通过将关键字放于页面title中、提高页面正文关键字词频等方式进行页面优化,实现提高企业网页排名的目的。
网页间链接流行度属于页面外优化,它也直接影响着网页在搜索结果中的排名,这种搜索结果排名技术建立于web文档之上的PageRank算法,本文就以PageRank算法为例,探究搜索引擎优化策略。
一、简述PageRank算法PageRank算法是由谷歌公司创始人拉里·佩奇于1998年提出的,它是谷歌公司用来标识网页等级、重要性的基本方法,也是衡量网页好坏的基本标准。
谷歌公司依靠PageRank算法在引擎行业独占鳌头,成为搜索引擎行业的代表。
PageRank算法在网页排序中的应用及改进PageRank算法是一种在网页排序中广泛应用的算法,旨在根据页面间的链接关系和互动,为网页分配权重。
本文将介绍PageRank算法的基本原理和其在网页排序中的应用,并探讨一些改进方法,以提高其准确性和效率。
一、PageRank算法的基本原理PageRank算法是由谷歌公司的创始人之一拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)于1996年提出的。
它根据网页之间的相互链接关系来计算每个网页的重要性指标,基本原理如下:1. 网页的权重:PageRank算法认为,一个网页的重要性取决于其被其他重要网页所链接的数量和质量。
一个链接来自权重高的网页对被链接的网页权重的贡献也更大。
2. 链接关系的传递性:如果网页A链接到网页B,那么网页B将获得一部分网页A的权重。
这种链接关系的传递性可以通过迭代计算来逐步传递网页的权重。
3. 反向链接的重要性:网页B被更多重要网页所链接时,网页B的权重会更高。
这个想法来源于互联网上用户通过链接表达的投票行为。
相对于单纯的链接数量,反向链接更能反映网页的权威性和受欢迎程度。
二、PageRank算法在网页排序中的应用PageRank算法在网页排序中的应用主要体现在搜索引擎中,通过计算网页的PageRank值,对搜索结果进行排序,从而提供更准确和有用的搜索结果。
1. 提高搜索准确性:PageRank算法通过对网页的重要性进行评估,将重要网页排在搜索结果的前面。
这样用户可以更容易地找到权威和有价值的信息。
2. 抑制垃圾信息:通过使用PageRank算法,搜索引擎可以过滤掉一些垃圾信息或低质量的网页。
因为这些网页往往没有被高质量网页所链接,其PageRank值较低。
3. 发现新网页:PageRank算法还可以帮助搜索引擎发现新网页。
当一个新网页被高质量网页链接时,其PageRank值将增加,并逐渐被搜索引擎所索引和优先展示。
PAGERANK算法在网络搜索和推荐系统中的应用原理及设计随着互联网的不断发展,我们已经不再是传统的信息获取方式,而是通过搜索引擎来获得所需要的信息。
搜索引擎的核心算法之一就是Google公司在1998年推出的PAGERANK算法。
这种算法被广泛应用于搜索和推荐系统,并成为互联网时代中最重要的技术之一。
PAGERANK算法原理PAGERANK算法最根本的原理就是基于链接的分布式计算。
这个过程中,网页的排名是根据其连接到其他网页的数量和质量来评估的。
如果一个页面有很多的高质量的链接,则该页面的排名就会更高。
具体的,PAGERANK算法利用了一张由许多有向边连接而成的有向图。
在这种图中,每个节点代表一个网页,每个边代表两个网页之间的连接。
如果一个节点没有指向别的节点的连接,则称之为“Sink Node”。
PAGERANK算法是基于如下传递函数来实现的:PR(A) = (1-d) + d(PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))其中,PR(x)表示网页x的PAGERANK值;d是统计学家设置的一个常数,D值通常设置在0.85;T1 ~ Tn表示所有页面中指向当前页面的页面;C(T1) ~ C(Tn)表示所有指向T1 ~ Tn页面的外部链接总数。
这个过程的实现是通过迭代计算来完成的。
我们可以首先为每个节点设置一个相同的PR0作为初始值。
在每次更新过程中,我们都会计算出每个节点的新PR值,并更新它们的PR值。
然后再根据新的PR值进行下一轮的迭代,直到PR值稳定下来为止。
PAGERANK算法在搜索引擎中的应用PAGERANK算法在搜索引擎中最重要的应用就是用于计算每个搜索结果的排名。
搜索引擎很难根据用户查询条件来准确找到他们所需要的信息。
通过计算每个页面的PAGERANK值,搜索引擎可以将最有可能包含所需信息的页面排在搜索结果的前列。
PAGERANK算法在推荐系统中的应用除了在搜索引擎中使用,PAGERANK算法也可以用于推荐系统。
基于用户行为的改进PageRank影响力算法王鹏;汪振;李松江;赵建平【期刊名称】《计算机工程》【年(卷),期】2017(043)012【摘要】In the calculation of user influence,the PageRank algorithm considers only the following relation among users,which leads to the low accuracy of the calculation results.Therefore,a URank algorithm combining user behavior factors with PageRank algorithm is proposed.By using the factors such as forwarding rate,comment rate and authentication,the user's quality can be obtained by combining the quality of users and the quality of followers.Experimental results show that based on the SIR propagation model,URank algorithm is superior to PageRank algorithm in computational accuracy.%PageRank算法在计算用户影响力方面只考虑用户间的跟随关系,导致计算结果准确性低下.为此,提出一种将用户行为因素与PageRank 算法相结合的URank算法.利用网络中用户发布信息的转发率、评论率以及是否认证等行为因素,综合用户自身质量与追随者质量,得到用户影响力.基于SIR传播模型的实验结果表明,URank算法在计算准确性方面优于PageRank算法.【总页数】5页(P155-159)【作者】王鹏;汪振;李松江;赵建平【作者单位】长春理工大学计算机科学技术学院,长春130022;长春理工大学计算机科学技术学院,长春130022;长春理工大学计算机科学技术学院,长春130022;长春理工大学计算机科学技术学院,长春130022【正文语种】中文【中图分类】TP391【相关文献】1.基于PageRank的用户影响力评价改进算法 [J], 王顶;徐军;段存玉;吴玥瑶;孙静2.基于PageRank和用户行为的微博用户影响力评估 [J], 张俊豪;顾益军;张士豪3.微博环境下基于用户行为与主题相似度的改进PageRank算法 [J], 朱颢东;丁温雪;杨立志;冯嘉美4.基于用户行为与页面分析的改进PageRank算法 [J], 王旭阳;任国盛5.基于改进 PageRank算法的微博用户影响力排序研究 [J], 丁温雪;徐家兴;朱颢东因版权原因,仅展示原文概要,查看原文内容请购买。
搜索引擎PageRank算法的改进杨劲松;凌培亮【期刊名称】《计算机工程》【年(卷),期】2009(035)022【摘要】In order to solve the problems in information retrieval when enterprise making rapid decision, this paper proposes an improved PageRank algorithm. Considering the time factor by Web page, it distributes the forward link different PageRank value based on the proportion by the similarity analysis between anchor text and Web page text. The final PageRank value is more suitable for topic-specific search engine and keeps simplicity of algorithm. Experimental result shows that the improved algorithm can effectively reduce the phenomenon of topic-drift and enhance the PageRank value of new Web page.%为了解决企业快速决策时信息检索的问题,提出一种改进的PageRank算法.在考虑网页产生时间因素的同时,通过锚文本与网页主题的相似度分析按权重分配网页各正向链接PageRank值,产生的PageRank值更贴合主题搜索引擎的要求,并保持算法的简洁性.实验结果证明该改进算法能有效减少主题漂移现象,恰当提升新网页PageRank 值.【总页数】3页(P35-37)【作者】杨劲松;凌培亮【作者单位】同济大学机械工程学院,上海,200092,.;同济大学机械工程学院,上海,200092,.【正文语种】中文【中图分类】TP391【相关文献】1.基于PageRank算法的搜索引擎优化策略 [J], 黄志栋;员巧云2.基于改进PageRank算法的管道专业搜索引擎系统设计与实现 [J], 王兵;许少华;张兴旺3.主题搜索引擎的PageRank算法研究 [J], 县小平4.搜索引擎PageRank算法的改进 [J], 张延红5.搜索引擎PageRank算法的比较与改进 [J], 张毅;张冬梅因版权原因,仅展示原文概要,查看原文内容请购买。
PageRank算法在搜索引擎中的应用搜索引擎是现代人们获取信息最方便的途径之一,而其中最核心的部分就是排名算法。
PageRank算法作为最早应用于搜索引擎中的算法之一,其核心思想是通过分析网页之间的链接关系,为每个网页赋予一个权值,从而实现搜索结果的排序。
本文从PageRank算法的原理、应用场合以及算法优化方面进行探究,以期更好地理解搜索引擎排名算法的工作机制。
一、PageRank算法的原理PageRank算法最早于1998年由谷歌创始人拉里·佩奇和谢尔盖·布林共同提出,得名于拉里·佩奇的姓氏。
PageRank算法的核心思想是基于网页之间的链接关系和重要性来对网页进行排序。
具体而言,如果某一网页被许多其他网页引用,那么该网页就被认为是一个比较权威和受欢迎的网页,其权重也会相应提高。
在实际应用中,PageRank算法会先建立一个有向图,其中每个网页都对应一个节点,而网页之间的链接则对应着图中的边。
PageRank算法将网页的重要性定义为其在有向图中的PageRank值,该值通过一系列公式计算得出。
具体来说,PageRank算法的计算公式为:PageRank(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))其中,PageRank(A)表示网页A的PageRank值;d为阻尼系数,其取值通常设置为0.85;PR(Ti)表示指向网页A的链接来源网页Ti的PageRank值;C(Ti)表示指向网页Ti的链接数。
从公式中可以看出,一个网页的PageRank值不仅取决于它的入链数量,还与指向它的链接来源网页的PageRank值有重要关系。
二、PageRank的应用场合PageRank算法在搜索引擎中的应用最为广泛,在谷歌等TOP级搜索引擎的排名算法中均有应用。
通过PageRank算法,搜索引擎能够更准确地判断页面的重要性和相关性,并根据这些因素对搜索结果进行排序。
PageRank算法研究现状与展望摘要:为了能使用户在Internet海量的信息中准确的找到需要的资源,Web 挖掘这项新技术出现了。
而PageRank算法就是在这种背景下产生的。
它是基于Web超链接结构分析算法最成功的代表之一,已经成功的运用在了实际系统中。
但同时PageRank算法也有一定的局限性和不足之处。
本文讨论了PageRank算法的背景、算法原理及其主要的缺陷。
关键词:PageRank 算法Web结构超链接1.引言随着Internet的飞速发展,Web上的信息量也以惊人的速度增长,人们也越来越多的在Internet上发布和获取信息,万维网已经成为资料共享和信息交流的最大平台。
那么,一个很突出的问题就出现了:如何在互联网中海量的资源中迅速、准确的找到自己所需的信息?而Web挖掘这项新技术就是为了解决这一难题的。
Web挖掘技术是数据挖掘技术和Internet技术的结合,是当今计算机研究领域的新热点。
2.经典的Web结构分析算法传统的互联网应用技术大多是基于文档内容的,业界对互联网搜索功能的理解是:某个关键词在一个文档中出现的频率越高,该文档在搜索结果中的排列位置就要越显著。
这种做法都是忽略了互联网包含而传统数据环境没有的另一种丰富信息:互联网的超链接拓扑结构。
所谓的超链接就是指从一个网页指向另一个目标的连接关系。
另一个目标可以是其它网页也可以是本网页其它位置。
假设网页A有一条超链接指向网页B,那么我们就认为网页A的创建者判定网页B包含了有价值的信息。
因此,充分利用互联网间的链接结构信息对互联网的搜索具有重大意义。
基于超链接的分析方法,PageRank、HITS、SALSA等算法应运而生。
其中不少算法已经在实际系统中使用,并取得了良好的效果,而PageRank算法就是其中应用最广泛的一个。
3.PageRank算法原理PageRank算法是Google创始人Sergey Brin和Lwarence Page于1998年提出来的,它是基于Web超链接结构分析的算法中最成功的代表,也是评鉴网页权威性的重要工具。
PageRank模型的改进及微博用户影响力挖掘算法毛国君;谢松燕;胡殿军【期刊名称】《计算机应用与软件》【年(卷),期】2017(034)005【摘要】随着Web技术的发展,微博逐渐成为当下最流行的社交平台之一.微博中用户影响力计算是相关研究中的焦点问题.通过对PageRank模型的改进,提出一种新的用户影响力挖掘算法PR4WB(PageRank for MicroBlogs),解决了传统的PageRank算法由于页面权威值的等分传递带来的潜在误差过大的问题.PR4WB算法在考虑微博中用户关系的同时,利用社会网络概念将自身的活跃度、博文质量及可信性加以关联,形成动态的评价模型.基于Twitter数据的实验表明,PR4WB算法能更加准确、客观地反映出用户的实际影响力.%With the development of Web technology, microblog has become one of the most popular social platforms.The calculation of user influence in microblog is the focus of related research.Through the improvement of the PageRank model, a new user influences mining algorithm PR4WB (PageRank for Microblog) is proposed to solve the problem that the traditional PageRank algorithm has too much potential error due to the transfer of page authority value.PR4WB algorithm takes into account the user relationship in microblog while using the concept of social network to link its activity, blog quality and credibility to form a dynamic evaluationmodel.Experiments based on Twitter data show that,PR4WB algorithm can more accurately and objectively reflect the user's actual influence.【总页数】6页(P28-32,37)【作者】毛国君;谢松燕;胡殿军【作者单位】中央财经大学信息学院北京 100081;中央财经大学信息学院北京100081;中央财经大学信息学院北京 100081【正文语种】中文【中图分类】TP391.1【相关文献】1.基于PageRank的微博用户影响力评估模型研究 [J], 谢橙瞬;周莲英2.基于改进PageRank算法的微博影响力模型研究 [J], 毕秋敏;李世辉;曾志勇3.基于改进 PageRank算法的微博用户影响力排序研究 [J], 丁温雪;徐家兴;朱颢东4.一种改进PageRank的微博用户影响力计算方法 [J], 郑远飞;陈晓升;王志文;陈坚旋;陈珂;5.一种改进PageRank的微博用户影响力计算方法 [J], 郑远飞;陈晓升;王志文;陈坚旋;陈珂因版权原因,仅展示原文概要,查看原文内容请购买。
PageRank算法在学术论文引用网络分析中的应用引言:学术界对于研究成果的认可和引用是评估学术价值和影响力的重要指标。
针对学术论文引用网络的分析,PageRank算法作为一种重要的排名算法应运而生。
本文将探讨PageRank算法在学术论文引用网络分析中的应用,并讨论其优势和局限性。
一、PageRank算法简介PageRank算法是由谷歌创始人拉里·佩奇和谢尔盖·布林于1997年提出的一种网页排名算法。
该算法通过对网络中网页之间的链接关系进行分析,确定网页的权重,从而实现对网页的排序。
PageRank算法通过一系列迭代计算,将排名权重分配给每个网页,在搜索引擎中起到了很大的作用。
二、PageRank算法在学术论文引用网络分析中的应用学术论文引用网络是指通过分析学术论文之间的引用关系来构建的一个网络模型。
PageRank算法在该领域的应用主要包括以下几个方面:1. 学术领域内的重要性评估通过对学术论文引用网络进行分析,可以利用PageRank算法确定每篇论文的重要性评估。
具有较高PageRank值的论文通常被认为是影响力较大的论文,能够反映论文的学术影响力和贡献程度。
这一评估指标对于学术界的人才选拔、科研项目的评审和学术资源的分配等具有重要意义。
2. 学术领域内的专家发现在学术论文引用网络中,通过对作者间的合作关系和引用关系进行建模,可以利用PageRank算法找出领域内的专家学者。
这些专家学者通常在学术界具有较高的声誉和影响力,对于学术研究的发展具有重要作用。
通过对这些专家学者的评估,可以为学术界提供有效的人才引进和合作建议。
3. 学术领域内的研究领域识别通过对学术论文引用网络中的引用关系进行分析,可以利用PageRank算法识别出学术领域内的研究热点和重要领域。
在这些领域中经常引用的论文具有较高的PageRank值,反映了这些领域的研究热度和重要性。
根据这些识别结果,可以为学术界提供研究方向的指导和科研资源的分配。
PageRank算法在网页排序中的应用及改进引言:随着互联网的不断发展和普及,人们对于信息获取的需求也越来越迫切。
然而,互联网上的信息海量而杂乱,如何将最有价值的信息准确地呈现给用户成为了一个重要的课题。
PageRank算法的提出,为网页排序带来了革命性的变革,成为了搜索引擎领域的重要工具。
本文将介绍PageRank算法在网页排序中的应用及改进。
一、PageRank算法的原理PageRank算法是由谷歌公司的创始人之一拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)于1996年提出的,他们将其命名为PageRank,以纪念佩奇。
PageRank算法通过分析互联网上链接的数量和质量来确定网页的排名。
在PageRank算法中,网页被视为一个节点,而链接被视为网页之间的边。
算法基于两个基本假设:1. 链接数量:一个网页被其他网页链接的数量越多,说明它越重要。
2. 链接质量:链接源的重要性对被链接网页的影响程度不同,权重越高的网页链接对被链接网页的贡献越大。
根据这两个假设,PageRank算法通过迭代计算的方式为每个网页赋予一个权重,即PageRank值。
权重越高的网页被认为在搜索结果中的排名越靠前。
二、PageRank算法的应用1. 搜索引擎排名:PageRank算法是谷歌搜索引擎最初的核心算法之一。
通过分析网页之间的链接关系,谷歌可以为每个网页计算其PageRank值,并将其作为排序依据,将最有关联和有质量的网页展示给用户。
这种方式可以提高搜索结果的相关性和质量。
2. 网络推荐系统:PageRank算法也被广泛应用于网络推荐系统中。
通过分析用户的浏览历史和喜好,系统可以计算出每个网页的PageRank值,并根据这些值给用户推荐相关性更高的内容。
这种个性化推荐方式可以提升用户的浏览体验,并增加网站的粘性。
三、PageRank算法的改进虽然PageRank算法在网页排序中取得了巨大的成功,但也存在一些问题和局限性。
PageRank算法在引文网络中的应用研究作者:张东红张冬芳马一凡来源:《电脑知识与技术》2021年第27期摘要:随着学术网络平台的文献数量不断增长,快速高效的在众多质量参差不齐的文献中找到适合自己研究领域的高质量文献,对学术研究具有重要的意义。
文中首先对传统的PageRank算法的原理、基本思想以及其发展历程进行分析;然后在对比了链接网路与引文网络的相似性和差异性后提出将链接网络中的PageRank算法应用到引文网络中;最后对PageRank算法在引文网络中的应用进行研究分析。
研究发现,传统的PageRank算法存在一些缺陷,引文网络中需将文献发表时间和PageRank算法结合,进而衡量文献的重要性。
关键词:学术网络平台;PageRank算法;引文网络;文献排名中图分类号:TP311 文献标识码:A文章编号:1009-3044(2021)27-0044-03Abstract: With the continuous growth of the amount of literature on academic network platforms, it is of great significance for academic research to quickly and efficiently find high-quality literature suitable for one's own research field among numerous literatures with uneven quality. Firstly, the principle, basic idea and development process of the traditional PageRank algorithm are analyzed. Then, after comparing the similarity and difference between link network and citation network, the PageRank algorithm in link network is proposed to apply to citation network. Finally,the application of PageRank algorithm in citation network is studied and analyzed. It is found that the traditional PageRank algorithm has some defects. In the citation network, the publication time of literature and PageRank algorithm should be combined to measure the importance of literature.Key words: academic network platform; PageRank algorithm; citation network; literature ranking1 引言当今时代是知识经济时代,网络学术平台成为人们获取参考文献的有效途径。
信ia与电ggChina Computer&Communication2020年第18期基于PageRank改进算法的核心专利发现研究和志强陈萌王梦雪(河北经贸大学信息技术学院,河北石家庄050061)摘要:专利是科技信息及知识的载体,核心专利的识别对创新主体具有重要的意义,本文在深入研究现有基于引用核心专利识别算法优缺点的基础上,综合考虑引文网络度中心性和专利年龄因素,对PageRank算法进行了改进,并将改进后的算法与其他常用算法进行实验对比。
结果表明:本文提出的PageRank改进算法在挖掘高质量、新公布核心专利方面具有明显的优势.关键词:核心专利识别;PageRank;引文网络中图分类号:TP301.6文献标识码:A文章编号:1003-9767(2020)18-052-04Research on Core Patent Discovery Based on Improved PageRank AlgorithmHe Zhiqiang,Chen Meng,Wang Mengxue(School of Information Technology,Hebei University of Economics and Business,Shijiazhuang Hebei050061,China) Abstract:Patent is the carrier of scientific and technological information and knowledge,and the identification of core patent is of great significance to the innovation subject.Based on the in-depth study of the advantages and disadvantages of the existing core patent identification algorithm,considering the centrality of citation network and the age of patent,the PageRank algolithm is improved,and the improved algo t让hm is implemented with other commonly used algorithms The experimental results show that the improved PageRank algorithm has obvious advantages in mining high-quality and newly published core patents.Key words:core patent identification;PageRank;citation network0引言段庆锋等人将时间因素纳入引用权重的分配算上对PageRank专利是科技信息及知识的载体,是世界上最大的知识产权信息源。
基于网页时间权值的PageRank算法改进
冯海涛
【期刊名称】《西安邮电学院学报》
【年(卷),期】2013(018)002
【摘要】针对PageRank搜索算法采用传统文献引文分析方法导致先后更新的网页没有有效给予权值的不足,提出一种改进的N-step PageRank搜索算法.新算法在原有网页优先级别的计算方法上加入网页时间权值,使对页面级别的计算更为合理.实验结果表明,新算法能够加强最新发布网页的重要性,优化网页的搜索排序.【总页数】4页(P121-124)
【作者】冯海涛
【作者单位】中国电信陕西公司终端渠道运营支撑中心,陕西西安710075
【正文语种】中文
【中图分类】TP311
【相关文献】
1.基于社交网络的PageRank算法改进 [J], 王筱蕾
2.基于网页等级的PageRank算法改进 [J], 马海波;陈时勇
3.基于社交网络的PageRank算法改进 [J], 王筱蕾;
4.一种基于网页质量的PageRank算法改进分析 [J], 赵亚娟;闫娜
5.基于网页链接与用户反馈的PageRank算法改进研究 [J], 曹姗姗;王冲
因版权原因,仅展示原文概要,查看原文内容请购买。
PageRank在度量标准文献重要性中的研究
李涛;汪光阳
【期刊名称】《苏州科技大学学报:自然科学版》
【年(卷),期】2017(034)002
【摘要】为了更好的度量标准文献的重要性,现将Page Rank算法引入到标准引
用网络中,但算法在计算标准文献重要性时仅根据出度数来平均分配Page Rank值,在一定程度上影响了标准文献重要性的度量。
为此提出了一种Standard Rank算法来改进Page Rank算法,在计算标准文献重要性时用标准文献重要性比例来代替平均分配,并且根据标准引用网络自身的结构特征修改了阻尼系数。
实验结果表明:Standard Rank算法在度量标准文献重要性时具有更好的效果。
【总页数】5页(P59-62,66)
【作者】李涛;汪光阳
【作者单位】安徽工业大学计算机科学与技术学院,安徽马鞍山243002
【正文语种】中文
【中图分类】TP393
【相关文献】
1.软件更改可能性预测中的重要性度量研究 [J], 朱晓燕;宋擒豹;张本文
2.PageRank在度量标准文献重要性中的研究 [J], 李涛;汪光阳
3.一种复杂网络中节点安全重要性排序的度量方法 [J], 张子超;郝蔚琳;张伊凡
4.一种复杂网络中节点安全重要性排序的度量方法 [J], 张子超;郝蔚琳;张伊凡;;;;
5.浅谈标准文献在标准情报工作中的重要性 [J], 王燕飞
因版权原因,仅展示原文概要,查看原文内容请购买。
一种抵抗链接作弊的PageRank改进算法贺志明;王丽宏;张刚;程学旗【期刊名称】《中文信息学报》【年(卷),期】2012(026)005【摘要】A large number of link-based spams caused a huge impact on traditional PageRank algorithm, such as link farm, link exchange, golden links and so on. This paper proposes a new PageRank algorithm named Three Stages PageRank algorithm(TSPageRank) which can resist link spam to a certain extent. Through experiments, we found out that TSPageRank algorithm increased 59. 4% on the result of PageRank. TSPageRank can increase the PR of useful and authority pages and decrease the PR of spam and rubbish pages.%大量的基于链接的搜索引擎作弊方法对传统PageRank算法造成了巨大的影响,例如,链接农场、交换链接、黄金链、财富链等使得网页的PageRank值失去了公正性和权威性.该文在分析多种作弊方法对传统PageRank 算法所造成的不利影响的基础上,提出了一种可以抵抗链接作弊的三阶段PageRank算法—TSPageRank算法,该文对TSPageRank算法的原理进行了详细分析,并通过实验证明TSPageRank算法比传统的PageRank算法在效果上提高了59.4%,能够有效地提升重要网页的PageRank值,并降低作弊网页的PageRank值.【总页数】6页(P101-106)【作者】贺志明;王丽宏;张刚;程学旗【作者单位】中国科学院计算技术研究所,北京100190;国家计算机网络与信息安全管理中心,北京100029;中国科学院计算技术研究所,北京100190;中国科学院计算技术研究所,北京100190【正文语种】中文【中图分类】TP391【相关文献】1.基于网页链接与用户反馈的PageRank算法改进研究 [J], 曹姗姗;王冲2.基于网页链接和内容分析的改进PageRank算法 [J], 钱功伟;倪林;MIAO Yuan;曹荣3.一种对抗社交网络链接作弊的算法 [J], 申华4.基于Tf-Idf和网页链接的PageRank改进算法 [J], 戴上平;郑波荣5.一种基于链接结构的PageRank改进算法 [J], 王春芹因版权原因,仅展示原文概要,查看原文内容请购买。