Google PageRank 技术解密
- 格式:doc
- 大小:46.00 KB
- 文档页数:9
深入探讨PageRank(一):PageRank算法原理入门深入探讨PageRank(一):PageRank算法原理入门一、PageRank简介大名鼎鼎的PageRank算法是Google排名运算法则(排名公式)的一个非常重要的组成部分,其用于衡量一个网站好坏的标准。
在揉合了诸如Title、Keywords标识等所有其它因素之后,Google利用PageRank来调整网页的排名,使得“等级/重要性”的网页会相对排在前面。
简单来说,Google通过下述几个步骤来实现网页在其搜索结果页面中排名:(1)找到所有与搜索关键词匹配的网页(2)根据页面因素如标题、关键词密度等排列等级(3)计算导入链接的锚文本中关键词(4)通过PageRank得分调整网站排名结果事实上,真正的网站的排名过程并非这么简单,我们会在后面进行详细深入阐述。
PageRank于2001年9月被授予美国专利,专利人是Google创始人之一的拉里.佩奇(Larry Page)。
所以,PageRank里面的Page 并不是指网页,而是指佩奇~PageRank对于网页重要性的级别分为1~10级,10级为满级。
PR值越高说明该网页越受欢迎,也即越重要。
一个PR值为1的网站表明该网站不具备流行度,而PR值为7~10的网站则表明该网站是非常受欢迎的,或者说极其重要。
一般PR值达到4,就算是一相当不错的网站了。
Google把自己网站的PR值设置为10~类似里氏震级,PageRank级别并不是线性增长的,而是按照一种指数刻度,打个比方PageRank4比PageRank3虽然只是高了一级,但却在影响力上高上6~7倍,因此,一个PageRank5的网页和一个PageRank8的网页之间差距会比你可能认为的要大的多。
在讨论之前,先介绍两个概念:导入链接,又称逆向链接,是指链至你网站的站点,也就是我们一般所说的外部链接。
而当你链至另外一个站点,那么这个站点就是你的导出链接,即你向其他网站提供本站的链接。
Google PageRank(网页级别)介绍
Google的核心软件称为 PageRank(网页级别),这是由Google创始人 Larry Page 和Sergey Brin 在斯坦福大学开发出的一套用于网页评级的系统,网页级别是所有Google网络搜索工具的基础。
作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。
实质上,当从网页 A 链接到网页 B 时,Google 就认为"网页 A 投了网页 B 一票"。
Google 根据网页的得票数评定其重要性。
然而,除了考虑网页得票数(即链接)的纯数量之外,Google 还要分析投票的网页。
"重要"的网页所投出的票就会有更高的权重,并且有助于提高其它网页的"重要性"。
重要的、高质量的网页会获得较高的网页级别。
Google 在排列其搜索结果时,都会考虑每个网页的级别。
当然,如果不能满足您的查询要求,网页级别再高对您来说也毫无意义。
因此,Google 将网页级别与完善的文本匹配技术结合在一起,为您找到最重要、最有用的网页。
Google 所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足您的查询要求。
Google 以其复杂而全自动的搜索方法排除了任何人为因素对搜索结果的影响。
虽然Google 也在搜索结果旁刊登相关广告,但没人能花钱买到更高的网页级别,从而保证了网页排名的客观公正
请点击访问:更多关于Google PageRank(网页级别)介绍的文章。
PageRank 通俗易懂解释一、引言在信息爆炸的今天,互联网已经成为我们获取和分享信息的主要渠道。
然而,随着网页数量的不断增加,如何快速找到高质量、相关的信息变得越来越困难。
为了解决这个问题,谷歌的创始人拉里·佩奇和谢尔盖·布林发明了一种名为PageRank 的算法。
本文将通过通俗易懂的方式,详细解释PageRank 的原理和应用。
二、PageRank 简介PageRank 是一种基于网页之间相互链接关系的排名算法,旨在对互联网上的网页进行重要性评估。
PageRank 的核心思想是:一个网页的重要性取决于它被其他重要网页链接的次数和质量。
换句话说,如果一个网页被很多高质量的网页链接,那么这个网页的重要性也会相应提高。
三、PageRank 原理1. 初始化:首先,我们需要为每个网页分配一个初始的PageRank 值。
通常,将所有网页的PageRank 值设置为相同的初始值,如1/N,其中N 是网页的总数。
2. 计算链接关系:接下来,我们需要计算网页之间的链接关系。
对于每个网页,我们可以统计指向它的链接数量和质量。
链接数量是指有多少其他网页链接到了当前网页,而链接质量则是指链接到当前网页的其他网页的重要性。
3. 更新PageRank 值:有了链接关系后,我们就可以根据PageRank 的核心思想来更新每个网页的PageRank 值。
具体来说,一个网页的新PageRank 值等于它所有链接的PageRank 值之和,再乘以一个衰减因子。
衰减因子的值通常为0.85,表示链接传递的权重会随着距离的增加而逐渐减小。
4. 迭代计算:重复步骤2 和3,直到PageRank 值收敛为止。
收敛是指连续两次计算得到的PageRank 值之间的差异小于某个预设的阈值。
四、PageRank 应用PageRank 算法最初是谷歌搜索引擎的核心组成部分,用于对搜索结果进行排序。
通过PageRank 分析,我们可以快速找到高质量、相关的信息。
G oogle的Page R ank技术剖析曹 军(北京大学信息管理系 北京 100871)摘 要 检索结果排序算法一直是情报检索系统的核心技术之一,在搜索引擎中的地位则更加重要。
通过对搜索引擎google的关键技术PageRank的深入剖析,分析了其在G oogle排序系统中的作用,并对其发展所存在的问题进行了探讨。
关键词 搜索引擎 排序算法 网页级别 PageRank G oogle 情报检索 1 前 言情报检索系统最核心的问题之一是对文献和提问式的相关性判断,依靠排序算法(ranking algorithm)对文献检索结果按照相关性进行排序输出[1]。
对于基于关键词检索的网络搜索引擎,通过网页收集程序(如spider等)进行收集并索引的信息资源量极其庞大,如G oogle可以搜索的网页高达20亿页[2],而非专业的搜索引擎用户的提问式却大多是由1~3个单词组成。
由于提问式的不专指和信息资源量巨大的矛盾,系统往往会返回数量庞大的检索结果。
没有很好的排序算法,用户就需要花费巨大的精力进行浏览筛选。
如果搜索引擎能按照检索结果网页的价值和与用户提问的相关度进行排序,那么对于减轻用户负担、提高检索效率同时,好的排序算法也可以帮助搜索引擎的网页收集程序更加高效地发现和索引网页,元搜索引擎也需要用排序算法来对从不同搜索引擎检索来的结果进行综合排序[3]。
可见较之传统的情报检索系统,排序算法在搜索引擎技术中占有更加核心的地位。
传统情报检索中的排序算法以基于向量空间模型的相似度计算为代表,把文献和提问都用等长的向量表示,每个文献看成n 维的向量(W j……W n)。
W j代表词汇集中第j个单词,如果w j没有在文献中出现,则w j的值为0;如果在文献中出现,则W j的值代表这个单词的权重。
情报检索理论中最常用的计算词权W j的方法是用tf(文献内词频)乘以idf(反文献频率),其基本思想是一个词的分辨力(或标引性)与此词的文献内频率成正比(当然排除无检索意义的功能词),同时又和此词在文献集合中的集合频率成反比。
page rank算法的原理
PageRank算法是由谷歌创始人之一拉里·佩奇(Larry Page)
提出的,用于评估网页在搜索引擎中的重要性。
PageRank算法的原理可以概括为以下几点:
1. 链接分析:PageRank算法基于链接分析的思想,认为一个
网页的重要性可以通过其被其他重要网页所链接的数量来衡量。
即一个网页的重要性取决于其他网页对它的引用和推荐。
2. 重要性传递:每个网页都被赋予一个初始的权重值,然后通过不断迭代的计算过程,将网页的重要性从被链接的网页传递到链接的网页。
具体来说,一个网页的权重值由其被其他网页所链接的数量以及这些链接网页的权重值决定。
3. 随机跳转:PageRank算法引入了随机跳转的概念。
即当用
户在浏览网页时,有一定的概率会随机跳转到其他网页,而不是通过链接跳转。
这样可以模拟用户在浏览网页时的行为,并增加所有网页的重要性。
4. 阻尼因子:PageRank算法还引入了阻尼因子,用于调控随
机跳转的概率。
阻尼因子取值范围为0到1之间,通常取值为0.85。
阻尼因子决定了用户在浏览网页时选择跳转到其他网页
的概率。
通过以上原理,PageRank算法可以计算出各个网页的重要性
得分,从而在搜索引擎中按照重要性进行排序。
PageRank算法的原理及应用PageRank算法是一种被广泛应用于搜索引擎的网页排序算法,它是由Google公司的两位创始人——拉里·佩奇和谢尔盖·布林在1998年发明的。
经过多次改进和完善,如今的PageRank算法已经成为了搜索引擎排名的重要指标之一。
本文将从算法原理、公式推导和应用探究三个方面来介绍PageRank算法。
一、算法原理PageRank算法的核心思想是基于互联网上各个页面之间的链接关系进行排序,在一定程度上反映了网页的权威性和价值。
所谓链接关系,就是指一个页面通过超链接将访问者引向另一个页面的关系。
如果一个网页被其他网页链接得越多,那么这个网页的权威度就应该越高。
但是,PageRank并不直接以链接数量作为评价标准,而是通过一个复杂的算法来计算每个网页的等级。
具体来说,PageRank算法是基于马尔科夫过程的概率模型,它将互联网上的所有页面抽象成图形,每个网页都是一个节点,超链接则是节点之间的边。
PageRank算法的核心计算就是将这个图形转化成一个矩阵,然后使用迭代的方式求出每个节点的等级,即PageRank值。
在这个过程中,每个节点的PageRank值会受到其它所有节点的影响,而它自身的权值又会传递给其他节点,如此循环迭代,直到所有节点的PageRank值趋于收敛。
二、公式推导PageRank算法的公式推导是比较繁琐的,这里只能简单概括一下。
首先,PageRank值可以表示为一个向量,每个向量元素代表一个页面的权值。
由于PageRank算法是基于网页链接之间的关系计算出来的,所以可以将它表示成一个矩阵M,该矩阵中的元素mi,j表示第j个页面指向第i个页面的链接数量。
接着,可以构造一个向量v,v中的所有元素都是1/N(其中N为网页总数),代表每个页面初始的PageRank值。
然后,PageRank值可以通过迭代计算得到,具体的计算公式如下:PR(A) = (1-d)/N + d * (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))其中,PR(A)表示节点A的PageRank值,d是一个常数(0<d<1),代表网页的阻尼系数,T1-Tn是所有指向节点A的页面,C(Ti)是Ti页面的出链总数,PR(Ti)是Ti页面的PageRank值,N为网页总数。
PageRank算法详解PageRank算法是谷歌搜索引擎中最为重要的算法之一。
它通过计算网页之间的链接关系和权重来确定每个网页在搜索结果中的排名。
在谷歌早期,PageRank 算法的出现使得其搜索结果变得更加准确和有效,进而成为了全球最大的搜索引擎。
一、PageRank算法的产生1997年,拉里-佩奇(Larry Page)和谢尔盖-布林(Sergey Brin)在斯坦福大学完成了他们的博士论文,在这篇文章中他们提出了一个新的搜索算法—— PageRank。
基于局部链接法(Local Link Method)的搜索引擎实现效果不太理想。
在这种算法下,搜索引擎将根据特定的自定义指标对文本内容进行倒排索引,然后计算文本内容与关键字之间的相似性。
而该算法无法处理链接的信息,也就是说,一个因链接数目众多而重要的页面可能会得到较低的排名。
因此,佩奇和布林提出了PageRank算法来帮助解决这个问题。
这种算法基于网页链接之间的权重,可以更好地判断每个网页的重要性。
二、PageRank算法的原理PageRank 算法的核心是对互联网进行图论分析,即将互联网理解为一张由网页及其链接组成的图结构,其中,网页为节点,链接为边。
对于一张由网页及其链接组成的图结构,PageRank算法中定义的网页得分,即 PageRank 值,表示该网页在该网页集合中的重要性。
PageRank 值的计算基于以下两个规则:一、入度PageRank的值与一个网页的入度有关。
例如,一个网页有更多的链接指向它,它的 PageRank 值会更高。
这是由于网页拥有更多的链接,说明与这个页面相关的主题更加广泛和深入,并且广大网民更加喜欢这个页面。
二、出度另一方面,如果一个网页链接到其他重要的网页,那么这个页面的PageRank 值也会提高。
这是由于向外链接表示该网页被认为对其他网页有一定的参考价值。
对于搜索引擎来说,这种链接相当于对另一个页面的推荐。
通过对由超过50,000 万个变量和20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。
PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页B 的链接解释为由网页A 对网页B 所投的一票。
这样,PageRank 会根据网页B 所收到的投票数量来评估该页的重要性。
此外,PageRank 还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。
重要网页获得的PageRank(网页排名)较高,从而显示在搜索结果的顶部。
Google 技术使用网上反馈的综合信息来确定某个网页的重要性。
搜索结果没有人工干预或操纵,这也是为什么Google 会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。
---------------其实简单说就是民主表决。
打个比方,假如我们要找李开复博士,有一百个人举手说自己是李开复。
那么谁是真的呢?也许有好几个真的,但即使如此谁又是大家真正想找的呢?:-) 如果大家都说在Google 公司的那个是真的,那么他就是真的。
在互联网上,如果一个网页被很多其它网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高。
这就是Page Rank 的核心思想。
当然Google 的Page Rank 算法实际上要复杂得多。
比如说,对来自不同网页的链接对待不同,本身网页排名高的链接更可靠,于是给这些链接予较大的权重。
Page Rank 考虑了这个因素,可是现在问题又来了,计算搜索结果的网页排名过程中需要用到网页本身的排名,这不成了先有鸡还是先有蛋的问题了吗?Google 的两个创始人拉里•佩奇(Larry Page )和谢尔盖•布林(Sergey Brin) 把这个问题变成了一个二维矩阵相乘的问题,并且用迭代的方法解决了这个问题。
他们先假定所有网页的排名是相同的,并且根据这个初始值,算出各个网页的第一次迭代排名,然后再根据第一次迭代排名算出第二次的排名。
Google PageRank 技术解密PageRank(网页级别)是Google用于评测一个网页“重要性”的一种方法。
在揉合了诸如Title标识和Keywords 标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。
一:什么是PageRank(网页级别)PageRank(网页级别)是Google用于评测一个网页“重要性”的一种方法。
在揉合了诸如Title标识和Keywords 标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。
简单说来,Google通过下述几个步骤来实现网页在其搜索结果页(SERPS)中的排名:1)找到所有与搜索关键词匹配的网页2)根据页面因素如标题\关键词密度等排列等级3)计算导入链接的锚文本中的关键词4)通过PageRank得分调整网站排名结果事实上,真正的网站排名过程并不是这么简单,我们会在后面进行详细深入的阐述。
二:PageRank的决定因素Google的PageRank是基于这样一个理论:若B网页设置有连接A网页的链接(B为A的导入链接时),说明B 认为A有链接价值,是一个“重要”的网页。
当B网页级别(重要性)比较高时,则A网页可从B网页这个导入链接分得一定的级别(重要性),并平均分配给A网页上的导出链接。
导入链接(也叫逆向链接)指链至你网站的站点,也就是我们一般所说的“外部链接”。
而当你链至另外一个站点,那么这个站点就是你的“导出链接”,即你向其它网站提供的本站链接。
PageRank反映了一个网页的导入链接的级别(重要性)。
所以一般说来,PageRank是由一个网站的导入链接的数量和这些链接的级别(重要性)所决定的。
三:如何知道一个网页的PageRank得分可从上下载并安装Google的工具栏,这样就能显示所浏览网页的PageRank得分了。
PageRank得分从0到10,若不能显示PageRank得分,可检查所安装版本号,需将老版本完全卸载,重启机器后安装最新版本即可。
四:PageRank的重要性搜索引擎网站排名算法中的各排名因子的重要性均取决于它们所提供信息的质量。
但如果排名因子具有易操纵性,则往往会被一些网站管理员利用来实现不良竞争。
例如初引入的排名因子之一--关键词元标识(Meta Keywords),是由于理论上它可以很好地概括反映一个页面的内容,但后来却由于一些网站管理员的恶意操纵而不得不黯然退出。
所以“加权值”--即我们对该因子提供信息的信任程度是由排名因子的易操纵程度和操纵程度共同决定的。
PageRank无疑是颇难被操纵的一个排名因子了。
但在它最初推出时针对的只是链接的数量,所以被一些网站管理员钻了空子,利用链接工厂和访客簿等大量低劣外部链接轻而易举地达到了自己的目的。
Google意识到这个问题后,便在系统中整合了对链接的质量分析,并对发现的作弊网站进行封杀,从而不但有效地打击了这种做法,而且保证了结果的相关性和精准度。
五:Google的前1,000项搜索结果一般说来,网站排名因素包括网页标题(META TITLE),网页正文中的关键词密度,锚文本(也叫链接文本,指链接或超链的文本内容)和PageRank所决定的。
请记住:单靠PageRank是无法使你获得比较理想的网站排名的。
PageRank只是网站排名算法中的一个乘积因子,若你网站的其它排名因子的得分是零,就算你的PageRank是两百亿,最后的得分还是零。
但这并不是说PageRank就毫无价值,而是在什么情况下PageRank才能完全发挥其功力。
如果在Google上进行广泛搜索,看起来好象有几千个结果,但实际显示最多前1,000项结果。
例如对“car rental”,显示搜索结果为5,110,000,但实际显示结果只有826个。
而且用时只有0.81秒。
试想一下,0.84秒的时间就可以计算这五百万搜索结果的每个排名因子得分,然后给出最终我们所看到的网站排名结果吗?答案就在于:搜索引擎选取与查询条件最相关的那些网页形成一个子集来加速搜索的速度。
例如:假设子集中包含2,000个元素,搜索引擎所做的就是使用排名因子中的两到三个因素对整个数据库进行查询,找到针对这两三个排名因子得分较高的前2,000个网页。
(请记住,虽然可能有五百多万搜索结果,但最终实际显示的1,000项搜索结果却是从这个2,000页的子集中提炼出来的。
)然后搜索引擎再把所有排名因子整合进这2,000项搜索结果组成的子集中并进行相应的网站排名。
由于按相性进行排序,子集中越靠后的搜索结果(不是指网页)相关性(质量)也就越低,所以搜索引擎只向用户显示与查询条件最相关的前1,000项搜索结果。
请注意,在搜索引擎生成这2,000项网页的子集中我们强调了“相关性”这个词。
即搜索引擎找寻的是与查询条件有共同主题的网页。
如果这时候我们把PageRank考虑进去,就很可能得到一些PageRank很高但主题只是略微相关的一些搜索结果。
显然这有违搜索引擎为用户提供最为相关和精准的搜索结果的原则。
一旦理解了为什么会如此,就说明了为什么你应当首先努力在“页面”因子和锚文本上下足工夫,最后才是PageRank。
所以关键在于:你必须首先在页面因素和/或锚文本上下足工夫,使这些排名因子能够获得足够的得分,从而使你的网站能够按目标关键词跻身于这2,000项搜索结果的子集中,否则PageRank再高也与事无补。
六:PageRank和其它排名因子之间的不同网页Title标识仅能被列出一次。
正文中的关键词连续的重复只会降低关键词的重要性,重要的是接近度。
锚文本加权值极高,但存在上限,超过上限的锚文本信息将被忽略或降低权值。
PageRank 潜质无穷,没有上限的限制,但需要大量工作。
备注其它排名因子都存在一个上限(阙值),超过上限部分其权值将降低或不再计分。
PageRank则不存在此问题。
除了PageRank外,其它排名因子都存在一个阙值,也叫临界值或差值。
即当增长到一定值时,因子的重要性反而开始慢慢降低,则该值就是非PageRank因子的阙值。
七:非PageRank因子的上限阙值(Non-PageRank Factor Threshold)除了PageRank外,其它排名因子都存在一个阙值,也叫临界值或差值。
即当增长到一定值时,因子的重要性反而开始慢慢降低,则该值就是非PageRank因子的阙值。
设阙值为1,000,如果网页A和B是我们对某一查询条件的其中两个查询结果,且A的总分数(包括页面因子得分和PageRank得分)是900,B是500,则显然A会排在B的前面。
但由于A和B的分数均低于我们上面假设的非PageRank因子阙值,因而在不改变PageRank的情况下,我们可以通过对B页进行精心的页面优化使页面因子分数得到提高来使其排名超过A。
但如果A的总得分升至1,100分,则B若还只是一味优化页面因子是远远不够的。
在这种情况下,提升PageRank就成为首要任务了。
一般说来,Google的查询结果页中既可能包含一些分数超过阙值的网页,也可能包含一些分数低于阙值的网页。
所以:为了提高竞争能力,必须在阙值范围内尽可能提高页面的搜索引擎排名得分,否则会降低页面的竞争力。
“页面因子”是接近和达到阙值最迅捷的方式,它与PageRank的结合使用才是提升网站排名得分的最佳优化策略。
八:使用阙值推知两种排名策略的价值阙值解释了搜索引擎商所遵循的原则和不同的实施途径,同时亦阐述了为什么会产生关于PageRank的一些误解。
我们可以把这两种策略当成两个人A和B。
A认为“PageRank”并不重要。
他们已有数年网页优化经验并知道如何完美地利用“页面因素”来达到优化的目的。
他们亦理解基本的锚文本,但对PageRank得分毫不在意。
结果如何呢?由于最大化地使用了“页面因子”,从而使A迅速达到“非PageRank因子的阙值”。
所以通过精心选择关键词可使他们获得较好的网站排名。
而且只要网站内容比较好,随着时间推移总会有排名高的站点链接,涓涓细流汇成河。
A最后亦得到了PageRank得分,并籍此巩固了排名。
B认为“PageRank”十分重要。
他掌握了很多关于提升PageRank得分的信息,并为提高该得分下足了工夫。
结果又如何呢?B的做法和A相反,但A在非PageRank因子上下工夫,结果却得到了PageRank得分。
而B在PageRank 因子上下工夫,结果却得到非PageRank因子得分。
究其原因,就是由于提高PageRank得分需要外部链接,链接又具有锚文本,从而通过精心挑选外部链接的锚文本,B自发提高了其非PageRank因子的得分,从而赢得了较高的PageRank得分。
虽然这只是两个极端,但我们可以利用它们来推知这两种途径各自的优缺点:A:忽略PageRank 网站排名在短期内就可得到提升自我生成链接节省了工作量需投入大量工作维持网站排名对新竞争者的应变速度较慢B:忽略页面排名因子可获得可靠网站排名,并可在需要时轻松修改页面因素使排名迅速提升极可能从非搜索类引擎来源上获得更高访问量网站排名提升较慢操作难度较大容易为SPAM过滤程序所制事实上,我们前面说过,最终排名得分=所有非PageRank因子实际得分x实际PageRank得分。
亦即二者相辅相成,再加上随着网上营销方式的发展壮大,关键词的竞争也变的愈来愈激烈,这种情况下只靠非PageRank因子得到好排名显然是不可能的。
而且非PageRank因子存在着阙值的局限性。
同时,对于竞争性极高的关键词,还存在着PageRank下限的问题。
也就是说,除非网站的PageRank得分超过这个下限标准,否则网站排名很难上去。
PageRank的下限由关键词的竞争度所决定。
竞争性一般的关键词PageRank下限也不高,而对竞争较为激烈的关键词来说,它所要求的PageRank下限相应就要高。
而PageRank得分的提升又非常有难,这时候非PageRank因子就变的非常重要了。
综上所述:我们需要充分发挥各排名因子的优势来赢取理想的综合排名得分。
同时关键词(竞争度适宜)的精心选择亦变的非常重要,它可以节省大量的支出。
九:PageRank的计算方法PageRank (A)= (1-d)+ d(PageRank (T1)/C(T1)+ … + PageRank (Tn)/C(Tn))其中PageRank(A)表示给定页面A的PageRank得分;D为阻尼因子,一般设为0.85;PageRank (T1)表示一个指向A页的网站其本身的PageRank得分;C(T1)表示该页面所拥有的导出链接数量;PageRank (Tn)/C(Tn)表示为每一个指向A页的页面重复相同的操作步骤。