当前位置:文档之家› 几种常见的搜索引擎的性能比较与分析2

几种常见的搜索引擎的性能比较与分析2

几种常见的搜索引擎的性能比较与分析2
几种常见的搜索引擎的性能比较与分析2

闽江学院

本科毕业论文

题目几种常见的搜索引擎性能比较与分析学生姓名吴宽富

学号120081003154

系别物理系与电子信息工程系

年级2008级

专业电子信息工程

指导教师林宏

职称讲师

完成日期2012-5-10

声明

闽江学院毕业论文(设计)诚信声明书

本人郑重声明:

兹提交的毕业论文(设计)《几种常见的搜索引擎的性能比较与分析》,是本人在指导老师林宏老师的指导下独立研究、撰写的成果;论文(设计)未剽窃、抄袭他人的学术观点、思想和成果,未篡改研究数据,论文(设计)中所引用的文字、研究成果均已在论文(设计)中以明确的方式标明;在毕业论文(设计)工作过程中,本人恪守学术规范,遵守学校有关规定,依法享有和承担由此论文(设计)产生的权利和责任。

声明人(签名):

年月日

摘要

本文研究的目的是为了让我们更好的理解目前常见的几种搜索引擎,熟悉它,认识它,用好它,让它们成为我们工作生活、学习和工作的好帮手。

本文主要是对搜索引擎的初显、发展做大概的叙述,对搜索引擎的技术原理、工作的原理、系统构架等做简单分析,希望大家可以对搜索引擎有进一步的了解,同时对我们常用的几种搜索引擎进行分类,并对搜索结果的排序方法进行研究。最后通过几个指标对常见的几种搜索引擎做性能比较与分析,并通过实例来说明搜索引擎的应用,从而让大家对搜索引擎有更深的认识,让搜索引擎更好地为我们学习、生活和工作服务。

关键词:搜索引擎排序方法性能比较性能分析

刷红色处要用书面语

刷紫色处是我改好的

英文翻译要一并跟上

Abstract

This thesis is about to ultimately make people have a detailed knowledge of some common search engines at present. With knowing them, be familiar with them and taking advantage of them well, we can have them as good helpers in our daily lives, study and work.

This thesis mainly to narrate the general appearance and development of search engines, and analyse particularly search engines’technique principle, work principle, system architecture and so on. It is hoped that people would be able to know better about the search engines. Meanwhile, some common search engines are sorted, and their results-basically-sorted methods are analysed. With the comparison and analysis among the common search engines and showing how to make use of them effectively, this paper is attempt to help people understand search engines more deeply, and make search engines serve our study, daily lives and work better.

Key words:Search engines; Sorting method ; Performance comparison ; Performance analysis

目录*(这里头有误吧)

声明 (2)

摘要 (3)

ABSTRACT (4)

第一章课题背景知识 (1)

1.1搜索引擎的初显 (1)

1.2搜索引擎的发展 (2)

第二章常见几种搜索引擎 (3)

2.1搜索引擎的原理 (3)

2.2搜索引擎的分类 (5)

第三章常用搜索引擎的结果排序方法 (6)

3.2DirectHit算法 (7)

3.3 PageRank算法 (7)

3.2竞价排名法 (9)

第四章常用的几种搜索引擎的性能比较及性能分析 (10)

4.1数据库 (11)

4.2检搜结果 (12)

4.3用户界面 (13)

第五章常用的几种搜索引擎实际应用与性能分析 (16)

参考文献 (25)

感谢 (25)

第一章课题背景知识

近几年,随着网络的不断发展和壮大,搜索引擎越来越成为人们生活中重要的一部分,找资料、查地图、听音乐,只有想不到的,没有搜索不到的。中国二十多年来互联网的不断发展,造就出5亿的网民,搜索引擎也出现空前的火热。各种分类的行业网站也慢慢的兴起,使得搜索引擎越来越成为人们生活中必不可少的实用工具。

搜索引擎的出现,整合了众多网站信息,恰恰起到了信息导航的作用。通用搜索引擎就如同互联网第一次出现的门户网站一样,大量的信息整合导航,极快的查询,将所有网站上的信息整理在一个平台上供网民使用,于是信息的价值第一次普遍的被众多商家认可,迅速成为互联网中最有价值的领域。大家熟知的搜索引擎Google、百度、雅虎等是通用搜索引擎现如今的杰出代表,他们为互联网的发展做出了重要的贡献。

总而言之搜索引擎改变了人们的生活,给人们的生活工作学习带来了巨大的帮助。

1.1搜索引擎的初显(刷白什么意思?!)

搜索引擎从1990年原型初显,进过三十多年的发展,现在成为人们生活中必不可少的一部分,它经历了太多技术和观念的变革。

搜索引擎出现之前,互联网上就已经存在很多旨在让人们共享的信息资源了。这些资源当时主要存在于各种允许匿名访问的FTP站点。为了便于人们在分散的FTP资源中找到他们所需的东西,1990年,加拿大麦吉尔大学(McGillUniversity)的几个大学生开发了一个软件Archie。它是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载这个文件。Archie实际上是一个大型的数据库,再加上与这个大型数据库相关联的一套检索方法。Archie虽然还不是搜索引擎,但是从它的工作原理上看,它是所有搜索引擎的祖先。

当万维网(WorldWideWeb)出现以后,人们可以通过html传播网页信息,网络上的信息开始成倍增长。人们纷纷使用各种方法将网络上的信息搜集来,进行分类、整理,以方便查找。现在人们很熟悉的网站雅虎(Yahoo)就是在这个环境下诞生的。还在Stanford大学读书的美籍华人杨致远和他的同学迷上了互联网。他们将互联网上有趣的

网页搜集过来,与同学一起分享。后来,1994年4月,他们俩共同办了雅虎。随着访问量和收录链接数的增长,雅虎目录开始支持简单的数据库搜索。但是因为雅虎的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。

1.2搜索引擎的发展

当“蜘蛛”程序出现时,现代意义上的搜索引擎才初显端倪。它实际上是一种电脑“机器人”(ComputerRobot),电脑“机器人”是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序就象蜘蛛一样在网络间爬来爬去,反反复复,不知疲倦。所以,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。

这种程序实际是利用html文档之间的链接关系,在Web上一个网页一个网页的爬取(crawl),将这些网页抓到系统来进行分析,并放入数据库中。第一个开发出“蜘蛛”程序的是MatthewGray,他于1993年开发了WorldWideWebWanderer,它最初建立时是为了统计互联网上的服务器数量,到后来发展到能够捕获网址。现代搜索引擎的思路就来源于Wanderer,后来很多人在此基础上对蜘蛛程序进行了改进。

1994年7月20日发布的Lycos网站第一个将“蜘蛛”程序接入到其索引程序中。引入“蜘蛛”后给其带来的最大优势就在于其远胜于其它搜索引擎的数据量。自此之后几乎所有占据主导地位的搜索引擎中,都靠“蜘蛛”来搜集网页信息。Infoseek是另一个重要的搜索引擎,于1994年年底才与公众见面。起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。但是它友善的用户界面、大量附加服务使它在用户中赢得了口碑。1995年12月,它与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。1995年12月15日,AltaVista 正式上线。它是第一个支持高级搜索语法的搜索引擎,成功地整合了此前人类所有的信息检索技术,解决了包括字根处理、关键词检索、布尔逻辑,以及通过向量空间模型的查询排名等关键问题。正式公开之前,AltaVista就已经拥有20万访问用户,在短短三个星期之内,到访人数由每天30万次增加到200万次。它的成功在于满足了用户三个方面的需求:网上索引范围超过了此前任何一家搜索引擎;短短几秒钟内便可从庞大的数据库中为用户返回搜索结果;AltaVista小组从一开始就采用了一种模块设计技术,

能够跟踪网站的流行趋势,同时不断扩大处理能力。在当时许多搜索引擎之中,

AltaVista脱颖而出,成为网络搜索的代名词。Google就是站在这样的巨人的肩膀上颠覆并创造着。“上网即搜索”改变了人们上网方式的,就是现在鼎鼎大名的Google。Google并不是搜索引擎的发明者,甚至有点落后,但是它却让人们爱上了搜索。

1998年9月,在佩奇和布林创建Google之时,业界对互联网搜索功能的理解是:某个关键词在一个文档中出现的频率越高,该文档在搜索结果中的排列位置就要越显著。这就引出了这样一个问题,如果一个页面充斥着某一个关键字的话,那么它将排在很显著的位置,但这样一个页面对于用户来说,却没有任何意义。佩奇和布林发明了“网页级别”(PageRank)技术,来排列搜索结果。即考察该页面在网上被链接的频率和重要性来排列,互联网上指向这一页面的重要网站越多,该页面的位次也就越高。当从网页A链接到网页B时,Google就认为“网页A投了网页B一票”。Google根据网页的得票数评定其重要性。然而,除了考虑网页得票数的纯数量之外,Google还要分析投票的网页,“重要”的网页所投出的票就会有更高的权重,并且有助于提高其他网页的“重要性”。Google以其复杂而全自动的搜索方法排除了任何人为因素对搜索结果的影响。没人能花钱买到更高的网页级别,从而保证了网页排名的客观公正。除此之外,动态摘要、网页快照、多文档格式支持、地图股票词典寻人等集成搜索也都深得网民的喜爱。其他众多搜索引擎也都紧跟Google,推出这些服务。Fast(Alltheweb)公司发布的搜索引擎AllTheWeb,总部位于挪威,其在海外的风头直逼Google。Alltheweb的网页搜索支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。而中国的百度更是凭借“更懂中文”而吸引着中国的网络受众,它拥有超过10亿的中文网页数据库,并且,这些网页的数

量每天正以千万级的速度在增长。

搜索引擎就越来越成为人们生活中重要的一部分。

第二章常见的搜索引擎的原理和分类

2.1 搜索引擎的原理

搜索引擎,应该被定位成一个计算机应用软件系统,或者是一个网络应用软件系统。

从网络用户的角度看,它根据用户提交的类自然语言查询词或者短语,返回一系列很可

能与该查询相关的网页信息,供用户进一步判断和选取。为了有效地做到这一点,它大致上被分成三个子系统;即网页搜集,网页预处理和查询服务。

网页搜集主要负责网页的抓取,由URL 服务器、爬行器、存储器、分析器和URL 解析器组成,爬行器是该部分的核心;网页预处理主要负责对网页内容进行分析,对文档进行标引并存储到数据库里,由标引器和分类器组成,该模块涉及许多文件和数据,有关于桶的操作是该部分的核心;查询服务主要负责分析用户输入的检索表达式,匹配相关文档,把检索结果返回给用户,由查询器和网页级别评定器组成,其中网页等级的计算是该部分的核心。

搜索引擎的主要工作流程是:首先从蜘蛛开始,蜘蛛程序每隔一定的时间自动启动并读取网页URL 服务器上的URL 列表,按深度优先或广度优先算法,抓取各URL 所指定的网站,将抓取的网页分配一个唯一文档,存入文档数据库。并将当前页上的所的超连接存入到URL 服务器中。在进行抓取的同时,切词器和索引器将已经抓取的网页文档进行切词处理,并按词在网页中出现的位置和频率计算权值,然后将切词结果存入索引数据库。整个抓取工作和索引工作完成后更新整个索引数据库和文档数据库,这样用户就可以查询最新的网页信息。查询器首先对用户输入的信息进行切词处理,并检索出所有包含检索词的记录,通过计算网页权重和级别对查询记录进行排序并进行集合运算,最后从文档数据库中提取各网页的摘要信息反馈给查询用户。

网页数据库

索引数据库

日志数据库网页抓取部

网页预处理

部分信息查询服

务部分用户终端HTTP 服务器

图1-1-1搜索引擎通用总体系统结构图

2.2 搜索引擎的分类

搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(FullTextSearchEngine)、目录索引类搜索引擎(SearchIndex/Directory)和元搜索引擎(MetaSearchEngine)。

2.2.1全文搜索引擎

全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。

图1-2-1全球著名全文搜索引擎LOGO

2.2.2目录索引

目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有OpenDirectoryProject(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。

图1-2-2全球著名目录索引LOGO

2.2.3元搜索引擎(METASearchEngine)

元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。

2.2.4其他

除上述三大类引擎外,还有以下几种非主流形式:

(一)集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。

(二)门户搜索引擎:如AOLSearch、MSNSearch等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。

(三)免费链接列表(FreeForAllLinks,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。

(四)垂直搜索引擎:有针对性的搜索引擎。一次搜索的结果可能有成千上条,而在这过于庞大的信息群中,有用信息只是其中的小部分。通用搜索引擎的弊端在网络信息的急剧膨胀下突显起来,搜索越来越难以控制,用户需求和市场服务间的巨大反差产生了强大的“搜索噪音”,垂直搜索引擎的应运而生,成为搜索引擎发展史上的一块里程碑。

第三章常见的搜索引擎的结果排序方法

3.1 词频位置加权排序算法

词频位置加权排序算法是一种只从关键词出现次数和位置考虑进行排序的方法,它是计算机情报检索中最基础的排序算法。该方法以一个关键词与网页的相关度大小作为排序标准,而关键词在网页中的相关度则由它在网页中出现的频次和位置两方面加权计算得出。在这种方法中,词对网页的相关性与词在该网页中的权值成正比。一个词在网页中出现的次数决定词对网页的相关度,这种想实际上来自于卢恩自动标引的方法。卢恩认为,过一些无检索意义的词后,一个词在一篇文献中出现的频次越高,那么它对这篇文献的重要性就越大,这是目前研究自动标引的一个基本理论基础。许多搜索引擎都以索引项的词频和位置作为相关度的判定标准,采用前述的词频加权方法来计算相关度。一个词在网页文档中出现的频率越高,它代表该文档主题的程度就越大,其作为索引项的准确性也就越高,权值就越大。在与查询词匹配时,它所代表的文档与查询请求的相关度就越高。

除词频外,一个词在文档中的位置也对索引器选词和计算词的权值产生影响。例如在网页title 标签、链点标签、Meta keyword标签、Meta description标签中选词并按词频计算权值时,或索引项出现在网页标题、文章前几段、段首等位置时,其权值会加大。虽然大多数搜索引擎都以词频和词的位置来计算相关度,但在细节上又各有不同。在计算网页的相关度时,其中各词的关系和词间的

相对位置也是影响因素。网页中各词的相互距离越近则结果排序越靠前。以词频和词位置计算相关度的方法是较为客观准确的,它是应用最为广泛也是最成熟的方法,各大搜索引擎迄今仍以它作为计算相关度的基本方法。

这种算法的主要优点就是简单、易实现。该方法的缺点也很明显,虽然词的频次和位置是决定排序结果的要素,但并不是唯一要素。该算法过于依赖词的重要性,而忽视了络信息的另一个特点,即网络信息内容的质量无法得到保证。因此较易为人利用来实现不良竞争,轻易地把其网页设计修改成“含有关键词的网页”,从而在搜索引擎结果中排在前面。这使搜索引擎结果的客观性和准确性受到侵害,检索的查准率受到影响。

3.2DirectHit算法

与其它的算法相比,Askjeeves公司的directhit技术则是一种注重信息的质量和用户反馈信息的排序方法。

用户输人检索词提交给搜索引擎后,搜索引擎将查询到的相关信息以web页面形式反回给用户时,一般提供相关URL、title网页的、标签和来自于body标签,类似于要的一段少量的文字。用户浏览返回的结果、查找自己需要的信息实际是一个过滤无用信息、进行二次检索的过程。用户在二次检索中得到的结果应该是相关性较高的结果,排名应该靠前。

DirectHit算法就是一种按照上述用户的反馈结果进行排序的技术。其算法基本思想如下搜索引擎将查询的结果返回给用户,DirectHit开始跟踪用户在该搜索引擎检索结果的点击如果返回结果中排名靠前的网页被用户点击后,浏览时间较短,用户又重新返回搜索引擎击其他的检索结果,那么可以认为其相关度较差,系统将降低该网页的相关性另一方面,如果网页被用户点击打开进行浏览,并且用户在该网页浏览的时间较长,那么该网页的受欢程度就高,相应的,系统就会增加该网页的相关度。由于相关度在不停地变化,对于同一个词在不同的时间进行检索,得到结果集合的排序也就有可能不同,即DirectHit排序是一种动态排序。

从上面的分析可以看出,在该算法排序中,网页排序结果是由两部分决定的,即网页被

点击次数和被浏览的时间长度。

很显然,用户点击反馈越多则该算法的准确度就越高,因此DirectHit与一些搜索引擎建立了合作伙伴关系,即这些引擎使用DirectHit技术进行结果排序,而用户在使用这些搜索引擎查询点击后,搜索引擎将点击的结果反馈给DirectHit,DirectHit将这些收集这些结果再计算相关度。

同时,该算法带来了新的问题,即有些网站为了提高自己的排名,多次从的伙伴中点击自己的网站,来获取靠前的排名结果。对此,Askjeeves公司也采用相关的技术来屏蔽一些重复的点击,从而保证排名的相对准确性。

该算法是建立在用户点击的基础上的,因此该算法又被称为受欢迎程度来决定算法。同时分类目录进行排序时是各搜索引擎编辑者已经排好的,与之相比,该算法又称为用户控制排序算法,而分类目录的排序则称为编制控制排序算法。

该算法的优点是它利用了用户的反馈信行排序,充分满足了“用户保障原则”;但是,该在70%的用户是不会浏览检搜结果中第三页以后的信息,因此,对一些排名靠后或者新登录的网站很难有机会获得击,从而一直无法提高自己的排名。

3.3 PageRank算法

PageRank算法是由google的创始人之一、斯坦福大学计算机系的Lawrencepage博士等设计的一种对网页进行排序的算法。PageRank不仅是google成为全球最成功的搜索引擎的重要因素之一,同时它还带动了超链接分析技术的发展。随着PageRank的成功,越来越多的研究单位和商业组织开始涉足超链接分析技术这一领域的研究与开发。

PageRank采用的一种独特的表示网页重要度大小的数值。在google收集的网页数据库中,每一个网页都有一个自己的PageRank。用户使用google进行查找后,google按照关键词匹配进行查找,首先根据词频位置加权排序算法将查找结果排序,然后再PageRank 值的大小对排序进行调整,将调整好的排序结果返回给用户。PageRank的计算公式如下:

假设一个由4个页面组成的小团体:A,B,C和D。如果所有页面都链向A,那么A的PR (PageRank)值将是B,C及D的和。

继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面不能投票2次。

所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。

换句话说,根据链出总数平分一个页面的PR值。

最后,所有这些被换算为一个百分比再乘上一个系数q。由于下面的算法,没有页面的PageRank会是0。所以,Google通过数学系统给了每个页面一个最小值1-q

所以一个页面的PageRank是由其他页面的PageRank计算得到。Google不断的重复计算每个页

面的PageRank。如果给每个页面一个随机PageRank值(非0),那么经过不断的重复计算,这些页

面的PR值会趋向于正常和稳定。这就是搜索引擎使用它的原因。

PageRank算法优点点:是一个与查询无关的静态算法,所有网页的PageRank值通过离线计算获得;有效减少在线查询时的计算量,极大降低了查询响应时间。不足:人们的查询具有主题特征,PageRank忽略了主题相关性,导致结果的相关性和主题性降低;另外,PageRank有很严重的对新网页的歧视。

3.2 竞价排名法(怎么编号的)

上述3种排序主要是从技术出发来寻求好的排序结果,接下来我们讨论的是从商业

利润出发的一种排名方法——竞价排名法。这种方法开始于原来的overtune公司,该公司

目前已经为这项服务申请了专利。在我们国内,百度的竞价排名服务就做的非常的出名。

竞价排名(payperclick)是指一些商业网站购买关键字排名,搜索引擎公司按照客户

点击或者按照时间段对它们进行收费的一种服务。下面我来举例子说明竞价排名过程:

设有一商业网站R为了取得关键词E在搜索引擎F中的第N位排名,它首先向F申请E

的竞价排名服务,F对其网站进行审核(包括是否合法等),然后给出N+1、N-1两个排名的

价格,R交给F的服务费必须在上面两个价格之间才能获得第N位排名。在拿到服务费

以后,F将对R的内容进行一定的审查,审查完毕后,R将获得在F中进行词检索E的第N 位排名。当然,如果以后有新的商业网站出R'的服务费高于R,则R的排名将会后退。此后,如果用户在检索B时在检索结果中点击了R的链接,那么R将向F付服务费。

笔者认为,竞价排名主要在以下两个方面出现,一方面,从商业网站来说,上文已经说过,搜索引擎每次检索反馈的结果集合太大太多,需分很多页来显示,而大部分用户都不愿意浏览第3页以后的信息,因此导致一些排名靠后的网页根本就没有机会被浏览。而在互联网时代,对于一些商业网站来说,点击就意味着就有商机,排序靠前对他们来说非常重要。因此,他们愿意付出一定的代价来换取商机。这实际上也就是商业网站的一种广告投资。另外一方面,从搜索引擎来说,各搜索引擎公司也需要赢利方式。互联网在遭遇泡沫经济后,各种互联网服务提供商,如e-mail服务等都开始寻找自己新的赢利模式,收费服务便在这时应运而生。作为internet第二大应用项目的搜索引擎服务,能够获取效益的一种手段就是在检索结果时将一些付费商业网站排名前面,为它们做广告宣传,自己则获取广告收人。这种收费方式甚至被业界誉为最成功的互联网收费模式。上述从需求和供求两方面的结合,就诞生了竞价排名这个检搜结果排序方式。

在实施竞价排名时,由于是用户他们自己选择关键词,因此只要他们申请了这项服务的排序,搜索相关度还是比较高的。另外搜索引擎本身也会做审查的过程,检搜出来信息的质量也得到了一定的保证。而且,这种方式确实给商业网站和搜索引擎都带来了收益。该服务的缺点是对于一些没有申请服务而相关度大的网站,其排名将会相对靠后,这样就不利于用户找到最合适的资料。

第四章常见的几种搜索引擎的性能比较及性能分析

搜索引擎的评价主要是指检索性能的评价。从用户的角度来考虑,用户追求的是搜索引擎的检索效率,即在最短的时间内找到他们最需要的结果。怎样才能达到这个目的呢?首先,网站登录时间、检索响应时间、检索式构建时间、检索结果查阅时间都希望应尽可能的短;其次,要得到最需要的结果,离不开搜索引擎网站中数据库的规模,检

索式构建的合理与否等因素。结合以上两种指标体系,以上述检索效率的影响因素为依据,我们以数据库、检索结果和用户界面作为搜索引擎检索性能的评价标准。

4.1数据库

网上信息量呈几何级数增长,为提高查全率,各搜索引擎都在努力扩大自己的数据库,google所收网页已号称有50亿个;数据库数据的更新周期影响着查准率,百度的更新周期已号称部分日更新,总量周更新。但各搜索引擎的数据库规模,数据更新周期等均为其商业秘密,具有不可得性。本文通过网站https://www.doczj.com/doc/2f15056825.html,/?domain=https://www.doczj.com/doc/2f15056825.html, 得出以上几个搜索引擎的日访问量数据,然后分析其数据库规模。

常用中文搜索引擎日访问量统计表

平均日访问IP(周平均)日平均访问

PV(周平

均)

网站在中国

访问量排名

网站在世界

访问量排名

访问速率

google 300720000 3470308800 8 1 568ms/44

雅虎135660000 860084400 25 4 2214ms/26

百度67500000 1165050000 1 5 874ms/76

搜狐搜狗5778000 20916360 23 113 2201ms/26

网易有道3144000 7231200 39 259 718ms/84

新浪28,380,000 167,725,800 4 16 1,871Ms/34

上述数据是2012年4月15号到4月21号的数据。(这个数据是真实的吧)为提高查全率,各搜索引擎总是尽最大努力去收集尽量多的网页。据最新资料,

google所收网页已达50亿,收藏15亿个网址,在同行中首屈一指。而百度则号称收有十多亿个中文网页,并以每秒2.3个网页的速度增长,它的数据更新周期已达一周一次。而上述三大门户网站则侧重于收藏网站,并把收藏网站作为一种商业行为,即对所收网站进行收费,否则不予收藏。因此,它们所收的网页数量远远不如google和百度。

4.2检搜结果

检索结果的评价主要是查全率和查准率。查准率高可以减少重复检索,节省用户的检索时间;查全率高可以提高用户命中结果的可能性。对各搜索引擎检索结果的比较,笔者建立了一个比较模型,然后选取关键词进行检索,并对检索结果进行数据统计。

模型说明:第一,统计总命中记录数和前20个结果所在站点总数,进行查全率比较;通过前20个结果中重复数和前20个结果中相关度等级分布情况进行查准率统计;第二,选取含义明确、较新出现的词汇作为检索词。本次数据统计选用的五个关键词为:A1:房地产市场,A2:电子商务,A3:通货膨胀,A4:打破垄断,A5:中国股票市场;第三,检索结果与检索词的相关度分为三个等级,分别为K1、K2、K3("K1"表示相关状况较好,"K2"表示内容部分相关,"K3"表示内容不相关);第四,在每个具体的检索数据栏里列出该检索词的检索响应时间。

表2前20个结果中相关等级为K1/K2/K3的命中个数(无重复)(居中)

雅虎中文百度搜狐搜狗网易有道新浪

Google中

A1 11/8/3 14/5/2 9/11/0 13/6/0 10/8/0 11/7/0

A2 13/6/1 15/4/1 16/4/0 13/5/2 12/5/2 14/4/3

A3 11/8/1 17/2/0 9/2/0 14/3/0 14/6/0 12/6/2

A4 14/3/0 16/4/0 6/14/0 14/3/0 12/6/1 11/10/0

A5 15/2/4 16/3/0 14/6/1 16/5/1 13/6/0 15/3/2

表3总命中数/前20个结果所在站点总数/20数前个结果重复数/响应时间(单位:秒)Google中

雅虎中文百度搜狐搜狗网易有道新浪

A1 71800000

/18/1/0.08 12375744

2/18/1/0.7

6

33400000/

20/0/0.18

3

1210170/

/0/0.269

45100/20/

0/?

773684/1

8/1/?

A2 18500000

0/20/1/0.1

2 14336554

1/20/0/0.4

7

10000000

0/20/0/0.3

1

2767291/

/0/0.253

12900000

0/19/0/?

246421/2

0/0/?

A3 33700000

/17/1/0.14 44243475

/19/1/0.18

45100000

/19/0/0.24

6900000/

?/0/0.09

430000/18

/1/?

291949/1

5/2/?

A4 5260000/

17/1/0.30 6493278/

18/1/0.15

2980000/

20/0/0.28

373785/

?/0/0.11

614000/20

/0/?

14434/16

/3/?

A5 1700000/

20/0/0.12 60790374

/18/1/0.14

2770000/

19/1/0.37

1208509/

/0/0.005

8250000/1

9/0/?

7692/18/

注:搜狐栏中的“?”是因为搜狐搜索结果中没有网站网址显示;网易和新浪栏中“?”表示这两个网站没有显示搜索时间

4.3用户界面(这点其实可以抓点儿图更直观更具说服力)

不管是搜索引擎服务商还是用户,对用户界面的要求都是美观、实用。搜索引擎界面的美观性主要表现在简洁上,“实用”则体现在界面所提供的功能、内容等方面。首页简洁能节省网站的登录时间,并能让用户尽快地找到检索入口;结果输出界面要求简洁而不简单,简洁能缩短网页响应时间,让用户更方便地查阅输出结果。页面的实用性主要体现于显示的结果内容和页面友好性上,包括首页中给用户提示的帮助系统,结果输出页中“网页快照”和提供二次检索的“在结果中搜索”及检索结果的摘要等方面。因此,用户界面数据主要从这几个方面来统计。

主要内容有网页快照否是否支持“在

结果中检搜”是否提供相关检搜词参照

google中文非常简洁,首

页页面文字11

行有内容详细提供图像、网

页目录搜索和

网上论坛服务

百度非常简洁,首

页页面文字10

行有内容详细提供图片、新

闻、MP3、网

站搜索和贴巴

服务

雅虎中文较为简洁,首

页页面文字11

行有内容非常简

提供分类网

站、图片、新

闻搜索

网易有道繁杂,分为六

大块:搜索框、

分类搜索目录

无提供分类网

站、图片搜索

有,较少(在网

页上部有一小

网站的广告)

搜狐搜狗繁杂,分为七

大块:(两大部

分为医疗广

告)

有内容详细提供新闻、

MP3、商业企

业、分类目

录搜索服务

有,多(两大部

分的医疗广告

占了整个网页

页面的四分之

一)

新浪较为简洁,分

为检索框、分

类目录、专题

搜索等四大块有,内容较详

提供全部网

站、分类目录、

新闻、图片、

MP3、旅游、

等搜索服务

有,少(网页顶

部有一个演唱

会的广告)

由于各网站侧重点不同,所设主页的链接数也不相同。雅虎、搜狐、新浪、网易都是门户网站,它们提供多项服务,首页有上百个链接;而google、百度由于专注于搜索

主业,网页做得极为简洁,链接数都很少。这样有两个好处:第一,由于打开网站的负担轻(链接少),用户能迅速登录;第二,网页页面简洁,不会给用户眼花缭乱的感觉,能让用户在最短的时间内找到检索入口。百度和google的首页的友好性很强,有详细的帮助文档。

google和百度检索结果输出界面具有很强的实用性。首先,它们在检索结果输出时能显示更多、更详细的信息。其他网站显示内容不全:搜狐检索结果不显示所搜索到的网址,而网易、新浪不显示搜索响应时间、搜狐只显示标题和摘要两项,网易只有标题、摘要和网址三项。此外,百度和google还把丰富的检索技巧放在结果输出页的醒目位置,如:在每条检索结果后附上“网页快照”,在网页顶部或底部附有“在结果中检索”、“相关检索词”。

第五章实例说明常见的几种搜索引擎的应用

所有的搜索引擎都是服务人,为人解决问题,帮助人获取互联网的信息是搜索引擎存的最大的价值,下面笔者从学习、生活和工作中选取三个例子具体分析搜索引擎是的应用。(下面这个表太大同时也可以抓图说明问题)

搜索对象搜索引

擎种类

信息相关性评价和信息价

值评价

是否存在商业推

广

性能比较与分

六度空间理论百度信息相关性较高,查看了

前十条搜索记录,有九条

都是关于此理论的,关于

六度空间各百科,论坛,

博客等资料。信息价值度

较高,在百度前十条中,

有七条有价值

存在为百姓网,

58同城,慧聪网,

赶集,起点中文

网做推广

百度搜索引擎

拥有目前世界

上最大的中文

信息库,总量达

到6000万页以

上,并且还在以

每天几十万页

的速度快速增

长。由于后台应

浅析各类搜索引擎之间的联系与区别

浅析各类搜索引擎之间的联系与区别 摘要internet上蕴藏着非常丰富的信息资源,但是要从浩如烟海的信息 中准确、及时、方便、迅速的找到自己所需要的信息,却并不是一件容易的事情.为此应对重点网络搜索引擎的检索技术和功能作一全面的介绍.使学生在网络信息检索中选择了好的搜索引擎,才能快速、准确地找到所需要信息.本文主要对百度和google两个典型搜索引擎之间的检索技术、各自特点进行全面的比较和分析,从而得出各类搜索引擎之间的联系与区别。 关键字google 百度搜索引擎比较分析 Google是世界上最大的搜索引擎,通过对200多亿网页信息的整理,每天为世界各地提供1.5亿次以上的网上信息查询服务。百度是全球最大的中文搜索引擎, 拥有超过10多亿的中文网页数据库, 每天响应超过亿次的网络信息搜索请求。在这两大搜索引擎之间, 搜索的结果平均有85%的不同,因此,有网站把两者结合建立了百Google度。然而,这两大搜索引擎之间究竟有什么特点和区别,本文将根据数据加以分析、比较研究。 Google与百度的特点 Google的特点 google秉持着开发“确解用户之意, 切返用户之需”的“完美的搜索引擎” , 使得搜索方式发生了根本性变化, 在业界独树一帜, 其强大的功能和独到的特点就在于: (1)“网页快照”功能。能从google服务器里直接取出缓存的网页。如果原地址打开很慢, 那么可以直接查看google缓存页面, 因为google服务器速度极快;如果原链接已经死掉或者因为网络的原因暂时链接不通, 那么可以通过google快照看到该页面信息;如果打开的页面信息量巨大, 一下子找不到关键词所在位置, 那么可以通过google快照, 因为快照中google用黄色表明关键字位置。 (2)“单词英文解释”功能。写英文文章的时候, 最头疼的事情就是对某个英文单词的用法不确定。现在有了google, 一切就迎刃而解了!无论你是想查找某个生词的意思还是想了解某个单词的用法, 均可使用在线词典。 (3)“网页翻译”功能。google提供了网页翻译功能, 虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文, 但是不得不承认, 这是个杰出功能, 只要你点击“Translate this page ”按钮, google为你提供了人工智能的机器翻译, 翻译出来的结果让你大致能够看得明白。 (4)“搜索结果过滤”功能。网络上的成人信息浩如烟海, 而且很多站点具有欺骗或者其他不良企图, 浏览者很容易掉入其中的陷阱。为此google新设立了成人内容过滤功能, 见google的设置页面,不过, 中文状态下的尚没有这个功能。 (5)“超文本匹配分析”功能。google的搜索引擎, 同时也分析网页内容,

搜索引擎需求分析

搜索引擎需求分析 搜索引擎简介 搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目了然的信息地图,供你随时查阅。 搜索引擎的工作原理?搜索引擎的工作原理大致可以分为: 1、搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。 2、整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。 3、接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。 搜索引擎对网站的影响 一个网站的命脉就是流量,而网站的流量可以分为两类。一类是自然流量,一类就是通过搜索引擎而来的流量。如果搜索引擎能够更多更有效的抓取网站内容,那么对于网站的好处是不言而喻的。所以,SEO也应运而生了。 在百度和谷歌两大搜索引擎的工作中,百度的工作周期相对来说短一些,百度大约在10天左右重新访问网站一次,Google大约在15天左右重新访问一次网站。由于一天之内不能游历全球所有的网站,如果推广网站时,能到更多的网站上提交相应的网站信息,也是加快蜘蛛收录网站内容的重要环节。 搜索引擎作用 搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站用户行为的 一个有效工具”。高效的站内检索可以让用户快速准确地找到目标信息,从而更有效地促进产品/服务的销售, 而且通过对网站访问者搜索行为的深度分析,对于进一步制定更为有效的网络营销策略具有重要价值。 1、从网络营销的环境看,搜索引擎营销的环境发展为网络营销的推动起到举足轻重的作用

国内外搜索引擎的特征及其比较

国内搜索引擎的特征及其比较 摘要随着信息的剧增,Internet的进一步普及,在浩如烟海的信息高速公路上,根据自己的需求快速准确地需找所需要的信息越来越依赖于借助多种多样的Internet信息检索工具,而搜索引擎是我们平时使用最多的一种。下面就国内的四个著名搜索引擎来探究它们的特征和区别。 关键字引擎检索查询 一百度(http://WWW.baidu.corn) 百度由百度网络技术有限公司于1999年底在美国硅谷创建,是目前全球最大的中文搜索引擎。数据库中收录约3亿个中文网页,平均2周更新一次,对部分网页每天更新。搜索方式以关键词检索为主,同时可结合分类目录限定检索范围,分基本检索和高级检索两种,支持布尔算符和字段限制符。特设百度快照功能,供用户迅速查看每条检索结果的内容。检索时不区分英文字母的大小写,检索结果依相关度排列。 二中文Goog1.(hap://WWW.google.corn) Gcog1.由两位斯坦福大学的博士I丑rry Page和SergeyBrin在1998年创立,是目前世界上最大的搜索引擎。数据库中收录约1O亿多个中文网页,采用高级的网页级别技术,用户界而出色,有新闻组、图像、新闻等搜索,以搜索相关性高闻名。检索方式为关键词检索,分为基本检索和高级检索,基本检索以布尔检索为主,高级检索中包括: (1)排除某些站点; (2)限定检索结果于某一特定网站; (3)限定语言类型; (4)相关网页检索,检索结果依检索式相关性排列。 三新浪(http://WWW.sina.com) 新浪搜索引擎是面向华人的网上资源查询系统。提供网站、网页、新闻、软件、游戏等查询服务。共有16大类目录,1万多个细目和数十万个网站。搜索方式包括关键词查询和分类目录检索两种。除基本检索以外,还具备“重新查询”“在结果中再查”和“在结果中去除”三种高级检索,支持布尔逻辑检索,用

2020年【搜索引擎】行业调研分析报告

2020年【搜索引擎】行业调研分析报告 2020年2月

目录 1. 搜索引擎行业概况及市场分析 (6) 1.1 搜索引擎行业市场规模分析 (6) 1.2 搜索引擎行业结构分析 (6) 1.3 搜索引擎行业PEST分析 (7) 1.4 搜索引擎行业发展现状分析 (9) 1.5 搜索引擎行业市场运行状况分析 (10) 1.6 搜索引擎行业特征分析 (11) 2. 搜索引擎行业驱动政策环境 (12) 2.1 市场驱动分析 (12) 2.2 政策将会持续利好行业发展 (14) 2.3 行业政策体系趋于完善 (14) 2.4 一级市场火热,国内专利不断攀升 (15) 2.5 宏观环境下搜索引擎行业的定位 (15) 2.6 “十三五”期间搜索引擎建设取得显著业绩 (16) 3. 搜索引擎产业发展前景 (17) 3.1 中国搜索引擎行业市场规模前景预测 (17) 3.2 搜索引擎进入大面积推广应用阶段 (18) 3.3 中国搜索引擎行业市场增长点 (19) 3.4 细分化产品将会最具优势 (19) 3.5 搜索引擎产业与互联网等产业融合发展机遇 (20) 3.6 搜索引擎人才培养市场大、国际合作前景广阔 (21)

3.7 巨头合纵连横,行业集中趋势将更加显著 (22) 3.8 建设上升空间较大,需不断注入活力 (22) 3.9 行业发展需突破创新瓶颈 (23) 4. 搜索引擎行业竞争分析 (24) 4.1 搜索引擎行业国内外对比分析 (24) 4.2 中国搜索引擎行业品牌竞争格局分析 (26) 4.3 中国搜索引擎行业竞争强度分析 (26) 4.4 初创公司大独角兽领衔 (27) 4.5 上市公司双雄深耕多年 (28) 4.6 互联网巨头综合优势明显 (29) 5. 搜索引擎行业存在的问题分析 (30) 5.1 政策体系不健全 (30) 5.2 基础工作薄弱 (30) 5.3 地方认识不足,激励作用有限 (30) 5.4 产业结构调整进展缓慢 (30) 5.5 技术相对落后 (31) 5.6 隐私安全问题 (31) 5.7 与用户的互动需不断增强 (32) 5.8 管理效率低 (33) 5.9 盈利点单一 (33) 5.10 过于依赖政府,缺乏主观能动性 (34) 5.11 法律风险 (34)

新搜索引擎与问天搜索对比分析报告

1搜索环境 新搜索引擎:PC机,2G内存,数据量166万; 问天搜索:服务器,数据量500万 2搜索地址 问天搜索: https://www.doczj.com/doc/2f15056825.html,/ClassifyResults.aspx?vectors=58+59+60+61+62+&journals=&field=qk&star t=1&resultperpage=20&source=all&sortoption=relevancy&query=&xTitleIndex=42&select=58+ 新搜索引擎: http://192.168.0.172/https://www.doczj.com/doc/2f15056825.html,/zhishiku.aspx 3搜索结果对比表 4搜索结果截图(详见附表1) 5结论 搜索时间: 当数据量不是很大时,两个搜索引擎的搜索时间差距不是很大,而当数据量很大时,新搜索引擎的用时少。 搜索数量: 从结果对比表可以看出,问天搜索的结果数量较少,甚至搜索结果为0,而新搜索引擎的结果数量较多。 搜索相关度: 大多数情况下,问天搜索的相关度不是很理想,没有达到预期的效果,新搜索引擎的相关度则相对来说较好,满足了搜索的预期要求。 另外知识库的关键字是自定义的,所以关键字定义的越全面,新搜索引擎的搜索结果也更加全面更加准确。

1 搜索环境 新搜索引擎:PC机,2G内存,数据量166万; 问天搜索:服务器,数据量500万 2 搜索地址 问天搜索: https://www.doczj.com/doc/2f15056825.html,/SearchResults.aspx?lang=s&start=1&source=all&resultperpage=10&query= &sortoption=relevancy&field=all 新搜索引擎: http://192.168.0.172/https://www.doczj.com/doc/2f15056825.html,/search.aspx 3 搜索结果对比表 4搜索结果截图(详见附表2) 5 结论: 搜索时间: 当数据量不是很大时,两个搜索引擎用时没有很大的差距,但数据量很大时,新搜索引擎的用时明显少。 搜索相关度: 问天搜索的结果中包含有很多如“的”、“而且”等一些需要过滤的停用词,而且位置都排在搜索结果的前面,严重的影响着搜索的相关度。 新搜索引擎启用了较全面的停用词库,很好的过滤掉了那些不需要的停用词,相对于问天搜索,相关度明显提高很多。 搜索数量: 问天搜索的搜索数量很少,而且停用词占了一部分,并且还存在搜索不出结果的情况,新搜索引擎的搜索数量比问天搜索的搜索数量高出很多。

企业网站搜索引擎友好性分析实验报告

企业网站搜索引擎友好性分析实验报告 1.实验目的 了解搜索引擎营销对网络营销信息传递的作用,通过对部分选定网站搜索引擎进行友好性分析,深入研究网站建设的专业性对搜索引擎营销的影响,对于发现的问题,提出相应的改进建议。 2.实验内容和步骤 (1)从备选网站中选定一个企业网站; (2)浏览该网站并确认该网站最相关的2-3个核心关键词(比如主要产品名称、所在行业等); (3)用每个关键词分别在搜索引擎google和百度进行检索,了解该网站在搜索结果中的表现,如排名、网页标题和摘要信息内容等,同时记录 同一关键词检索结果中与被选企业同行的其他竞争者的排名和摘要信息情况; (4)根据有关信息分析被调查网站的搜索引擎友好性。 本实验备选网站网址 https://www.doczj.com/doc/2f15056825.html, https://www.doczj.com/doc/2f15056825.html, https://www.doczj.com/doc/2f15056825.html, https://www.doczj.com/doc/2f15056825.html, https://www.doczj.com/doc/2f15056825.html, https://www.doczj.com/doc/2f15056825.html, https://www.doczj.com/doc/2f15056825.html, https://www.doczj.com/doc/2f15056825.html, https://www.doczj.com/doc/2f15056825.html, https://www.doczj.com/doc/2f15056825.html, 3.实验报告 本次实验所选的网站是娃哈哈集团的https://www.doczj.com/doc/2f15056825.html,,并以GOOGLE,百度两个搜索引擎进行搜索。 杭州娃哈哈集团有限公司为中国最大的食品饮料生产企业,全球第五大饮料生产企业,仅次于可口可乐、百事可乐、吉百利、柯特这4家跨国公司主要生产含乳饮料、瓶装水、碳酸饮料、茶饮料、果汁饮料、罐头食品、医药保健品、休闲食品等八大类60多个品种的产品,其中瓶装水、含乳饮料、八宝粥罐头多年来产销量一直位居全国第一。进入该公司网页首先出现醒目的“娃哈哈”三个字,背景是传统的鮮紅色,配以简单的关键词和动态的产品图片介紹。通过浏览其网站后我觉得应该选用“饮料业”“饮用水”“乳品”作用核心关键词进行研究分析。 一,在GOOGLE搜索。

六大搜索引擎的比较

一、界面、广告以及速度搜索引擎在我们日常操作中的使用频率非常高,大家使用它的目的都非常明确,就是用它来搜寻需要的内容,而不会为搜索引擎的页面做过多的停留,因此搜索引擎的界面设计和速度就对我们的使用产生不小的影响,下面来看看这六款搜索引擎在界面和速度上的表现。谷歌、百度和微软的Live Search,这三大搜索引擎的界面大家都已经相当熟悉,它们有着共同的特点,就是简洁至极:网站LOGO、搜索框和按钮以及个别功能服务链接,除此以外,页面上就没有其他多余和花哨的东西了,给人的感觉非常清爽,界面一目了然,特别是Live Search在不失简洁的同时还通过一些小脚本和背景图片使得页面整体更加美观。三者使用起来都很方便,并且首页界面上没有任何第三方的广告。搜索结果页面,三者同样是采用简洁的风格,页面左侧排列着搜索结果,百度搜索结果页面右侧有不少广告,谷歌视关键词的不同也可能出现右侧广告。 Live Search的界面十分简洁且美观 百度搜索结果页面右侧的广告与上面三者相比,雅虎全能搜在界面上显得更为活泼、色彩更加多样,并且在首页内容上也更丰富。首页上除了常规的搜索所需组成部分外,雅虎全能搜还加入了天气预报、邮箱登录的显示区域。虽然这些占据了一点点页面,但是它们功能实用且不影响正常使用。雅虎全能搜的搜索主页 搜狗搜索的界面可谓结合了谷歌和Live Search:在布局上

与谷歌类似,而在细节上与Live Search有着异曲同工之妙;而搜索新军——网易有道的界面与谷歌、百度站在同一阵线,风格、版式都十分一致。在搜索结果页面中,搜狗搜索页面左侧有少量广告。总的来说,六款搜索引擎的界面设计都比较合理、美观、大方。雅虎全能搜的界面稍有不同,加入了天气预报和邮箱模块,而其他五款都尽量精简,其中谷歌、百度和有道趋于一致,采用最简的风格,而Live Search和搜狗在首页的一些细节上多加以了一些修饰。此外,值得一提的是一些搜索引擎对于Logo文化的重视,在传统的节日或者一些特殊的纪念日时都会将首页的Logo徽标换成与该日子相关的设计。其中在这方面要数谷歌和百度做得最为出色:无论是三八节、五一节这样的国际节日,或者情人节、万圣节这样的西方舶来物,还是春节、清明、端午等传统的中国农历节日,谷歌和百度都会精心设计相应的节日Logo;此外,谷歌在一些特殊的纪念日,如达芬奇诞辰、地球日之类的纪念日也会推出专门的徽标;而百度近期开始定期在首页推出一个搜索封面人物,以此反映对互联网时代风云人物的价值取向,十分有特色。雅虎和搜狗在节日Logo设计方面也有所表现,在节日时也可经常看到其专门的徽标;网易有道正式版新近推出不久,我们还无法对其在特殊Logo的设计上是否会有所表现作出评价。搜索引擎的特色Logo其实并不仅仅是一个单纯的设计,它还有更多的作用:它承载了一种信息,传达了搜索引擎提供商对于创新、

搜索引擎营销策划方案

搜索引擎营销策划方案简介搜索引擎营销策划方案简介 目录 网络营销策划方案: (流量、页面优化相关性、Alexa排名、PR值、SEN[百度相关搜索]、长尾) 一、网站分析 1、网站流量分析 (1)、流量来路统计 (2)、浏览页面和入口分析 (3)、客流地区分布 (4)、搜索引擎与关键词分析 (5)、客户端分析 2、站点页面分析 (1)、主页面整体分析 (2)、页面标签分析 (3)、超链接检查 (4)、浏览速度分析 (5)、源代码设计分析 、网站运用技术和设计分析 (1)、分析目前技术是否采用合理 (2)、分析网站构架是否合理 (3)、分析网站设计是否有亲和力、是否容易阅读 、网络营销基础分析 (1)、关键词分析 (2)、搜索引擎登记状况分析 (3)、搜索引擎排名状况分析 (4)、交换链接相关性 (5)、网络营销主要方法分析 、网站运营分析 (1)、网络投资分析 (2)、网站运营策略分析 二、网站优化 1、网站结构优化 2、网页标签优化 3、网页减肥压缩 4、超链接优化 5、页面内容优化 三、网站推广 1、搜索引擎排名 (1)、关键词选择 (2)、搜索引擎登陆 (3)、搜索引擎排名 (4)、(GOOGLE--》百度---》YAHOO----》.......

(5)SEN(相关搜索优化) 2、相关链接交换 3、网络广告投放 4、对手链接全交换(长尾链接) 四、网络营销策划方案【以服装为例】 传统的市场营销目标是把合适的产品以合适的价格出现在合适的地方。正确的营销推广组合方式是把你的产品/服务信息呈现给正确的人(目标受众)。 网络营销效果应该是围绕建立你的品牌而进行的。不论你的品牌是来自于你的产品或是你的服务,都必须建立起客户信任度。而与客户建立关系就是让客户和你的网站间树立起信任和商业信誉。你的品牌是你和竞争对手的一个很大的区别。必须以客户的角度看看你的网站和你的品牌,他们是否能给你产生信任感?请记住,即使搜索引擎搜索结果高排名也不会给你任何商业的信誉(网站搜索引擎优化相关服务:网站优化、搜索引擎优化、Google排名、Google优化),他们只是让客户更快找到你。| 营销的唯一目标是达成销售。在网络营销领域,这是很容易被忽略的,因为有太多需要操心的,搜索引擎结果排名,网站流量,点击率,回报率等等。 搜索引擎优化的目标是让您能够在搜索引擎结果中更容易被找到。但这并不能保证销售,光有曝光率是不能产生销售结果的,还必须有个强大的市场营销活动帮助促进销售,如果没有产生销售收入,排在搜索引擎第一名对你的生意而言毫无意义。你的业务应该是集中在市场营销,比如增加客户而不是访客。 目前Google、雅虎、百度等搜索引擎竞价产品是网络营销的主流产品,越来越多的企业选择搜索引擎竞价产品。多数企业购买竞价产品后并不知道还有维护这回事情,只是静待客户上门。做了一段时间下来就发现起初还有点效果,到后来效果就越来越差了。 出现这种情况的原因就在于没有对其竞价产品进行维护。搜索引擎竞价的效果由多方面的因素组成,每日的消耗预算、关键词上词数量和报告分析等维护工作的好坏直接影响了搜索引擎竞价产品的效果。我们的企业在使用竞价产品的时候,不应守株待兔,而是应选择有实力的服务商进行产品维护,提升网络营销效果。 记住只有价格策略也不能带来销售。价值驱动销售,你的品牌决定你的价值。如果你建立了重要而且独特的品牌,客户将记住你的品牌,并回来购买你的产品。因此请建立你的品牌。 你与竞争者的区别。客户在购买某个产品的时候都会货比三家,谁能脱颖而出关键在于产品描述,客户服务,客户体验还有网站印象,如果你的网站看上去在某个领域很专业,这有助于帮助将增强你的品牌价值。福客思建材超市网确保你的网站是专注于客户和提升客户体验,通常客户在网站上的看到的企业与自己所理解的有很大不同。我们应尽量避免建设这么一个基于说明书似的的企业网站。 网站要怎样做才能让你的客户关注你?应该是快速载入、方便导航的,目标客户相关内容的,并且经常更新的内容。这些内容应有助于提高信任度和信誉。 网站的成功是建立在健全的市场营销策略而不是搜索引擎流量。搜索引擎优化应该是整个营销策略之一,而不是你的唯一营销策略。我们的网站应该是客户友好而不仅仅是搜索引擎友好,我们应创建独特的品牌价值从而排除其他竞争对手。 建设企业网站是开展网络营销非常重要的一环。然而事实上,大部分企业网站都没有发挥出应有的网络营销作用。这跟企业对网站建设的认识是分不开的。多数企业认为网站是企业的网上门面,越漂亮越好。美工设计、Flash动画、企业形象成为企业最关注的地方,至于网站是否符合网络营销的需要,是否便于今后的功能增加或调整,并不考虑。部分网站建设服务商也一味迎合企业的喜好,在表现形式上大下功夫,拉高网站建设费用,至于内在功能和营销应用环节则不做深究。 福客思建材超市网致力于网站建设是服务于网络营销需要的,这一点一定要明确。网站建设应当设计与应用并重。既要注重企业的形象展示,更应明确网站的网络营销服务职能和流程,注重产品或服务展示、用户互动、信息检索、客户体验等环节的建设,使网站更加实用,有效 福客思建材超市网很好的提供了这项服务的专业门户网站,为会员提供三套独立网站。

技能训练5-1主要搜索引擎特性的对比分析

技能训练5-1 主要搜索引擎特性的对比分析 以“六度空间理论”、“搜索引擎优化”、“手持移动电视”为关键字,在三大搜索引擎(百度、谷歌、搜搜)上进行“网页”搜索,将相关搜索结果整理为100字左右的文字描述,然后以4-6人为小组分享各自的结论,并就三大搜索引擎的特点、返回结果信息的相关性、价值度的大小等方面进行讨论,并将形成的结论填入下表。 表5-4 三大搜索引擎对比分析表 调查时间: 11·28 调查人:余思琪 搜索对象搜索引 擎种类 搜索引擎 特性描述 信息 相关 性 评价 信息 价值 度 评价 是 否存在 商业推 广 六度 空间理论百度 拥有目前世界上 最大的中文信息库, 支持主流的中文编码 标准,采用智能相关 度算法,支持二次检 索(又称渐进检索或 逼进检索),采用先进 的网页动态摘要显示 技术 相关 度高,前 20条里有 19条都与 之相关,大 多来自百 科.文库. 博客 信息 价值度,在 这19条中 我都能了 解到关于 六度空间 理论的相 关信息 没 有Google 目前规模最大搜 索引擎,提供常规搜 不高, 前十条中 一般, 其中有不 存 在关键

索和高级搜索两种功能。信息条目数量。但也要注意其多种语言字母无大小写之分,全部默认为小写,不使用词干法,也不支持通配符只有5条 与其相关 来自百科, 和一些网 页 少与所搜 索的东西 不相关 字广告 和广告 联盟 搜搜 腾讯出品为广 大用户提供的问答互 动平台。覆盖面广 ——接触庞大QQ用户 群,针对性强——准 确覆盖目标用户,互 动性强——即搜即Q, 立刻抓住您的客户, 灵活可控——快捷调 整广告内容和广告开 销 相关 度很高,前 十条内都 与之相关 信息 价值度高。 从前十条 中我都能 了解到六 度空间理 论的含义 没 有 什么是六度空间理论? 你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。这就是六度分割理论,也叫小世界理论。

移动搜索市场研究报告完整版

编号:TQC/K811 移动搜索市场研究报告完 整版 Daily description of the work content, achievements, and shortcomings, and finally put forward reasonable suggestions or new direction of efforts, so that the overall process does not deviate from the direction, continue to move towards the established goal. 【适用信息传递/研究经验/相互监督/自我提升等场景】 编写:________________________ 审核:________________________ 时间:________________________ 部门:________________________

移动搜索市场研究报告完整版 下载说明:本报告资料适合用于日常描述工作内容,取得的成绩,以及不足,最后提出合理化的建议或者新的努力方向,使整体流程的进度信息实现快速共享,并使整体过程不偏离方向,继续朝既定的目标前行。可直接应用日常文档制作,也可以根据实际需要对其进行修改。 Ⅰ. 数据来源 该报告数据主要来自于比达咨询 (BigData-Research)数据中心相关监测 数据的整理分析、《微参与》移动用户调 查。此外,研究过程中还充分参考了专家 访谈、企业公开数据及桌面资料等信息内 容。 Ⅱ. 概念定义 移动搜索:移动搜索是指依托移动互 联网,借助手机、iPad等移动设备在综合 搜索网站、垂直搜索网站等多类搜索网站

搜索引擎市场分析及人民搜索发展思考

搜索引擎市场分析及人民搜索发展思考 ——对即刻搜索赢得搜索引擎市场竞争的分析和建议 一、当前我国搜索引擎市场状况分析 1.搜索引擎作为第二大网络应用,“新门户”趋势明显。 截至2012年6月底,中国网民数量达到5.38亿,手机网民规模达到3.88亿。其中,搜索引擎用户规模达到4.29亿,半年增长率为5.2%,网民渗透率为79.7%,仍然是仅次于即时通讯(如QQ、MSN)第二大网络应用。搜索引擎的网民使用率进入稳定发展阶段,用户规模会随着网民总体规模的增长而进一步提升。 2.搜索引擎竞争的市场规模潜力大、市场集中度高。 根据易观智库产业数据,2012年第2季度中国搜索引擎运营商市场规模为70.0亿,环比增长26.6%,同比增长62.0%。 从市场格局看,2012年第2季度我国搜索引擎市场集中度进一步提升。百度营销收入占搜索引擎运营商市场份额78.6%;谷歌中国份额小幅下滑,达15.7%;搜狗凭借“云-端”商业模式实现流量入口及商业变现的梯级化产品业务布局,市场份额达 2.9%。腾讯搜搜“大社区”战略布局也赢得广告主认可,保持 1.5%的市场份额;所有其他搜索引擎市场份额被压缩到0.3%。 3.搜索引擎竞争趋势为市场发展多元化和搜索终端多样化。 2012 年,国内搜索市场呈现多元化竞争格局,不断细分的搜索市场及发展的手持终端,在改变搜索用户行为习惯的同时影响着搜索市场的整体布局。 搜索市场发展多元化。综合搜索引擎服务、垂直搜索引擎服务、专业网站站内搜索及社交媒体搜索同时影响网民的搜索行为:综合搜索引擎服务(如百度、谷歌、搜狗、搜搜等),作为网络信息检索的

主要工具,大幅提高了人们获取信息的效率,成为人们从各种网络资源中获取信息的主要手段。以一淘、去哪儿等为代表的垂直搜索网站、以淘宝为代表的购物网站、以优酷为代表的视频网站等站内搜索在各自领域内吸引了一定数量的用户,对综合搜索引擎产生分流;微博、SNS 等信息量巨大的社交媒体的兴起,使网站内社交搜索的作用及分量加大,对整体搜索市场产生影响。 搜索终端多样化。随着3G 网络优化、智能手机普及,手机搜索由于碎片、及时等特点备受青睐,随时随地获取自己所需的信息已成为网民的基本需求之一。虽然手机搜索比例(56.2%)仍不如电脑搜索(85.2%),但手机搜索具有较大的市场价值。随着移动互联网的发展和各搜索服务在手机端的持续发力,未来手机搜索用户比例必将进一步增长。 4.垂直搜索、社交网站搜索、微博搜索增长空间巨大。 根据对网民最近半年在电脑和手机上应用搜索引擎的行为进行调查,发现综合搜索网站仍是最主要的搜索服务,但网站站内搜索的习惯也已逐渐养成,网站数量较多的专业网站如购物、视频等站内搜索开始占据较大的用户规模。综合搜索引擎使用率最高,为97.8%;其次为视频网站和购物网站站内搜索,比例分别为75.6%和72.9%。 社交网站因为社交属性、信息属性等聚集了大量搜索用户,且搜索信息大都是用户感兴趣或生活相关的,用户黏着性高。 垂直搜索网站是近几年搜索市场关注重点,各大行业领域内的大互联网公司也纷纷发力垂直搜索市场,如淘宝网建立一淘,优酷建立搜库等,为用户提供细分领域内的信息,获取领域内的入口优势同时增加自身品牌的用户粘度。垂直搜索网站的使用比例虽仅有24.7%,但如果能坚持其精准性和个性化特点,进一步加强用户的个性化和认知度,垂直搜索的未来空间会很大。

搜索引擎对比

百度、谷歌、搜狗、有道四大搜索引擎的比较分析学校:中南财经政法大学学号:2009357770832 姓名:李心彤 随着经济与科技的发展,信息对于人们来说越来越重要,而随着计算机的普及,人们利用搜索引擎来获取信息也是越来越频繁。因此,国内外的几家搜索引擎展开了角逐,在各自领域努力发挥着自己的优势。本文通过对百度、谷歌、搜狗、有道四大搜索引擎的个人化体验,对其作出比较与分析。体验主要从以下几个方面进行: 一、政治敏感度

搜索引擎百度搜狗有道谷歌 词条数量323 1433 43 69100 可以看出,在搜索较为敏感的政治事件时,各大搜索引擎表现出极大的不同。作为国内最大用户最多的百度搜索引擎,是唯一一个表现出明确屏蔽态度的搜索引擎,会在搜索框下方显示“根据相关法律法规和政策,部分搜索结果未予显示”,且其搜索数量也是几个搜索引擎中较少的。同时,在搜索出来的词条中,再未显示关键词中的任何一个字,仅在具体内容中偶有一两个相同字眼。可见百度对政治敏感内容十分顾忌。 而搜狗则在搜索页的最末用灰色字体显示“根据相关法律法规和政策,部分搜索结果未予显示”,不太能够引起人的注意。其搜索结果虽然在四个引擎中排名第二,但仍然并不算多。且其跟百度一样,搜索出来的结果中并未出现过多的关键词。 有道虽然是所有引擎中结果数量最少的,但出人意料的是,有道所搜索出来的前几个词条,是完全符合搜索词的。虽然其具体内容皆无法打开,但不得不说有道是国内引擎中最大胆的。 而谷歌作为国外开发的搜索引擎,一向对政治事件十分随意,因此,我们不难从图片中看出搜索政治敏感事件时,谷歌就像搜索随意的生活内容一样将各项结果显示,且有些资源是来自于国外的网站。但是具体点击时,视频、图片以及部分文字类内容明显在检测和过滤后是打不开的,且检测与过滤速度十分缓慢。但是,部分论坛里的讨论、对事件阐述并不太多也不太高调的文字类内容还是能够得以显现。 笔者随后更换搜索的关键词,使其更多与国家政治领导人相关,其搜索结果为: 搜索引擎百度搜狗有道谷歌 词条数量80200 3986 99 117000

七大搜索引擎特点

七大搜索引擎:百度、XX、搜搜、搜狗、有道、雅虎、必应 1?百度: 1.基于字词结合的信息处理方式。巧妙解决了中文信息的理解问题,极大地提高了搜索的准确性和XX。 2.支持主流的中文编码标准。包括GBK汉字内码扩展规范)、GB2312简体)、BIG5繁体),并且能够在不同的编码之间转换。 3.智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。 5.百度搜索支持二次检索(又称渐进检索或逼进检索)。可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。利于用户更加方便地在海量信息中找到自己真正感兴趣的内容。 6.相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词, 帮助用户查找更相关的结果,统计表明可以促进检索量提升10-20%。 7.运用多线程技术、高效的搜索算法、稳定的UNIX平台、和本地化的服务器,保证了最快的响应速度。百度搜索引擎在xx境内提供搜索服务,可大大缩 短检索的响应时间(一个检索的平均响应时间小于0.5秒) 8.可以提供一周、二周、四周等多种服务方式。可以在7天之内完成网页 的更新,是目前更新时间最快、数据量最大的中文搜索引擎。 9.检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,提高用户检索效率。 10.智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最准确、最广泛、最具时效性的信息提供了坚实基础。 11.分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高性能和高稳定性。

中国搜索引擎优化市场分析

中国搜索引擎优化市场分析 因为要完成市场部同事布置的作业,在找遍google,Baidu无果的情况下,索性硬着头皮写了这篇文章,不知道效果如何,总之这几天要交作业了。 一、搜索引擎优化的基础概念 搜索引擎优化的定义 搜索引擎优化(英文全称是Search Engine Optimization,简称为SEO)是网络营销中的一种,更准确地说是搜索引擎营销(Search Engine Marketing,简称为SEM)中的一种,竞价广告优化(Pay per Click,简称为PPC)也是搜索引擎营销的一部分。搜索引擎优化是通过研究搜索引擎收录和排名的规律,对网站提出系列的技术和内容优化方案和外部链接营销营销方案,使得网站的内部结构更加符合搜索引擎的收录和排名算法,被搜索引擎算法更加认可,最终在搜索引擎关键字自然排名中获得较好的排名,使网站的自然搜索流量得以提升。 搜索引擎优化与搜索引擎的关系 进一步的解释是,搜索引擎优化是一种研究搜索引擎规则,然后通过修改网站等一些技术和营销手段,使网站对于搜索引擎更加地友好。网站在实施了搜索引擎优化之后,可以让搜索引擎更加快捷清晰完整地理解网站的内容,帮助搜索引擎提高收录和排名性能,改善搜索引擎的用户体验,搜索引擎优化并不是一个欺骗搜索引擎算法的行为,而是一个与搜索引擎共生互利的操作方式。 另外在搜索引擎的搜索结果页(Search Result Pages,简称为SEARPs) 中,不仅有自然搜索排名,也有付费搜索排名,搜索引擎优化的主要工作集中在提升网站在自然搜索排名的位置。 搜索引擎优化工作内容 由此可以看出来,搜索引擎优化工作是一种网络营销顾问服务,主要是通过提供优化解决方案的形式来展开工作,但在实际操作过程中,因为客户在网络营销,甚至技术实施方面力量不到位,有时一些解决方案以外的工作,网络营销工作也会代替操作。比如外部链接营销工作,内容文字的修改工作,甚至于一些网页的修改工作,程序的开发工作。 二、中国搜索引擎优化现状 每个事物的发展都会经过以下几个阶段,萌芽、初步发展、高速发展、成熟、衰落。中国2003年才起步,正处于初步发展阶段。具体特征: 1、从事这方面的人不多,也不专业。 2、未形成规模。 3、多是作坊式经营,即主要是对本公司的网站进行一定的修改,就说成所谓为网站优

国内外搜索引擎分析

搜索引擎分析 Google(Google) 好处:世界上使用英文搜索引擎最多的人,被认为是最准确、排序最科学、效率最高的搜索引擎。 不利的一面:Google中国在2010年从大陆市场撤出,将服务器从北京移到香港,目前,大陆地区暂时不能使用。 一种名为雅虎的搜索引擎。 好处:世界上第一个搜索引擎,对于国内用户来说,在Google无法使用时,它可以替代Google,主要用于查询英文资源。 不利因素:缺乏核心技术,搜索结果主要由其他搜索引擎如Google和Bing 提供。 必应(必应)搜索

好处:微软开发的搜索引擎,因与微软系统的IE浏览器捆绑而被广泛使用。 不好的一面是:IE的使用在国内用户中越来越少,而Bing的搜索用户更少。 奥尔搜索。 优势:主要面向美国国内用户,国内信息资源丰富。 不利因素:过于本土化,不适合美国以外的用户。 搜素引擎在国内常用。 百度(Baidu)搜索 好处:全球使用人数最多的中文搜索引擎。中文更加通晓,更符合中国人的使用习惯。 不利因素:广告多,有竞价排名。 360搜索 好处:强大的技术支持,以及其它相关的软件支持。 不利之处:成立之初就将与百度的竞争放在首位,忽略了用户体验。 搜狗(Sogou)搜寻 好处:所具备的功能可以满足一般用户的需要,特别是在音乐搜索方面有一定的优势。 不利因素:数据资源匮乏。 搜索(索索) 优势:与QQ等腾讯软件捆绑,提供一定的使用方便,具有一些特色功能,如表情搜索,中国首个街景地图等。

坏处:缺乏推广意识,更多的局限于腾讯自身的圈子。(youdao)搜索。 长处:精通词典,擅长英文词汇和网上翻译。 缺陷:太具倾向性,其它功能较弱。

几种常见的搜索引擎的性能比较与分析2

闽江学院 本科毕业论文 题目几种常见的搜索引擎性能比较与分析学生姓名吴宽富 学号120081003154 系别物理系与电子信息工程系 年级2008级 专业电子信息工程 指导教师林宏 职称讲师 完成日期2012-5-10

声明 闽江学院毕业论文(设计)诚信声明书 本人郑重声明: 兹提交的毕业论文(设计)《几种常见的搜索引擎的性能比较与分析》,是本人在指导老师林宏老师的指导下独立研究、撰写的成果;论文(设计)未剽窃、抄袭他人的学术观点、思想和成果,未篡改研究数据,论文(设计)中所引用的文字、研究成果均已在论文(设计)中以明确的方式标明;在毕业论文(设计)工作过程中,本人恪守学术规范,遵守学校有关规定,依法享有和承担由此论文(设计)产生的权利和责任。 声明人(签名): 年月日

摘要 本文研究的目的是为了让我们更好的理解目前常见的几种搜索引擎,熟悉它,认识它,用好它,让它们成为我们工作生活、学习和工作的好帮手。 本文主要是对搜索引擎的初显、发展做大概的叙述,对搜索引擎的技术原理、工作的原理、系统构架等做简单分析,希望大家可以对搜索引擎有进一步的了解,同时对我们常用的几种搜索引擎进行分类,并对搜索结果的排序方法进行研究。最后通过几个指标对常见的几种搜索引擎做性能比较与分析,并通过实例来说明搜索引擎的应用,从而让大家对搜索引擎有更深的认识,让搜索引擎更好地为我们学习、生活和工作服务。 关键词:搜索引擎排序方法性能比较性能分析 刷红色处要用书面语 刷紫色处是我改好的 英文翻译要一并跟上

Abstract This thesis is about to ultimately make people have a detailed knowledge of some common search engines at present. With knowing them, be familiar with them and taking advantage of them well, we can have them as good helpers in our daily lives, study and work. This thesis mainly to narrate the general appearance and development of search engines, and analyse particularly search engines’technique principle, work principle, system architecture and so on. It is hoped that people would be able to know better about the search engines. Meanwhile, some common search engines are sorted, and their results-basically-sorted methods are analysed. With the comparison and analysis among the common search engines and showing how to make use of them effectively, this paper is attempt to help people understand search engines more deeply, and make search engines serve our study, daily lives and work better. Key words:Search engines; Sorting method ; Performance comparison ; Performance analysis

搜索引擎服务市场前景分析

中国人民解放军电子工程学院地方生学员毕业设计报告 报告题目:搜索引擎服务市场发展前景分析 学员姓名:商静静 学员队别:三十三队 专业名称:电子商务 指导教员:宋君

二〇一〇年四月二十四日

摘要:在Web2.0时代的今天,互联网已经影响到人类生活的各个方面,互联网用户对搜索引擎的依赖程度不断加深,搜索引擎已经是人们使用Internet信息资源的重要工具。本文对搜索引擎及其发展和作用进行了简要的介绍,阐述了搜索引擎服务市场的现状,进而对未来发展前景做出了初步预测。文章有以下几个部分组成,首先介绍了搜索引擎的定义、原理。这是本文的理论基础,其次回顾了搜索引擎的发展历史及其发挥的作用。第三对搜索引擎的现状就国际国内状况进行了对比分析。第四部分则是对搜索引擎市场的展望。最后一部分是本文的结论。 关键词:搜索引擎;信息检索;发展现状;发展趋势 Abstrac t: In the Web2.0 age of today, the Internet has affected every aspect of human life. Internet users’ relying on search engine which is an important tool for people to use Internet information resources is continuously deepened. This paper is to introduce simply search engine and its serve market so as to make a preliminary forecast for its future development. The paper is divided into the following several sections. Firstly, it introduces the definition and principle of search engine, which is the theoretical basis of this article. Secondly, it reviews the history and role of search engine. Thirdly it analyzes the situation of search engine through comparing international and domestic conditions. Fourthly it outlooks part the market outlook of. Lastly it is the conclusion of the paper. Key Words:search engine;Information Retrieval;Development Status;Development Trend

相关主题
文本预览
相关文档 最新文档