搜索引擎

  • 格式:docx
  • 大小:27.25 KB
  • 文档页数:9

下载文档原格式

  / 9
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

搜索引擎

1、搜索引擎的概念

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

2、搜索引擎分类

全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索

引擎与免费链接列表等。

3、搜索引擎工作原理及种类搜索引擎的优缺点

a搜索引擎工作原:页面收录,页面分析,页面排序,关键字查询。

4、举例对google和百度进行比较分析

1、google 是全球最大的并且最受欢迎的搜索引擎,主要的搜索服务有:网页,

图片,音乐,视频,地图,新闻,问答。

(1)Google的功能和特点:

Google 搜索引擎是一个利用蜘蛛程序(Spider) 以某种方法自动地在互联网中搜集和发现信息,并由索引器为搜集到的信息建立索引,从而为用户提供面向网页的全文检索服务的互联网信息查询系统。

①拥有目前最庞大的中文网页数据库,支持多达132种语言,可将多国语言的搜索引擎整合到同一个界面,而且在这个界面下, 你可以定制语言以及到何种网站中去搜索, 不必像Yahoo那样, 要搜索不同语言版本的网站, 必须先进入相应语言的网站。同时会自动根据用户所使用的浏览器设置相应的语言界面。

②不仅对中文支持强大, 而且支持中英文和多种编码混合的检索词。

③其专利网页级别技术PageRank能够提供高命中率的搜索结果, 帮助用户找到相关主题的权威网站。

④它不以花哨取胜, 而是以功能表现为本。其网站只提供搜索引擎功能, 界面简洁、易用, 搜索速度快捷, 使得用户所输入的任何关键字或信息均能得到Google快速响应, 且其语链分析的算法还会将搜索结果排列出优先次序, 从而使重要的结果排列在前, 节省了用户查询时间。

⑤在查询多个关键字时, 只提供包含所有关键字的网页, 而且遵从关键字的相对位置。

⑥其搜索结果通常会比其它搜索引擎来得更准确, 且搜索结果摘录查询网页的含有关键字的内容, 而不仅仅是网站简介。

⑦其“网页快照”功能, 能从Google服务器里直接取出缓存的网页, 基本上避免了死链或页面连接不上对搜索用户造成的不便, 且其查找速度较常规链接快得多。

⑧具有十分简单、方便的新网站登录功能, 除了接受网站自行提交的申请外, Google自身也经常在互联网上漫游, 搜寻新网站, 经过必要的分析后作取舍、更新和编排等处理。

(2)Google检索实例:

①单个检索词的检索

示例:搜索“元芳”

操作敲回车键(Enter)或点击“Google搜索”按钮,即可检索到有关“元芳”

的资料。

②多个关键字的检索

搜索结果要求包括两个及两个以上关键字,需在关键字之间加上“与”或“+”或“and”;搜索结果要求不包括某些特定信息时,用“—”表示逻辑非操作。示例1:搜索所有关键字“木有”和“稀饭”的中文网页。

操作在搜索框中键入“木有稀饭”,敲回车。

示例2:搜索所有包含“木有“不含“稀饭”的中文网页。

操作在搜索框中键入“木有—稀饭”,敲回车。

③高级检索

搜索专用语只要在专用词语上加上英文双引号,就可以准确地进行查询。这一方法在查找名言警句或专有名词时显得格外有。

示例:搜索包含“long long ago”字串的页面。

操作输入:“long long ago”,敲回车。

④限制搜索的网站可用“site”将搜索结果局限于某个具体网站、网站频道或某个域名。若要排除某网站或者域名范围内的页面,只需用“-网站/域名”。示例:搜索中文教育科研网站(edu. cn)上包含“天津师大”的页面。

操作输入“天津师大 site:edu .cn”

⑤搜索某一类型文件可用“filetype: ”来搜索。

示例:搜索有关“信息检索”的PDF文档。

操作输入:“信息检索 filetype:pdf”

⑥搜索的关键字包含在URL链接中“inurl:”返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。

示例:查找MIDI曲“沧海一声笑”。

操作输入:“ inurl:midi 沧海一声笑”

⑦搜索的关键字包含在网页标题中可用“intitle”和“allintitle”来搜索,其用法类似于inurl 和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。

示例:查找韩国明星玄彬的照片集。

操作输入:“intitle:玄彬写真”

Google还具有很多强大的检索方法,这里不再赘述。感兴趣的读者可自行学习。(3)Google的优越性

①界面简洁

Google的首页美观、简洁,使用户能直观地感觉到搜索引擎功能的存在和其搜索功能强大的可能性,从而有继续搜索操作的愿望。主页设计没有分类目录,不会使人眼花缭乱而无所适从,给人以开门见山的感觉。

②易用

Google采用了新一代的网页级别(PageRank)先进技术,,这种技术使网页之间链接直接,畅通无阻。有效链接率高,也为用户带来便捷、易用的效果。此外,,Google 还提供了详尽、具体的“Google 说明”,用语大众化,易于理解。还配以清晰的图片,加以强化解释。

③快速

Google 搜索速度的快捷是它的又一大特色。用户所输入的任何关键字或信息, 都能得到Google 快速的响应,且其超链分析的算法还会将搜索结果排列出优先次序,从而使重要的结果排列在前,节省了用户的查询时间。此外,Google数据库的更新速度快,有效链接率高,这些都是带出搜索快速的重要因素。

④相关性高

Google根据网页间彼此的连接关系,把一篇网页被连接数目的多寡视为其相关性的一项指标。对于用户所输入的关键字,Google最大程度地寻求语义上匹配。此外,Google还包含汉字的相关性,例如对中文简体网站,找出对应的繁体网站,甚至是日文网站。高相关性更好地提高了Google 搜索的结果的精准度,还提高了搜索效率。

(4)Google的不足之处

至目前为止,在满足用户的搜索需求上,Google 依然存在一些令人遗憾的地方。

①其数据的更新速度无法进一步提高。由于数据量的庞大,使Google搜索引擎的数据更新无法早于30天, 在一定程度上影响了用户对信息的时效需求, Google目前还无法突破这一瓶颈。

②无法搜索动态生成的网页。因为大多数负责搜索网页的蜘蛛软件都不敢去碰动