当前位置:文档之家› 搜索引擎使用心得

搜索引擎使用心得

搜索引擎使用心得
搜索引擎使用心得

2011-2012学年度高一级电脑作业(1)

班级高一27班姓名颜奕钦坐号54 利用网络搜索有关知识,回答下列问题。(注意作业提交时,要以班级号+座号命名,如24班3号,其作业的文件名为2403)

1)搜索引擎的发展史

互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。

1990年,加拿大麦吉尔大学(University of McGill)计算机学院的师生开发出Archie。当时,万维网(World Wide Web)还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie 搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖

2)搜索引擎的工作原理

在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。

另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。

当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频

次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。

3)搜索引擎的分类

1.全文索引

全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。

根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。

2.目录索引

目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo!、新浪分类目录搜索。

3.元搜索引擎

元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。

其他非主流搜索引擎形式

(1)集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。

(2)门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。

(3)免费链接列表(Free For All Links,简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多

4)常用搜索策略与搜索技巧

1. 利用AROUND(n)限定关键词距离

如图中,在谷歌搜索框内搜索时,在两个关键词之间加入 AROUND(n),注意要大写。n是两词相距的距离范围,单位为单词(搜英文)或字(搜中文)。

用了这个之后谷歌就不会给出一大堆一个词在文章头,另一个词在页尾这样的搜索结果给你,用来搜索有关键词的某句句子时很方便。

2. 在Gmail里搜索带有特定星标的邮件

gmail的超级星标功能很给力,你可以用很多种不同的星标来注明不同类型的重要邮件,不过问题也产生了:标完之后,怎么让它显示某个特定的星标呢?

所以,你可以用这些搜索指令来显示不同类型的星标:

has:yellow-star (或 l:^ss_sy) 显示黄色星标

has:blue-star (或 l:^ss_sb) 显示蓝色星标

has:red-star (或 l:^ss_sr) 显示红色星标

has:orange-star (或 l:^ss_so) 显示橙色星标

has:green-star (或 l:^ss_sg) 绿色星标

has:purple-star (或 l:^ss_sp) 紫色星标

has:red-bang (或 l:^ss_cr)

has:yellow-bang (或 l:^ss_cy)

has:blue-info (或 l:^ss_cb)

has:orange-guillemet (或 l:^ss_co)

has:green-check (或 l:^ss_cg) 绿勾

has:purple-question (或 l:^ss_cp)

3. 用CloudMagic实现Gmail中的即时搜索

Gmail里你要搜索,每次都要打进去然后按搜索再等一会,才能返回搜索结果。我们可以安装CloudMagic插件来实现即时的搜索(即你一边打字,下拉列表会即时显示出搜索结果)。

4. 用Bing搜索壁纸

Bing images里有个专门的“壁纸”类型,可以用来快速找到你想要的壁纸

5. Evernote搜索小技巧

Evernote用来记录笔记什么的很方便,而且在Android和iOS上它都有客户端。在搜索栏打入sourc:mobile.*会让它列出所有在手机客户端上创建的笔记;再比如输入source:ms.app.*就能找出哪几个笔记是从微软的程序(Word, Excel,Outlook之类)里复制粘帖过来的。

关于Evernote的更多搜索指令,请参照这里

6. Trunk.ly能帮你搜索你在社交网络分享过的链接

如果你经常在Facebook或者Twitter上分享一些有意思的链接,而它们又经常会很快被淹没在历史的洪流里,以后如果你重新想起它想再看一遍却不知道该上哪里去找,这时Trunk.ly就能帮到你。

除了Facebook和Twitter,它还支持在Delicious,Instapaper,RSS feeds,Pinboard中搜索,不过人人网和开心网什么的,大家就别指望它能搜了。

7. 在Windows自带搜索功能里限定搜索的类型

如果你想搜索某个文件夹,却又烦恼它会一起返回大量无关的围观文件,那么你可以试试“关键词 kind:folder”这个搜索指令,效果嘛,谁用谁知道。

当然,除了搜文件夹,把folder换成mp3什么的当然也可以了!

5)请选择3个不同类型的搜索引擎,如谷歌、百度、新浪,分别搜索以下内容:2010年世界500强的前10名企业、三聚氰胺的分子结构、我国名字中包含“虎”的濒危动物及其保护等级。使用表格列出你的关键词及搜索结果。根据搜索结果,根据搜索结果对搜索引擎进行比较,分别说明他们的特点及其适合查询哪些信息,不适合查询哪些信息。

百度:网页搜索、图片搜索、音乐搜索、知道、百科、贴吧、新闻、词典、百度HI……https://www.doczj.com/doc/08774802.html,/more/

谷歌:网页搜索、图片搜索、音乐搜索、地图、生活、翻

译……https://www.doczj.com/doc/08774802.html,/intl/zh-CN/options/

雅虎:网页搜索、图片搜索、音乐搜索、资讯、邮箱、黄页、腐败魔方、知识堂……https://www.doczj.com/doc/08774802.html,/allservice/index.html

6)经过以上研究,你有什么感受和发现?请写出你的心得体会。

我所选择的主题是世界文化遗产。这个主题用搜索引擎寻找资料很快捷方便.我在进行主题活动的时候深深地体会到:在使用搜索引擎前,应该先考虑所找信息中的关键字,因为有时候我们在查找的过程中没有输入准确的关键字,往往所搜索出来的东西都是与之无关的;之后再进一步确定选择何种搜索引擎。所以书上说关键字的选择对信息的查找结果是至关重要的。

我有的时候还运用目录搜索引擎。因为这样可以缩小搜索的范围,因此我在搜索或查询信息的时候,既可以选择关键字搜索,也可以按分类目录逐层查找。因为书上说过:如果搜索目标有明确的主题,有需要获得较为系统的信息,使用目录搜索引擎比全文搜索引擎更有效。

在网上各种搜索引擎的功能`侧重点不同,所以搜索到的网叶往往不尽相同,我们可以根据需要不同的内容来使用不同的搜索引擎来搜索。用不同的搜索引擎,用同样的关键字进行搜索比较的话,还是百度用时少,内容多。

Java开源搜索引擎分类列表

Java开源搜索引擎分类列表 Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。 Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。 更多Egothor信息 Nutch Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 更多Nutch信息 Lucene Apache Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是替文件的每一个字作索引,索引让搜寻的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的是使使用者可以随时应自已需要自订其功能。 更多Lucene信息 Oxyus 是一个纯java写的web搜索引擎。 更多Oxyus信息 BDDBot BDDBot是一个简单的易于理解和使用的搜索引擎。它目前在一个文本文件(urls.txt)列出的URL中爬行,将结果保存在一个数据库中。它也支持一个简单的Web服务器,这个服务器接受来自浏览器的查询并返回响应结果。它可以方便地集成到你的Web站点中。 更多BDDBot信息 Zilverline Zilverline是一个搜索引擎,它通过web方式搜索本地硬盘或intranet上的内容。Zilverline 可以从PDF, Word, Excel, Powerpoint, RTF, txt, java, CHM,zip, rar等文档中抓取它们的内容来建立摘要和索引。从本地硬盘或intranet中查找到的结果可重新再进行检索。Zilverline支持多种语言其中包括中文。 更多Zilverline信息 XQEngine

各大搜索引擎高级搜索语法整理

每个搜索引擎都有自己的高级搜索语法,通过高级搜索语法你可以方便快捷的查找你想要搜索的内容。 目录 一、Google谷歌搜索高级语法 1. 减除无关资料(-) 2. 英文短语搜索(" ") 3. 指定网域 4. 查找特定文件 5. 按链接搜索 6. 限定关键词只在标题中 7. 限定关键词只在URL中 8. Info 9. Related 10. Cache 二、百度(baidu)搜索高级语法 1. 把搜索范围限定在网页标题中——intitle 2. 把搜索范围限定在特定站点中——site 3. 把搜索范围限定在url链接中——inurl 4. 精确匹配——双引号和书名号 5. 要求搜索结果中不含特定查询词 6. 专业文档搜索 三、Yahoo雅虎搜索高级语法 1. title 2. Link 3. Site:或者domain 4. Hostname

5. url 6. 如何使搜索结果中的查询词不被拆开? 四、Sogou搜狗搜索高级语法 1. 使用双引号进行精确查找 2. 使用多个词语搜索 3. 减除无关资料 4. 在指定网站内搜索 5. 文档搜索 五、四大搜索引擎高级语法总结 一、Google谷歌搜索高级语法 1. 减除无关资料(-) 如果要避免搜索某个词语,可以在这个词前面加上一个减号(“-”,英文字符)。但在减号之前必须留一个空格。 2. 英文短语搜索(" ") 在Google 中,可以通过添加英文双引号来搜索短语。双引号中的词语(比如"like this")在查询到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。 一些字符可以作为短语连接符。Google 将“-”、“\”、“.”、“=”和“..."等标点符号识别为短语连接符。 3. 指定网域 有一些词后面加上冒号对Google 有特殊的含义。其中有一个词是“site:”。要在某个特定 的域或站点中进行搜索,可以在Google 搜索框中输入“site https://www.doczj.com/doc/08774802.html,”。 例如,要在Google 站点上查找新闻,可以输入:新闻site:https://www.doczj.com/doc/08774802.html, 4. 查找特定文件 Google已经可以支持13种非HTML文件的搜索——PDF文件,Microsoft Office (doc, ppt, xls, rtf)、Shockwave Flash (swf)、PostScript (ps)和其它类型文档。新的文档类型只要与用户的搜索相关,就会自动显示在搜索结果中。

浅析各类搜索引擎之间的联系与区别

浅析各类搜索引擎之间的联系与区别 摘要internet上蕴藏着非常丰富的信息资源,但是要从浩如烟海的信息 中准确、及时、方便、迅速的找到自己所需要的信息,却并不是一件容易的事情.为此应对重点网络搜索引擎的检索技术和功能作一全面的介绍.使学生在网络信息检索中选择了好的搜索引擎,才能快速、准确地找到所需要信息.本文主要对百度和google两个典型搜索引擎之间的检索技术、各自特点进行全面的比较和分析,从而得出各类搜索引擎之间的联系与区别。 关键字google 百度搜索引擎比较分析 Google是世界上最大的搜索引擎,通过对200多亿网页信息的整理,每天为世界各地提供1.5亿次以上的网上信息查询服务。百度是全球最大的中文搜索引擎, 拥有超过10多亿的中文网页数据库, 每天响应超过亿次的网络信息搜索请求。在这两大搜索引擎之间, 搜索的结果平均有85%的不同,因此,有网站把两者结合建立了百Google度。然而,这两大搜索引擎之间究竟有什么特点和区别,本文将根据数据加以分析、比较研究。 Google与百度的特点 Google的特点 google秉持着开发“确解用户之意, 切返用户之需”的“完美的搜索引擎” , 使得搜索方式发生了根本性变化, 在业界独树一帜, 其强大的功能和独到的特点就在于: (1)“网页快照”功能。能从google服务器里直接取出缓存的网页。如果原地址打开很慢, 那么可以直接查看google缓存页面, 因为google服务器速度极快;如果原链接已经死掉或者因为网络的原因暂时链接不通, 那么可以通过google快照看到该页面信息;如果打开的页面信息量巨大, 一下子找不到关键词所在位置, 那么可以通过google快照, 因为快照中google用黄色表明关键字位置。 (2)“单词英文解释”功能。写英文文章的时候, 最头疼的事情就是对某个英文单词的用法不确定。现在有了google, 一切就迎刃而解了!无论你是想查找某个生词的意思还是想了解某个单词的用法, 均可使用在线词典。 (3)“网页翻译”功能。google提供了网页翻译功能, 虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文, 但是不得不承认, 这是个杰出功能, 只要你点击“Translate this page ”按钮, google为你提供了人工智能的机器翻译, 翻译出来的结果让你大致能够看得明白。 (4)“搜索结果过滤”功能。网络上的成人信息浩如烟海, 而且很多站点具有欺骗或者其他不良企图, 浏览者很容易掉入其中的陷阱。为此google新设立了成人内容过滤功能, 见google的设置页面,不过, 中文状态下的尚没有这个功能。 (5)“超文本匹配分析”功能。google的搜索引擎, 同时也分析网页内容,

搜索引擎使用技巧

搜索引擎使用技巧 1、简单查询 在搜索引擎中输入关键词,然后点击“搜索”就行了,系统很快会返回查询结果,这是最简单的查询方法,使用方便,但是查询的结果却不准确,可能包含着许多无用的信息。 2、使用双引号""、书名号《》 给要查询的关键词加上双引号、书名号(半角,以下要加的其它符号同此),可以实现精确的查询,这种方法要求查询结果要精确匹配,不包括演变形式。例如在搜索引擎的文字框中输入“电传”,它就会返回网页中有“电传”这个关键字的网址,而不会返回诸如“电话传真”之类网页。 3、使用加号(+) 在关键词的前面使用加号,也就等于告诉搜索引擎该单词必须出现在搜索结果中的网页上,例如,在搜索引擎中输入“+电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。 4、使用减号(-) 在关键词的前面使用减号,也就意味着在查询结果中不能出现该关键词,例如,在搜索引擎中输入“电视台-中央电视台”,它就表示最后的查询结果中一定不包含“中央电视台”。 5、使用布尔检索 and,称为逻辑“与”,用and进行连接,表示它所连接的两个词必须同时出现在查询结果中,例如,输入“computer and book”,它要求查询结果中必须同时包含computer和book。or,称为逻辑“或”,它表示所连接的两个关键词中任意一个出现在查询结果中就可以,例如,输入“computer or book”,就要求查询结果中可以只有computer,或只有book,或同时包含computer和book。not,称为逻辑“非”,它表示所连接的两个关键词中应从第一个关键

词概念中排除第二个关键词,例如输入“automobile not car”,就要求查询的结果中包含automobile(汽车),但同时不能包含car(小汽车)。 6、使用搜索语法:filetype,site filetype就是按照文件类型搜索,比如搜毕业论文,可以用: 毕业论文filetype:doc site是只搜索某一个站点的,比如只想看百度上的小说,可以用: 玄幻小说site:baidu 关键词后必须带空格 7、使用通配符(*和?) 通配符包括星号(*)和问号(?),前者表示匹配的数量不受限制,后者匹配的字符数要受到限制,主要用在英文搜索引擎中。例如输入“computer*”,就可以找到“computer、computers、computerised、com puterized”等单词,而输入“comp?ter”,则只能找到“computer、compater、competer”等单词。 8、区分大小写 这是检索英文信息时要注意的一个问题,许多英文搜索引擎可以让用户选择是否要求区分关键词的大小写,这一功能对查询专有名词有很大的帮助,例如:Web专指万维网或环球网,而web则表示蜘蛛网。

百度搜索语法完整版

百度搜索语法标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

百度搜索语法 一:指定文件类型,缩小搜索范围:FILETYPE。目前百度支持的文档类型包括PDF、DOC、RTF、XlS、PPT、RTF、ALL(其中ALL表示搜索百度所有支持的文档类型)如大家想找找关于黑客方面的文章且是DOC格式:黑客 FILETYPE:DOC。 二:邮件搜索语法:SUBJECT、TO、FROM。 “subject:工资明细”即可找到主题中含有“工资明细”的电子邮件,输入“”就可以找到Claire发的、主题中含有“头文字d”的email:输入“”就可以找到发给Peter的所有工作报告邮件了。 三:标题搜索语法:title只要输入“title: 皇马亚洲之行”就能找到标题中含有“皇马亚洲之行”的各种类型文件包括Excel,Word,网页,图片等等,文件再多再杂也不用担心,一样快速攫取目标。 “关键词 folder:文件所在路径”硬盘搜索就会自动搜索指定文件所在路径里面所有和关键词相关的搜索结果。比如输入“九寨沟folder:C:\旅游照片”,所有C盘“旅游照片”文件夹中的九寨沟图片都被显示出来。 五:引号搜索语法:“关键词”以搜索北京医院为例:如果“北京医院”,总是搜出一些“北京……医院”的信息,现在只要在关键词外面添加引号,输入““北京医院””就可以得到只含有“北京医院”的结果了 六:其他 1. 减除无关资料要搜寻关于“武侠小说”,但不含“古龙”的资料,可使用如下查询:“武侠小说 - 古龙”。

百度支持“-”功能,用于有目的地删除某些无关网页,但减号之前必须留一空格。 2. 并行搜索 使用“A|B”来搜索“或者包含词语A,或者包含词语B”的网页。 要查询"图片"或"写真"相关资料,无须分两次查询,只要输入“图片 | 写真”搜索即可。百度会提供跟"|"前后任一关键词相关的网站和资料。 3. 相关检索 如果您无法确定输入什么关键词才能找到满意的资料,可以请先输入一个简单词语搜索,百度会在搜索结果页面的底部为您提供“相关搜索”做参考,这些“相关搜索”是基于其它用户使用的关键词而为您制作的。 4. 百度快照 当某个搜索结果中的某个网站不能打开时,百度快照能为您很好的解决这个问题。 百度快照功能在百度的服务器上保存了几乎所有网站的大部分页面,使您在不能链接所需网站时,百度为您救急,并且通过百度快照能够提高您的搜索效率。 因为: 百度快照的服务稳定,下载速度极快,您不会再受死链接或网络堵塞的影响; 在快照中,您的关键词均已用不同颜色在网页中标明,一目了然; 点击快照中的关键词,还可以直接跳到它在文中首次出现的位置,使您浏览网页更方便。

新搜索引擎与问天搜索对比分析报告

1搜索环境 新搜索引擎:PC机,2G内存,数据量166万; 问天搜索:服务器,数据量500万 2搜索地址 问天搜索: https://www.doczj.com/doc/08774802.html,/ClassifyResults.aspx?vectors=58+59+60+61+62+&journals=&field=qk&star t=1&resultperpage=20&source=all&sortoption=relevancy&query=&xTitleIndex=42&select=58+ 新搜索引擎: http://192.168.0.172/https://www.doczj.com/doc/08774802.html,/zhishiku.aspx 3搜索结果对比表 4搜索结果截图(详见附表1) 5结论 搜索时间: 当数据量不是很大时,两个搜索引擎的搜索时间差距不是很大,而当数据量很大时,新搜索引擎的用时少。 搜索数量: 从结果对比表可以看出,问天搜索的结果数量较少,甚至搜索结果为0,而新搜索引擎的结果数量较多。 搜索相关度: 大多数情况下,问天搜索的相关度不是很理想,没有达到预期的效果,新搜索引擎的相关度则相对来说较好,满足了搜索的预期要求。 另外知识库的关键字是自定义的,所以关键字定义的越全面,新搜索引擎的搜索结果也更加全面更加准确。

1 搜索环境 新搜索引擎:PC机,2G内存,数据量166万; 问天搜索:服务器,数据量500万 2 搜索地址 问天搜索: https://www.doczj.com/doc/08774802.html,/SearchResults.aspx?lang=s&start=1&source=all&resultperpage=10&query= &sortoption=relevancy&field=all 新搜索引擎: http://192.168.0.172/https://www.doczj.com/doc/08774802.html,/search.aspx 3 搜索结果对比表 4搜索结果截图(详见附表2) 5 结论: 搜索时间: 当数据量不是很大时,两个搜索引擎用时没有很大的差距,但数据量很大时,新搜索引擎的用时明显少。 搜索相关度: 问天搜索的结果中包含有很多如“的”、“而且”等一些需要过滤的停用词,而且位置都排在搜索结果的前面,严重的影响着搜索的相关度。 新搜索引擎启用了较全面的停用词库,很好的过滤掉了那些不需要的停用词,相对于问天搜索,相关度明显提高很多。 搜索数量: 问天搜索的搜索数量很少,而且停用词占了一部分,并且还存在搜索不出结果的情况,新搜索引擎的搜索数量比问天搜索的搜索数量高出很多。

搜索引擎的种类与使用的技巧

搜索引擎的种类与使用的技巧 [摘要]随着信息技术的发展,网络的迅速普及,搜索引擎在网络用户的生活中扮演着越来越重要的地位,了解并能熟练使用搜索引擎成为大众的必修课。对搜索引擎的基本知识和种类作简要介绍,并结合亲身实践介绍几种实用的搜索技巧。 [关键词]搜索引擎种类技巧 一、搜索引擎概述 搜索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。它主要是用于检索网站、网址、文献信息等内容。随着网络技术的发展,各种搜索引擎层出不穷,目前流行的搜索引擎主要是帮助用户搜索表层信息,如google、百度、雅虎等。 二、搜索引擎的分类 目前,主流的搜索引擎有如下几类: (一)全文索引 根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。

(二)目录索引 目录索引虽然有搜索功能,但不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词进行查询。目录索引中最具代表性的是Yahoo、新浪分类目录搜索。 (三)元搜索引擎 元搜索引擎接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。着名的元搜索引擎有InfoSpace、Dogpile等。中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。 三、搜索引擎使用技巧 (一)关键词的选择 目前搜索引擎不具备智能识别能力,较人脑而言还很“弱智”,往往不能很好地把握用户到底想要什么,只会在现成的数据库索引中查找相匹配的关键词。因此,选择合适的关键词是成功检索的第一步。关键词的选择虽然没有什么定式,不过也有一些规律可循,在提取关键词时力求做到规范,避免口语化,便能达到事半功倍的效果。此处用特殊实例来说明: 2.使用多个含义相近的关键词。对于热门信息来说,搜索时犯愁的是返回条目太多,可对冷门事件或事物来说往往恰恰相反。此时可使用同义关键词和关联关键词来检索,以达到更全面的搜索结果。如:在学术部门的年轻人想查阅申报课题的技巧时会发现相

各大搜索引擎高级搜索语法整理及语法详解

目录 一、 Google谷歌搜索高级语法 1. 减除无关资料(-) 2. 英文短语搜索(””) 3. 指定网域 4. 查找特定文件 5. 按链接搜索 6. 限定关键词只在标题中 7. 限定关键词只在URL中 8. Info 9. Related 10. Cache 二、百度(baidu)搜索高级语法 1. 把搜索范围限定在网页标题中——intitle 2. 把搜索范围限定在特定站点中——site 3. 把搜索范围限定在url链接中——inurl 4. 精确匹配——双引号和书名号 5. 要求搜索结果中不含特定查询词 6. 专业文档搜索 三、Yahoo雅虎搜索高级语法

1. title 2. Link 3. Site:或者 domain 4. Hostname 5. url 6. 如何使搜索结果中的查询词不被拆开? 四、Sogou搜狗搜索高级语法 1. 使用双引号进行精确查找 2. 使用多个词语搜索 3. 减除无关资料 4. 在指定网站内搜索 5. 文档搜索 五、四大搜索引擎高级语法总结 一、 Google谷歌搜索高级语法 1. 减除无关资料(-) 如果要避免搜索某个词语,可以在这个词前面加上一个减号(“-”,英文字符)。但在减号之前必须留一个空格。 2. 英文短语搜索(””) 在 Google 中,可以通过添加英文双引号来搜索短语。双引号中的词语(比如"like this")在查询到的文档中将作为一个整体出现。这

一方法在查找名言警句或专有名词时显得格外有用。 一些字符可以作为短语连接符。Google 将“-”、“\”、“.”、“=”和“..."等标点符号识别为短语连接符。 3. 指定网域 有一些词后面加上冒号对 Google 有特殊的含义。其中有一个词是“site:”。要在某个特定的域或站点中进行搜索,可以在 Google 搜索框中输入“site:https://www.doczj.com/doc/08774802.html,”。 例如,要在 Google 站点上查找新闻,可以输入:新闻 site:https://www.doczj.com/doc/08774802.html, 4. 查找特定文件 Google已经可以支持13种非HTML文件的搜索——PDF文件,Microsoft Office (doc, ppt, xls, rtf)、Shockwave Flash (swf)、PostScript (ps)和其它类型文档。新的文档类型只要与用户的搜索相关,就会自动显示在搜索结果中。 例如,如果您只想查找 PDF或Flash 文件,而不要一般网页,只需搜索“关键词filetype:pdf” 或“关键词filetype:swf”就可以了。 5. 按链接搜索 例如,“link:https://www.doczj.com/doc/08774802.html,”将找出所有指向 Google 主页的网

搜索引擎符号的使用

对于搜索中文内容,百度,腾讯等中国人创造的搜索引擎搜索出来的内容比较准确,而google,雅虎等则搜索英文内容比较准确,现在比较有名的还有360,新浪,网易等搜索引擎。 搜索引擎特殊符号 不同的搜索引擎提供的查询方法不完全相同,你要想具体了解,可以到各个网站中去查询,但有一些通用的查询方法,各个搜索引擎基本上都具有。由于使用目录查询比较简单,你只需确定要查找目标所在的目录,然后一层层打开,逐步细化就可以找到。 1、简单查询 在搜索引擎中输入关键词,然后点击“搜索”就行了,系统很快会返回查询结果,这是最简单的查询方法,使用方便,但是查询的结果却不准确,可能包含着许多无用的信息。} 2、使用双引号用(" ") 给要查询的关键词加上双引号(半角,以下要加的其它符号同此),可以实现精确的查询,这种方法要求查询结果要精确匹配,不包括演变形式。例如在搜索引擎的文字框中输入“电传”,它就会返回网页中有“电传”这个关键字的网址,而不会返回诸如“电话传真”之类网页。 3、使用加号(+) 在关键词的前面使用加号,也就等于告诉搜索引擎该单词必须出现在搜索结果中的网页上,例如,在搜索引擎中输入“+电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。 4、使用减号(-) 在关键词的前面使用减号,也就意味着在查询结果中不能出现该关键词,例如,在搜索引擎中输入“电视台-中央电视台”,它就表示最后的查询结果中一定不包含“中央电视台”。 5、使用通配符(*和?) 通配符包括星号(*)和问号(?),前者表示匹配的数量不受限制,后者匹配的字符数要受到限制,主要用在英文搜索引擎中。例如输入“computer*”,就可以找到“computer、computers、computerised、computerized”等单词,而输入“comp?ter”,则只能找到“computer、compater、competer”等单词。 6、使用布尔检索 所谓布尔检索,是指通过标准的布尔逻辑关系来表达关键词与关键词之间逻辑关系的一种查询方法,这种查询方法允许我们输入多个关键词,各个关键词之间的关系可以用逻辑关系词来表示。

六大搜索引擎的比较

一、界面、广告以及速度搜索引擎在我们日常操作中的使用频率非常高,大家使用它的目的都非常明确,就是用它来搜寻需要的内容,而不会为搜索引擎的页面做过多的停留,因此搜索引擎的界面设计和速度就对我们的使用产生不小的影响,下面来看看这六款搜索引擎在界面和速度上的表现。谷歌、百度和微软的Live Search,这三大搜索引擎的界面大家都已经相当熟悉,它们有着共同的特点,就是简洁至极:网站LOGO、搜索框和按钮以及个别功能服务链接,除此以外,页面上就没有其他多余和花哨的东西了,给人的感觉非常清爽,界面一目了然,特别是Live Search在不失简洁的同时还通过一些小脚本和背景图片使得页面整体更加美观。三者使用起来都很方便,并且首页界面上没有任何第三方的广告。搜索结果页面,三者同样是采用简洁的风格,页面左侧排列着搜索结果,百度搜索结果页面右侧有不少广告,谷歌视关键词的不同也可能出现右侧广告。 Live Search的界面十分简洁且美观 百度搜索结果页面右侧的广告与上面三者相比,雅虎全能搜在界面上显得更为活泼、色彩更加多样,并且在首页内容上也更丰富。首页上除了常规的搜索所需组成部分外,雅虎全能搜还加入了天气预报、邮箱登录的显示区域。虽然这些占据了一点点页面,但是它们功能实用且不影响正常使用。雅虎全能搜的搜索主页 搜狗搜索的界面可谓结合了谷歌和Live Search:在布局上

与谷歌类似,而在细节上与Live Search有着异曲同工之妙;而搜索新军——网易有道的界面与谷歌、百度站在同一阵线,风格、版式都十分一致。在搜索结果页面中,搜狗搜索页面左侧有少量广告。总的来说,六款搜索引擎的界面设计都比较合理、美观、大方。雅虎全能搜的界面稍有不同,加入了天气预报和邮箱模块,而其他五款都尽量精简,其中谷歌、百度和有道趋于一致,采用最简的风格,而Live Search和搜狗在首页的一些细节上多加以了一些修饰。此外,值得一提的是一些搜索引擎对于Logo文化的重视,在传统的节日或者一些特殊的纪念日时都会将首页的Logo徽标换成与该日子相关的设计。其中在这方面要数谷歌和百度做得最为出色:无论是三八节、五一节这样的国际节日,或者情人节、万圣节这样的西方舶来物,还是春节、清明、端午等传统的中国农历节日,谷歌和百度都会精心设计相应的节日Logo;此外,谷歌在一些特殊的纪念日,如达芬奇诞辰、地球日之类的纪念日也会推出专门的徽标;而百度近期开始定期在首页推出一个搜索封面人物,以此反映对互联网时代风云人物的价值取向,十分有特色。雅虎和搜狗在节日Logo设计方面也有所表现,在节日时也可经常看到其专门的徽标;网易有道正式版新近推出不久,我们还无法对其在特殊Logo的设计上是否会有所表现作出评价。搜索引擎的特色Logo其实并不仅仅是一个单纯的设计,它还有更多的作用:它承载了一种信息,传达了搜索引擎提供商对于创新、

搜索引擎的语法规则

概况 互联网的发展可以用日新月异来形容,它每时每刻都在发生变化。由于互联网上的信息是呈几何级数增长且极其无序的,信息量越大,越难被利用。没有人对互联网上信息的有效性和有序性负责,因此如何进行快速有效地查询,获取和利用互联网上的信息,就成了一个大问题。目前解决这一问题的最佳途径是利用搜索引擎。这个需求直接导致了信息检索技术的快速发展,各类搜索引擎层出不穷。 但是如同互联网上的信息一样,搜索引擎的发展本身也是无序的,我们要通过搜索引擎,在互联网上找到需要的信息,直接获得自己想要的东西,或者学习之类都是面对海量信息。因此我们首先要了解其特点。 如何选择最符合需要的搜索引擎,通过其在互联网上找到我们所需要的信息,也是一个需要研究和解决的课题。基于这个目的,我们对目前互联网上较有规模的中文搜索引擎作一个粗浅的比较,以期抛砖引玉,使现有的中文搜索引擎发展得更快更好。 发展历程略 特点 一、快速化 速度的提高是现在各个搜索引擎都在努力达到的目标。快不仅仅是指搜索引擎返回结果的速度,更是指搜索引擎获取新信息的速度,现在博客、论坛和资讯网站都已经成为信息最重要的来源,一般都什么重大新闻,直接上百度要多快有多快。

二、多样化 多样化主要包括两个方面:内容多样化和搜索途径多样化。 内容除文字之外还包括图片、音频、视频内容的搜索。而在搜索结果内容上,也是非常的多样化,有图文、最新新闻、微博信息、轻应用、知心搜索等。 搜索途径多样化:可以通过语音指令、动作指令、地理位臵等进行搜索。 三、实时搜索 随着个人媒体平台兴起,搜索引擎的实时性要求日益增高,百度也推出了关于微博的实时搜索,搜索方法:浏览器中输入 https://www.doczj.com/doc/08774802.html,/s?rtt=2&tn=baiduwb&wd=关键字,实时搜索最突出的特点是时效性强,越来越多的突发事件首次发布在微博上,实时搜索核心强调的就是“快”,用户发布的信息第一时间能被搜索引擎搜索到。 一、各大搜索网站的特长、优势及弱点分析 1、“Google”是功能强大,易用性最强的搜索网站,搜索速度快而且提供了最丰富的高级搜索功能。 Google(https://www.doczj.com/doc/08774802.html,)是业界著名的搜索网站,Google 获得过最受欢迎搜索引擎奖、最佳搜索引擎技术奖、最佳图像搜索技术奖等多项荣誉。 优点:不论是中文还是英文搜索都同样出色,而且还有业内公认的高水平图像搜索技术与日渐成熟的目录搜索功能。Google是易用

技能训练5-1主要搜索引擎特性的对比分析

技能训练5-1 主要搜索引擎特性的对比分析 以“六度空间理论”、“搜索引擎优化”、“手持移动电视”为关键字,在三大搜索引擎(百度、谷歌、搜搜)上进行“网页”搜索,将相关搜索结果整理为100字左右的文字描述,然后以4-6人为小组分享各自的结论,并就三大搜索引擎的特点、返回结果信息的相关性、价值度的大小等方面进行讨论,并将形成的结论填入下表。 表5-4 三大搜索引擎对比分析表 调查时间: 11·28 调查人:余思琪 搜索对象搜索引 擎种类 搜索引擎 特性描述 信息 相关 性 评价 信息 价值 度 评价 是 否存在 商业推 广 六度 空间理论百度 拥有目前世界上 最大的中文信息库, 支持主流的中文编码 标准,采用智能相关 度算法,支持二次检 索(又称渐进检索或 逼进检索),采用先进 的网页动态摘要显示 技术 相关 度高,前 20条里有 19条都与 之相关,大 多来自百 科.文库. 博客 信息 价值度,在 这19条中 我都能了 解到关于 六度空间 理论的相 关信息 没 有Google 目前规模最大搜 索引擎,提供常规搜 不高, 前十条中 一般, 其中有不 存 在关键

索和高级搜索两种功能。信息条目数量。但也要注意其多种语言字母无大小写之分,全部默认为小写,不使用词干法,也不支持通配符只有5条 与其相关 来自百科, 和一些网 页 少与所搜 索的东西 不相关 字广告 和广告 联盟 搜搜 腾讯出品为广 大用户提供的问答互 动平台。覆盖面广 ——接触庞大QQ用户 群,针对性强——准 确覆盖目标用户,互 动性强——即搜即Q, 立刻抓住您的客户, 灵活可控——快捷调 整广告内容和广告开 销 相关 度很高,前 十条内都 与之相关 信息 价值度高。 从前十条 中我都能 了解到六 度空间理 论的含义 没 有 什么是六度空间理论? 你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。这就是六度分割理论,也叫小世界理论。

搜索引擎的使用方法和技巧

百度搜索引擎的使用方法和技巧 学生姓名: 学院:信息技术学院 专业:信管(电) 班级: 学号: 指导教师: 完成日期: 2015年3月28日 辽东学院 Eastern Liaoning University

一、简单搜索 1. 关键词搜索 只要在搜索框中输入关键词,并按一下“搜索”,百度就会自动找出相关的网站和资料。百度会寻找所有符合您全部查询条件的资料,并把最相关的网站或资料排在前列。 小技巧:输入关键词后,直接按键盘上的回车键(即Enter健),百度也会自动找出相关的网站或资料。 关键词,就是您输入搜索框中的文字,也就是您命令百度寻找的东西。可以是任何中文、英文、数字,或中文英文数字的混合体。可以命令百度寻找任何内容,所以关键词的内容可以是:人名、网站、新闻、小说、软件、游戏、星座、工作、购物、论文、、、 例如:可以搜索[windows]、[918]、[F-1赛车]。 可以输入一个关键词,也可以输入两个、三个、四个,您甚至可以输入一句话。 例如:可以搜索[博客]、[原创爱情文学]、[知音,不需多言,要用心去交流;友谊,不能言表,要用心去品尝。悠悠将用真诚,尊敬和大家来建立真正的友谊]。 注意:多个关键词之间必须留一个空格。 2. 准确的关键词 百度搜索引擎严谨认真,要求一字不差。 例如:分别输入 [舒淇] 和 [舒琪] ,搜索结果是不同的。 分别输入 [电脑] 和 [计算机] ,搜索结果也是不同的。 因此,如果您对搜索结果不满意,建议检查输入文字有无错误,并换用不同的关键词搜索。 3. 输入两个关键词搜索 输入多个关键词搜索,可以获得更精确更丰富的搜索结果。 例如,搜索[悠悠情未老],可以找到几千篇资料。而搜索[悠悠情未老],则只有严格含有“悠悠情未老”连续5个字的网页才能被找出来,不但找到的资料只有几十篇,资料的准确性也比前者差得多。 因此,当你要查的关键词较为长时,建议将它拆成几个关键词来搜索,词与词之间用空格隔开。 多数情况下,输入两个关键词搜索,就已经有很好的搜索结果。 4. 减除无关资料 有时候,排除含有某些词语的资料有利于缩小查询范围。 百度支持“-“功能,用于有目的地删除某些无关网页,但减号之前必须留一空格,语法是“A -B”。

如何用Java开源工具建立搜索引擎

使用 Java 开源工具建立一个灵活的搜索引擎 揭示开源的力量 为应用程序添加搜索能力经常是一个常见的需求。本文介绍了一个框架,开发者可以使用它以最小的付出实现搜索引擎功能,理想情况下只需要一个配置文件。该框架基于若干开源的库和工具,如Apache Lucene,Spring 框架,cpdetector 等。它支持多种资源。 其中两个典型的例子是数据库资源和文件系统资源。Indexer 对配置的资源进行索引并传输到中央服务器,之后这些索引可以通过API 进行搜索。Spring 风格的配置文件允许清晰灵活的自定义和调整。核心API 也提供了可扩展的接口。 引言 为应用程序添加搜索能力经常是一个常见的需求。尽管已经有若干程序库提供了对搜索基础设施的支持,然而对于很多人而言,使用它们从头开始建立一个搜索引擎将是一个付出不小而且可能乏味的过程。另一方面,很多的小型应用对于搜索功能的需求和应用场景具有很大的相似性。本文试图以对多数小型应用的适用性为出发点,用Java 语言构建一个灵活的搜索引擎框架。使用这个框架,多数情形下可以以最小的付出建立起一个搜索引擎。最理想的情况下,甚至只需要一个配置文件。特殊的情形下,可以通过灵活地对框架进行扩展满足需求。当然,如题所述,这都是借助开源工具的力量。 基础知识 Apache Lucene 是开发搜索类应用程序时最常用的Java 类库,我们的框架也将基于它。为了下文更好的描述,我们需要先了解一些有关Lucene 和搜索的基础知识。注意,本文不关注索引的文件格式、分词技术等话题。 什么是搜索和索引 从用户的角度来看,搜索的过程是通过关键字在某种资源中寻找特定的内容的过程。而从计算机的角度来看,实现这个过程可以有两种办法。一是对所有资源逐个与关键字匹配,返回所有满足匹配的内容;二是如同字典一样事先建立一个对应表,把关键字与资源的内容对应起来,搜索时直接查找这个表即可。显而易见,第二个办法效率要高得多。建立这个对应表事实上就是建立逆向索引(inverted index)的过程。 Lucene 基本概念 Lucene 是Doug Cutting 用Java 开发的用于全文搜索的工具库。在这里,我假设读者对其已有基本的了解,我们只对一些重要的概念简要介绍。要深入了解可以参考参考资源中列出的相关文章和图书。下面这些是Lucene 里比较重要的类。 Document:索引包含多个Document。而每个Document则包含多个Field对象。Document 可以是从数据库表里取出的一堆数据,可以是一个文件,也可以是一个网页等。注意,它不等同于文件系统中的文件。 Field:一个Field有一个名称,它对应Document的一部分数据,表示文档的内容或者文档的元数据(与下文中提到的资源元数据不是一个概念)。一个Field对象有两个重要属性:Store ( 可以有YES, NO, COMPACT 三种取值) 和Index ( 可以有TOKENIZED, UN_TOKENIZED, NO, NO_NORMS 四种取值) Query:抽象了搜索时使用的语句。

开源搜索引擎比较

开源搜索引擎的比较 1.N utch 简介: Nutch是一个用java实现的基于Lucene的开源搜索引擎框架,主要包括爬虫和查询两部分组成。Nutch所使用的数据文件主要有以下三种:1)是webDb,保存网页链接结构信息,只在爬虫工作中使用。2)是segment,存储网页内容及其索引,以产生的时间来命名。segment文件内容包括CrawlDatum、Content、ParseData、ParseText四个部分,其中CrawlDatum保存抓取的基本信息,content 保存html脚本,ParseData和ParseText这两个部分是对原内容的解析结果。3)是index,即索引文件,它把各个segment的信息进行了整合。爬虫的搜索策略是采用广度优先方式抓取网页,且只获取并保存可索引的内容。 Nutch0.7需要java1.4以上的版本,nutch1.0需要java1.6。 特点: 1、遵循robots.txt,当爬虫访问一个站点时,会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。 2、采用基于Hadoop的分布式处理模型,支持分布式的实现。 3、Nutch可以修剪内容,或者对内容格式进行转换。 4、Nutch使用插件机制,可以很好的被用户定制和集成。 5、Nutch采用了多线程技术。 6、将爬取和建索引整合在了一起,爬取内容的存储方式是其自己定义的 segment,不便于对爬取的内容进行再次处理,需要进行一定的修改。 7、因为加入了对页面分析,建索引等功能其效率与heritrix相比要相对较低。

搜索引擎高级语法

一、Google谷歌搜索高级语法 1. 减除无关资料(-) 如果要避免搜索某个词语,可以在这个词前面加上一个减号(“-”,英文字符)。但在减号之前必须留一个空格。 2. 英文短语搜索(””) 在Google 中,可以通过添加英文双引号来搜索短语。双引号中的词语(比如"like this")在查询到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。 一些字符可以作为短语连接符。Google 将“-”、“\”、“.”、“=”和“..."等标点符号识别为短语连接符。 3. 指定网域 有一些词后面加上冒号对Google 有特殊的含义。其中有一个词是“site:”。要在某个特定的域或站点中进行搜索,可以在Google 搜索框中输入“site https://www.doczj.com/doc/08774802.html,”。 例如,要在Google 站点上查找新闻,可以输入:新闻site:https://www.doczj.com/doc/08774802.html, 4. 查找特定文件 Google已经可以支持13种非HTML文件的搜索——PDF文件,Microsoft Office (doc, ppt, xls, rtf)、Shockwave Flash (swf)、PostScript (ps)和其它类型文档。新的文档类型只要与用户的搜索相关,就会自动显示在搜索结果中。 例如,如果您只想查找PDF或Flash 文件,而不要一般网页,只需搜索“关键词filetype:pdf” 或“关键词filetype:swf”就可以了。 5. 按链接搜索 例如,“link:https://www.doczj.com/doc/08774802.html,”将找出所有指向Google 主页的网页。不能将link: 搜索与普通关键词搜索结合使用。 6. 限定关键词只在标题中 例如“allintitle:中国苹果”表示“中国”和“苹果”都必须出现在标题中 “intitle:中国苹果”表示“中国”必须出现在标题中,“苹果”可以出现在网页的任意位置,可以是标题也可以不是。。 7. 限定关键词只在URL中 例如“allinURL:koko com”表示“koko”和“com”都必须出现在URL中 “inURL:koko com”表示“koko”必须出现在URL中,“com”可以出现在网页的任意位置,可以是URL也可以不是。。 8. Info用来显示与某链接相关的一系列搜索 提供cache、link、related和完全包含该链接的网页的功能。

搜索引擎对比

百度、谷歌、搜狗、有道四大搜索引擎的比较分析学校:中南财经政法大学学号:2009357770832 姓名:李心彤 随着经济与科技的发展,信息对于人们来说越来越重要,而随着计算机的普及,人们利用搜索引擎来获取信息也是越来越频繁。因此,国内外的几家搜索引擎展开了角逐,在各自领域努力发挥着自己的优势。本文通过对百度、谷歌、搜狗、有道四大搜索引擎的个人化体验,对其作出比较与分析。体验主要从以下几个方面进行: 一、政治敏感度

搜索引擎百度搜狗有道谷歌 词条数量323 1433 43 69100 可以看出,在搜索较为敏感的政治事件时,各大搜索引擎表现出极大的不同。作为国内最大用户最多的百度搜索引擎,是唯一一个表现出明确屏蔽态度的搜索引擎,会在搜索框下方显示“根据相关法律法规和政策,部分搜索结果未予显示”,且其搜索数量也是几个搜索引擎中较少的。同时,在搜索出来的词条中,再未显示关键词中的任何一个字,仅在具体内容中偶有一两个相同字眼。可见百度对政治敏感内容十分顾忌。 而搜狗则在搜索页的最末用灰色字体显示“根据相关法律法规和政策,部分搜索结果未予显示”,不太能够引起人的注意。其搜索结果虽然在四个引擎中排名第二,但仍然并不算多。且其跟百度一样,搜索出来的结果中并未出现过多的关键词。 有道虽然是所有引擎中结果数量最少的,但出人意料的是,有道所搜索出来的前几个词条,是完全符合搜索词的。虽然其具体内容皆无法打开,但不得不说有道是国内引擎中最大胆的。 而谷歌作为国外开发的搜索引擎,一向对政治事件十分随意,因此,我们不难从图片中看出搜索政治敏感事件时,谷歌就像搜索随意的生活内容一样将各项结果显示,且有些资源是来自于国外的网站。但是具体点击时,视频、图片以及部分文字类内容明显在检测和过滤后是打不开的,且检测与过滤速度十分缓慢。但是,部分论坛里的讨论、对事件阐述并不太多也不太高调的文字类内容还是能够得以显现。 笔者随后更换搜索的关键词,使其更多与国家政治领导人相关,其搜索结果为: 搜索引擎百度搜狗有道谷歌 词条数量80200 3986 99 117000

实验五搜索引擎使用实验

实验五搜索引擎使用实验一、实验目的 1.了解搜索引擎的发展情况和现状;理解搜索引擎的工作原理;2.了解中英文搜索引擎的基本知识和种类; 3. 掌握中英文搜索引擎的初级检索与高级检索两种方式; 4. 分析和对比各种中英文搜索引擎的共性与区别; 5. 了解网络促销的主要方式二、实验内容: 1. 找网上的中英文搜索引擎,并列出5个中文搜索引擎和5个英文搜索引擎的名称; 2.掌握google、百度中高级搜索语法应用方法。 3. 用3个中文、2个英文搜索引擎对同一主题\同一检索词(关键词)进行检索,从检索效果分析得到的检索结果,并比较分析你所选择的搜索引擎的共性与区别。 4.了解网络促销的应用方式和网络广告促销的特点三、实验步骤 1. 搜索引擎的关键词检索(1)进入Google,熟悉并掌握以下功能:掌握Google 的网站检索功能,选取一些关键词在主页上使用“所有网页”检索网页,并通过使用运算符提高查准率;同时使用“高级检索”功能;掌握Google的图像检索功能;掌握Google的网上论坛功能;掌握Google的主题分类检索功能。(2)进入百度,熟悉并掌握Baidu各功能。搜索到至少两个专利介绍网站,并搜索一条关于手机防盗产品的专利技术,写出检索步骤并截图。 2. 搜索引擎的高级搜索语法应用(百度或谷歌) 3.浏览不同类型的网络广告。四、实验报告 1.进入Google,

搜索关键词“搜索引擎优化”,要求结果格式为Word格式;搜索关键词“电子商务”,但结果中不要出现“网络营销”字样;分别写出检索步骤并截图。 2. 精确匹配——双引号和书名号,分别加和不加双引号搜索“山东财经大学”,查看搜索结果。分别加和不加书名号搜索“围城”,查看搜索结果。 3. 搜索同时包含“山东财经大学”和“会计学院”的网页,并查看数量。 4.利用百度搜索两个专利介绍网站,并搜索一条关于手机防盗产品的专利技术,写出检索步骤并截图。 5.选择使用Google和百度,查询某商务信息(自定,如“海尔2012年销售额” )。要求写出:搜索引擎的名称、检索信息的主题、检索结果(列出前5个)。6.分析实验中所使用搜索引擎的优缺点。 7.比较说明中国和美国的网络广告发展情况。五.实验操作答案 1.(1)可以直接搜索word版的搜索引擎优化即可。如下图 (2)操作和上面差不多,看下图 2.不加引号搜索“山东财经大学”时,没有结果;而加引号时则有许多搜索结果。但是加不加引号搜索“围城”时,结果却是相同的。 3.大多为关于山东财经大学的信息,而会计学院则是属于山财的分支。 4. 1.进入

相关主题
文本预览
相关文档 最新文档