搜索引擎历史
- 格式:doc
- 大小:46.00 KB
- 文档页数:5
搜索引擎毕业论文搜索引擎毕业论文搜索引擎是当今信息时代的重要工具之一,它以其高效、准确的搜索结果,为人们提供了便捷的信息检索途径。
然而,搜索引擎的发展也面临着一些挑战和问题。
本文将探讨搜索引擎的发展历程、技术原理以及存在的问题,并提出一些改进的建议。
一、搜索引擎的发展历程搜索引擎的发展可以追溯到20世纪90年代,当时互联网开始迅速普及。
最早的搜索引擎主要是通过建立网页目录和分类索引的方式进行信息检索,但由于互联网信息的快速增长,这种方式无法满足用户的需求。
随着技术的进步,基于关键词的搜索引擎逐渐兴起,它通过对网页内容进行索引和排名,提供更加准确和全面的搜索结果。
二、搜索引擎的技术原理搜索引擎的核心技术是信息检索和网页排名。
信息检索是指根据用户输入的关键词,从海量的网页中筛选出与之相关的页面。
这一过程主要包括网页爬取、索引建立和查询处理等步骤。
网页爬取是指搜索引擎通过自动化程序(蜘蛛)访问互联网上的网页,并将其内容存储到数据库中。
索引建立是指将网页内容进行分词、词频统计等处理,生成索引文件以便后续查询。
查询处理是指根据用户输入的关键词,从索引文件中查找相关网页,并按照一定的算法进行排序和展示。
网页排名是指根据一定的算法,对搜索结果进行排序和展示。
搜索引擎的排名算法通常基于网页的相关性、权威性和用户体验等因素进行评估。
相关性是指网页与用户输入的关键词的匹配程度,权威性是指网页的信誉和影响力,用户体验是指用户对搜索结果的满意度。
搜索引擎通过对这些因素进行综合评估,为用户提供最符合其需求的搜索结果。
三、搜索引擎存在的问题尽管搜索引擎在信息检索方面取得了显著的成就,但仍然存在一些问题。
首先,搜索结果的准确性和可信度有待提高。
由于互联网上存在大量的垃圾信息和虚假信息,搜索引擎往往难以准确判断网页的质量和真实性。
其次,搜索引擎的个性化推荐功能存在一定的局限性。
虽然搜索引擎可以根据用户的搜索历史和兴趣偏好,为其提供个性化的搜索结果,但这种推荐往往容易陷入信息过滤的困境,导致用户接触到的信息变得单一和局限。
搜索引擎优化(SEO)的历史1、20 世纪九十年代Yahoo 是最早使用SEO 技术的公司之一,那个时候,他们还没有估计到搜索产业的巨大增长潜力。
世纪之交,Yahoo的联合创始人大卫•费罗和杨致远为了增加站点的曝光度,想办法让他们的网站能被互联网上其他搜索引擎发现。
通过对站点结构的优化和一些“狡猾”的代码编写技巧,他们的网站变得很容易被那些新用户检索到。
他们当时也没有考虑将这种服务的商业化操作,因为当时没有人清楚这样做到底是否符合商业道德,也没有可以参考的简单标准。
随着搜索引擎开始对网上的信息进行归类,企业主开始意识到站点被显示在搜索引擎上的价值了,最显而易见的是可以增加站点的访问量。
他们开始不断向搜索引擎递交他们站点的网址,为了适应搜索引擎蜘蛛(Robots)而对他们的站点做出改变。
前期的努力就集中在站点的递交,不久以后,自动向搜索引擎递交站点的程序诞生了,同样,臭名昭著的搜索引擎垃圾(Spam)也开始存在了。
● 1994 年,Yahoo、Lycos 等分类目录型搜索引擎相继诞生,搜索引擎表现出网络营销价值,搜索引擎营销思想开始出现;● 1995 年,自动提交到搜索引擎的软件诞生,搜索引擎营销“智能化”,此后不久许多搜索引擎开始拒绝自动登录软件提交的信息;● 1995-1996 年,基于网页HTML 代码中META 标签检索的搜索引擎技术诞生。
利用META 标签改善在搜索引擎中排名的技术很快成为搜索引擎营销的重要内容,这就是搜索引擎优化方法的萌芽;● 1997 年,搜索引擎优化与排名自动检测软件问世,网络营销人员可以据此制定针对性的搜索引擎营销策略;● 1998 年,“搜索引擎算法”开始关注网站外部链接,“ 网站链接广度”(linkpopularity)概念诞生。
2、二十一世纪SEO 专家开始出现还是近5 年的事情。
因为在较早的2001 年,精力充沛的网站管理员们迅速认识到他们可以通过反复向搜索引擎递交来征服搜索结果。
第十一章搜索引擎营销(SEM)作为网民进入互联网的主要入口,搜索引擎的对企业推广的重要性不言而喻。
对很多网站,尤其企业网站而言,绝大部分的流量来源都是搜索引擎,换句话说,搜索引擎是一般企业网站流量来源的生命线。
也正因为如此,搜索引擎常被作为企业网站推广和产品促销的主要手段。
SEM,即Search Engine Marketing的缩写,是指有效地利用搜索引擎来进行网络营销和推广的网络营销方法。
一般来说,企业开展搜索引擎营销有两条道路可以选择,一是购买收费的搜索引擎广告(商业排序),例如购买百度的竞价排名广告、Google的AdWords广告等;二是通过技术手段,对网站进行优化,即我们通常所说的SEO(搜索引擎优化)等方法,让关键词通过自然搜索的结果排到好的位置(自然排序)。
作为搜索引擎营销的重要组成部分,SEO(Search Engine Optimization)就是根据搜索引擎的算法,利用技术手段对网站进行优化,使搜索引擎更容易搜索网站的内容,并且让网站的各个网页在搜索引擎中获得较高的评分,从而获得最优排名的一种网络推广方式。
本章重点介绍搜索引擎技术的基础知识。
第一节搜索引擎工作原理上网的人都会用到搜索引擎,只要输入想要查询的关键词就可以迅速得到海量结果。
但是,搜索引擎究竟是怎么工作的呢?为什么输入一个关键词就能得到这些结果?为什么有的结果排在前面,有的落在后面?这中间有着什么样的规则呢?想学习好搜索引擎优化,想通过自然排序获得好的搜索排名,一定要先了解搜索引擎的工作原理。
11.1.1搜索引擎的发展历史在互联网发展初期,网站相对较少,信息查找比较容易。
然而伴随互联网爆炸性的发展,网络信息越来越丰富,普通网络用户想找到所需的资料如同大海捞针,为满足大众信息检索的需要,专业的搜索网站便应运而生了。
怎样清除历史记录1. 为什么清除历史记录很重要在我们使用计算机、浏览器、社交媒体或其他应用程序时,这些工具会自动记录我们的活动和历史记录。
历史记录包括我们的浏览历史、搜索记录、下载记录、登录信息和其他个人活动。
清除历史记录的重要性在于保护我们的隐私和安全。
如果我们不定期清除历史记录,其他人可能会获得我们的个人信息,并可能滥用这些信息。
此外,清除历史记录还可以提高设备的性能。
随着时间的推移,记录的数据会变得越来越庞大,这可能会导致设备变慢。
因此,定期清除历史记录是保持设备运行顺畅的重要步骤。
2. 清除浏览器历史记录2.1. Google Chrome要清除Google Chrome浏览器的历史记录,请按照以下步骤操作:1.打开Chrome浏览器并点击右上角的菜单图标(三个点)。
2.在菜单中选择“历史记录”选项。
3.点击“清除浏览数据”按钮。
4.在弹出的窗口中选择要清除的时间范围。
如果您想清除所有历史记录,请选择“始终”。
5.选中要清除的项目,如浏览历史、下载历史、缓存图像和文件、密码等。
6.点击“清除数据”按钮。
2.2. Mozilla Firefox要清除Mozilla Firefox浏览器的历史记录,请按照以下步骤操作:1.打开Firefox浏览器并点击右上角的菜单图标(三条水平线)。
2.在菜单中选择“选项”。
3.在左侧导航菜单中选择“隐私和安全”选项。
4.在“历史记录”部分,点击“清除历史记录”按钮。
5.在弹出的窗口中选择要清除的时间范围。
如果您想清除所有历史记录,请选择“全部”。
6.选中要清除的项目,如浏览和下载历史、缓存、Cookie等。
7.点击“清除”按钮。
2.3. 微软Edge要清除微软Edge浏览器的历史记录,请按照以下步骤操作:1.打开Edge浏览器并点击右上角的菜单图标(三个点)。
2.在菜单中选择“设置”选项。
3.在左侧导航菜单中选择“隐私、搜索和服务”。
4.在“清除浏览数据”部分,点击“选择清除什么”按钮。
在搜索过程中如何有效管理搜索历史在如今这个信息爆炸的时代,我们几乎每天都会进行各种各样的搜索。
无论是查找学习资料、工作相关的信息,还是满足日常的兴趣爱好,搜索已经成为我们获取知识和解决问题的重要途径。
然而,随着搜索次数的增加,搜索历史也变得越来越繁杂。
如果不加以有效管理,不仅会影响我们的搜索效率,还可能泄露个人隐私。
那么,在搜索过程中,我们应该如何有效管理搜索历史呢?首先,我们要明确为什么管理搜索历史是重要的。
一方面,良好的搜索历史管理能够提高我们再次查找相关信息的效率。
比如,当我们需要回顾之前搜索过的某个特定主题的资料时,如果搜索历史条理清晰,就能迅速找到,节省大量时间。
另一方面,管理搜索历史有助于保护个人隐私。
搜索历史中可能包含一些敏感信息,如个人健康状况、财务状况等,如果这些信息被不当获取或利用,可能会给我们带来麻烦。
接下来,让我们探讨一些具体的管理方法。
第一种方法是定期清理不需要的搜索历史。
这并不是说要把所有的搜索历史都删除,而是要有选择性地清理。
比如,对于那些已经解决的问题、一次性的查询或者不再有参考价值的搜索记录,我们可以果断删除。
这样可以避免搜索历史过于冗长和混乱,使真正重要的信息更容易被找到。
在进行清理时,可以根据时间顺序来筛选。
比如,设定一个时间范围,如一个月或三个月之前的搜索记录,如果确定不再需要,就可以删除。
同时,也可以根据搜索的主题来判断。
对于一些琐碎的、无关紧要的主题,如临时查询的某个娱乐新闻,就可以考虑清理。
第二种方法是对搜索历史进行分类和标记。
我们可以根据搜索的内容将其分为不同的类别,比如学习、工作、生活、娱乐等。
然后,为每个类别添加相应的标记或标签。
这样,当我们想要查找特定类别的搜索记录时,只需要筛选对应的标签,就能快速找到相关的历史记录。
例如,如果我们正在做一个关于历史研究的项目,那么可以把所有与此相关的搜索记录标记为“历史研究”。
当项目继续推进,需要回顾之前的搜索时,就能轻松找到相关内容。
怎样删除历史记录在现代社会中,我们经常使用各种设备和应用来进行日常工作和生活。
与此同时,我们的设备和应用程序也会记录我们的历史记录。
这些历史记录包括我们的网页浏览历史、搜索历史、通话记录以及其他一些个人信息。
由于隐私和安全的考虑,有时候我们可能需要删除这些历史记录。
本文将介绍一些常见设备和应用程序中删除历史记录的方法。
1. 删除浏览器历史记录浏览器是我们经常使用的工具之一,它记录了我们在网上的浏览历史。
删除浏览器历史记录的方法因浏览器而异。
下面是一些常见浏览器的删除历史记录的方法:Google Chrome要删除Google Chrome浏览器的历史记录,您可以按下快捷键 Ctrl + Shift + Delete,然后选择要删除的历史记录的时间范围,如“最近一个小时”、“最近一天”等,最后点击“清除历史记录”按钮。
Firefox在Firefox浏览器中,您可以按下快捷键 Ctrl + Shift + Delete 打开浏览器的“清除历史记录”对话框。
您可以选择要删除的历史记录的时间范围,然后点击“清除”按钮。
Safari在Safari浏览器中,您可以点击菜单栏中的“历史”选项,然后选择“清除历史记录”。
在弹出的对话框中,您可以选择要删除的时间范围,最后点击“清除历史记录”按钮。
2. 删除搜索历史记录搜索引擎通常会记录我们的搜索历史记录。
下面介绍如何删除一些常见搜索引擎的搜索历史记录:Google要删除Google搜索历史记录,您可以访问您的Google账户的“我的活动”页面。
在该页面中,您可以选择“删除活动通过”选项,然后选择“所有的时间”来删除所有的搜索历史记录。
Bing在Bing搜索引擎中,您可以访问Bing的“搜索历史记录”页面。
登录您的Microsoft账户后,您可以选择“删除搜索历史记录”选项,然后点击“删除”按钮来删除搜索历史记录。
Baidu在百度搜索引擎中,您可以点击页面右上角的“设置”按钮,然后选择“清除记录”。
Google一、企业简介Google公司(中文译名:谷歌),是一家美国的跨国科技企业,致力于互联网搜索、云计算、广告技术等领域,开发并提供大量基于互联网的产品与服务,其主要利润来自于AdWords等广告服务。
谷歌的使命是整合全球信息,使人人皆可访问并从中受益。
谷歌是第一个被公认为全球最大的搜索引擎,在全球围拥有无数的用户。
二、企业发展1997年到1998年间,谷歌联合创始人拉里·佩奇和尔盖·布林在学生宿舍里共同开发了全新的在线搜索引擎,之后他们募集了100万美元,在美国加门罗帕克的一间车库筹备公司。
成立数天后,公司注册了域名。
1999年6月7日,谷歌获得了两家风险投资公司的投资,一共是2500万美元,这成为谷歌发展的最重要的开始。
2000年,谷歌与雅虎公司达成合作协议,谷歌为雅虎提供搜索引擎服务,使得谷歌开始崭露头角。
在此之前,谷歌还未成为搜索行业的主流,当时的行业领头羊仍是雅虎。
2001年,谷歌的网页评级机制PageRank被授予了美国专利。
但在互联网激烈的竞争下,仅仅靠出售技术,没有其他盈利方式是远远不够的,于是埃克里·施密特被风投家介绍空降到谷歌,成为公司CEO。
谷歌开始了一个新的时代。
谷歌创新的推出了Adwords文字广告——在搜索结果右边附加相关广告,使得谷歌在保持主页简明朴素的同时又能增加广告收入,这是谷歌最核心最成功的赚钱方式。
2006年10月,谷歌公司以16.5亿美元,收购影音容分享YouTube,是谷歌有史以来最大的并购。
2007年11月05日,谷歌宣布基于Linux平台的开源手机操作系统的名称为android。
2008年9月7日,Google Map卫星升空,将为Google Earth提供50厘米分辨率高清照片。
同年,谷歌与金融集团汇丰银行(HSBC)以及国际有线电视集团Liberty Global组成名为“O3b Networks”的网络计划,通过发射16颗卫星将网络服务带入地球上还未连上网络的地区,取名为O3b就是指地球上另外未有网络建设的30亿人口,希望借这样的网络计划工程,真正建立在地球上任何区域皆有连网能力的环境。
搜索引擎的基础知识来源:广告圈 知己知彼--基础知识篇搜索引擎是一种用于帮助互联网用户查询信息的搜索工具,它以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。
听起来,好像很复杂啊。
其实,最简单的说法,就是用来在网上找资料的工具。
它的出现也蛮富有趣味的呢。
诞生历史十几年前,万维网还没有出生的时候,网民在很短的时间内就掌握其中的全部信息,搜索引擎完全没有出现的必要。
1993年,互联网上出现了最早的Web浏览器Mosaic,次年Netscape推出了Navigator.浏览器的发展促使Web得到迅速推广,站点数目以惊人的速度增加。
于是,搜索引擎就诞生了。
第一个搜索引擎的出生地在美国,它的名字叫Archie,是由McGill大学的一个小组开发的。
随着互联网的信息按几何式增长,搜索引擎开始快速发展。
1994年春天,世界上出现了最早的真正意义上的搜索引擎--Lycos.随着Yahoo!的出现,搜索引擎的发展也进入了黄金时代,其性能也更加优越。
随着搜索引擎家族的不断发展壮大,逐渐分布到信息世界的各个角落,它们的种类、技术也在不断的发生变化。
主要种类目前有着数量众多的搜索引擎,但按照它们信息搜集方法和服务提供方式的不同,可以大致划分为三大主要类型:基于蜘蛛程序的的机器人搜索引擎、目录式搜索引擎(Directory,也叫做Catalog)和Meta元搜索引擎。
机器人搜索引擎这种搜索引擎由一个称为蜘蛛(Spider)的机器人程序以某种策略的程序自动访问Web站点,提取站点上的网页,并根据网页中的链接进一步提取其它网页,或转移到其它站点上。
由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。
听起来感觉很复杂吧?简单讲,就是由程序自动抓去网上的信息,“搜索引擎”这个词的原义就是指这种狭义上的基于机器人的搜索引擎。
搜索引擎经验总结分类:总结人:相生昌原文:http://blog.cs /xs c2001/archive/2006/04/03/649106.aspx一、搜索引擎概述搜索引擎的发展历史在互联网发展初期,网站相对较少,信息查找比较容易。
然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索需求的专业搜索网站便应运而生了。
现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Em tage发明的Archie。
虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Em tage想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。
Archie工作原理与现在的搜索引擎已经很接近,它依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。
由于Archie深受用户欢迎,受其启发,美国内华达Sys tem Computing Services 大学于1993年开发了另一个与之非常相似的搜索工具,不过此时的搜索工具除了索引文件外,已能检索网页。
当时,“机器人”一词在编程者中十分流行。
电脑“机器人”(Computer Robot)是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序。
由于专门用于检索信息的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。
世界上第一个用于监测互联网发展规模的“机器人”程序是Matthew Gray开发的World wide Web Wanderer。
刚开始它只用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。
与Wanderer相对应,Martin Kos ter于1993年10月创建了ALIWEB,它是Archie的HTTP版本。
搜索引擎发展历史:1萌芽:Archie,GopherArchie:1990年,加拿大蒙特利尔的麦吉尔大学的一个学生只做了一个自动索引互联网上匿名FTP网站文件的程序,称Archie。
如今提供Archie服务的网站已经很少。
Gopher:受Archie启发,美国明尼苏达大学的一个学生Mark McCahill,于1991年发明了Gopher的搜索协议,其命名来自该校的吉祥物,与Archie最大的不同是,Archie仅能够索引网络上的文件,而Gopher却可以对网页也进行索引。
直到今天,网上仍然有一些Gopher 的服务器运行着,许多Gopher协议的狂热者依然维护着它们。
2起步:Robot(网络机器人)的出现与spider(网络爬虫)第一个用于检测互联网发展规模的机器人程序诞生于1993年,由美国麻省理工学院的Matthew Gray 开发,名字叫做world wide web wander。
最初它只是用来统计互联网上的服务器数量,监测网络规模。
英国软件工程师Martijin Koster 创建了ALIWEB(Archie-Like Indexing of the web),事实上是一个Archie的互联网版本。
网站管理者若希望自己的的网页被索引,需要提交每一个网页的索引信息。
有点类似Yahoo。
网址:/3发展:excite、galaxy、yahoo1993年2月,6个斯坦福大学生开发出了Excite,不到一年时间,组成公司,并在1995年12月上市,不过2002年被Infospace(/)收购的Excite停止了自己的搜索服务,改用元搜索Dogpile(/)。
1994年斯坦福的两名博士生,杨致远jerry yang和David Filo共同创建了雅虎。
(/)1994年初,美国华盛顿大学计算机工程系的学生Brian Pinkerton 开始了他的小项目webCrawer,1994年4月20日,webCrawer(/)正式亮相。
如何清理计算机的历史搜索记录作为现代生活中不可或缺的工具,计算机在我们日常生活中发挥着重要的作用。
我们使用计算机进行各种操作,如浏览网页、搜索信息、收发邮件等等。
然而,这些操作可能会留下我们的个人信息,在计算机的历史搜索记录中,这对于我们的隐私保护来说可能是一个潜在的威胁。
因此,清理计算机的历史搜索记录是非常重要的。
本文将介绍如何清理计算机的历史搜索记录,以保护个人隐私。
1. 清理浏览器的历史记录在计算机上使用浏览器是最常见的上网方式之一。
为了保护个人信息的安全,清理浏览器的历史记录是必要的。
具体步骤如下:1.1. 打开浏览器,点击浏览器菜单栏上的“设置”选项。
1.2. 在设置页面中,找到并点击“隐私与安全”选项。
1.3. 在隐私与安全页面中,找到并点击“清除浏览数据”或类似的选项。
1.4. 在清除浏览数据页面中,选择要清除的历史搜索记录,并点击“清除”按钮。
根据浏览器的不同,可能还需要选择删除的时间范围,例如:最近一个小时、最近一天、最近一周等。
1.5. 点击“清除”按钮后,浏览器将清除选中的历史搜索记录。
2. 清理操作系统的搜索历史记录除了浏览器的搜索历史记录外,计算机的操作系统也可能记录用户的搜索历史。
清理操作系统的搜索历史记录可以从更深层次上保护个人隐私。
以下是清理常见操作系统搜索历史记录的方法:2.1. Windows 操作系统:2.1.1. 打开“控制面板”,选择“搜索历史记录”或“文件资源管理器选项”。
2.1.2. 在“搜索历史记录”或“文件资源管理器选项”窗口中,找到并点击“清除历史记录”或类似的选项。
2.1.3. 确认清除操作后,搜索历史记录将被删除。
2.2. macOS 操作系统:2.2.1. 打开“系统偏好设置”,选择“Spotlight”或“时间机器”选项。
2.2.2. 在“Spotlight”或“时间机器”窗口中,找到并点击“隐私”或类似的选项。
2.2.3. 在隐私选项中,找到并点击“清除历史记录”或类似的选项。
三代搜索引擎的历史现状和发展趋势研究三代搜索引擎的历史现状和发展趋势研究三代搜索引擎的历史.现状和发展趋势研究三代搜索引擎的历史、现状和发展趋势研究内容摘要搜索引擎自上个世纪九十年代初问世以来,一直在不断地更新发展,本文以实现技术替代为依据,把搜索引擎的发展历史分为三代,分别对其历史、现状和发展趋势进行了阐述和研究,为搜索引擎应用的深度研发提供了切实的思路和目标。
关键词搜索引擎第一代搜索引擎第二代搜索引擎第三代搜索引擎第一代搜索引擎1994年4月,斯坦福大学的两名博士生,美籍华人杨兴邦和davidfilo共同创立了yahoo!。
随着访问量和收录于链接数的快速增长,yahoo目录已经开始积极支持直观的数据库搜寻。
yahoo以后陆续存有altavista、inktomi、google提供更多搜索引擎服务。
yahoo!几乎沦为20世纪90年代的因特网的代名词。
1996年8月,sohu公司设立,制作中文网站分类目录,曾存有“回家打听地图,玩游戏打听搜狐”的美誉。
第一代搜索引擎的特征是基于人工分类目录搜索。
目录式搜索是以人工方式或半自动方式建立起来的目录导航,目录的用户界面是分级结构,首页提供了几个分类入口,把信息放在目录下,逐级向下查询,用它可以找到需要的信息。
因为是手工输入,所以算不上是真正的搜索引擎,只是按目录分类链接而已。
随着互联网的发展,人工编辑的分类目录已经不适应环境。
其明显瑕疵就是全然靠手工操作,须要人工按照分类一层一层核对,逐层步入就可以找出,搜寻速度非常快,采用比较复杂。
尽管现在仍存有采用,但可以确认的就是,靠目录式搜寻这种完整方式就将追到尽头,采用搜索引擎的时代已经到来。
信息分类是目录式搜索的发展趋势,它让互联网变的更普及更贴近、更方便人们的生活。
人们日常在互联网上所看到的信息,往往是不管你愿不愿意,接受不接受它都会强加给你,人们称这类信息为被动信息;而人们主动去查询招聘、租房、旅游等方面的信息称它为主动信息。
搜索引擎历史1990年以前,没有任何人能搜索互联网。
所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。
虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。
Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。
Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。
Jughead是后来另一个Gopher搜索工具。
Robot(机器人)一词对编程者有特殊的意义。
Computer Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。
由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。
世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。
刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB (Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。
ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。
随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Wanderer 基础上,一些编程者将传统的Spider程序工作原理作了些改进。
其设想是,既然所有网页都可能有连向其他网站的链接,那么从一个网站开始,跟踪所有网页上的所有链接,就有可能检索整个互联网。
到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan's World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider。
JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。
而RBSE是第一个索引Html文件正文的搜索引擎,也是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。
Excite 的历史可以上溯到1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。
到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers。
(注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile)1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。
除了网站搜索,它还支持Gopher和Telnet搜索。
1994年4月,Stanford University的两名博士生,美籍华人Jerry Yang(杨致远)和David Filo 共同创办了Yahoo(Jerry Yang Alerts a Usenet group to the Yahoo Database ,1996年的Yahoo)。
随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。
因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。
Wanderer只抓取URL,但URL信息含量太小,很多信息难以单靠URL说清楚,搜索效率很低。
Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。
(注:Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务;2002年10月9日,Yahoo放弃自己的网站目录默认搜索,改为默认Google的搜索结果,成为一个真正的搜索引擎。
并于2002年12月23日收购inktomi,于2003年7月14日收购包括Fast和Altavista在内的Overture)1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler (Brian Pinkerton Announces the Availability of Webcrawler)。
1994年4月20日,WebCrawler 正式亮相时仅包含来自6000个服务器的内容。
WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。
(注:后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile)Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。
Carnegie Mellon University的Michael Mauldin将John Leavitt 的spider程序接入到其索引程序中,创建了Lycos。
1994年7月20日,数据量为54,000的Lycos正式发布。
除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents。
(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务)Infoseek(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称1994年1月已创立,但直到年底它的搜索引擎才与公众见面。
起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。
但是它的发展史和后来受到的众口称赞证明,起初是否第一个登台并不总是很重要。
Infoseek的友善用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。
而1995年12月与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。
(注:Infoseek后来曾以相关性闻名,2001年2月,Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果。
1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。
用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。
第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。
(注:元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。
)DEC的AltaVista(2001年夏季起部分网友需通过p-roxy访问,无p-roxy可用qbseach单选altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年12月才登场亮相(AltaVista Public Beta Press Release )。
但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。
Altavista最突出的优势是它的速度(搜索引擎9238:比较搞笑,设计altavista的目的,据说只是为了展示DEC Alpha芯片的强大运算能力)。
而Altavista的另一些新功能,则永远改变了搜索引擎的定义。
AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。
用户可以用AltaVista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。
AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL 的搜索引擎,并能在24小时内上线。
AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。
在面向用户的界面上,AltaVista也作了大量革新。
它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。
这系列功能,逐渐被其它搜索引擎广泛采用。
1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。
(2003年2月18日,Altavista被Overture收购。
)然后到来的是Inktomi。
1995年9月26日,加州伯克利分校CS助教Eric Brewer、博士生Paul Gauthier创立了Inktomi(UC Berkeley Announces Inktomi),1996年5月20日,Inktomi 公司成立,强大的HotBot出现在世人面前。