《搜索引擎发展史》PPT课件
- 格式:ppt
- 大小:3.11 MB
- 文档页数:55
【搜索引擎的发展史】1990年,加拿大麦吉尔大学(University of McGill)计算机学院的师生开发出Archie。
当时,万维网(World Wide Web)还没有出现,人们通过FTP来共享交流资源。
Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。
用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。
虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。
所以,Archie被公认为现代搜索引擎的鼻祖。
搜索引擎的起源:所有搜索引擎的祖先,是1990年由Montreal的McGill University三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明的Archie(Archie FAQ)。
Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。
Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。
Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。
Jughead是后来另一个Gopher搜索工具。
发展(1):世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。
刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
搜索引擎一般由以下三部分组成:爬行器(机器人、蜘蛛)索引生成器查询检索器发展(2):Excite 的历史可以上溯到1993年2月,6个Stanford University(斯坦福大学)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。
搜索引擎发展历程搜索引擎在过去几十年的发展历程中经历了多次重大的技术突破和演进。
早期的搜索引擎主要是基于全文检索技术,用户通过输入关键词,搜索引擎会从海量数据中匹配出相关的网页结果。
1990年代初,最早的搜索引擎出现了,例如Excite和Infoseek。
当时的搜索引擎主要依赖人工编辑来整理和分类网页信息。
然而,由于互联网规模膨胀迅猛,这种人工编辑的方式很快变得不够高效和可扩展。
随着互联网的普及,1996年谷歌搜索引擎诞生了。
谷歌的创新之处是引入了PageRank算法,通过分析网页间的链接关系来评估网页的重要性和相关性。
这一算法大大提升了搜索结果的质量,并很快使得谷歌成为领先的搜索引擎。
为了提供更精准的搜索结果,搜索引擎开始采用语义分析和自然语言处理技术。
这些技术能够理解用户的意图,而不仅仅是匹配关键词。
例如,当用户搜索"天气"时,搜索引擎会返回天气预报结果,而不仅仅是包含"天气"关键词的网页。
移动互联网的兴起,使得移动搜索成为搜索引擎发展的重要方向。
移动搜索引擎需要考虑到用户的位置信息、设备特性和网络环境等因素,以提供更符合用户需求的搜索结果。
同时,移动搜索引擎还需要在有限的屏幕空间和低带宽环境下展示结果。
随着人工智能技术的快速发展,搜索引擎也开始引入机器学习和深度学习算法。
通过分析用户的搜索历史和行为,搜索引擎能够为用户提供个性化、定制化的搜索结果。
此外,搜索引擎还可以通过自动推荐、自动补全等功能提供更便捷、智能的搜索体验。
总的来说,搜索引擎发展的历程是一个不断创新和提升搜索质量的过程。
从最早的全文检索到引入链接分析、语义分析、移动搜索和人工智能等技术,搜索引擎不断演进,以满足用户不断变化的需求。
都知道搜索引擎是互联网的产物,随着互联网的发展搜索引擎也在逐代的更新。
分别经过了第一代搜索引擎、第二代搜索引擎、第三代搜索引擎。
在技术方面也是在逐步的升级,更加的完善、更加的贴近用户的需求、更加的快速、处理的数据量也是越来的越大。
那搜索引擎具体经过了那三个阶段呢?下面简单的复述一下。
搜索引擎前身分类目录的简述。
在互联发展的初期没有现在获取知识这么的复杂和多方位。
比如我们想看新闻就会去登陆某个新闻网站。
就可以了非常的简单,但随着互联的再发展和信息量的逐步爆发,用户不可能记住那没多的网址。
这种情况下就产生了分类目录,就像是现在的导航页差不多。
如果用想知道哪方面的知识而又不知道网站,那么直接去相关的分类下去找就好了,这就是搜索引擎的前生。
可以让大家知道在没有搜索引擎时是怎样的情况。
第一代搜索引擎文本搜索简述。
有了前一种分类目录的积累,给第一代搜索引擎的建立带来了很好的基础。
并且伴随着互联网信息的免费创建和个人站的暴涨,简单的分类目录已经不能满足用户的需求了,就这样第一代搜索引擎应运而生。
第一代搜素引擎只能检索纯文本,就和现在站内搜索差不多,只是通过用户的搜索词进行简单的匹配。
有时候我们把分类目录也称之为第一代搜索引擎。
第二代搜索引擎超链分析。
第二代搜索引擎区分于第一代搜索引擎的主要差别在于超链的分析。
关于超链的分析大家可以看一下百度李彦宏的百度百科,有详细的介绍这里就不在复述了。
就不签来说,全世界的搜索引擎大都停留在这个阶段,而第二代搜索引擎区分于第一代还有在文本搜索上和超链分析上加上了搜索结果页面用户的点击行为分析、目标也的用户体验分析等。
第三代搜索引擎语义搜索。
第三代搜索引擎的核心技术就是语义搜索,这需要庞大的数据库来支持。
简单的说语义搜索既是所想即所得,而不需要大量的点击和多次的搜索,直接展现结果。
现在李彦宏的百度知心搜索只是第三代搜索引擎的一个雏形,要到达到真正的所想即所得,中间需要过滤掉很多的点击,需要技术和经验的积累。
搜索引擎成为互联网的重要应用之一??? 从90年代末开始,互联网上的网站与网页数量飞速增长,网民的兴趣点也从屈指可数的几家综合门户类网站分散到特色各异的中小网站去了。
人们想在互联网上找到五花八门的信息,但由于人工分类编辑网站目录的方法受到时效和收录量的限制,无法再满足人们对网上内容的检索需求,于是搜索引擎在2000年后开始大行其道。
使用蜘蛛程序在互联网上自动抓取海量网页信息,索引并存储到庞大的数据库中,并通过特殊算法将相关性最好的结果瞬间呈现给搜索者,搜索引擎的便捷使其成为互联网最受欢迎的应用之一。
以至于有相当多的人将浏览器的默认首页设为搜索引擎,甚至形成了将网站名称输入到搜索框中而非浏览器地址栏这样独特的网络导航习惯。
呼叫目录返回顶部搜索成为人们思考行为的一部分??? 随着网上社区(SNS),博客(Blog),维基百科(Wikipedia)等如火如荼的发展,网民从单纯的信息获取者演变成信息发布者,人们通过网络分享自己的知识、体验、情感或见闻,使互联网上的内容越来越丰富多彩。
例如,按照统计,目前中国网民在百度知道平台上的问题解决率高达97.9%,这些问题涉及科技、社会、文化、商业等各个方面,尤其对人们的衣食住行等日常生活问题,几乎都能从平台获得满意的答案。
截至到09年7月的4年时间内,中文互动问答平台百度知道已经累计为中国网民解决了5650多万个问题,成为人们日常生活的最佳互动问答平台。
社区内容上的无所不谈使搜索引擎的收录也变得无所不包,人们发现通过搜索引擎可以找到他想要的任何信息,从新闻热点到柴米油盐,从育儿百科到MBA课程。
信息的便捷获取潜移默化的改变了人们的思考行为,搜索结果页上汇集了整个互联网的智慧,谁不想在苦思冥想前“搜索一下”呢?呼叫目录返回顶部搜索成为人们消费行为的重要环节??? 随着对搜索引擎的依赖加深,当人们有消费需求或看到感兴趣的商品时,“搜索一下”已经是已形成的“条件反射”。
搜索引擎发展史Archie--所有搜索引擎的祖先所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。
当时World Wide Web还未出现。
Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。
Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。
Jughead是后来另一个Gopher搜索工具。
由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。
世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。
刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。
ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB 收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。
1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan’s World Wide Web Worm)、NASA 的Repository-Based Software Engineering (RBSE) spider。