搜索引擎论文

  • 格式:docx
  • 大小:19.57 KB
  • 文档页数:6

下载文档原格式

  / 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

搜索引擎发展状态及未来趋势

【摘要】

搜索引擎包括图片搜索引擎、全文索引、目录索引等,其发展历史可分为五个阶段,目前企业搜索引擎和网站运营搜索引擎运用范围较广。在搜索引擎的未来发展中,呈现出个性化,多元化,智能化,移动化,社区化等多个趋势。

【关键词】

发展起源、索引、数据库、网站运营、未来趋势

【参考文献】

《个性化搜索引擎原理与技术》《搜索引擎的设计与实现》搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。其工作作原理分为抓取网页,处理网页和提供检索服务。抓取每个独立的搜索引擎都有自己的网页抓取程序,它顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。

搜索引擎的发展起源可以追溯到第一个Gopher搜索工具Veronica。后来的搜索引擎的发展分为五个阶段。第一阶段,出现World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统

计互联网上的服务器数量,后来则发展为也能够捕获网址。第二阶段,出现了以概念搜索闻名的Excite以及元搜索引擎Dogpile。第三阶段,即yahoo的出现。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。Yahoo以后陆续有Google等提供搜索引擎服务,但不可否认的是,Yahoo几乎成为20世纪90年代的因特网的代名词。第四阶段,一种新的搜索引擎形式出现了,即元搜索引擎。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第五阶段的代表是智能检索的产生:它利用分词词典、同义词典,同音词典改善检索效果,进一步还可在知识层面或者说概念层面上辅助查询,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。

搜索引擎目前包括图片搜索引擎、全文索引、目录索引、元搜索引擎、垂直搜索引擎等。全文索引引擎是名副其实的搜索引擎,国外代表有Google,国内有百度、搜狐等。它们从互联网提取各个网站的信息,建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。搜索引擎的自动信息搜集功能分为定期搜索和提交网站搜索。它的特点是搜全率比较高。目录索引,就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。与全文搜索引擎相比,目录索引有许多不同之处。首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。其次,搜索引擎收录网站时,只要网站本身

没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录。最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。

关于搜索引擎的应用,不得不提的是企业搜索引擎。企业搜索引擎可以理解为“企业级”搜索引擎,但其应用领域并非指单纯的企业,政府、教育、科研、媒体、医疗、军队、安全部门都有类似的应用需求。企业搜索引擎应企业知识管理之需而生。目前像新华通讯社这样的知识型组织,其信息管理应用服务系统担负着采集、发布、管理各类文字及图片信息的重大任务。其采集的信息涉及政治、外交、经济、文教、科技、法律等各个领域。企业搜索引擎工具与互联网搜索引擎的核心技术基本相同,如采集、检索等。不同之处在于企业搜索对相关核心技术的要求更高,如采集的效率更快,全面性更强,深度更深,而且能够定向定量采集。

此外,搜索引擎在网站运营中,也具有举足轻重的地位。在网站运营的过程中,细节决定着网站的成败,搜索引擎优化(SEO)是一个整体的过程,从网站建设到网站运营,这个过程都离不开了优化策略,每个环节都必须有优化的思想。首先,主题要应尽量用简洁的主题介绍当前页面的内容,不同网页的主题内容一定要不同,不可以千篇一律,

主题中应尽量体现当前页和网站的从属关系。其次,必须保证关键字分析和选择的质量。同时还应该通过关键字分析工具,查看网站关键字在搜索结果中的位置,随时调整优化。另外,搜索引擎还应关注网站的导出、导入及内部链接,以及提交网址,创建网站地图等。

当然,发展到现今这个阶段,搜索引擎技术和商业经营模式已经处于一个成熟和相对稳定状态。搜索引擎服务商要进一步发展必然要突破现有的技术和商业经营模式制约。而通过市场整合走综合化道路,实现对现有搜索市场的内外部资源的优化配置。这对于搜索引擎服务商来说是一个不错的选择。这样既可以发挥他们在搜索引擎领域的技术、市场优势,又可以实现从单一搜索引擎业务到综合门户业务的跨越式发展。通过多样化的业务开展把流动的搜索终端用户群转变为固定用户群,同时可以通过其他业务的开展吸引更多的用户。无论是传统产业还是新兴的信息产业,发展与主营业务相关的业务,走综合化道路似乎更加为人们所认同和采用。它可以在一定程度上减少投资风险,优化业务经营,在业务对冲或者综合业务经营中保持公司经营的稳定性。通过对现有市场资源的整合,实现搜索引擎公司内外资源的优化配置,增加企业的经营筹码,提高企业抗击市场风险的能力,从而提升公司以及整个搜索引擎行业经营管理和业务水平。

个性化趋势是搜索引擎的一个未来发展的重要特征和必然趋势之一。搜素引擎经过多年的发展后,功能越来越强大,提供的服务也越来越多样化。目前搜索引擎已达数千种,因此行业竞争也越来越激烈。日前,百度发布的新版首页在业界激起了热烈反响,其认为个性

化推荐是网络搜索的未来这是国内搜索引擎首次试水“个性化推荐”。随着网络信息量的爆炸式发展,大而全的传统搜索引擎越来越不能满足用户需求,反而微博、豆瓣等,更加能够

实际上,在电子商务领域中,越来越多的国内电商早已意识到个性化推荐的巨大作用,从而正推动“个性化推荐技术”成为一种专业的基础服务。

在未来的搜索引擎发展进程中,也将出现许多其他趋势。首先,多元化搜索会有不少竞争和成长的空间。搜索引擎服务从提供单一的文字、图片搜索,向提供音乐、视频、资讯、软件、文件等多元化的搜索发展,并且呈现进一步的分化。其次,搜索引擎会提供更具有个性化和智能化的针对性搜索。例如根据用户自身平时使用的搜索习惯和可能从事的行业特点,能够深度理解你要搜苹果还是水果还是要搜公司,更深度理解。第三,移动化。中国普通网民移动化的浪潮已经存在,随着手机等移动工具的使用,搜索引擎为我们提供的移动搜索也将进一步发展。第四,社区化。社区搜索整合的目标是为用户提供一站式服务,比如在Facebook、QQ里搜索与某个用户相关的内容,依托社区网友的内容,可以实现更准确的搜索,其目标就是为了用户提供一站式的服务。此外,未来的搜索引擎还将在以下几个方面改进和发展。一、搜索细化搜索条件。给出的搜索条件越具体,搜索引擎返回的结果也会越精确。二、用好搜索逻辑命令。搜索引擎基本上都支持附加逻辑命令查询,常用的是“+”号和“-”号,或与之相对应的布尔逻辑命令AND、OR和NOT。用好这些命令符号可以大幅提