搜索引擎概述
- 格式:ppt
- 大小:3.60 MB
- 文档页数:49
1.5 搜索引擎1.5.1 搜索引擎概述1.搜索引擎概念搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
它包括信息搜索、信息整理和用户查询三部分组成。
搜索引擎之所以能在短短几年时间内获得如此迅猛的发展,最重要的原因是搜索引擎为人们提供了一个前所未有的查找信息资料的便利方法。
搜索引擎最重要也最基本的功能就是搜索信息的及时性、有效性和针对性。
2.搜索引擎分类搜索引擎可以分成以下几类。
(1)全文搜索引擎全文搜索引擎是目前应用最广泛的搜索引擎,典型代表有Google搜索、百度搜索。
它们从互联网提取各个网站的信息,建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
(2)目录式搜索引擎目录索引的典型代表主要有Yahoo!、新浪分类目录搜索。
它是以人工方式或半自动方式搜集信息,由搜索引擎的编辑员查看信息之后,依据一定的标准对网络资源进行选择、评价,人工形成信息摘要,并将信息置于事先确定的分类框架中而形成的主题目录。
目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。
用户完全可以按照分类目录找到所需要的信息,不依靠关键词进行查询。
(3)元搜索引擎元搜索引擎接受用户查询请求后,通过一个统一的界面,同时在多个搜索引擎上搜索,并将结果返回给用户。
著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。
在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
一、实训背景随着互联网的飞速发展,搜索引擎已经成为人们获取信息、解决问题的重要工具。
为了深入了解搜索引擎的技术原理和实现方法,提高自己的编程能力和实际操作技能,我参加了本次搜索引擎技术实训。
本次实训主要涉及搜索引擎的基本原理、数据结构、算法以及实际应用等方面。
二、实训目标1. 掌握搜索引擎的基本原理和实现方法;2. 熟悉搜索引擎的关键技术,如信息检索、文本处理、索引构建等;3. 能够运用所学知识开发一个简单的搜索引擎;4. 提高自己的编程能力和实际操作技能。
三、实训内容1. 搜索引擎概述实训首先介绍了搜索引擎的基本概念、发展历程以及国内外主要搜索引擎的特点。
通过对搜索引擎的了解,使我对搜索引擎有了全面的认识。
2. 信息检索技术信息检索是搜索引擎的核心技术之一。
实训中,我们学习了布尔模型、向量空间模型等基本检索算法,了解了倒排索引、TF-IDF等检索方法。
3. 文本处理技术文本处理是搜索引擎预处理阶段的重要任务。
实训中,我们学习了中文分词、词性标注、停用词过滤等文本处理技术,为后续的索引构建和检索提供了基础。
4. 索引构建技术索引构建是搜索引擎的关键技术之一。
实训中,我们学习了倒排索引的构建方法,了解了索引优化策略,如索引压缩、索引重建等。
5. 搜索引擎实现在掌握了搜索引擎的基本原理和技术后,我们开始着手实现一个简单的搜索引擎。
实训过程中,我们选择了Python编程语言,利用jieba分词库、Whoosh索引库等工具,实现了搜索引擎的查询、检索、展示等功能。
6. 搜索引擎优化为了提高搜索引擎的检索效果,实训中我们还学习了搜索引擎优化(SEO)的相关知识。
通过优化网页内容、提高网页权重等方法,使搜索引擎能够更好地满足用户需求。
四、实训成果通过本次实训,我取得了以下成果:1. 理解了搜索引擎的基本原理和实现方法;2. 掌握了信息检索、文本处理、索引构建等关键技术;3. 实现了一个简单的搜索引擎,具备查询、检索、展示等功能;4. 提高了编程能力和实际操作技能。
民法论文论搜索引擎提供者的版权责任一、搜索引擎概述(一)搜索引擎的概念。
搜索引擎是在网页中自动生成用户所需的信息或者为用户提供含有信息的网页的链接工具,其通过技术手段帮助用户在庞大的互联网资源中以最快的速度寻找到自己所需的信息,是一种利用自动抓取程序对网络资源进行整理以备查询的网络媒体形式。
搜索引擎提供者是以提供信息搜索链接服务为主的运营商,是众多提供网络中介服务的网络服务提供者(InternetServiceProvider,以下简称ISP)中的一种。
(二)搜索引擎的特征。
对于普通用户而言,通过搜索引擎得到的信息只是其反馈的相关网站的链接地址列表,只有通过点击搜索结果链接到第三方网站上才能够浏览或下载所需信息,也即是说搜索引擎在此过程中起到一个桥梁中介的作用,它只是告诉用户信息位置,而真正提供信息的是被链接的网站。
所以搜索引擎的特征在于其技术中立性。
二、搜索引擎提供者要承担的几种直接版权责任搜索引擎提供者要承担的直接版权责任是指搜索引擎提供者在其提供搜索引擎服务时的有关行为直接侵犯了权利人的版权,其应为自己的行为承担侵权责任的情形。
(一)暂时复制责任。
搜索引擎在检索信息时要收集关键信息以形成检索数据,而这些信息进入搜索引擎提供者的计算机系统时会在其系统内存中被自动复制,这种复制只是一种必须而且暂时的复制。
在我国《著作权法》第十条第五款只是以不完全列举的方式给“复制”下了一个定义:“复制权,即以印刷、复制、拓印、录音、录像、翻录、翻拍等方式将作品制成一份或多份的权利。
”从该定义看,很难得出搜索引擎提供者在系统工作时是否属于《著作权法》意义上的复制。
(二)链接责任。
链接是指通过使用计算机可以识别的语言编辑包含标记指令的文本文件,在两个不同的文档或同一文档的不同部分建立联系,从而使访问者可以通过一个链接地址访问不同网站的文件,或通过一个特定的栏目访问同一站点上的其他栏目。
三、搜索引擎提供者的间接侵权责任及认定(一)间接侵权责任的概念。