各类搜索引擎的分类

  • 格式:doc
  • 大小:33.00 KB
  • 文档页数:2

下载文档原格式

  / 5
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

各类搜索引擎的分类、特点、工作原理及代表

1,图片搜索引擎

图片搜索是通过搜索程序,向用户提供互联网上相关的图片资料的服务。

从所使用的技术上来分类,可分为:

(1) 基于上下文本(context)的图片搜索,传统意义上图片搜索通常是通过Alt等锚来索引,搜索的,《浅谈图片搜索引擎的实现》中提出了跨越性的图片搜索的实现,具有很高的参考价值。如果这一设想可以实现,那将极大的改变人们的生活具有很高的参考价值。(2) 基于图片内容的搜索基于文本的图片搜索涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科,其相关技术主要包括:图像数据模型、特征提取方法、索引结构、相似性度量、查询表达模式、检索方法等。相似图片的检测主要涉及特征表示和相似性度量这两类关键技术。图像特征的提取与表达是基于内容的图像处理技术的基础。从广义上讲,图像的特征包括基于文本的特征(如关键字、注释等)和视觉特征(如颜色、纹理、形状等)两类。

2.全文索引

全文搜索引擎的代表是网络爬虫,网络爬虫是一个自动提取网页的程序,它为搜索引擎从Internet网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL 开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并放入等待抓取的URL队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页,并重复上述过程,直到达到系统的某一条件时停止。所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索;对于聚焦爬虫来说,这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导。

爬虫设计是否合理将直接影响它访问Web的效率,影响搜索数据库的质量,另外在设计爬虫时还必须考虑它对网络和被访问站点的影响,因为爬虫一般都运行在速度快,带宽高的主机上,如果它快速访问一个速度较慢的目标站点,可能导致该站点出现阻塞。Robot应遵守一些协议,以便被访问站点的管理员能够确定访问内容,Index是一个庞大的数据库,爬虫提取的网页将被放入到Index中建立索引,不同的搜索引擎会采取不同方式来建立索引,有的对整个HTML文件的所有单词都建立索引,有的只分析HTML文件的标题或前几段内容,还有的能处理HTML文件中的META标记或特殊标记。

3.目录索引

目录搜索引擎的数据库是依靠专职人员建立的,这些人员在访问了某个Web站点后撰写一段对该站点的描述,并根据站点的内容和性质将其归为一个预先分好的类别,把站点URL 和描述放在这个类别中,当用户查询某个关键词时,搜索软件只在这些描述中进行搜索。很多目录也接受用户提交的网站和描述,当目录的编辑人员认可该网站及描述后,就会将之添加到合适的类别中。

目录的结构为树形结构,首页提供了最基本的入口,用户可以逐级地向下访问,直至找到自己的类别,另外,用户也可以利用目录提供的搜索功能直接查找一个关键词。由于目录式搜索引擎只在保存了对站点的描述中搜索,因此站点本身的变化不会反映到搜索结果中,这也是目录式搜索引擎与基于Robot的搜索引擎之间的区别。分类目录在网络营销中的应用主要有下列特点:

通常只能收录网站首页(或者若干频道),而不能将大量网页都提交给分类目录;网站一旦被收录将在一定时期内保持稳定;无法通过"搜索引擎优化"等手段提高网站在分类目录中

的排名;在高质量的分类目录登录,对于提高网站在搜索引擎检索结果中的排名有一定价值;紧靠分类目录通常与其他网站推广手段共同使用。

4.元搜索引擎

我们可将元搜索引擎看成具有双层客户机/服务器结构的系统。用户向元搜索引擎发出检索请求,元搜索引擎再根据该请求向多个搜索引擎发出实际检索请求,搜索引擎执行元搜索引擎检索请求后将检索结果以应答形式传送给元搜索引擎,元搜索引擎将从多个搜索引擎获得的检索结果经过整理再以应答形式传送给实际用户。当然,某些元搜索引擎具有略微不同的机制。元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,将结果进行相关处理,以整体统一的格式反馈给用户。

它的特点是本身并没有存放网页信息的数据库。数码相机什么牌子好,呵呵多数元搜索引擎在处理其它的搜索引擎返回结果时,只提取出每个搜索引擎的结果中考前的条目,然后将这些条目合并在一起返回给用户,元搜索引擎实现起比较简单,但是它也有一定的局限性,例如多数元搜索引擎都只能访问少数几个搜索引擎,并且通常不支持这些搜索引擎的高级搜索功能,在处理逻辑查询时也常常会出现错误。在这几种检索工具中,目录式搜索引擎成本高,信息t少的缺点,但它的信息准确这一优点使其在一定的领域和时间内仍会被使用,机器人搜索引擎是当前各种搜索引擎的主流,但随着网络信息量的增加,单一搜索引擎已经难已满足要求,结合目录式搜索引擎,机器人搜索引擎的优势,以元搜索引擎为核心的多层代理搜索引擎是搜索引擎的发展方向。

5.垂直搜索引擎

垂直搜索引擎是应用于某一个行业、专业的搜索引擎,是搜索引擎的延伸和应用细分化。垂直搜索引擎为用户提供的并不是上百甚至上千万相关网页,而是范围极为缩小、极具针对性的具体信息。因此,特定行业的用户更加青睐垂直搜索引擎,是垂直搜索引擎的长期、稳定的群体。

垂直搜索的特点:

(1)快速直达

1.中文直达:直达各大知名网站、论坛、联盟站点,数据实时更新,中文直达服务让用户搜索一步到位.

2.关键词直达网站:商家可以提交自己的关键词,让客户输入关键词直达您的网站,增加无限商机

3.站内直达:直达网站内各频道、栏目,站内直达满足用户在网站的全方位服务.

(2)方便搜索

1.功能强大:提供强大的搜索功能, 多款引擎随时切换, 让用户操作变得更加便捷.

2.搜索发现:用户进入搜索首页, 浏览器会提示用户发现了新的搜索引擎, 并可将其设为默认.

3.内容全面:聚合常用搜索及垂直搜索, 聚合各大热门搜索引擎, 多项搜索多重性能.

4.完美兼容:界面设计符合标准, 在不同内核的浏览器上均可正常使用.

5、安全第一。收录大量网上银行、证券、股票、咨询、新闻等网址, 不再担心进入钓鱼网站.所有直达关键词网站,均严格经过叮铃铃各项指标的检验,有利的排斥了虚假广告、假冒产品、不良信息的商家网站。

(3)资源共享

结合网站,按您的需要生成不同样式、不同功能的搜索框代码, 轻松将搜索服务与网站结合.

(4)精准搜索

垂直搜索引擎一般都提供了比较精准或者细化的搜索服务,因此使用垂直搜索引擎有时候能取得更精准的搜索结果。附:垂直搜索引擎索引,发布国内外高质量的垂直搜索引擎。