元搜索引擎及其主要技术
- 格式:pdf
- 大小:467.69 KB
- 文档页数:7
元搜索引擎的工作原理是什么一、引言在日常工作和生活中,搜索引擎早已成为了每个人不可或缺的工具。
随着互联网的发展,搜索引擎的数量和类型也逐渐增多,其中元搜索引擎就是其中一种类型。
二、元搜索引擎的定义元搜索引擎是指能够同时向多个搜索引擎提交用户的查询请求,并将返回的结果集进行整合排列展示的搜索引擎。
简单来说,元搜索引擎能够在多个搜索引擎上搜索你想要的内容,将搜索结果整合在一起呈现给用户。
相比单一搜索引擎,元搜索引擎具有更广泛的范围和更全面的信息量。
三、元搜索引擎的工作原理1. 用户输入查询请求:用户在元搜索引擎页面上输入关键词,并点击搜索按钮。
2. 元搜索引擎发送查询请求:元搜索引擎会将用户的查询请求发送给多个搜索引擎,如百度、谷歌、必应等等。
3. 搜索引擎返回结果:多个搜索引擎收到查询请求后,会对其进行处理并返回结果,这些结果可能是网页、图片、视频等等。
4. 元搜索引擎整合结果:元搜索引擎将返回的结果集进行整合、分类和排序。
通常会去除重复的结果,并根据一定的算法将最相关的结果放在最前面。
5. 呈现给用户:整合后的结果将会呈现给用户,用户通过点击结果集中的链接,就可以访问网页或者查看相关内容。
四、元搜索引擎的优缺点1. 优点:(1)覆盖面广:元搜索引擎可以同时搜索多个搜索引擎,获取到更为广泛的搜索结果。
(2)减少冗余:通过整合各个搜索引擎的结果,可以减少重复结果的出现。
(3)提供更全面的信息:元搜索引擎不仅可以搜索网页,还可以搜索图片、视频、新闻等多种信息,为用户提供更全面的信息。
2. 缺点:(1)准确度有限:由于搜索结果可能来自于多个搜索引擎,因此搜索结果可能会有一定的偏差。
(2)速度慢:元搜索引擎需要向多个搜索引擎发送查询请求,因此相比单一搜索引擎,速度可能会慢一些。
(3)不够深入:由于元搜索引擎的操作对象是其他搜索引擎,因此无法深入到每一个站点去搜索。
五、结语随着网络信息的快速发展和多种类型搜索引擎的出现,元搜索引擎已成为了一种比较常见的搜索方式。
元搜索引擎作者:姬洪强来源:《中小学信息技术教育》2007年第12期网络已逐渐成为教师教学中重要的信息来源,教师通常借助搜索引擎来检索所需求的资源。
然而,一种搜索引擎往往不能满足所有人或一个人所有的检索需求,经常需要使用多种搜索引擎,并对搜索结果进行比较、筛选和印证。
为解决逐一登录各种搜索引擎,并多次输入同一检索请求(检索字串)等操作繁琐的问题,元搜索引擎应运而生。
元搜索引擎的优点是返回的检索结果信息量大,检索效率高,服务多样化。
下面介绍几款国内外优秀的元搜索引擎以供中小学教师参考使用。
一、国内元搜索引擎1.Xooda 元搜索引擎()Xooda元搜索引擎支持16个国家/地区,可调用Baidu、Google、Yahoo、iAsk、Sogou、ZhongSou等12个源搜索引擎中全部或任意几个搜索引擎,可选择每个搜索引擎返回结果的数目。
它还可以进行进阶搜索,自动实现符合特殊检索语法要求的转换,只调用支持特殊检索语法的搜索引擎。
支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新优化排序。
2.酷爱元搜索引擎()酷爱元搜索引擎提供自动搜索和人工搜索两种模式。
调用Baidu、Sogou、Yahoo等独立搜索引擎,各搜索引擎的结果会进行智能排序。
当用户输入关键词的时候,搜索框会自动列举出相关的关键词列表。
它的深入搜索功能可以为用户提供更精确的关键词,进一步细化结果。
当用户点击网页智能分析时,酷爱会把最相关的结果呈现给用户。
3.万纬元搜索引擎()万纬搜索引擎是最有名的中文元搜索引擎之一。
万纬中文集成搜索引擎包括了5个英文搜索引擎Argos、Google、Hotbot、NorthernLight、Yahoo和7个中文搜索引擎,如网典、新浪、雅虎(中文)、搜狐、天网、悠游搜索。
用户可根据需要自由选择其中最多6个引擎进行同步搜索,搜索结果可按相关度、时间、域名和引擎分类,还可以选择搜索的关键词之间是用and 还是用or来运算。
简述搜索引擎的分类及其特点一、搜索引擎有哪些类型1、全文搜索引擎全文搜索引擎是利用爬虫程序抓取互联网上所有相关文章予以索引的搜索方式。
一般网络用户适用于全文搜索引擎。
这种搜索方式方便、简捷,并容易获得所有相关信息。
但搜索到的信息过于庞杂,因此用户需要逐一浏览并甄别出所需信息。
尤其在用户没有明确检索意图情况下,这种搜索方式非常有效。
2、元搜索引擎元搜索引擎是基于多个搜索引擎结果并对之整合处理的二次搜索方式,适用于广泛、准确地收集信息。
不同的全文搜索引擎由于其性能和信息反馈能力差异,导致其各有利弊。
元搜索引擎的出现恰恰解决了这个问题,有利于各基本搜索引擎间的优势互补。
而且本搜索方式有利于对基本搜索方式进行全局控制,引导全文搜索引擎的持续改善。
3、垂直搜索引擎垂直搜索引擎是对某一特定行业内数据进行快速检索的一种专业搜索方式,适用于有明确搜索意图情况下进行检索。
例如,用户购买机票、火车票、汽车票时,或想要浏览网络视频资源时,都可以直接选用行业内专用搜索引擎,以准确、迅速获得相关信息。
4、目录搜索引擎目录搜索引擎是依赖人工收集处理数据并置于分类目录链接下的搜索方式,是网站内部常用的检索方式。
本搜索方式指在对网站内信息整合处理并分目录呈现给用户,但其缺点在于用户需预先了解本网站的内容,并熟悉其主要模块构成。
总而言之,目录搜索方式的适应范围非常有限,且需要较高的人工成本来支持维护。
5、集成搜索引擎集成搜索引擎是通过网络技术在一个网页上链接很多个独立的搜索引擎,查询时,点选或指定搜索引擎,一次输入,多个搜索引擎同时查询。
搜索的结果由各个搜索引擎分别以不同的页面显示。
6、门户搜索门户搜索引擎虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。
7、站内搜索站内搜索只查询自身数据库的信息,并把搜索结果展现给用户,站内搜索的特点是,信息都是网站自身的信息,并不会像全文搜索引擎那样去其他网站抓取信息,比如淘宝,我们使用淘宝搜索产品时,都是淘宝自身的数据信息。
全文搜索引擎全文搜索引擎是目前广泛应用的主流搜索引擎,国内则有著名的百度。
它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,再从这个数据库中检索与用户查询条件匹配的相关记录,按一定的排列顺序返回结果,因此他们是真正的搜索引擎。
代表:Google、Baidu、Sogou、so、soso、Yahoo、Bing等目录搜索引擎目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。
用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。
代表:DMOZ,早期的Yahoo等元搜索引擎元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。
在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
代表:搜星、InfoSpace、Dogpile、Xisoso、Vivisimo等垂直搜索引擎垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。
不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。
相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。
集合式搜索引擎集合式搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。
门户搜索引擎门户搜索引擎虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。
代表:AOLSearch、MSNSearch等免费链接列表免费链接列表(Free For All Links简称FFA)一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。
2期元搜索引擎及其主要技术177
的独立搜索引擎集中呈现在页面上,并提供了一个公共的检索人口,但是实际上用户一次只进入一个独立搜索引擎检索。
这种类型元搜索引擎的结果反馈页面多直接引用原始搜索引擎的结果页面。
从表面上看,这类元搜索引擎与独立搜索引擎具有更多的相似点,其主要代表有ezfind、Infodump等。
这类搜索引擎的特点是:
(1)一次检索一个搜索引擎;(2)检索结果直接凋用原始独立搜索引擎的结果页面{(3)只支持原始独立搜索引擎支持的检索句法。
图2显示出了ezfind的检索界面。
图2EZFlND的检索界面
32统一入口式元搜索引擎
统一人口式元搜索引擎为收录的独立搜索引擎建立丁一个公共查询人口,用户发出检索请求后,提问式被分别提交给多个独立搜索引擎,最终反馈的结果是多个独立搜索引擎查询结果的综台。
根据结果显示的不同,这类元搜索引擎又可分为直接调用原始页面型、混合综合型和分散综合型。
(1)直接凋用原始页面型元搜索引擎。
检索结果直接来自原始搜索引擎站点的结果页面,例如,AI上4()NE的检索界面(图3)就是一个典型的例子,该搜索引擎将查询内容分为5类,每一类中由系统默认凋用4个独立搜索引擎来检索,以Theweb(网页检索)和Hi曲一TechNews(高科技新
图3ALI。
40NE的检索界面闻)为例,前者检索使用Altavisla、Yah001、HotBot、ExciIe{后者则调用cMPTecllweb、zDNet、cnetNews、wiredNews一些新闻信息查询的站点。
结果页面凋用原独立搜索引擎的结果,如图d。
图4ALI,4()NE的查询结果界面
(2)混合综合型元搜索引擎。
将各个独立搜索引擎中查找的结果进行综合,结果显示以记录为单位,记录描述包括该记录被检出的来源。
例如ixquick的检索界面(图5).它提供了4种查询范围:网页(web)、新闻(News)、nlp3、图片(Picture)。
此外它还允许用户从系统挂接的12个搜索引擎中选择,进行新一轮查询。
ixquick的查询结果如图6所示。
圈5lxquick的检索界面
暨磐些鬻驾氅警j
蒜耥。
2照画纛…iF;鼍三二.ii等’j
:---………………-:一…一二—==薹茅监:黹孑一1瓣嚣4ii善ii!兰i:童;童!塾::。
;;。
,州……—一目!擎U&&谖挂索引
:般2麓………舢……摹+∞Ⅷ*A
聋蕊=茁籁.…。
圈6”“luIck的检索蛄果页面
(3)分散综合型元搜索引擎。
这种类型与混合综合型元搜索引擎在结果显示上有所不同,它以独
立搜索引擎为单位进行结果显示,在同一个独立擅
元搜索引擎及其主要技术
作者:李广建, 黄崑
作者单位:北京师范大学管理学院信息技术与管理学系,北京 100875
刊名:
情报科学
英文刊名:INFORMATION SCIENCE
年,卷(期):2002,20(2)
被引用次数:48次
1.查看详情
2.查看详情
3.查看详情
4.查看详情
5.Meta-Search availble from URL
6.张蕊元搜索引擎揭密 2000
7.王芳;张晓林元搜索引擎[期刊论文]-现代图书情报技术 1998(06)
8.Nicholas Tomaiuolo Are metasearchers better search-es? 1999(01)
1.查大元个性化推荐系统的研究和实现[期刊论文]-计算机应用与软件 2011(1)
2.陆安江.董旭晖个性化元搜索引擎模型的研究与设计[期刊论文]-计算机与现代化 2011(1)
3.陆安江.董旭晖个性化元搜索引擎模型的研究与设计[期刊论文]-计算机与现代化 2011(1)
4.董旭晖.陆安江.张正平基于Agent元搜索引擎的研究与设计[期刊论文]-计算机与现代化 2010(11)
5.陈建军搜索引擎优化探讨[期刊论文]-电脑知识与技术 2010(33)
6.王忠.程磊基于元搜索引擎的个性化Web信息采集[期刊论文]-计算机工程与设计 2009(13)
7.王继生.王一莉面向主题的元搜索引擎[期刊论文]-计算机工程与设计 2009(4)
8.刘松涛.祝忠明基于Web2.0的个人学术信息门户设计[期刊论文]-图书与情报 2007(5)
9.朱晓丽中外九大元搜索引擎的比较研究[期刊论文]-数字图书馆论坛 2007(9)
10.闫俊英.辜碧容元搜索引擎及其关键技术[期刊论文]-福建电脑 2007(11)
11.张丽丽.武振毅元搜索引擎在网络信息检索中的应用[期刊论文]-信息技术 2007(5)
12.朱晓丽国内医学搜索引擎的现状及发展对策[期刊论文]-现代情报 2007(2)
13.翁勍力.施水才.赵捧未基于元搜索的聚类挖掘引擎[期刊论文]-情报杂志 2007(9)
14.种梅.刘方爱元搜索引擎中的成员选择和结果合并策略研究[期刊论文]-计算机工程与设计 2007(21)
15.刘晔中文元搜索引擎综合比较分析[期刊论文]-情报探索 2007(3)
16.翁勍力.施水才.赵捧未基于网页摘要分析的元搜索引擎研究[期刊论文]-现代图书情报技术 2006(12)
17.苏超.蔡铭.姚玉荣面向领域资源的智能元搜索技术研究[期刊论文]-计算机科学 2006(9)
18.鲍劼搜索引擎技术的研究与站内搜索的实现[期刊论文]-能源技术与管理 2006(2)
19.查大元个性化推荐系统的研究和实现[期刊论文]-计算机应用与软件 2011(1)
20.聂丽平搜索引擎的可用性研究[学位论文]硕士 2006
21.闫峻新一代搜索引擎准确性收录技术的研究[学位论文]硕士 2006
22.李霞基于Web的中文元搜索引擎的研究及实现[学位论文]硕士 2006
23.陈默基于神经网络的元搜索引擎[学位论文]硕士 2006
24.陈默基于神经网络的元搜索引擎[学位论文]硕士 2006
25.孔芳芳基于个性化元搜索引擎结果优化设计[学位论文]硕士 2006
26.孔芳芳基于个性化元搜索引擎结果优化设计[学位论文]硕士 2006
27.孔芳芳基于个性化元搜索引擎结果优化设计[学位论文]硕士 2006
28.葛驰中文元搜索引擎万纬搜索探讨[期刊论文]-情报杂志 2005(4)
29.陶青.粟慧无人值守参考咨询模式--网络环境下参考咨询服务模式探讨[期刊论文]-情报理论与实践 2005(2)
30.郭少友元搜索引擎的原理与设计[期刊论文]-情报科学 2005(2)
31.胡誉耀谈元搜索引擎的虚拟资源分类[期刊论文]-高校图书馆工作 2005(2)
32.李娟高校数字图书馆中基于Agent的智能信息采集与服务原型系统的研究[学位论文]硕士 2005
33.樊康新基于服务器端的个性化元搜索引擎的研究与设计[学位论文]硕士 2005
34.樊康新基于服务器端的个性化元搜索引擎的研究与设计[学位论文]硕士 2005
35.傅晓静基于WEB的空间信息搜索引擎的研究与实现[学位论文]硕士 2005
36.傅晓静基于WEB的空间信息搜索引擎的研究与实现[学位论文]硕士 2005
37.王雁杰元搜索引擎的发展悖论及建议[期刊论文]-情报杂志 2004(7)
38.胡誉耀元搜索引擎的虚拟资源分类[期刊论文]-情报科学 2004(5)
39.陆安江.董旭晖个性化元搜索引擎模型的研究与设计[期刊论文]-计算机与现代化 2011(1)
40.吕传宇.李华.耿虎一种适合于专题式元搜索引擎的信息检索策略[期刊论文]-重庆大学学报(自然科学版) 2004(7)
41.吴学毅.赵立宏.吕蕊芹网络文献数据库元搜索引擎机理研究[期刊论文]-图书情报知识 2004(1)
42.李建伟试论第三代搜索引擎的技术发展趋势[期刊论文]-广西右江民族师专学报 2004(3)
43.吕传宇答疑系统中专题式智能型元搜索引擎的研究[学位论文]硕士 2004
44.胡誉耀元搜索引擎在数字图书馆中的运用[期刊论文]-图书与情报 2003(5)
45.邓顺国试论搜索引擎的发展趋势[期刊论文]-图书馆理论与实践 2003(5)
46.周燕网络信息资源组织研究[期刊论文]-图书与情报 2003(1)
47.楼松斋.张惠惠中文电子期刊的元搜索引擎[期刊论文]-情报科学 2003(11)
48.郑德权.于凤.于浩.赵铁军提高Web信息检索精度的多步策略[期刊论文]-哈尔滨商业大学学报(自然科学版) 2003(3)
49.苗松基于代理的集成式检索系统构想[期刊论文]-大学图书情报学刊 2003(3)
50.王锡钢.刘振文搜索引擎技术的分析与研究[期刊论文]-鞍山钢铁学院学报 2002(6)
51.陆安江.董旭晖个性化元搜索引擎模型的研究与设计[期刊论文]-计算机与现代化 2011(1)
本文链接:/Periodical_qbkx200202021.aspx。