元搜索引擎
- 格式:doc
- 大小:15.50 KB
- 文档页数:3
元搜索引擎随着科学技术的发展,元搜索引擎技术应运而生。
元搜索引擎是基于搜索引擎之上的搜索引擎。
如今已逐渐成为了社会的热点话题,它已经渐渐地融入到人们的日常生活中。
A元搜索引擎定义:通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,它是是对分布于网络的多种检索工具的全局控制机制。
B元搜索引擎核心理论:元搜索引擎就是一个具有双层客户机/服务器机构的系统,一般由检索请求提交、检索接口代理、检索结果显示3部分组成。
(1)请求提交。
负责实现用户的检索设置要求,包括调用哪些独立搜索引擎、是否有最长检索时间设置、是否提供高级检索服务、设置每个搜索引擎返回的检索结果数量、在线帮助是否有效等。
若用户选择个性化检索,则推理机制将根据用户基本信息与动态知识库进行分析推理用户的当前意向,进行查询求精处理,并根据用户对返回结果的行为使用反馈机制动态更新知识库。
(2)检索接口代理。
负责将用户的检索请求“翻译”成能够满足不同搜索引擎“本地化”要求的格式,包括是否支持布尔检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。
它是元搜索引擎的一个重要指标。
(3)结果显示。
负责所有来源搜索引擎检索结果的去重、合并、输出处理等。
元搜索引擎如何将独立搜索引擎的检索结果以统一的格式显示给用户,是评测其检索性能的重要手段。
C元搜索引擎代表性文献:i 《元搜索引擎结果生成技术研究》张卫丰徐宝文等著ii 《中外元搜索引擎的比较研究》晏一平岳泉著D元搜索引擎主要模型:数学模型作为一个信息检索系统,元搜索引擎可以形式化的通过一个六元组来描述:MSE-System=(SEn,Qn,Hn,Fn,Rn,Tn)其中SEn、Qn、Hn、Fn、Rn和Tn分别表示待选择搜索引擎集合,信息检索需求集合,信息检索需求交换集合,待选择搜索引擎集合和信息检索需求集合之间的匹配处理框架,排序算法以及查询结果集筛选标准。
标准的检索工具
一些常见的标准检索工具包括:
1. 搜索引擎:如Google、Bing、百度等,用户可以通过输入关键词来获取相关信息。
2. 图书馆目录:图书馆提供的系统,用于查找图书、期刊、论文等资源。
3. 学术搜索引擎:如Google Scholar、Web of Science、Scopus 等,主要用于查找学术文献和学术资源。
4. 数据库:包括各种专业领域的数据库,如PubMed(生物医学)、IEEE Xplore(工程技术)、EBSCOhost(多学科领域)等。
5. 元搜索引擎:如Zotero、EndNote等,可以同时搜索多个数据库并整合结果。
6. 社交媒体搜索:如Twitter、Instagram、微博等,用于查找特定的社交媒体内容。
7. 文件管理工具:如Windows的文件搜索功能、Mac的Spotlight 等,用于在本地计算机上快速查找文件和文件夹。
8. 专业领域的检索工具:根据特定领域的需求,有一些定制化的检索工具,如化学领域的Reaxys、生物信息学领域的BLAST等。
这只是一些常见的标准检索工具,还有许多其他工具适用于特定的搜索需求。
比较Google、百度、Excite等搜索引擎的异同一搜索引擎的概念搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
百度、谷歌、Excite等是搜索引擎的代表。
二搜索引擎的分类1.全文索引全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。
它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
2.目录索引目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。
用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。
目录索引中最具代表性的莫过于大名鼎鼎的Yahoo!、新浪分类目录搜索。
3.元搜索引擎元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。
著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。
在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
其他非主流搜索引擎形式(1)集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。
元搜索引擎名词解释元搜索引擎名词解释:元搜索引擎,通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。
一个真正的元搜索引擎由三部分组成,即:检索请求提交机制、检索接口代理机制、检索结果显示机制。
"请求提交"负责实现用户"个性化"的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。
"接口代理"负责将用户的检索请求"翻译"成满足不同搜索引擎"本地化"要求的格式。
"结果显示"负责所有源搜索引擎检索结果的去重、合并、输出处理等元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。
使用元搜索引擎同时对几个搜索引擎进行检索,获得分级编排的检索结果。
元搜索引擎的原理我们可将元搜索引擎看成具有双层客户机/服务器结构的系统,用户向元搜索引擎发出检索请求。
元搜索引擎再根据该请求向多个搜索引擎发出实际检索请求;搜索引擎执行元搜索引擎检索请求后将检索结果以应答形式传送给元搜索引擎,元搜索引擎将从多个搜索引擎获得的检索结果经过整理再以应答形式传送给实际用户。
当然,某些元搜索引擎具有略微不同的机制。
元搜索引擎的分类在可以检索的目标搜索引擎、检索提问的处理方式以及如何编译和显示结果方面,元搜索引擎有着很大的差异。
有些元引擎一个接一个的搜索目标搜索引擎,另一些则同时进行搜索。
有些搜索引擎将检索提问转变成目标搜索引擎的提问语言,而有一些则原封不动的发送给目标引擎。
按功能划分,元搜索引擎包括多线索式搜索引擎和All-in-One式搜索引擎;按运行方式的差异可分为在线搜索引擎和桌面搜索引擎。
元搜索引擎
作者:姬洪强
来源:《中小学信息技术教育》2007年第12期
网络已逐渐成为教师教学中重要的信息来源,教师通常借助搜索引擎来检索所需求的资源。
然而,一种搜索引擎往往不能满足所有人或一个人所有的检索需求,经常需要使用多种搜索引擎,并对搜索结果进行比较、筛选和印证。
为解决逐一登录各种搜索引擎,并多次输入同一检索请求(检索字串)等操作繁琐的问题,元搜索引擎应运而生。
元搜索引擎的优点是返回的检索结果信息量大,检索效率高,服务多样化。
下面介绍几款国内外优秀的元搜索引擎以供中小学教师参考使用。
一、国内元搜索引擎
1.Xooda 元搜索引擎()
Xooda元搜索引擎支持16个国家/地区,可调用Baidu、Google、Yahoo、iAsk、Sogou、ZhongSou等12个源搜索引擎中全部或任意几个搜索引擎,可选择每个搜索引擎返回结果的数目。
它还可以进行进阶搜索,自动实现符合特殊检索语法要求的转换,只调用支持特殊检索语法的搜索引擎。
支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新优化排序。
2.酷爱元搜索引擎()
酷爱元搜索引擎提供自动搜索和人工搜索两种模式。
调用Baidu、Sogou、Yahoo等独立搜索引擎,各搜索引擎的结果会进行智能排序。
当用户输入关键词的时候,搜索框会自动列举出相关的关键词列表。
它的深入搜索功能可以为用户提供更精确的关键词,进一步细化结果。
当用户点击网页智能分析时,酷爱会把最相关的结果呈现给用户。
3.万纬元搜索引擎()
万纬搜索引擎是最有名的中文元搜索引擎之一。
万纬中文集成搜索引擎包括了5个英文搜索引擎Argos、Google、Hotbot、NorthernLight、Yahoo和7个中文搜索引擎,如网典、新浪、雅虎(中文)、搜狐、天网、悠游搜索。
用户可根据需要自由选择其中最多6个引擎进行同步搜索,搜索结果可按相关度、时间、域名和引擎分类,还可以选择搜索的关键词之间是用and 还是用or来运算。
4.比比猫元搜索引擎()
比比猫是采用聚类技术对结果进行处理,并且提供收藏、快照等功能的社会化搜索引擎。
它可以同时调用Google、Yahoo、Baidu、iAsk以及Sogou等5个搜索引擎。
使用时,网页左边会出现分析搜索内容后返回的结果列表,用户可以通过搜索分类查看所需要的结果,过滤掉与需求不相关的内容。
在访问多个搜索引擎的同时,它可以把最好的检索结果获取下来进行自动分类。
用户可以把喜欢的网页和个人文件保存在网站上,不管在哪儿,只要能上网,就能找回收藏。
5.K风元搜索(/k-metasearch)
K风元搜索是由K风软件在2007年1月2日开发的元搜索引擎软件产品,特色是任意聚合搜索引擎;快速建立网络、行业、站内搜索引擎;网页收藏夹;网页分享社区。
K风元搜索能够在后台自由集成成员搜索引擎,随意添加、删除或开启、关闭成员搜索引擎,个性化聚合搜索引擎。
K风的相关搜索调用切换功能,可以选择调用本地或其他网络上的关键词数据。
二、国外元搜索引擎
1.MetaCrawler( )
MetaCrauler由华盛顿大学推出,支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务,包括常规检索、高级检索、定制检索、国家或地区的资源检索等。
其中,高级检索模式可实现搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,检索结果排序依据(包括相关度、域名、源搜索引擎)设定等。
以上内容均可作为定制检索的个性化选项并予以保存。
另外,检索结果中包括一个以1000为最大值的相关度指标。
2.Dogpile()
Dogpile是最老、最受欢迎的多元搜索引擎之一。
它是1996年12月由美国人Aaron Flin推出的并行式和串行式相结合的混合式元搜索引擎。
Dogpile可以调用20多个独立的源搜索引擎。
在收到查询提问时,它首先并行地调用Google、Yahoo、MSN、Ask Jeeves等4个源搜索引擎,如果没有得到10个以上的结果,再调用另外的搜索引擎。
但Dogpile不提供可调用的源搜索引擎列表,不支持对各个源搜索引擎的自行指定和选择。
3.Mamma()
Mamma是并行式元搜索引擎,自称为“搜索引擎之母”。
可同时调用7个最常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。
其特点是检索界面友好,检索选项丰富,主要包括可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。
4.Ixquick ()
Ixquick最大优点是支持中文检索。
支持各种基本的和高级的检索功能,包括关键词检索、短语检索、截词检索、布尔检索、概念检索、自然语言检索、指定字段检索、包含(+)或排除(-)检索等。
Ixquick知道哪些搜索引擎能够处理短语、布尔逻辑、截词等等,Ixquick将负责把“翻译”后的查询请求直接递交到那些能够处理这些复杂请求的搜索引擎中,实现更加有针对性的搜索服务,瞄准更加高、精、专的检索结果。
自从第一个元搜索引擎Metacrawler推出以来,这一新型的网络检索工具异军突起,发展十分迅速,目前可用的元搜索引擎已非常多。
尽管元搜索引擎存在着一些功能局限,但其以涵盖较多的搜索资源,能够在尽可能短的时间内提供相对全面、准确的检索结果等诸多优异功能受到用户的青睐,已渐成为一种不可或缺的网络检索工具。
(作者单位:浙江师范大学教育学院)。