浅谈元搜索引擎的关键技术
- 格式:pdf
- 大小:707.61 KB
- 文档页数:2
价值工程源共享、协同工作的目的。
通过简单的配置就可以建立起一个完备的Internet ,实现常用的Web 页面发布、电子邮件系统互通、FTP 文件传输等功能,而内部用户则可通过拨号方式访问Internet ,实现Internet 接入。
本方案的操作系统分为服务器端操作系统和客户端操作系统。
服务器端操作系统和客户端操作系统均采用Windows 系列操作系统,其中服务器操作系统采用Windows2000Server ,客户端操作系统采用Windows2000profession 、Windows XP 系统,客户端操作系统为随机软件,不需另外购置。
医药商业企业信息化建设的关键是降低购销链过程成本,快速协调地提供物流服务;同时降低库存,提高资金使用效率。
英克科技是国内医药行业最为卓越的应用方案服务商。
同时,英克科技已经率先并成功的解决了目前医药市场背景下统购分销、连锁配送的管理难题。
英克ERP 系统是英克科技(INCA )根据KRM (知识与资源一体化管理)思想开放的ERP 系统,该ERP 软件具有技术先进性、管理科学性、对行业有深度了解。
其主要宗旨是将企业的各方面资源(信息、人力、资金、设备、时间、方法等方面)进行优化、整合,在强化企业财务管理、提高资金运营效率、建立“企业-供应商-客户”之间的供应链、提供强有力的管理。
它的目标是帮助高层管理人员对企业中错综复杂的动态信息进行及时、准确的分析和处理,使企业管理真正由经验管理进入科学管理模式,使企业的管理水平产生质的飞跃。
英克ERP 医药商业企业解决方案根据项目本身的目标要求和医药行业的实际,具有如下的主要特点:完全满足医药行业的质量管理规范(GSP )的要求:“即插即用的管理插件”可以使企业从容面对环境的改变;原子化的任务颗粒度能使企业做到精细核算、降低成本,以提高资金利用率;“知识流”保证企业在规范化管理的同时保持企业的个性特征。
作为应用软件运行的基础和整个计算机管理系统扩展的底层保证,本项目的数据库拟选用目前世界上最流行的中大规模关系数据库Oracle 公司的大型关系数据库Oracle 8i ,能够保证用户核心数据安全地存储和高效地访问;并且,Oracle 数据库支持英克公司ERP 软件。
搜索引擎技术、现状、以及未来发展趋势的文献综述(可编辑优质文档)(可以直接使用,可编辑完整版资料,欢迎下载)搜索引擎技术、现状、以及未来发展趋势的文献综述[摘要]随着最近10年中国互联网的快速发展,互联网已经彻底改变了人们的生活方式,而在互联网的发展过程中,搜索引擎发挥了巨大的推动作用。
本文对搜索引擎的发展历史,采用的技术,发展现状,出现的问题以及未来发展方向进行了综述,让读者对搜索引擎有个宏观的了解。
[关键词]搜索引擎,汉语分词,调查报告[正文]一、搜索引擎概述搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。
从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。
二、搜索引擎的重要发展历程1. 1990年,Montreal的McGill University三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明Archie(Archie FAQ),成为所有搜索引擎的祖先。
2. 1993年,MIT Matthew Gray的World wide Web Wanderer,是世界上第一个Spider 程序。
3.1994年4月,杨致远和David Filo共同创办了Yahoo!。
4.1995年,一种新的搜索引擎形式出现了——元搜索引擎(Meta Search Engine),即Washington大学硕士生 Eric Selberg 和 Oren Etzioni 发明的 Metacrawler。
5.1996年8月,sohu公司成立。
6.1998年,Google成立。
7. 2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。
浅析“搜索引擎之母”摘要:随着网络信息量的增加,单一搜索引擎已经难以满足要求,结合目录式搜索引擎,机器人搜索引擎的优势,以元搜索引擎为核心的多成代理搜索引擎是搜索引擎的发展方向。
本文介绍了元搜索引擎的概念、分类、分析了元搜索引擎的基本构成、优缺点,讨论了元搜索引擎的发展趋势。
关键词:搜索引擎;元搜索引擎;信息检索中图分类号:tp393文献标识码:a文章编号:1007-9599 (2013) 07-0000-021元搜索引擎的含义元搜索引擎,是在基于因特网搜索引擎的基础上,调用其它基于因特网的搜索引擎之上的引擎,所以称“搜索引擎之母”。
其中,“元”为“总的”意思,元搜索引擎就是将很多个独立搜索引擎进行调取、合成、优化利用和控制。
元搜索引擎就像是一个过滤器:输入的信息是由多个独立搜索引擎的输出结果而来,然后经过一番提取、删除、萃取等操作,最终形成结果,最后将最终结果输出给用户。
2元搜索引擎的基本组成请求提交代理、检索接口代理、结果显示代理是元搜索引擎的主要组成部分。
请求提交代理的主要任务是对用户特别的检索设置要求加以实现,主要包括搜索时间限定、调取了哪些搜索引擎、搜索结果数量上的限制等。
检索接口代理主要任务是将使用者的检索要求变成成满足其他不同搜索引擎自身要求的样式。
结果显示代理主要任务是将所有源搜索引擎检索结果去掉重复的然后进行合并最后进行输出处理等。
2.1请求提交代理:主要任务是对用户特别的检索设置要求加以实现,主要包括搜索时间限定、调取了哪些搜索引擎、搜索结果数量上的限制、是否提供高级检索服务、设置每个搜索引擎返回的检索结果数量、在线帮助是否有效等。
若用户选择个性化检索,则推理机制将根据基本信息与动态只是库进行分析推理用户的当前意向,进行查询求精处理,并根据用户对返回结果的行为适用反馈机制动态更新知识库。
2.2检索接口代理:不一样的搜索引擎所支持的查询方式是不一样的,即使是一样的方式也会有不一样的表示方法,所以我们必须把元搜索引擎中的一些查询要求对应到对应的搜索引擎中,并且不能将语义信息丢失掉。
元搜索引擎的调查分析
刘畅;林剑锋;王雁杰
【期刊名称】《现代图书情报技术》
【年(卷),期】2004(000)009
【摘要】通过对Dogpile、Ixquick、Profusion等6个国外元搜索引擎作较深入的调查和对比分析,归纳总结并评价了国外元搜索引擎的发展现状,最后基于这些调查结果对元搜索引擎提出一些发展建议.
【总页数】4页(P40-43)
【作者】刘畅;林剑锋;王雁杰
【作者单位】北京大学信息管理系,北京,100871;北京大学信息管理系,北
京,100871;北京大学信息管理系,北京,100871
【正文语种】中文
【中图分类】TP391
因版权原因,仅展示原文概要,查看原文内容请购买。
搜索引擎的工作原理及应用一、搜索引擎的概念搜索引擎是一种用于查找互联网中特定信息的工具。
它通过在庞大的互联网上索引和检索网页,帮助用户快速找到他们需要的信息。
二、搜索引擎的工作原理搜索引擎的工作原理可以分为五个主要步骤:1. 网页抓取(Crawling)搜索引擎首先会使用爬虫程序(Spider)在互联网上抓取网页。
爬虫会从一个初始的URL(统一资源定位符)开始,然后按照网页上的链接逐步爬取更多的网页。
抓取的网页会被存储在搜索引擎的数据库中。
2. 网页索引(Indexing)搜索引擎会对抓取的网页进行索引,以方便后续的检索。
索引是一个类似于图书馆目录的数据库,它记录了每个网页的关键词、标题、摘要和链接等信息,以及网页的其他特征。
通过索引,搜索引擎可以快速地找到相关网页。
3. 查询解析(Query Parsing)当用户输入一个查询词(关键词)时,搜索引擎会对查询词进行解析和处理。
它会去除无关词(如“的”、“是”等),将查询词转化成合适的搜索语法,并根据用户的搜索历史或地理位置等信息进行个性化的推荐。
4. 检索与排序(Retrieval and Ranking)搜索引擎会根据索引中的关键词匹配算法检索出与查询词相关的网页。
它会考虑网页的关键词密度、标题和摘要的相关性,以及其他评估指标,为搜索结果排序。
搜索引擎一般会返回最相关和最高质量的网页作为搜索结果。
5. 结果展示(Result Display)最后,搜索引擎会将排序好的搜索结果呈现给用户。
通常会显示网页的标题、摘要和链接,以及其他与用户查询相关的信息,如图片和视频等。
三、搜索引擎的应用1. 网页搜索搜索引擎最常见的应用就是用于在互联网上搜索特定内容。
用户可以通过输入关键词快速找到相关的网页、新闻、博客、研究论文等。
2. 学术研究学术搜索引擎是专门用于查找学术论文、研究成果和学术资源的工具。
例如,Google学术可以搜索包含特定关键词的学术文章,并提供相关的引用和学术影响力评估。
搜索引擎分类摘要搜索引擎是一种能够帮助用户在互联网上定位和获取所需信息的工具。
随着互联网的迅速发展,搜索引擎也变得越来越多样化。
本文将介绍几种常见的搜索引擎分类,包括通用搜索引擎、垂直搜索引擎和元搜索引擎。
1. 通用搜索引擎通用搜索引擎是最常见的搜索引擎类型,它能够提供广泛的搜索服务,包括网页、图片、视频等多种内容。
通用搜索引擎致力于通过分析网页的内容和链接关系,为用户提供最相关的搜索结果。
目前,全球最大的通用搜索引擎是谷歌(Google),其他著名的通用搜索引擎还有百度、必应(Bing)等。
通用搜索引擎的工作原理通常包括三个主要步骤:抓取、索引和排名。
首先,搜索引擎会使用爬虫程序抓取互联网上的网页内容。
然后,对抓取到的网页进行索引构建,以便更快地检索和匹配用户的搜索关键词。
最后,对索引的网页进行排名,将最相关的搜索结果展示给用户。
虽然通用搜索引擎功能齐全,但是对于特定领域的搜索需求它的效果可能并不理想。
因此,针对特定领域的搜索需求,垂直搜索引擎应运而生。
2. 垂直搜索引擎垂直搜索引擎也称为专业搜索引擎,它专注于特定领域的信息检索。
相较于通用搜索引擎,垂直搜索引擎提供更加精确和专业化的搜索结果。
例如,知乎作为一个垂直搜索引擎,主要面向问题和答案的搜索需求。
而豆瓣则致力于提供电影、图书等娱乐领域的专业化搜索服务。
垂直搜索引擎的优势在于它能够更好地理解和满足特定领域用户的搜索需求。
通过针对特定领域的内容进行分析和聚合,垂直搜索引擎能够提供更加精准和有效的搜索结果。
此外,垂直搜索引擎通常提供更加丰富的专业化功能,如过滤器、排序选项等,以便用户更好地定位所需信息。
然而,垂直搜索引擎的局限性在于其覆盖范围相对较窄。
由于专注于特定领域,垂直搜索引擎往往无法提供其他领域的相关信息,因此对于跨领域搜索需求,用户可能需要同时使用多个垂直搜索引擎或通用搜索引擎。
3. 元搜索引擎元搜索引擎是将多个搜索引擎的结果进行整合和呈现的搜索工具。
元搜索引擎名词解释元搜索引擎名词解释:元搜索引擎,通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。
一个真正的元搜索引擎由三部分组成,即:检索请求提交机制、检索接口代理机制、检索结果显示机制。
"请求提交"负责实现用户"个性化"的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。
"接口代理"负责将用户的检索请求"翻译"成满足不同搜索引擎"本地化"要求的格式。
"结果显示"负责所有源搜索引擎检索结果的去重、合并、输出处理等元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。
使用元搜索引擎同时对几个搜索引擎进行检索,获得分级编排的检索结果。
元搜索引擎的原理我们可将元搜索引擎看成具有双层客户机/服务器结构的系统,用户向元搜索引擎发出检索请求。
元搜索引擎再根据该请求向多个搜索引擎发出实际检索请求;搜索引擎执行元搜索引擎检索请求后将检索结果以应答形式传送给元搜索引擎,元搜索引擎将从多个搜索引擎获得的检索结果经过整理再以应答形式传送给实际用户。
当然,某些元搜索引擎具有略微不同的机制。
元搜索引擎的分类在可以检索的目标搜索引擎、检索提问的处理方式以及如何编译和显示结果方面,元搜索引擎有着很大的差异。
有些元引擎一个接一个的搜索目标搜索引擎,另一些则同时进行搜索。
有些搜索引擎将检索提问转变成目标搜索引擎的提问语言,而有一些则原封不动的发送给目标引擎。
按功能划分,元搜索引擎包括多线索式搜索引擎和All-in-One式搜索引擎;按运行方式的差异可分为在线搜索引擎和桌面搜索引擎。
收稿日期:2002-09-06.作者简介:文坤梅(1978-),女,硕士研究生;武汉,华中科技大学计算机科学与技术学院(430074).基金项目:国家高性能计算基金资助项目(99319).元搜索引擎中检索结果排序的优化方法文坤梅 卢正鼎 邓 曦 陈 莉(华中科技大学计算机科学与技术学院)摘要:提出了一种新的基于概率模型的排序优化方法.利用贝叶斯规则,结合各组成系统平均执行性能的信息,推导出一种新的相关度计算公式,较好地解决了结果融合中相关度规范化和均衡化的问题.经实验验证,该方法对结果进行了最优化排序,其实际执行性能超出了现有的任何一个组成系统的性能.关 键 词:元搜索引擎;概率模型;结果优化排序;排序融合中图分类号:T P393.09;T P311.135 文献标识码:A 文章编号:1671-4512(2003)03-0049-03 在目前所存在的搜索引擎中[1],没有一个搜索引擎能够覆盖所有的WWW 资源,大部分的搜索引擎都只能涉及到整个资源的一小部分.并且各类搜索引擎的信息来源差异较大,因此集成多个搜索引擎而产生的元搜索引擎具有比传统引擎覆盖面大,引擎效果更好且具有可扩展性等优点.其中对各个组成系统所返回的搜索结果进行排序是提高元搜索引擎效率的关键技术.1 排序融合的关键技术每一个成员搜索引擎都有自己的排序检索结果算法[2],根据用户所给定查询的相关度来排序文件.然而,这些方法千差万别,通常每一个算法都是某一搜索引擎提供者所特有的,并且算法不公开,这就使得融合以及排序来自不同数据源的数据结果变得非常复杂.1.1 相关度的规范化每一个成员搜索都有各自的尺度来衡量文件的相关度.例如,数据源R 1判断文件f 1对某一查询其相关度为0.1,而数据源R 2判断文件f 2对某一查询其相关度为1000.如果想把来自R 1和R 2的结果融合成为单一的文件排序列表,那么f 1的相关度是高于或者低于f 2根本无法判断,因为不存在统一的标准.如何统一各个数据源的相关度,这就涉及到相关度的规范化问题.1.2 相关度的均衡化大多数搜索引擎的排序算法是不公开的,只有少数公开其算法.事实上,即使用同样的排序算法,在处理相关度问题时依然存在很大的困难.原因在于算法是基于不同的文件集合来排序文件.例如,R 1是专门研究计算机科学的数据源,那么词语“数据结构”可能会出现在很多文件中,于是“数据结构”这个词语在R 1中将会有很低的相关度.而与此同时,如果数据源R 2和计算机科学完全不相关,并且R 2中出现过这个词语的文件很少,那么“数据结构”在数据源R 2中可能会有很高的相关度.对包含“数据结构”这个词语的查询,R 1可能会赋予文件较低的相关度,而R 2则会赋予较高的相关度.在同一个查询中,两个非常相似的文件f 1和f 2,如果f 1在R 1中,而f 2在R 2中,却得到了不同的相关值.因此,即使数据源采用同样的排序算法,一个元搜索引擎仍然需要一些附加的信息用一种有效的办法来融合查询结果.最好的解决办法就是综合考虑各个成员搜索引擎所给出的相关度,从而消除各个数据源本身带来的偏差.2 检索结果排序的优化方法在响应一个给定查询时,为了组合多个查询检索系统[3]所得到的文件排序列表,更好地解决上述两个问题,提出了一种新的概率模型.2.1 一种元搜索引擎的概率模式假定在响应给定查询时,元搜索引擎已经得第31卷第3期 华 中 科 技 大 学 学 报(自然科学版) V ol .31 No .32003年 3月 J .Huazhong U niv .of Sci .&T ech .(Nature Science Edition ) M ar . 2003DOI :10.13245/j .hust .2003.03.017到了各个成员搜索引擎的文件排序列表.同时也获取了一些简单的统计信息,包括关于组成系统的平均执行性能信息.这些信息都是以元数据形式给出的.基于这些信息,提出了一种概率模型并推导出优化的元搜索引擎策略.其中元数据包括:对任何一个查询,每一个成员搜索引擎所对应文件的相关度和不相关度,且这些都是未规范化的初始值.给定n个检索系统返回的文件排序列表, r i(d)被检索系统i赋值为文件d的相关度(如果文件d没有被系统i检索,那么它的相关度就为∞).相关度是成员搜索引擎在评测文件d时提供给元搜索引擎的,评测建立在相关度规则之上[4].对给定的文件,假定:Q re=Q r[r1,r2,…,r n]re;Q ir=Q r[r1,r2,…,r n]ir,式中,Q re是给定的文件相关的概率值;Q ir是给定的文件不相关的概率值.给定序列r1,r2,…, r n,规定如果Q re>Q i r,那么文件是相关的,反之则不相关.可以先计算出相关度的几率:O re=Q re/Q ir然后根据这一价值尺度来排序.应用贝叶斯规则,得到: Q re=Q r[r1,r2,…,r n]re·Q r[re]/Q r[r1,r2,…,r n]; Q ir=Q r[r1,r2,…,r n]ir·Q r[ir]/Q r[r1,r2,…,r n].Q r[r1,r2,…,r n]这一项在实际中很难得到,以比率的形式估算,即 Q re=Q r[r1,r2,…,r n]re·Q r[re]/{Q r[r1,r2,…,r n]i r Q r[ir]},满足原始贝叶斯独立性假设,上式等同于 Q re=Q r[re]∏i Q r[r i|re]/Q r[ir]∏i Q r[r i|ir].最后,由于仅仅考虑排序文件,可对其取对数,得到相关度的计算公式∑ni=1log Q r[r i|re]/Q r[r i|ir],式中Q r[r i re]是文件被成员系统i排列到水平r i的相关概率值.同样,Q r[r i ir]是一个文件可能被成员系统i排到水平r i的不相关概率值.因此,对每一个成员搜索引擎,得到了文件的相关度,把所有成员搜索引擎的概率值比率的对数值相加,所得之和即为该文件的最终相关度.相关度与非相关度的比率消除了相关度的规范化问题,屏蔽掉了各个成员搜索引擎中具体的相关度;另外各个成员搜索引擎的比率值相加这一点又综合考虑了各个搜索引擎所起的作用,实现了相关度的均衡化,从而客观地反映了文件的真实相关度.2.2 方法评估与实验结果利用基于概率模型的优化方法进行了实验,以目前比较通用的6种搜索引擎作为成员引擎集成了元搜索引擎M ix,这五种成员搜索引擎分别是:新浪(sina)、网易(netease)、天网(pku)、雅虎(Yahoo)、搜狐(Sohu)以及Google(对应i=1,2,…,6).Mix在数据融合时采用了基于概率的检索结果优化排序方法,由于存在6个成员搜索引擎系统,因此i=6,对任意文件d,其相关度 ∑6i=1log{Q r[r i|re]/Q r[r i|ir]}=log{Q r[r1|re]/Q r[r1|ir]}+log Q r{[r2|re]/ Q r[r2|ir]}+log{Q r[r3|re]/Q r[r3|ir]}+ log{Q r[r4|re]/Q r[r4|ir]}+log{Q r[r5|re]/ Q r[r5|ir]}+log{Q r[r6|re]/Q r[r6|ir]}. 元搜索引擎Mix利用此相关度公式融合各个成员搜索引擎所返回的结果,不仅扩大了搜索的覆盖面,而且引擎效果更好,将用户真正想得到的信息赋予了较高的相关值.假设输入“肝炎”为关键字,经测试发现每个成员搜索引擎以及M ix系统都能响应查询,实验结果如表1所示,其中,c为搜索效率;t为搜索时间.表1 各个组成搜索引擎与元搜索引擎的效率比较搜索引擎总页数c/%t/sSina8264855.80.126网易7700052.00.162天网3170621.40.016Yahoo7700052.00.162Sohu8264855.80.126Goog le7700052.00.162M ix11856386.10.183 综上可见,由于采用了基于概率的检索结果排序方法,元搜索引擎的效率得以很大的提高,具体表现在搜索覆盖率的增大,同时响应时间并没有太大的变化,综合性能强于任何一个成员搜索引擎.此外,系统的强壮性也有很大的提高,当成员系统执行性能特别差时,元搜索引擎系统的执行性能也不会随之变得更差.50 华 中 科 技 大 学 学 报(自然科学版) 第31卷参考文献[1]张晓辉,邵 华,常桂然.WWW 上的信息发现与搜索引擎技术.小型微型计算机系统,1998,19(6):66~71[2]Arasu A ,Cho J ,Hector G M ,et .al .Searching theWeb .ACM T ransactions on Inter net T echnolo gy ,2001,1(1):2~43[3]王继成,邹 涛.基于Internet 的信息资源发现技术与实现.计算机研究与发展,1999,36(11):1369~1374[4]Law rence S ,Lee C .Contex t and pag e analysis for im -proved Web search .IEEE Internet Computing ,1998,2(4):38~46An optimal for ranking results of web search in metasearchWen Kunmei Lu Zhengding Deng X i Chen LiA bstract :The paper put forw ard a new optimal scheme based on a probability model .By using the Bayes rule and combining the informatio n of the average performance of the component sy stems ,a new relation deg ree formula was deduced and the problem s on relational degree standardization and equilibrium w ere solved .The ex periment results showed the new sy stem provided the optim al ranking .Key words :metasearch engine ;probability model ;results optimal ranking ;ranking and fusingW en Kunmei Postg raduate ;College of Computer Sci .&Tech .,Huahzong Univ .of Sci .&Tech .,Wuhan 430074,China .华中科技大学出版社书讯Ⅱ电气工程及自动化系列教材书 名 编(著)者定价/元电路理论—电阻性网络黄冠斌14.80电路理论—时域与频域分析杨传谱22.80电路理论—端口网络与均匀传输线陈崇源14.00电力系统分析(上)(第三版)(国家级优秀教材———国家九五重点教材)何仰赞22.00电力系统分析(下)(第三版)(国家级优秀教材———国家九五重点教材)何仰赞23.50电机学(国家级教学成果二等奖)辜承林32.00高电压技术文远芳18.80电力系统继电保护原理与应用(上)尹项根22.80电力开关技术王章启18.00电力工程基础熊信银25.0051第3期 文坤梅等:元搜索引擎中检索结果排序的优化方法 。
元搜索元搜索引擎又称多搜索引擎,通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。
(搜索引擎分类:全文搜索引擎、目录索引、元搜索引擎)元搜索引擎的另外一个定义:元搜索引擎(Metasearch Engine),是一种调用其它独立搜索引擎的引擎,亦称“搜索引擎之母(The mother of searce engines)”。
在这里,“元”(Meta)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。
相对元搜索引擎,可被利用的独立搜索引擎称为“源搜索引擎”(source Engine),或“搜索资源”(searcing resources),整合、调用、控制和优化利用源搜索引擎的技术,称为“元搜索技术”(Meta-searching technique),元搜索技术是元搜索引擎的核心。
世界上最早的元搜索是metacrawler,它是infospaceinc.的一部分,初始网上运行时间为 1995年,是由华盛顿大学的学生erik和教授oren etzin共同开发研制的。
它是万维网搜索引擎metacrawler 的姐妹引擎,是一个并行式的元搜索引擎。
具有同时调用Google、Yahoo、Ask Jeeves About、LookSmart、TeomaOverture、FindWhat 等搜索引擎的功能,然后按相关度给出精确,详细的结果。
它可以对网页、图像、音频、多媒体、新闻、购物等进行选择检索,还提供了如下高级检索功能:提高你检索的品质(Qualify Your Search):你可以创建一个特定的检索,查询一个精确的字段,或者排除包含特定词的页面。
使用布尔逻辑符检索(Use Boolean Terms):在关键词中使用and,or和not布尔逻辑检索符,使得检索结果更精确。
源搜索可定制的元搜索引擎设计技术
吴国文;乐嘉锦;陈国梁
【期刊名称】《计算机应用与软件》
【年(卷),期】2004(021)012
【摘要】本文介绍了一种源搜索引擎可以定制的元搜索引擎的实现技术,描述了系统的总体结构,并着重介绍了包装器与抽取器的格式与实现.通过包装器与抽取器实现源搜索引擎的定制,使系统集成的源搜索引擎的增加、更改、删除变得容易.【总页数】3页(P13-14,125)
【作者】吴国文;乐嘉锦;陈国梁
【作者单位】长江计算机(集团)公司研究院,上海,200040;东华大学计算机科学与工程系,上海,200051;长江计算机(集团)公司研究院,上海,200040
【正文语种】中文
【中图分类】TP393.4
【相关文献】
1.个性化移动元搜索引擎研究与设计 [J], 何震苇;邹若晨;钟伟彬;严丽云
2.搜索引擎技术的新发展——多元搜索引擎系统 [J], 黄于蓝;王洪;徐端颐;贾惠波
3.元搜索引擎并行式数据查询代理模块的设计与实现 [J], 白金平
4.基于专业搜索引擎的元搜索引擎的设计 [J], 张芳;肖国强
5.基于元搜索引擎的数字图书馆网络信息资源检索系统设计 [J], 王玉琼
因版权原因,仅展示原文概要,查看原文内容请购买。