检索工具分类
- 格式:doc
- 大小:42.00 KB
- 文档页数:5
检索工具包括哪些
检索工具共有以下四种:
1、目录型检索工具:
目录型检索工具是由信息管理专业人员在广泛搜集网络资源,并进行加工整理的基础上,按照某种主题分类体系编制的一种可供检索的等级结构式目录(如馆藏目录,联合目录,国家书目,出版社与书店目录)。
2、题录型检索工具:
题录型检索工具是以单篇文献为基本著录单位来描述文献外表特征(如文献题名、著者姓名、文献出处等),无内容摘要,是快速报道文献信息的一类检索工具。
3、文摘型检索工具:
文摘型检索工具是将大量分散的文献,选择重要的部分,以简炼的形式做成摘要,并按一定的方法组织排列起来的检索工具。
按照文摘的编写人,可分为著者文摘和非著者文摘(如知识型文摘,报导型文摘)。
4、索引型检索工具:
索引型检索工具是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元,如书名、刊名、人名、地名、语词等,按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。
检索工具的基本类型
检索工具的基本类型可以分为以下几类:
1. 搜索引擎:包括Google、百度、必应等,用户可以通过输
入关键词来获取相关的搜索结果。
2. 目录和分类索引:例如Yahoo目录、DMOZ等,它们会将
网站按照主题和类别进行分类,并提供目录结构来帮助用户浏览和搜索相关内容。
3. 元搜索引擎:例如Dogpile、MetaCrawler等,会同时调用多个搜索引擎的结果,并将它们合并在一起呈现给用户。
4. 学术搜索引擎:专门用于学术研究领域的搜索工具,例如Google学术、谷歌学术、PubMed等,提供学术论文、期刊和
学术资源的搜索与访问。
5. 图片搜索引擎:用户可以通过上传图片或输入关键词搜索相关的图片资源,例如Google图片搜索、百度图片搜索等。
6. 新闻搜索引擎:专门搜索新闻内容的工具,例如Google新闻、百度新闻等。
7. 社交媒体搜索工具:用于搜索和跟踪社交媒体平台上的内容,例如Twitter搜索、Facebook搜索等。
8. 专业领域搜索工具:适用于特定领域或行业的搜索工具,例
如医学数据库搜索、法律搜索引擎等。
这些基本类型的检索工具可以通过不同的搜索算法和技术来帮助用户快速准确地找到所需信息。
1.检索工具的分类(1)按照信息搜集方法分类按照信息搜集方法的不同,搜索引擎系统可以分为三大类:1)目录式搜索引擎(Directory Search Engine)以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。
信息大多面向网站,提供目录浏览服务和直接检索服务。
该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。
这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory.2)机器人搜索引擎(Crawler-Based Search Engine)由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。
服务方式是面向网页的全文检索服务。
该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。
这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google.3)元搜索引擎(Meta Search Engine)这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。
服务方式为面向网页的全文检索。
这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。
这类搜索引擎的代表是WebCrawler、InfoMarket.目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。
例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索"便搜索人工分类库,选择"网页搜索"便搜索机器人搜索引擎的索引库。
⼏种常⽤信息检索⼯具简介中国知⽹(CNKI)简介:是国家知识基础设施(National Knowledge Infrastructure,NKI),由于1998年提出。
是以实现全社会知识资源传播共享与增值利⽤为⽬标的信息化建设项⽬,由、发起,始建于1999年6⽉。
地位:采⽤并具有国际领先⽔平的技术,建成了世界上全⽂信息量规模最⼤的"",并正式启动建设《》及CNKI,通过产业化运作,为全社会知识资源⾼效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台。
提供以下检索服务:⽂献检索、数字检索、翻译助⼿、图形搜索维普科技期刊:简介:维普⽹,原名“维普资讯⽹”,是所建⽴的⽹站,该公司是中⽂期刊数据库建设事业的奠基⼈。
⽬前已经成为中国最⼤的综合⽂献数据库。
从1989年开始,⼀直致⼒于对海量的报刊数据进⾏科学严谨的研究、分析,采集、加⼯等深层次开发和推⼴应⽤。
地位:站陆续建⽴了与⾕歌学术搜索频道、百度⽂库、百度百科的战略合作关系。
⽹站⽬前遥遥领先数字出版⾏业发展⽔平,数次名列中国出版业⽹站百强,并在中国图书馆业、情报业⽹站排名中。
经过多年的商业运营,维普⽹已经成为全球著名的中⽂专业信息服务⽹站,以及中国最⼤的综合性⽂献服务⽹站。
检索服务:分类检索万⽅数据库:简介:万⽅数据库是由万⽅数据公司开发的,涵盖期刊、、论⽂、学术成果、学术会议论⽂的⼤型地位:和齐名的中国专业的学术数据库。
其开发公司——万⽅数据股份有限公司是国内第⼀家以信息服务为核⼼的股份制⾼新技术企业,是在互联⽹领域,集信息资源产品、信息增值服务和信息处理⽅案为⼀体的综合信息服务商。
检索服务:浏览格式检索、专项信息检索、⾃由检索X-MOL化学资讯平台:简介:由北京衮雪科技有限公司创办,对化学⼯作者免费开放。
衮雪科技创⽴于2006年,⽬前拥有⼀个近百⼈的团队,团队80%以上成员拥有化学、⽣物学、药学等领域的硕⼠或博⼠学位。
三大检索工具(SCI、ISTP、Ei)收录检索技巧及核心期刊投稿导引一、绪论1.三大检索工具简介科技部下属的"中国科学技术信息研究所"从1987年起,每年以国外四大检索工具SCI、ISTP、Ei、ISR为数据源进行学术排行。
由于ISR(《科学评论索引》)收录的论文与SCI有较多重复,且收录我国的论文偏少;因此,自1993年起,不再把ISR作为论文的统计源。
而其中的SCI、ISTP、Ei数据库就是图书情报界常说的国外三大检索工具。
SCI,即《科学引文索引》,是自然科学领域基础理论学科方面的重要的期刊文摘索引数据库。
它创建于1961年,创始人为美国科学情报研究所所长Eugene Garfield(1925.9.15)。
利用它,可以检索数学、物理学、化学、天文学、生物学、医学、农业科学以及计算机科学、材料科学等学科方面自1945年以来(我馆购买了1994年至今的数据使用权)重要的学术成果信息;SCI还被国内外学术界当做制定学科发展规划和进行学术排名的重要依据。
ISTP,即《科学技术会议录索引》,创刊于1978年,由美国科学情报研究所编制,主要收录国际上著名的科技会议文献。
它所收录的数据包括农业、环境科学、生物化学、分子生物学、生物技术、医学、工程、计算机科学、化学、物理学等学科。
从1990-2003年间,ISTP和ISSHP(后文将要讲到ISSHP)共收录了60,000个会议的近300万篇论文的信息。
Ei,即《工程索引》,创刊于1884年,由Elsevier Engineering Information Inc.编辑出版。
主要收录工程技术领域的论文(主要为科技期刊和会议录论文),数据覆盖了核技术、生物工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等学科领域。
2.与三大检索工具相关的其它数据库介绍SSCI,即《社会科学引文索引》,创刊于1969年,收录数据从1956年至今;是社会科学领域重要的期刊文摘索引数据库。
三大著名检索工具索引介绍:1. SCI:科学引文索引(Science Citation Index)美国科技信息研究所(ISI--Institute for Scientific Information)挑选了3300 种核心期刊,为其编制索引并收入 SCI。
SCI 所涵盖的学科超过 100个,主要涉及以下领域:农业、生物及环境科学;工程技术及应用科学;医学与生命科学;物理学及化学;行为科学。
所收资料每年以60万条新记录及 900 万条以上引文参照的速度增长。
2. EI:工程索引(Engineering Index)是工程技术领域的综合性检索工具,由美国工程信息中心编辑出版,它囊括世界范围内工程的各个分支学科,如:土木工程、能源、环境、地理和生物工程;电气、电子和控制工程;化学、矿业、金属和燃料工程;机械、自动化、核能和航空工程;计算机、人工智能和工业机器人。
3. ISTP:国际会议录索引(Index to Scientific & Technical Proceedings)ISTP201 0年已为CPCIC-S[Conference Proceedings Citation Index - Science]是由ISI公司出版的重要数据库之一,它专门收录世界各种重要的自然科学及技术方面的会议,包括一般性会议、座谈会、研究会、讨论会、发表会等的会议文献,所收会议达1100多种,涉及学科基本与SCI相同。
与三大检索工具相关的其它数据库:1. SSCI:社会科学引文索引(Social Science Citation Index)收录全球1400 种主要的社会科学期刊论文,共涉及 50 种学科领域,具体包括社会科学及行为科学、人类学、考古学、商业、财政、经济、教育、地理历史、图书馆学与情报学、法律、语言、政治、行销、统计、都市发展等。
每年平增加1 2.5 万条记录,它除了能检索文章被引用的情况外,同时还可以揭示原文中所有的考文献,并据此获得一批相关文献。
列出三种文献检索工具类型和五种参考工具书类型文献检索工具是研究者和学生在进行科学研究和学术写作过程中常用的工具。
它们可用于搜索和查找相关的学术文献和信息资源。
下面将介绍三种常见的文献检索工具类型。
1.图书馆数据库:图书馆数据库是大学图书馆或专业图书馆提供的在线搜索平台,用于查找图书、期刊、报纸、学位论文、技术报告等各类文献资源。
常见的图书馆数据库包括ProQuest、JSTOR、ScienceDirect、PubMed等。
这些数据库覆盖了广泛的学科领域,并提供高质量的学术资源。
用户可以通过关键词搜索、作者搜索、主题搜索等方式,快速定位到所需的学术文献。
2.学术搜索引擎:学术搜索引擎是专门为学术研究者提供的搜索工具,可以搜索全文、期刊文章以及其他学术资源。
学术搜索引擎通过爬取各类学术网站和数据库的内容,构建自己的索引库,用户可以通过输入关键词来进行检索。
常见的学术搜索引擎包括Google学术、Microsoft学术、百度学术等。
它们提供了强大的搜索功能,并且还能够显示文献的被引次数、相关文章、作者信息等,帮助用户更好地了解和使用文献资源。
3.学科专业数据库:学科专业数据库是为特定学科领域而设计的文献检索工具,其收录了该领域的核心期刊、会议论文、专利、技术报告等资源。
学科专业数据库能够提供更加精确和全面的文献搜索结果,帮助研究者深入探索学科前沿。
例如,化学领域的专业数据库有美国化学会(ACS)数据库、维普化学数据库;生物学领域的专业数据库有生物学文摘数据库(BIOSIS Previews)、基因检索数据库(GenBank)等。
参考工具书是指在研究和学习过程中用于查找信息和解决问题的工具书籍。
下面将介绍五种常见的参考工具书类型。
1.百科全书:百科全书是一种系统、全面地收录和阐述知识的工具书,它涵盖了各种学科专业和常识性的知识。
百科全书一般按字母顺序排列内容,并提供详细的解释和相关的辅助资料。
常见的百科全书有《中国大百科全书》、《世界大百科全书》等。
常用检索工具1.检索工具的分类(1)按照信息搜集方法分类按照信息搜集方法的不同,搜索引擎系统可以分为三大类:1)目录式搜索引擎(Directory Search Engine)以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。
信息大多面向网站,提供目录浏览服务和直接检索服务。
该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。
这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory。
2)机器人搜索引擎(Crawler-Based Search Engine)由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。
服务方式是面向网页的全文检索服务。
该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。
这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google。
3)元搜索引擎(Meta Search Engine)这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。
服务方式为面向网页的全文检索。
这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。
这类搜索引擎的代表是WebCrawler、InfoMarket。
目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。
例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索"便搜索人工分类库,选择"网页搜索"便搜索机器人搜索引擎的索引库。
检索工具的含义及类型
检索工具是指一类能够帮助用户快速找到所需信息的工具。
其主要作用是通过对信息进行索引或分类,使得用户可以在海量信息中快速定位到自己所需的内容。
根据其功能和用途,检索工具可以分为以下几种类型:
1. 搜索引擎:搜索引擎是一种通过关键词匹配来寻找网页的工具。
现代搜索引擎不仅可以搜索文本内容,还可以搜索图片、视频、新闻等类型的信息。
2. 数据库检索工具:数据库检索工具是一种可以帮助用户在数据库中查找信息的工具。
它可以根据用户的检索条件,搜索出符合条件的数据,并按照一定的方式进行排列。
3. 全文检索工具:全文检索工具是一种可以对大量文本进行全面搜索的工具。
它可以对包含关键词的文本进行分析,找出与关键词相关的信息,并在搜索结果中进行高亮显示。
4. 元搜索工具:元搜索工具是一种可以同时搜索多个搜索引擎的工具。
它可以将多个搜索引擎的搜索结果集成在一起,为用户提供更全面的搜索结果。
总之,检索工具是现代信息时代的必备工具,不同类型的检索工具具有不同的特点和优势,用户应该根据自己的需求选择适合自己的工具。
- 1 -。
常用的信息检索工具随着互联网的发展,信息爆炸式增长,如何快速、准确地获取所需信息成为了人们关注的焦点。
信息检索工具应运而生,它们可以帮助我们在海量的信息中快速找到所需的内容。
本文将介绍几种常用的信息检索工具。
1. 百度百度是国内最大的搜索引擎,拥有海量的网页、图片、视频等资源。
用户可以通过输入关键词来搜索相关内容,百度会根据关键词的相关度和网页的权重等因素进行排序,将最相关的结果展示在前面。
此外,百度还提供了知道、文库、贴吧等多个子产品,用户可以在这些平台上获取更加专业、深入的信息。
2. 谷歌谷歌是全球最大的搜索引擎,其搜索算法被认为是最为先进的。
谷歌的搜索结果不仅包括网页、图片、视频等资源,还可以搜索新闻、地图、学术论文等内容。
此外,谷歌还提供了Gmail、Google Drive、Google Translate等多个产品,用户可以在这些平台上进行邮件、文档、翻译等操作。
3. 必应必应是微软公司推出的搜索引擎,其搜索结果包括网页、图片、视频、新闻等内容。
必应的搜索结果页面设计简洁、美观,用户可以通过滑动鼠标滚轮来查看更多的搜索结果。
此外,必应还提供了必应翻译、必应地图等多个产品,用户可以在这些平台上进行翻译、地图导航等操作。
4. 搜狗搜狗是国内知名的搜索引擎,其搜索结果包括网页、图片、视频、新闻等内容。
搜狗的搜索结果页面设计简洁、清晰,用户可以通过左侧的分类标签来快速筛选所需的内容。
此外,搜狗还提供了搜狗输入法、搜狗浏览器等多个产品,用户可以在这些平台上进行输入、浏览等操作。
5. 360搜索360搜索是国内知名的搜索引擎,其搜索结果包括网页、图片、视频、新闻等内容。
360搜索的搜索结果页面设计简洁、美观,用户可以通过左侧的分类标签来快速筛选所需的内容。
此外,360搜索还提供了360安全浏览器、360杀毒软件等多个产品,用户可以在这些平台上进行浏览、杀毒等操作。
总结以上是几种常用的信息检索工具,它们都有各自的特点和优势。
档案检索工具一、档案检索工具的划分档案检索工具是以一定的形式揭示和介绍馆室藏,积累档案线索和查询档案材料的手段,进行档案管理和提供利用的工具;1按检索手段手工检索工具和机读检索工具;手工检索工具:以人工查检的各种目录、指南、索引等;有卡片式和书本式;机读检索工具:是借助计算机等手段形成和使用的检索工具,如机读目录、缩微目录等;2按功能查检性检索工具、介绍性检索工具和馆室藏性检索工具;查找性检索工具:为查找检索档案而编制的;有分类目录、专题目录、主题目录等;介绍性检索工具:亦称工具书;有全宗指南、档案馆指南等;馆室藏性检索工具:反映馆室藏档案分类整理、排列体系,为管理馆室藏档案而编制的检索工具;有全宗目录、案卷目录等;3按使用对象公务检索工具和开放检索工具;公务检索工具:为满足内部工作人员因档案管理和开展利用的需要而编制的各种目录和索引;有案卷目录、文件目录等;开放检索工具:为配合档案开放的需要而编制的检索工具;有开放档案目录、档案馆指南、全宗指南等;二、常用档案检索工具1全宗目录又称全宗名册,是介绍档案馆室所藏全部全宗简明情况的一种检索工具;目录项目内容:全宗号、全宗名称、全宗内案卷数量、起止年度等;2案卷目录是以案卷为单位,依据档案整理顺序排列组织起来,揭示和介绍一个全宗或某一部分档案内容和成分的一种检索工具;目录项目内容:案卷号分档案室编、档案馆编、案卷题名、年度、页数、保管期限、备注;3卷内文件目录是把某一案卷卷内文件依整理顺序排列组织起来,揭示和介绍一个案卷内文件内容和成分的一种检索工具;目录项目内容:顺序号、文号、责任者、文件题名、文件日期、页号、备注;把案卷目录和卷内文件目录结合起来,称为全引目录;4归档文件目录是依据归档文件分类方案和室编件号顺序排列组织起来,揭示一个分类方案内文件内容和成分的一种检索工具;目录项目内容:件号、责任者、文号、文件题名、日期、页数、备注;5专题目录专题目录是集中、系统地揭示某一专题档案的内容和成分的检索工具;其他检索工具还有分类目录、主题目录、人名目录、文号目录等;。
1.检索工具的分类(1)按照信息搜集方法分类按照信息搜集方法的不同,搜索引擎系统可以分为三大类:1)目录式搜索引擎(Directory Search Engine)以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。
信息大多面向网站,提供目录浏览服务和直接检索服务。
该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。
这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory。
2)机器人搜索引擎(Crawler-Based Search Engine)由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。
服务方式是面向网页的全文检索服务。
该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。
这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google。
3)元搜索引擎(Meta Search Engine)这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。
服务方式为面向网页的全文检索。
这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。
这类搜索引擎的代表是WebCrawler、InfoMarket。
目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。
例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索”便搜索人工分类库,选择”网页搜索”便搜索机器人搜索引擎的索引库。
一些传统的机器人搜索引擎也增加了人工分类的内容,以提供高精度的导航信息。
另外搜索引擎站点有”门户化”的倾向,在提供搜索服务的同时,提供多样的网络服务,如新闻、股票、天气预报、虚拟社区、游戏、电子商务等等,成为名副其实的”网络门户”。
(2)按照检索软件分类按照服务提供方式的不同,检索软件也可以分为三大类:全文数据库检索软件、非全文数据库检索软件、主题指南类检索软件。
全文数据库检索软件正常运作的前提是网站拥有大量的信息,因此必须依靠强大的数据库作为后盾。
它能够提供完整的文献和信息检索,查全率很高。
但由于信息量非常大,检索起来比较困难,对检索技术的要求很高。
非全文数据库检索软件具有速度快、使用简便、索引量大的特点,但仅提供部分全文检索,有时需要二次检索,感到不太方便。
主题指南类检索软件是目前网络检索中最常用的检索软件。
这种软件查准率高、速度快、使用方便。
现大部分网站都具备主题指南类检索功能。
(3)按照检索语言分类目前,因特网几乎使用了世界所有语言。
每一种语言都形成了自己独特的检索体系。
比较常用的语言有英文、法文、德文、日文、俄文、中文等。
2.全文数据库的检索软件(1)Alta Vista 检索引擎Alta Vista检索引擎为数字设备公司(DEC)开发,号称是目前最大的Web索引数据库。
Alta Vista检索引擎提供两种检索方法:简单检索和高级检索。
高级检索包括了简单检索的所有特性,还允许使用布尔运算符和接近操作符、括号等,查找的结果按关键词排序。
Alta Vista总能返回有用的信息,但由于没有对内容进行选择,它的”信噪比”也是最大的。
使用Alta Vista检索引擎时应注意:要进行有效的检索,最好尽可能多而精确地输入描述所感兴趣的主题的词或词组。
提供的词组越精确,检索结果就越好。
如果你输入的词包含大写字母,则检索对大小写就比较敏感。
如输入Telephone 则只检索含有这个词的内容,而输入telephone 则不论大小写都检索。
如果要把一些词作为词组或一个整体来查询时,最好把它们加上双引号。
如果要求特定单词包含在索引的文档中,可以在它前面加一个”+”号,如:+Telephone,并且在”+”号和单词之间不能有空格。
相应的,如果要排除含有特定单词的文档,可以在它前面加一个”-”号,如-cool。
进行简单查找的时候,可以在单词的末尾加一个通配符来代替任意的字母组合(最多可代替5个小写的字母)。
Alta Vista的通配符是”*”号,星号不能用在单词的开始或中间。
Alta Vista高级检索包含了简单检索的所有特性,还可以有布尔和接近操作符、括起来的逻辑组合等。
Alta Vista支持的布尔和接近检索二元操作符有AND(&)、OR(|)、NEAR(~)和一元操作符NOT(!)。
AND连接的若干词在文件中要同时出现;OR 确保检索式中至少有一个词出现在文件中;NOT 将某一个词从检索中排除出去。
它们的优先级是递减的,另外要注意,如果把检索的表达式写成sports NOT swimming,则语法上是不合逻辑的,正确的写法应该是sports AND NOT swimming。
NEAR 确保查询的两个词在10个字节内出现,它的优先级是最低的。
如果将上述符号用在检索表达式中,最好给检索表达式加上引号以减少检索表达式的混乱。
Alta Vista的优点是:在所有的检索软件中,它的功能最全面,查全率和查准率最高,全文标引系统质量可靠;在检索语句上与传统的联机检索语言类似,更容易掌握;系统反应速度快;网页链接可靠。
缺点是文件相关性评估的质量一般。
Excite检索引擎有基本检索和高级检索两种检索方式。
其中,Excite中要求的单词和排除的单词的使用方法同Alta Vista一样,使用”+”号和”-”号。
Excite支持二元操作符AND、OR、AND NOT 和一元操作符NOT。
它也支持用括号来构成逻辑组。
缺省的关键词使用的是隐式的OR ,即它检索含有指定的任意的单词。
Excite的优点是采用了概念检索的技术。
概念检索是指在检索文件的过程中,不仅能够检索到含有用户提出的关键词的文件,还能检索到与用户的检索主题密切相关、但并没有包括这些主题词的文件。
在所有的检索软件中,它的更新速度最快,且其数据库的规模也最大。
另外,它在提供相关信息方面表现颇佳。
Excite的缺点是它的相关性排序质量一般,检索结果也显得不尽人意。
随着世界华人对因特网商业价值的认同,越来越多的华人开始利用因特网传递商业信息,中文网站内容也不断丰富。
面对巨大的市场利益的诱惑,出现了越来越多的中文检索工具,一些原来的英文搜索网站也纷纷推出自己的中文网站。
(3)非全文数据库的检索软件Lycos 是最早出现的检索引擎之一,它是以巡视软件为主的非全文数据库检索工具,由美国卡内基梅隆大学的机器翻译中心开发研制。
它利用巡视软件自动搜集网页,对其进行分类,并建立数据库,提供关键词和主题查询(主题查询叫做目录服务)的检索服务。
用Lycos查询带符号或数字的词时,最好使用说明性的语言,如用”programming languages C++”,而不要用”C++”;用”convenience stores 7~11″,而不要用”7~11″。
Lycos用”+”表示所选择的是与某一主题高度相关的文件,如用”telecommunication+TV”选择远程通信中与电视密切相关的文件;排除不必要的文件用”-”,如用”telecommunication-radio”选择远程通信不包括无线电。
Lycos用”. “表示准确匹配该词;用”$”表示自动截词符号,查询以该词为词根的所有文件。
Lycos的优点在于它的速度快、使用简便、索引量大,它的弱点则是它不支持布尔检索和其他如Alta Vista或Excite 能提供的一些高级检索。
(2)Excite检索引擎Excite检索引擎是Architext软件公司的产品,该数据库界面友好,用户可以利用关键词、词组和自然语言检索,自然语言检索越详细越好。
3.主题指南类检索软件(1)Infoseek 检索系统Infoseek 以前曾经是Netscape的缺省检索引擎。
1995年由Infoseek公司开发,它是第一个提供有偿服务的网络信息检索系统。
Infoseek具备高级检索的功能。
与其他检索系统不同,它不提供布尔逻辑式检索,而是使用特殊的符号。
如果检索词是一组短语,而文件中也出现了这一短语,那么检索软件会认为这一文件的相关性评分最高。
如果短语中有3个关键词,那么第一次检索并不把它作为词组对待;如果重复检索,则将这3个关键词作为词组对待。
使用Infoseek 查询时,姓名和专有名词要大写,如Steve Jobs、December、Star Wars等;在姓和名之间要用逗号”,” ,如Clinton, Chelsea;用双引号”" “”来查找连在一起的词,但不能用单引号;用连接号”-”检索两个连在一起的词,如Cable-networks,用”-” 连接的两个词表明这两个词必须同时出现;用”[]“检索在100词之内出现这两个词的文件,如[Web search];用”()”来检索彼此靠近、但可以任何顺序排列的词;要求或排除操作符与Alta Vista相同;”+”号和”-”号的用法也与Alta Vista相同。
Infoseek检索对大小写敏感,大写的单词被当成正确的名词来查找,相邻的大写单词被认为是一个词组。
大写词组须用逗号分开,如:The Great Bambino,Baseball Hall Of Fame。
Infoseek检索的优点在于它的速度快和使用方便。
它既是检索引擎,又是可检索的主题目录,可以检索UseNet NewsGroups、E-mail地址和Web的FAQ。
由于软件排除数据库中重复的URL,每一个URL只标引一次,因此在Infoseek上检索到的重复文件相对比较少,它特别适合缺乏检索经验和训练的用户。
它的缺点在于数据库规模小,数据库综合性不强,而且缺乏高级功能,不支持布尔检索。
(2)Yahoo!(Yet Another Hierarchically Officious Oracle)Yahoo!不是搜索引擎,而是严格的层次组织的主题索引。
它已经开发了很长时间,有很多编辑人员来维护,所以质量非常高。
当不知该去哪里的时候,在Yahoo!上浏览是找到好站点的最好方法。
它也是找到好的”初学者”站点的最好方法,从那里可以连到更专门的站点上。
为了方便中国客户,目前,Yahoo!网站新开设了中文版本(包括简体和繁体版本)。