联机信息检索
- 格式:docx
- 大小:19.50 KB
- 文档页数:6
联机检索名词解释联机检索是指用户通过终端设备,使用计算机和计算机网络技术,与存储有大量数据和信息的大型计算机数据库进行交互,获取和查询数据库中相关信息的过程。
它是一种现代化的信息检索方式,也是计算机网络技术的一个重要应用领域。
随着计算机网络技术的飞速发展,联机检索已经成为人们获取信息的重要途径。
与传统的信息检索方式相比,联机检索具有许多优点。
首先,它打破了传统信息检索方式在时间和空间上的限制,用户可以在任何时间、任何地点进行信息检索。
其次,联机检索提供了丰富的数据资源和多样化的检索方式,用户可以根据自己的需求选择不同的数据源和检索方式进行查询。
此外,联机检索还具有高效、快捷、准确等优点,可以快速地获取到所需的信息。
联机检索系统的基本组成包括数据源、通信网络、终端设备和用户等。
其中数据源是联机检索系统的核心,它存储了大量的数据和信息,包括各种类型的数据库、数据仓库等。
通信网络是联机检索系统的重要组成部分,它负责将终端设备与数据源连接起来,实现数据的传输和通信。
终端设备是用户与联机检索系统进行交互的工具,用户通过终端设备向系统发出检索请求,系统将检索结果返回给用户。
用户是联机检索系统的服务对象,也是信息的获取者。
在联机检索系统中,数据源的选择和建设是至关重要的。
数据源的质量和数量直接影响到联机检索系统的性能和效果。
为了满足用户多样化的需求,数据源需要不断更新和扩充,同时还需要加强数据的加工和处理,提高数据的质量和可用性。
除了数据源的建设外,联机检索系统的性能还受到通信网络的影响。
通信网络需要具备高效、稳定、可靠等特性,以保证数据的传输速度和通信质量。
同时,还需要加强网络安全防护,保障数据的安全性和保密性。
为了更好地为用户提供服务,联机检索系统还需要具备友好的用户界面和丰富的检索功能。
用户界面需要简洁、易用、友好,使用户能够快速上手并熟练使用。
检索功能需要多样化、智能化,使用户能够根据不同的需求选择合适的检索方式进行查询。
四、简答1. 简述信息组织、存储与检索的关系。
答:信息组织、存储与检索三者是不可分割的。
信息检索是通过信息存取系统(即检索工具)来实现的,任何一种信息存取系统都包括信息存储子系统和信息检索子系统,它们是同一事物中既相互对立又相互联系、互为依存的两个方面,而信息存取系统的建设,需要信息组织。
信息组织在信息资源开发中具有重要的地位,在信息管理中具有承上启下的作用,它是建立信息系统的重要条件,是信息存储与检索的基础。
所以,三者是不可分割的。
2. 简述信息存储的含义及作用。
答:信息存储是指通过多种形式记录和排序信息的过程。
它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和内容性质组织成系统有序的、可供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。
存储子系统的建设,要求根据一定的原则记录和描述信息或知识载体的内容与形式特征,然后按特征序化成各类信息集合并组织成系统。
信息存储部分是揭示信息特征、整序信息、建设系统的过程。
只有经过记录、描述与组织序化的知识集合,才能提供有效的信息检索。
因此,信息存储是基础,信息检索是目的。
3.文献的概念及分类4.什么是文献类型标识符,在什么情况下使用如何使用答:文献类型标识符:标识各种文献类型的符号。
使用范围:仅在含有各种文献类型的目录及其他检索工具中使用。
使用方法:著录在正题名后面,并用中括号“[ ]”括起来。
5.目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。
它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。
6.信息检索语言7.追溯法:8.文献信息资源9.信息的概念是什么信息有哪些特征10.影响查全率和查准率的因素有哪些11试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以及混合分类语言。
一.名词解释1.信息检索:广义来说,指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程,包括“存”和“取”两个基本环节;狭义理解,一般只涉及“取”,信息检索也可称为“信息查询”或“信息查找”。
2.联机信息检索:指用户利用检索系统网络的终端设备,通过通信线路,运用一些特定的指令和检索策略与世界上的信息检索系统,进行质检的人机对话,从检索系统的数据库中查找出用户所需要的特定信息,并将检索结果与过程下载,显示和打印出来的过程。
3.CBR:基于内容的检索,指根据多媒体对象的听、视觉特征及其中蕴含的内容和语义特征进行检索,并希望能够借助于模式识别、语音识别、图像理解等相关领域的研究成果,对多媒体数据的听、视觉特征和语义特征进行自动(半自动)的分析、表达和组织。
4.网络信息源:指所有以电子数据的形式把文字、图像、声音、动画等多种形式的信息存贮在光、磁等非纸质介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。
5.搜索引擎:搜索引擎有广义与狭义之分。
广义的搜索引擎泛指网络上提供信息检索服务的攻击或系统。
狭义的搜索引擎主要是指利用网络自动搜索软件对INTERNET(主要是WEB)网络资源进行收集、组织并提供检索服务的一类信息服务系统。
6.URL:统一资源定位符(Uniform Resource Locator,缩写为URL)是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。
互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
7. 顺排/倒排文档:文档的概念是指数据库内容的组织形式。
一般地说,一个数据库至少包括一个顺排文档和一个倒排文档。
(1)顺排档,也称为主文档、引文文档,它是按记录存取号的大小顺序排列记录而成的文档。
文档越是新,记录存入文档的时间越是晚,记录的存取号就越大。
(2)倒排挡,是指把数据库中记录的一切可检字段或属性值(称检索标识,如著者,主题词等,不包括存取号)抽出,按某种顺序(字母或数字顺序)重新加以组织后得到的特征标识文档。
目前世界著名的五大联机检索系统DIALOG:目前世界上最大的国际联机检索信息系统。
总部设在美国旧金山附近的帕洛阿尔托市。
此系统现有近600个数据库,信息总量超过5亿条,其中包括50多种语言、6万多种期刊,数据库内容涉及综合性学科、自然科学、应用科学和社会科学等,文献类型有图书、报纸、期刊、学位论文、会议记录、研究报告、政府文件、专利文献、标准文献、年鉴、市场行情和厂商名录等。
ORBIT:ORBIT的全称为online retrieval of bibliographic information timeshared即文献目录信息分时联机检索。
是第二大国际联机检索系统,拥有200多个数据库。
以化工、石油、生物、化学、环境科学、医学、运动科学和安全科学等深入文献比较齐全而著称。
其特色数据库有SAE(汽车、飞机等交通工具)TULSA(石油、天然气开采与勘探)等30多个数据库,为该系统独有。
ESA/IRS:是欧洲最大的联机检索中心。
也是世界上大型的国际联机检索系统之一,仅次于美国的DIALOG和ORBIT联机检索系统。
涉及的专业范围有:科技、农业、卫生、管理、社会科学和宇航工程及技术等方面。
有120多个数据库,其中,酸雨(ACIDRAIN)、铸造(BIIPAM-CTIF)、原材料价格(PRICEDA TA)、卫星遥感图像(LEDA)、宇航及高技术软件(SPACESOFT)等为特色数据库。
STN:STN(The Scientific and Technical Information Network International)是国际科学技术信息网络系统的简称。
是由德国卡尔斯鲁厄能源、物理、数学专业信息中心(FIT)、美国化学文摘社(CAS)和日本国际化学信息协会(JAICI)三家合作经营的国际联机检索系统。
涉及的专业范围:化学、化工、生物、医学、数学、物理、能源、冶金、建筑等方面。
其特色数据库有:CAS化学物质结构图形数据库(REGISTRY)、德国专利数据库(PATDPA)、碳13核磁共振和红外光谱数值图形数据库(C13-NMR/IR)。
146文献信息主要包括:专著、报纸、期刊、会议录、汇编、学位论文、科技报告、技术标准、专利文献、产品样本、中译本、手稿、参考工具、检索工具、档案、图表、古籍、乐谱、缩放胶卷等。
计算机信息资源以数字的方式将图形、文字、声音、影像等信息存储在光电介质上,通过计算机或具有类似功能的设备阅读。
目前,计算机信息资源主要以文档(Document)或数据库(DataBase)等数字方式存储在计算机中。
4.8.1 光盘数据库检索系统光盘数据库通常是指CD-ROM数据库。
CD-ROM光盘具有存储能力强、介质成本低、数据可靠、便于携带等特点。
光盘配合计算机和相应的软件构成了光盘检索系统。
国内外著名的光盘数据库有以下3种。
1.科学引文索引和社会科学引文索引美国《科学引文索引》(Science Citation Index,SCI)是由美国科学情报社(Institute for Scientific Information,ISI,网址为)出版的世界著名的综合性检索期刊。
SCI收录了全世界出版的数、理、化等自然科学各学科的核心期刊(SCI的光盘版和印刷版)约3 500种和扩展版期刊(Web版,SCI-Expanded)5 947种。
ISI通过其严格的选刊标准和评估程序挑选刊源,而且每年略有增减,从而做到收录的文献能全面覆盖世界最重要和最有影响力的研究成果。
社会科学引文索引(Social Science Citation Index,SSCI)是美国科学情报社(ISI)著名的三大引文索引(SCI、SSCI和A&HCI)之一,它收录了全世界1 700多种著名的社会科学期刊。
2.EI(/)美国工程索引光盘数据库(Engineering Index Compendex Plus,EI),即Compendex数据库,是印刷本《The Engineering Index》的光盘版。
该光盘收录了自1970年以来的工程索引信息,囊括世界范围内有关工程的各个分支学科,专业覆盖应用物理、光学技术、航空航天、计算机等领域,收录的每篇文献都包括文献著录信息和文摘等信息。
联机信息检索一、联机信息检索概述联机信息检索起源于20世纪60年代,由美国最先发起并且逐渐形成了覆盖全球的信息检索系统,如DIALOG、OCLC等。
我国从20世纪80年代开始从事国际联机检索服务,现在已经建立了自己的联机检索系统。
(一)联机信息检索的定义与特点1、联机信息检索的定义联机信息检索是指用户利用计算机终端设备,通过通信网络与分布在世界各地的信息检索系统联机,以人——机对话方式,运用特定的检索指令与策略,访问检索系统的数据库,查找所需信息的过程。
这种检索方式是实时(real—time)、在线(online)进行的,用户提问一旦传到检索系统主机被接收后,计算机便立刻执行检索运算,并很快将检索结果传送到用户终端,用户可反复修改检索式,直至获得满意的检索结果。
2、联机信息检索的特点由于联机信息检索不仅实现了信息资源的集中管理和共享,而且打破了信息检索的地域和时间限制,因而与手工检索或者其他形式的计算机信息检索相比,它在检索方面具有独特的优势,具体表现在以下几个方面:(1)检索内容丰富联机信息检索系统有丰富的信息资源,世界上公开出版发行文献的90%都可以通过几种主要的联机信息检索系统查到。
如DIALOG、OCLC等,这些系统中存有数百个数据库,拥有上亿条文献记录,内容涉及各个领域,能满足不同学科检索的要求。
(2)检索效率高利用联机检索系统可以同步查询多个数据库,3—5分钟内即可完成一个或多个检索课题。
而且用户可以在检索过程中随时根据需要调整修改检索策略,从而保证了检索的快速性以及检索结果的查全率和查准率。
(3)检索内容新颖为了满足用户对信息及时性的要求,联机检索系统一般都是由专业人士负责管理,数据库中的信息定期更新,而且更新周期日益加快,尤其是一些时效性强信息的更新速度更快,有的随时都在更新。
如DIALOG系统的工程索引每周更新,报纸类数据库每天更新,商情数据库有的每天更新,有的随时都在更新。
(4)检索系统安全、可靠联机信息检索系统多数采用集中式管理,有专人负责对系统更新与维护,对数据库中的信息进行细致、严格、有序的组织与管理,同时滤去了许多无用信息,确保了信息的可靠性和系统的安全性。
(二)联机信息检索系统的组成一个联机检索系统由联机中心、通信网络、用户检索终端三大部分组成。
1、联机中心。
联机检索中心是联机信息检索系统的中枢部分,由中央主机、数据库、数据库管理与检索软件以及相应的检索服务体制组成。
(1)中央主机中央主机是整个联机检索系统的核心部分,对整个系统的运行进行管理和控制。
其功能是在系统软件和检索软件的支持下,完成信息的存储、处理和检索操作。
联机检索系统一般拥有多台中央主机,可以随时切换,保证检索过程不会因主机故障而中断。
(2)数据库数据库是实现联机检索的物质基础,是联机信息检索操作的对象,是由若干相互关联的数据库(称为文档),按适当的结构形式组成的一个文献信息集合体。
数据库的品种、文献数量和回溯年限是衡量联机信息检索系统规模的重要标志。
一个联机信息检索系统一般可以提供数十到数百个数据库用于检索,而各个数据库存储内容的学科主题、信息类型以及提供的检索途径都存在不同,因此了解各个数据库的特性是进行联机信息检索的基础和前提。
(3)数据库管理与检索软件数据库管理与检索软件是控制中央主机或者服务器进行数据库检索操作的程序,在整个检索系统中发挥着至关重要的作用,其性能和质量将直接影响用户所获取信息与检索需求的匹配程度。
不同联机信息检索系统采用的数据库管理与检索软件的功能是不同的。
2、通信网络通信网络是连接联机信息检索中心和检索终端设备的桥梁,在两者之间传输信息和数据。
联机信息检索系统的通信网络已经从最初的依托于公用电话线、专用线,以及通信卫星和海底电缆构成的国际通信网络,发展到依托于因特网,以Telnet(远程登录)方式或者WWW方式与信息检索系统联机。
3、检索终端检索终端是用户向联机信息检索中心发送或者接收信息的设备。
目前检索终端已经从最初的屏幕显示终端,即只由一个用于输入的键盘和一个用于输出的显示屏幕组成,不具备信息处理能力,只能接收或者发送信息,发展到现在的微机终端,即以一般的PC机为终端,可以对接收的数据进行处理(套录进数据库或者打印等)。
(三)联机信息检索的功能联机信息检索服务系统的功能,即提供的服务方式主要有以下几种:1、回溯检索(Retrospective Searching)一般的联机信息检索系统除了提供最新信息的检索服务外,都回溯收录了很长时间范围的数据,供用户回溯检索。
这种服务对于申请专利、课题开题、某一项目鉴定、撰写综合性论文等非常有用。
2、定题服务(Selecting Dissemination Of Information)定题服务是将用户预先制订的检索表达式长期保留在检索系统的主机中,在相应的数据库更新时,由中央主机自动按保留的检索式,对储存到数据库中的最新文献信息检索,并将检索结果定期反馈给用户。
这种服务对于用户掌握某一学科最新水平和发展动向特别有用,而且信息提供及时,费用相对也比较低。
3、联机订购原文(Online Ordering Full Copies)联机信息系统检索到的信息多数是二次文献,如题录、索引、文摘等,如果用户想要获取原文,可以通过联机终端直接向检索系统递交联机订购原文的请求。
联机信息检索系统自动将用户的订购要求发送到数据库文献提供者,数据库文献提供者将用户所需的文献发给用户。
4、电子邮件服务(E-mail Service)一些大型联机信息系统(如DIALOG、ORBIT等)都设有电子邮件服务,它允许用户发送电子信息到联机检索系统各部门和同一系统中的各个用户。
二、中文联机检索系统选介(一)CALIS系统1、CALIS介绍中国高等教育文献保障系统项目(China Academic Library &Information System,简称CALIS),是经国务院批准的我国高等教育“211工程”、“九五”、“十五”总体规划中三个公共服务体系之一。
CALIS的宗旨就是在教育部的领导下,把国家的投资、现代图书馆的理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。
CALIS管理中心设在北京大学图书馆,下设了文理、工程、农学、医学四个全国文献信息服务中心,华东北、华东南、华中、华南、西北、西南、东北七个地区文献信息服务中心和一个东北地区国防文献信息服务中心。
全国文理文献信息中心——北京大学图书馆全国工程文献信息中心——清华大学图书馆全国医学文献作息中心——北京大学医学图书馆全国农林文献信息中心——中国农业大学图书馆华东北地区中心——南京大学图书馆华东南地区中心——上海交通大学图书馆华中地区中心——武汉大学图书馆华南地区个心——中山大学图书馆西北地区中心——西安交通大学图杉馆西南地区中心——四川大学图书馆东北地区中心——吉林大学图书馆东北地区国防信息中心——哈尔滨工业大学图书馆CALIS在全国高校系统内构成了三级保障体系的框架,第一级是各个高校图书馆,第二级是地区中心,第三级是全国中心。
如果全国文献中心仍然不能满足需要时,则可以通过全国文献中心向CALIS系统以外的国内外图书馆或文献服务中心提出需求。
自1998年开始建设以来,CALIS管理中心引进和共建了一系列国内外文献数据库,包括大量的二次文献库和全文数据库,采用独立开发与引用消化相结合的道路,主持开发了联机合作编目系统、文献传递与馆际互借系统、统一检索平台、资源注册与调度系统,形成了较为完整的CALIS文献信息服务网络。
迄今参加CALIS项目建设和获取CALIS服务的成员馆己超过500家。
2、CALIS服务CALIS的服务功能分为两大块。
一是面向读者,二是面向图书馆。
面向读者的服务功能主要有以下几项:(1)公共检索用户可以按照本校——本地区——邻近地区——北京——国外的顺序,在网上查找全国性或地区性的书刊联合目录数据库,了解所需文献是否有及在哪里收藏。
也可以通过联机(或委托)检索CALIS国内外各种类型的文献数据库,得到某一学科或专题的详尽的文献线索乃至电子版全文。
(2)馆际互借对于本馆没有的文献(如图书),在本馆用户需要时,根据CALIS统一的制度、协议和办法,向其他馆借入;反之,在其他馆用户提出互借请求时,借出本馆所拥有的文献,满足用户的文献需求。
(3)文献传递对于本馆没有的文献(如期刊文章或学位论文),在本馆用户需要时,根据CALIS系统的制度、协议和办法,从其他馆获取;反之,在其他馆用户提出请求时,将本馆所拥有的文献传递给对方。
(4)电子资源导航根据各校重点学科建设的需要进行统筹规划和分工,对网上的电子资源(如研究进展报告、电子期刊论文、研究机构、专家学者等)按图书馆学的原理和方法进行收集、加工和整序,形成虚拟图书馆资源,补充和扩大CALIS的文献资源,提供用户浏览和查询。
面向图书馆的服务主要有以下5项功能。
(1)联机合作编目合作建立具有统一标准的书刊联合目录数据库,在此基础上实现联机共享编目,即任一授权成员馆对入馆新书(刊)编目上载以后,其他馆就可从网上查询并下载,从而大大减少书刊编目工作中的重复劳动,提高编目工作效率和书目数据质量,实现书目资源的共享。
(2)文献采购协作根据各校重点学科建设的需要进行资源分工和布局,在CALIS系统内首先实现国外文献订购前的查重与协调,减少不必要的重复,保证必要的品种,达到文献信息资源的合理分布与经费的合理使用。
(3)培训服务每隔一定阶段,针对CALIS提供的各种服务,CALIS管理中心将组织免费或少量收费的培训。
目前的培训服务主要集中在:联机编目人员的培训、馆际互借与文献传递的培训、系统管理员的培训。
希望接受培训的人员请先通过E-mail 或电话在CALIS管理办公室登记,CALIS工作人员以此为依据,发送培训通知。
培训对象为图书馆相关技术人员。
(4)数据库服务及存档服务CALIS可以对各图书馆或信息服务机构的特色资源提供数据库建设与加工服务,对各图书馆或信息服务机构需要保存的资源提供存档服务。
申请此项服务时,请先提出相关的建设方案,然后和CALIS系统运行部联系。
(5)技术支持CALIS对各图书馆或信息服务机构的自动化系统建设和数字图书馆建设提供完整的技术解决方案。
依据提供咨询的深度收取费用或免费。
CALIS对使用CALIS软件的各图书馆或信息服务机构提供完全的技术支持。
3、CALIS查询方法CALIS检索数据范围包括中、西、日、俄文所有数据,系统提供简单检索和高级检索两种检索方式,具有多种检索入口,从而提高了文献的检全率和检准率,节约检索时间,提高检索效率。