事实与数值型数据库资源检索
- 格式:doc
- 大小:100.00 KB
- 文档页数:10
第八章事实和数值型数据库第一节事实和数值型数据库概述在现代化图书馆的电子资源建设中,各种类型数据库的发展已经为图书馆的服务手段带来了飞跃性的变革。
数据库从存储的内容上可分为目录文摘数据库、全文数据库、事实型数据库、数值型数据库。
在图书馆电子资源建设的初期,二次文献数据库曾发挥了全面快速检索文献的作用,是电子资源的主要组成部分。
但随着文献信息的日益膨胀,面对INTERNET 网络信息的纷繁庞杂,用户越来越需要准确、真实、适用、具体、能够直接回答问题的针对性强的信息。
因此以一次信息(包括全文、事实、图形、数值信息)为主的源数据库已经成为数据库发展的主流,并将成为图书馆电子资源的发展重点。
以上几章中着重介绍了学术性文献库,在本章中我们将就另外两种目前具有重要的发展前途的数值型数据库及事实型数据库做一个概述性的介绍。
3.1事实数据库的发展历史如果从利用计算机作数据处理的角度来讲,则处理事实数据要比处理书目数据早得多。
但作为数据集合的数据库来讲,书目数据库的发展要比事实数据库的发展早一些。
最早的数据库是50年代的存于磁带上的书目库。
第一个事实数据库产生于1967年,是由美国Data 公司根据与俄亥俄律师协会的合同建立的俄亥俄法律法令全文库,收录有全美50个州的法律法令。
1968年,美国的Data Resource Inc公司成为第一家重要的数值数据库服务公司。
在70年代初期,事实数据库发展比较缓慢,其速度远远不及文献数据库的发展速度。
但由于事实数据库直接向用户提供原始情报,或经过加工存贮的“纯情报”,比如商业经济方面的数值数据库,直接向用户提供物价、产品规格、产值等方面的数据。
因此,越来越深受用户的欢迎。
自70年代中期以后,事实数据库迅速发展,没过多久其速度便赶上和超过了文献数据库的发展。
据统计,在1975年,欧洲只有51个事实数据库。
但到1985年,则猛增到1063个,平均每两年增加一倍。
1983年,世界数据库的总数为1845个,比1975年增加了38倍。
文献信息检索系统的分类文献信息检索系统的核心是数据库,而数据库本身又常以收录内容及功能的不同划分为如下几种类型。
1.书目型数据库(bibliographic database)主要是指二次文献数据库,包括各种机读版的题录型、文摘型的数据库。
如《中国生物医学文献数据库》(SinoMed)、MEDLINE等。
它们提供了可满足用户多种信息检索需求的有关文献的各种特征,如文献的篇名、著者、出处(包括刊名、年、卷、期、页码)、摘要、收藏单位等。
不仅可以告知用户其所需文献的线索一题录(包括篇名、著者、出处),更可以提供整篇文献内容浓缩的替代品一文摘。
因此,这是文献检索中最常用的一种数据库。
2.事实数值型数据库( fact-date database)主要为用户提供有关事物、人物、机构等方面的事实性信息和数值型数据。
例如万方数据资源系统中的事实型数据库《中国科研机构数据库》《中国科技信息机构数据库》《中国高等院校及中等专业学校数据库》,美国国立癌症研究所的关于癌症治疗信息的医生咨询数据库(PDQ),反映药物处方信息的《医师案头参考书》(Physicians'Desk Reference, PDR)等。
电子化的参考工具书,如词典、百科全书指南等也属于事实型数据库的范畴。
3.全文型数据库(full-text database)是将文献全文的全部内容转化为计算机可以识别、处理的信息单元而形成的数据集合。
全文型数据库对文献的字、词、句,乃至段落等进行更深层次的编辑加工,允许用户采用自然词语以及截词、邻近算符等匹配方法,方便快速地查到所需的文献,并能直接获取文献原文。
例如CNKI的学术文献总库、万方数据资源系统中的数字化期刊、EIsevier Science电子期刊全文库。
因此,全文型数据库是集文献线索的查询和文献全文的提供于一体,实现了毕其功于一役的一站式信息服务。
4.知识型数据库(knowledge database)一种疾病,不仅有一个概念性的界定,而且涉及病因、病理、诊断、治疗等相关知识;一种药物,不仅有其化学结构上的名称或命名,而且有药理作用、药效动力、副作用、适应证、使用方法等相关知识; -项检查,不仅有其概要性描述,而且涉及原理、检测值的解释、临床意义、操作方法、正常值范围、适用范围等一系列相关知识。
第四章事实与数据型数据库资源检索数据检索有广义和狭义之分。
事物除了质的规定性外,还有量的规定性,随着人类认识的发展,量作为事物的一个基本特征逐渐脱离了事物主体而形成一个独立领域,即各种数值,人们对各种数值需求的查询便构成了数据检索。
这里的数据是指进行各种统计、计算、科学研究或技术设计等所依据的数值,它包括两种类型:统计数据和科学数据。
统计数据是指人类社会和自然现象中各种事物的定量表述,科学数据是指各个领域中所用的参数、常数、理论数据、分子式、公式、产品规格、国家颁布的技术标准和施工定额等。
狭义的数据检索是利用相关的检索工具或检索系统查询有关数据,以获得某一问题量化的准确数值。
而在计算机技术中,通过编码输入到计算机中由计算机处理的所有字符都是数据,因此一切经过计算机处理的事实都称数据,广义的数据检索是指利用检索工具或检索系统查询一切经过计算机系统处理的内容,以获得对某一问题的解答。
在计算机检索系统中,事实检索与数据检索是同一关系。
在本章中,数据检索取狭义的解释。
事实检索是指在检索工具或检索系统中查询有关事件或实在情报,以求得对某一问题的解答。
如查事物的性质、定义、原理,查人物机构情况,查某事件发生的时间、地点、经过等。
数据和事实检索是要检索出包含在文献中的信息资源本身,是一种确定性检索,主要利用参考工具。
4.1 参考工具书4.1.1 参考工具书的定义与特点(1)定义参考工具书指能为读者提供各种所需的具体资料的工具书。
参考工具书按特定的方式汇编某学科或某范围的知识或资料,有的还附录了数量不等的备检资料以方便用户查检数据和事实信息,大都以图书的形式出版,属于三次文献,但在内容与编排方面,与普通图书有本质的区别。
(2)特点①知识性。
参考工具书在内容上具有信息密集的特点,涉及范围广泛,汇集了原始文献中有价值的数据事实。
它是在大量原始资料的基础上,对知识进行分类、整理、提炼、加工、浓缩和重组而形成的一种检索工具,内容较成熟、准确、可靠,本身便可提供用户所需的信息。
第四章事实与数据型数据库资源检索数据检索有广义和狭义之分。
事物除了质的规定性外,还有量的规定性,随着人类认识的发展,量作为事物的一个基本特征逐渐脱离了事物主体而形成一个独立领域,即各种数值,人们对各种数值需求的查询便构成了数据检索。
这里的数据是指进行各种统计、计算、科学研究或技术设计等所依据的数值,它包括两种类型:统计数据和科学数据。
统计数据是指人类社会和自然现象中各种事物的定量表述,科学数据是指各个领域中所用的参数、常数、理论数据、分子式、公式、产品规格、国家颁布的技术标准和施工定额等。
狭义的数据检索是利用相关的检索工具或检索系统查询有关数据,以获得某一问题量化的准确数值。
而在计算机技术中,通过编码输入到计算机中由计算机处理的所有字符都是数据,因此一切经过计算机处理的事实都称数据,广义的数据检索是指利用检索工具或检索系统查询一切经过计算机系统处理的内容,以获得对某一问题的解答。
在计算机检索系统中,事实检索与数据检索是同一关系。
在本章中,数据检索取狭义的解释。
事实检索是指在检索工具或检索系统中查询有关事件或实在情报,以求得对某一问题的解答。
如查事物的性质、定义、原理,查人物机构情况,查某事件发生的时间、地点、经过等。
数据和事实检索是要检索出包含在文献中的信息资源本身,是一种确定性检索,主要利用参考工具。
4.1 参考工具书4.1.1 参考工具书的定义与特点(1)定义参考工具书指能为读者提供各种所需的具体资料的工具书。
参考工具书按特定的方式汇编某学科或某范围的知识或资料,有的还附录了数量不等的备检资料以方便用户查检数据和事实信息,大都以图书的形式出版,属于三次文献,但在内容与编排方面,与普通图书有本质的区别。
(2)特点①知识性。
参考工具书在内容上具有信息密集的特点,涉及范围广泛,汇集了原始文献中有价值的数据事实。
它是在大量原始资料的基础上,对知识进行分类、整理、提炼、加工、浓缩和重组而形成的一种检索工具,内容较成熟、准确、可靠,本身便可提供用户所需的信息。
与检索工具相比,参考工具书提供的资料更具体。
②检索性。
参考工具书在编排上采用多种排检方法,具有易检性。
它采用了具有检索功能的序列方式,按分类方式、主题方式或其他方式排列。
它还备有完备的检索系统,使人们能快速、准确地查到所需了解的知识。
③概括性。
参考工具书在表现形式上概括性强,表达精练,可采用文字、图表等多种方式。
4.1.2 参考工具书的类型参考工具书一般包括字典、手册、年鉴、百科全书、名录、表谱、图录、产品资料等。
(1)字典类(Dictionary)由于汉语中字和词概念不同,所以在汉语中又有字典、词典、辞典之分。
它们是汇集字、词、成语,并按一定的次序编排、解释的工具书。
一般来说,字典汇集单字,并注明其字形、读音、意义和用法,词典主要解释词语的概念、意义和用法。
根据收录信息不同,字典类参考工具书又可进一步划分为以下类型:①语言字典:是常用工具书之一,有单语种字典和双语、多语对照字典,是汇集语言及事物名称,解释词义和用法,并按一定顺序排列以供查检的工具书。
主要是解答字、词在形、音、义方面的疑惑,如《新华字典》。
②专科词典、专业词典:专科词典、专业词典专门收录某一个或几个专业领域内专用的名词术语。
一般的语言字典,往往不收集各学科专用的词条、名词术语,当我们阅读专业书刊时,特别是在阅读英文专业书刊时,遇到一些专业词汇,一般的语言字典往往束手无策,这时就需要借助有关的专业词典,帮助我们阅读科技文献。
此类字典如《英汉(汉英)机电工程词典》、《机电一体化技术词典》、《计算机用户词典》、《电力工业词典》、《英日汉自动化术语词典》、《英汉科技大词典》。
③综合性词典、百科词典:广泛收集各学科领域使用的字和词,主要解决阅读词语上的疑难问题,或为学习文化知识提供材料,如《辞海》、《辞源》、《中国百科大辞典》、《现代科学技术词典》。
④缩略语词典:在科技文献中经常使用一些缩略语,如GB, CAD, ISO, IEE, IEEE, FMS, NC 等。
查缩略语的含义可用缩略语词典。
有时一个缩略语有多种含义,因此确定其含义时需结合上下文。
此类词典有《英汉缩略语辞典》、《英汉科技缩写词汇》、《首字母与缩略语词典》、《英汉科技文献缩略语辞典》、《英汉工程技术缩略语辞典》。
⑤姓名、地名译名词典:对姓名、地名的译名加以统一,主要解决由于语言习惯不同、思维方式不同、发音规则不同而带来的译名不同问题。
(2)手册(Handbook, Manual)顾名思义,手册是手边供随时查阅的工具书。
手册起源于英国,它是汇集有关事实、数据、公式等资料,提供某一范围内的基本知识和基本数据,以便于人们查考使用的事实便览型工具书。
中文称之为指南、便览、要览、必备、大全、须知的图书也属于手册的性质。
手册一般具有主题明确、内容集中、资料成熟、叙述简练的特点,而且便于携带,查阅方便。
手册按收录的内容可分为综合性手册和专科性手册两种。
综合性手册概括了各学科的内容,知识广泛、全面、系统,如《中华人民共和国资料手册》、《生活科学手册》、《世界新学科总览》、《当代新兴学术手册》等。
专科性手册一般是针对某一专门学科或特定用途而编写的,内容涉及学科专业的实用知识和参考资料,概括其基本知识、基本概念、各种公式、数据、规格、图表等,内容比较专深、具体,供专业人员或专门人员使用。
专科性的手册占多数,如《机械设计手册》、《机电产品设计工作手册》、《机电一体化实用技术手册》、《可编程序控制器应用指南》、《常用电子元器件简明手册》、《电子技术常用数据手册》、《实用数控机床技术手册》、《热处理手册》等。
(3)年鉴(Yearbook, Annual)年鉴是汇集某一年内有关领域的概况、重大事件、统计资料并按年度连续出版的工具书。
它以固定专栏的编排形式,准确、精练地报道有关知识信息。
一般设有大事记,可查一年内的重大事件和动态信息;设有统计资料,可用于查询相关数据;设有人物传记,可用于查找重要人物事迹,以及学术活动;设有重要机构,可用于查找机构概况;设有各学科的专题评述或综述,可获取某学科领域内上一年度的新成果。
年鉴的特点是资料内容新颖,可补充百科全书的不足。
根据收录内容,年鉴可分为综合性年鉴、专科性年鉴和统计性年鉴。
综合性年鉴收录内容广泛,较全面地反映国家或国际上政治、经济、文化、科学、教育等方面的年度发展状况和有关资料,如《世界年鉴》、《中国百科年鉴》、《广东年鉴》、《广州年鉴》等。
百科年鉴可弥补百科全书不能及时修订的不足。
专科性年鉴通常围绕一定的学科、专业领域或专题等系统地收集有关资料,反映其年度进展情况和统计数字,如《中国经济年鉴》、《香港经济年鉴》、《中国机械工业年鉴》、《中国电子工业年鉴》、《计算机年鉴》、《计算机用户年鉴》、《国际机器人学年鉴》、《中国集邮年鉴》、《中国税务年鉴》、《中国教育年鉴》、《世界大事年鉴》等。
统计性年鉴主要用数字来说明有关领域的进展情况,为读者提供数值数据,如《中国统计年鉴》(全面反映我国国民经济和社会发展情况的资料性年鉴,重点反映全国性数字)、《中国人口统计年鉴》、《上海统计年鉴》、《联合国统计年鉴》、《国际贸易统计年鉴》等。
(4)百科全书(encyclopedia)百科全书是以辞典形式编排的、荟萃各门知识或一门知识的大型参考工具书。
百科全书是百科知识的总汇和汇编,是较大型的工具书,系统、扼要地阐释各学科基本知识和重要研究成果,对每一学科提供定义、原理、方法、历史、现状、统计数字和参考书等多方面的资料,并着重反映学术上的最新成就,能为人们提供系统全面的知识信息和事实文献,以内容广博、资料准确、释文严谨、文字简明、体例严密、插图装帧精美、卷帙浩瀚而著称,又被称为工具书的巨人。
百科全书通常由国内外许多专家学者合作编成,具有较高的可靠性和权威性,附有各种索引,查找较为方便。
但百科全书出版周期较长,难以及时反映最新科研成果,因此,有些著名的百科全书还出版相应的百科年鉴以弥补其不足。
根据收录的范围,百科全书可分为综合性百科全书和专科性百科全书,利用百科全书可检索有关定义、概论、说明解释、著名人物、重大事件等。
综合性百科全书广泛收集各个学科、各个领域的知识,内容包罗万象。
如中国的《中国大百科全书》、《环球百科全书》等,国外的《美国百科全书》(The Encyclopedia American)、《新不列颠百科全书》(The New Encyclopedia Britanica)、《钱伯斯百科全书》(Chamber‘s Encyclopedia)等。
专科性百科全书一般专门收录某一学科(或几个相近学科)的知识,比综合性百科全书更为详尽,如中国的《中国电力百科全书》、《电子电路百科全书》、《中国企业管理百科全书》、《中外商贸大百科》、《化工百科全书》、《材料科学与工程百科全书》、《能源百科全书》等,国外的《美国学术百科全书》(Academic American Encyclopedia)、《麦克米伦科学百科全书》(Macmillan Encyclopedia of Science)等。
(5)名录(directories)名录是一种专门对人名、机构名、地名等专名进行汇集并予以简要揭示和介绍的工具书。
名录作为数据、事实检索的一种重要工具书,一般采用表格栏目的形式,文字简单明了。
名录一般按学科、行业、地区划分出版,编排整齐清楚,其书名常常可以反应书中内容,使用方便。
名录可分为人名录、机构名录和地名录。
①人名录:又称名人录,简要介绍某一方面人物的个人资料,主要包括姓名、生卒年月、学历、经历、籍贯、所从事的领域、主要著作及成果等,是著名人物简历的汇集。
人名录按时间分,可分为当代人名录(Who’s who)和回溯性人名录(Who was who,传记)两种;按收录内容分,可分为综合性人名录和专科性人名录,前者有《中国科苑英华录》、《今日科技界名人录》、《世界名人录》、《美国名人录》、《国际名人录》(The International Who’s Who)等,后者有《中国电力人物志》、《世界重要经济学家辞典》等。
②机构名录:机构名录是介绍各种组织机构的名称及其概况的工具书,包括机构性质、地址、业务范围、人员、规模、历史沿革和近况、出版物等情况。
机构名录为机构之间的联系、协作、交流提供方便,为了解产品情况提供信息,有些名录还具有明显的经济效益。
常见的有《中国机电企业名录》、《世界机电公司手册(中英文对照)》、《世界著名电气公司》、《出国留学指南》、《国际大学手册》、《全国大学一览》(日)、《留学美国指南》、《世界科学协会、学会指南》、《中国工商企业名录》、《中国企事业名录大全》、《1990年美国大学教师名录》(The National Faculty Directory 1990)等。