事实型数据库资源浅析
- 格式:pdf
- 大小:90.87 KB
- 文档页数:3
第八章事实和数值型数据库第一节事实和数值型数据库概述在现代化图书馆的电子资源建设中,各种类型数据库的发展已经为图书馆的服务手段带来了飞跃性的变革。
数据库从存储的内容上可分为目录文摘数据库、全文数据库、事实型数据库、数值型数据库。
在图书馆电子资源建设的初期,二次文献数据库曾发挥了全面快速检索文献的作用,是电子资源的主要组成部分。
但随着文献信息的日益膨胀,面对INTERNET 网络信息的纷繁庞杂,用户越来越需要准确、真实、适用、具体、能够直接回答问题的针对性强的信息。
因此以一次信息(包括全文、事实、图形、数值信息)为主的源数据库已经成为数据库发展的主流,并将成为图书馆电子资源的发展重点。
以上几章中着重介绍了学术性文献库,在本章中我们将就另外两种目前具有重要的发展前途的数值型数据库及事实型数据库做一个概述性的介绍。
3.1事实数据库的发展历史如果从利用计算机作数据处理的角度来讲,则处理事实数据要比处理书目数据早得多。
但作为数据集合的数据库来讲,书目数据库的发展要比事实数据库的发展早一些。
最早的数据库是50年代的存于磁带上的书目库。
第一个事实数据库产生于1967年,是由美国Data 公司根据与俄亥俄律师协会的合同建立的俄亥俄法律法令全文库,收录有全美50个州的法律法令。
1968年,美国的Data Resource Inc公司成为第一家重要的数值数据库服务公司。
在70年代初期,事实数据库发展比较缓慢,其速度远远不及文献数据库的发展速度。
但由于事实数据库直接向用户提供原始情报,或经过加工存贮的“纯情报”,比如商业经济方面的数值数据库,直接向用户提供物价、产品规格、产值等方面的数据。
因此,越来越深受用户的欢迎。
自70年代中期以后,事实数据库迅速发展,没过多久其速度便赶上和超过了文献数据库的发展。
据统计,在1975年,欧洲只有51个事实数据库。
但到1985年,则猛增到1063个,平均每两年增加一倍。
1983年,世界数据库的总数为1845个,比1975年增加了38倍。
浅析万方、维普、CNKI三大全文数据库万方、维普和CNKI都是中国知名的全文数据库,它们的出现为学术研究和科研工作提供了很大的便利,同时也成为了各大高校、研究机构必备的数字化资源。
本文将对这三个数据库进行简要分析比较。
一、万方数据库万方数据库成立于1993年,是一家专业的学术论文数据库出版商。
初期,万方的数据仅仅是在一些学术刊物上进行索引和收集。
后来,万方开始充分利用其兽医信息库、地学文献库、中药文献库等多个专门领域的数据库,推出了“万方数据”全文数据库,覆盖几乎所有领域的学术文献,以满足读者和作者的需求。
目前,万方全文数据库中约有5600多万条记录,包括7388种学术期刊、3515种会议录、2200种博硕论文等,内容涉及自然科学、社会科学、医药卫生、农业、工程技术等各个领域。
其中,自然科学领域的文献比较丰富,覆盖率也较高。
对于一般读者来说,万方文献库的检索界面使用简单,检索速度快,而且用户可以通过“文献下载券”来下载文献。
二、维普数据库维普数据库成立于2000年,是一家高质量的综合性数字化出版服务商。
维普的业务有期刊出版、数字图书出版、学术搜索引擎、学术知识服务平台等。
其中,维普期刊数据库是其主要业务之一。
目前,维普数据库收录学术期刊近三千种,覆盖几乎所有领域。
其中,社会科学和人文科学领域占维普数据库期刊总量的较大份额,自然科学和医学领域则相对较少。
维普数据库的文章多数是付费的,不过有一些优质文章对于普通用户免费开放,并且下载速度也较快。
三、中国知网(CNKI)中国知网,成立于1999年,是中国最大的数字图书馆之一,是中国科技文献数据库的重要组成部分。
知网数据库已发布刊物功能、学位论文功能、会议论文功能、专利功能、标准功能。
CNKI数据库的内容涉及自然科学、社会科学、农业、医药卫生、工程技术等各个领域。
目前,CNKI数据库中拥有数以千计的学术刊物,包括科技论文、会议论文、专业报纸和行业文摘等,而此外还有大量的博士和硕士论文。
数据型数据库和事实型数据库是两种不同类型的数据库概念。
1.数据型数据库:数据型数据库主要用于存储和管理结构化数据,这些数据以表格形式
组织,采用行和列的结构。
数据型数据库通常使用关系型数据库管理系统(RDBMS),如MySQL、Oracle等。
它们适用于需要对数据进行复杂查询、事务管理和数据完整性保证的场景。
数据型数据库强调数据的一致性和准确性,支持事务处理和数据关系建立。
2.事实型数据库:事实型数据库主要用于存储和分析大量的历史数据,以支持数据分析
和决策支持系统。
事实型数据库采用星型或雪花型模式来组织数据,其中一个中心表包含了主要的事实数据,而其他维度表则包含与该事实数据相关的维度信息。
事实型数据库通常用于数据仓库和商业智能系统中,用于快速查询和分析大量数据,并生成报表和数据分析结果。
总之,数据型数据库主要用于存储和管理结构化数据,强调数据的一致性和准确性,适用于复杂查询和事务处理;而事实型数据库主要用于存储和分析大量的历史数据,以支持数据分析和决策支持系统,适用于快速查询和分析大量数据的场景。
两者在数据组织结构和使用目的上有所不同。
在线作业A一判断题1.工具书是围绕一定的问题或学科作深入的论述,以阐明作者的观点,内容一般比较连贯完整。
()(5.0 分)TRUEFALSE知识点: 2 参考工具书用户解答:FALSE2.手册是汇集某一学科或某一主题需要经常查考的资料,供读者随时翻检的工具书。
()(5.0 分)TRUEFALSE知识点: 2.1 参考工具书的特征、作用用户解答:TRUE3.手工检索的特点:查找迅速,效率高、检索范围全面,主题广泛。
()(5.0 分)FALSETRUE知识点: 1.6.1 检索方法 用户解答: FALSE二 单项选择题1.(5.0 分)查全率 查准率 误检率 漏检率知识点: 1.2.2 信息检索的意义及作用 用户解答: 查准率2.(5.0 分)含有A 、B 之一或同时包含AB 两词的文献 含有检索词A 而不含检索词B 的文献 含有检索词B 而不含检索词A 的文献 含有这两个词的文献集合知识点: 1.6 文献检索的方法、途径和步骤用户解答: 含有A 、B 之一或同时包含AB 两词的文献3.(5.0 分)( )是检索出的相关信息量与检索出的信息总量的百分比。
布尔逻辑表达式“A OR B ”或“A+B ”表示查找出( )。
书目查询主要通过( )。
期刊论文数据库 学位论文数据库 搜索引擎各大学图书馆或情报部门的书目查询系统知识点: 1.5 检索工具及类型用户解答: 各大学图书馆或情报部门的书目查询系统4.(5.0 分)误检率 漏检率 查准率 查全率知识点: 1.4 文献检索基础知识 用户解答: 查全率5.(5.0 分)文字 纸张 信息内容 磁盘知识点: 1.3 信息源的类型及特点 用户解答: 信息内容( )是检出的相关文献与检出的全部文献的百分比。
文献信息的三个基本构成要素是( )、物质载体和信息符号。
6.(5.0 分)含有检索词B 而不含检索词A 的文献 含有这两个词的文献集合含有检索词A 而不含检索词B 的文献 含有A 、B 之一或同时包含AB 两词的文献知识点: 1.4.2 文献检索的基本原理 用户解答: 含有这两个词的文献集合7.(5.0 分)倒查法 追溯法 顺查法 抽查法知识点: 1.6.1 检索方法 用户解答: 倒查法8.(5.0 分)所收资料侧重基础知识,注重实用性 著录内容标明出处 侧重揭示文献内部特征布尔逻辑表达式“A AND B ”或“A ×B ”表示查找出( )。
事实型数据库资源浅析
张冬梅
摘 要: 数据库是图书馆最主要的电子资源。
与文献型数据库一样,事实型数据库也应该是图书馆数据库资源的一部分。
本文通过对图书馆的调查统计,分析了我国图书馆事实型数据库资源的现状与存在的问题,同时对如何评价事实型数据库提出了自己的观点。
关键词:事实型数据库 电子资源
1概述
数据库发展到今天,数量和各类已经非常庞大。
但迄今为止,对数据库的分类方法并没有统一。
各类数据库的标准化格式不健全,因此难以针对不同分头方法作出评价。
以Carlos Cuadrar的分类为出发点,他将数据库分类为 A.Reference Database(参照数据库)Bibliographic(文献型数据库)Referral(指示型数据库);B.Source Database(源数据库)Numeric(数值型数据库)Textual-Numeric(文本数值型数据库)Full-text(全文型数据库)Software(软件型数据库)。
我们会发现,这些数据库都有一个共同的特点,就是它们包含的信息都是用户直接可用的数值、文本或事实。
因为,笔者认为,数据库从内容上划分,分为文献型数据库和事实型数据库比较合适。
文献型数据库,包括目录文摘型文献数据库、全文型文献数据库。
这类数据库的学术性比较强,是科学研究成果的集合,是科研工作者进一步开展科研的基础;事实型数据库,包括数值数据库、知识数据库、法律法规数据库、新闻报道数据库、名录数据库、图像数据库、多媒体数据库、软件数据库等。
这类数据库专业性、时效性、应用性比较强,可以为科研工作提供支持、也可以为日常生活提供便利。
2事实数据库简介
2.1数据库类型
2.1.1数值数据库:存贮的数据是某种事实、知识的集合主要包括数字数据,如统计数据、科学实验数据、科学测量数据等。
如:中国科学计量指标数据库。
2.1.2事实数据库:存贮在计算机中的相互关联的数据集合。
收录人物、机构、事务等在现象、情况、过程之类的事实性数据,如机构名录、大事记等。
如万方中国科研机构数据库。
事实型数据库所包括的信息数据类型较多,如经贸信息、统计数据、企业基本信息及产品信息等相关信息均可划分到此种类型数据库中。
2.2检索类型
事实型信息检索(Fact Retrieval)、数值型信息检索(Data Retrieval)和文献型信息检索(Document Retrieval)三种。
事实型和数值型信息检索的内容主要是日常生活和工作中遇到的一些疑难问题,如字词、事件、事实、人物、机构名称,年代日期、公式、常数、规格、方法等。
这是一种确定性的检索,要么是有,要么是无;要么是对,要么是错。
2.3数据来源
2.3.1专门出版机构如中国统计出版社
2.3.2政府部门如国家统计局、省市统计局
2.3.3工具书如字典、词典、百科全书、年鉴、统计年鉴、手册、名录、大全、产品目录、样本、图集、图谱、法律条文等。
2.3.4企业如具体企业中负责数据统计的部门
3.事实数据库特征分析
通过使用,笔者发现事实型数据库区别于全文型数据库的特点在于以下方面:
3.1在以图书馆为代表的教学科研机构当中,事实类数据库的购买比例相对较低。
原因具体在于:事实型数据库产品比较全文型数据库数量较少;在内容的稳定性、规范性、学术性上较全文数据库弱;科研工作者使用事实型数据库的频率不及使用文献型数据库的频率高。
同时,事实型数据库本身也存在一些问题,比如:事实型数据库开发较难、产品质量良莠不齐;一些事实型数据库更新不及时、数据连贯性和准确性差、收录不够全面等等,这些问题都是可能制约事实型数据库实用性的因素。
3.2事实型数据库的专业性较强。
事实型数据库收录的内容一般不可能涵盖所有专业,往往是某一个专业、某一个行业,甚至某一个更小领域的相关信息。
例如:各种各样的商情数据库、行业或地区企业名录、法律法规数据库、医药数据库等等。
事实型数据库应该具有某一个领域的百科全书的功能,所以事实型数据库应该避免面面俱到,要有重点、有特色。
图书馆往往也根据主要服务对象的专业来选择订购事实型数据库。
3.3 事实型数据库的质量有待提高。
事实型数据库的质量一方面在于收录的内容,另一方面在于检索的平台。
事实型数据库的内容形式多样,有统计数据、企业名录、新闻报道等,如何将它们有序地组织起来,并且为用户提供方便的检索平台,是事实型数据库质量的关键。
目前,我国图书馆有一部分事实型数据库是由国内数据库商开发的,这些数据库重点收集我国相关行业的信息、数据、分析报告,在内容上具有一定的特色。
但往往由于数据库更新不及时、数据不连贯、检索点单一等原因使其内容上的特色不能很好地体现。
3.4 事实型数据库的相关版权问题。
通常情况下,文献型数据库的开发只要获得收录期刊、图书、论文等的版权人许可并支付一定报酬就可以了。
但事实型数据库的版权问题就复杂很多。
一方面,事实型数据库的内容丰富、种类繁多、信息来源广泛。
要妥善解决数据库收录的依法授权问题,可能要涉及很多权利人,例如:期刊杂志社、新闻媒体、科研院所、各行业统计机构、个体著作权人等等。
另外,如何判断哪些内容需要授权,哪些内容不需要授权,也是数据库收录中应该重视的问题。
另一方面,事实型数据库的很多内容本身是不构成版权保护的,例如:各种公开的政府统计数据、经济报告等。
这些信息的收集和组织过程中开发者投入了大量的成本,如何保护开发者的利益,这也是事实型数据库开发者最关心的版权问题。
4免费事实数据库推介
4.1黄页、白页:
中华大黄页
中国电信黄页 /
中国网上114/
美国机构名录 /
康帕斯世界企业、产品名录 /kinl/zh/
加拿大高校名录 http://oraweb.aucc.ca/showdcu.html
全球高校名录 /
4.2百科全书
国家百科全书 /
北京百科全书 http://beijing-book.db6 /
市场经济百科全书 /
4.3年鉴
中国年鉴信息网 /
国家统计局 http:∥
年鉴篇名数据库 /newpages/database/zgnj.htm
4.4字典、词典
词霸在线
粤语审音配词库 .hk/Lexis/lexi-can/
当代汉英词典 .hk/Lexis/lexi-can/
汉语大词典 /hd20/
4.5物化性质
化学元素特性 /
物理学参考数据 /PhysRefData/
医药药品信息 /medlineplus/
参考文献:
1.叶继元著.信息检索导论.北京:电子工业出版社,2003:125
2.蔡绍莹.事实型数据库初探.情报学报.1990(5):360-370
3. 何玮,雷春炳.医学专题事实型数据库的探讨.中华医学图书情报杂志,2002(2):3-6。