文摘索引型数据库和全文数据库区别

  • 格式:docx
  • 大小:15.32 KB
  • 文档页数:4

下载文档原格式

  / 4
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文摘索引型数据库和全文数据库的最大差别就是前者结果只提供题录和文摘等二次文献信息 , 后者除可提供二次文献信息外 , 还能提供作者原文的一次文献信息。

1 检索途径存在着差异

检索途径有主题、分类及除此之外的作者、号码等其它辅助途径 , 通过数据库设置的检索字段反映检索途径的实现。不同的数据库根据检索的实际需要设置检索字段。

全文数据库设置的检索字段一般较文摘索引型数据库少 , 如 Springer -Link 只设全文、文摘、作者、题名 4 个检索字段。有些全文数据所设字段如出版物日期只是起限制检索结果的作用 , 不具备真正的检索意义。文摘索引型数据库设置检索的字段较多 , 且每个字段的检索能在命令检索指令中独立执行。文摘索引型数据库由于收录的文献众多 , 一般不采用简单的浏览途径。有的数据库提供分类途径 , 但其分类一般遵循全景式的细致的学科等级体系 , 较之全文数据库的浏览分类导航系统严谨。

2 收录文献的原则和目的不同 , 数据库所起的作用不同

文摘索引型数据库一般收录特定时期的综合学科领域或某一学科分支的相同或不同出版类型的文献。有的强调收录文献的全面性 , 如维普公司上世纪出版的《中国科技期刊篇名数据库》以收录中国期刊全面而著名。有的强调收录文献的质量性 , 如 EI 公司的 COMPENDEX 以收录具有永久保留价值的文献为宗旨。

全文数据库以为用户提供利用一次文献为主要宗旨 , 其数据库商必须和著者或出版单位商谈著作使用权问题 , 只有双方达成协议签署合同 , 并履约支付著作权报酬才能使用文献原文而收录数据库。

3 检索技术的运用不尽相同

3 .1 检索原理的不同

文摘索引型数据库是以记录组织文献 , 处理每一条记录依据基于文献内容的特征属性和文献外表的特征 , 如题名、主题词、作者等等。它们构成了记录的一个个字段 , 是典型的结构化的线性的数据 , 模式简单 , 易于处理 , 体现传统的布尔检索、截词检索和位置检索等功能。

全文数据库主要通过运用对整个文本信息的分析 , 利用将全部文本划分为主题紧凑的不同子段 , 用不同的关键字特征标注各子段的文本切分技术和计算

机自动进行全文自动抽词标引来处理原始文献的。全文检索技术能体现关键词在子段和全文出现的频率和分布 , 处理的是典型的非结构化的非线性的数据。

3 .2 主题检索特征不同

文摘索引型数据库在提供自然语言的同时 , 一般都有自己的主题词表反映数据库中各检索词之间的关系 , 依据主题词表对文献进行主题标引 , 对每篇文献给出若干个主题词。数据库提供自然语言检索的同时 , 也提供规范的在线主题词表让用户选择 , 以便准确全面地检索出所需信息。虽然具体检索实施时 , 也存在各种不理想的问题 , 但相比只提供自然语言检索应是一进步。

全文数据库一般没有自己的主题词表 , 主题检索依靠不加规范的自然语言实现。使用自然语言主要是基于检索最终用户的大众化 , 最大好处就是避免了人工标引的随意性、繁琐性 , 提高了处理数据的效率 , 节约了成本。但其实质上是把检索词和数据库文献中的关键词或截取文献的标题、全文进行简单字型上的对照匹配 , 有的全文数据库和计算机累积的同一词、近义词和相关词汇匹配。大部分全文数据库使用的前一种方法 , 这种仅仅基于字型而非主题

概念语义关系的一致 , 不仅不能反映广泛存在于自然语言中的同义词、近义词之间的关系 , 也不能反映基于概念的词与词之间的等级从属关联关系。用户不但不能消除检索词的歧义性 , 也不能根据自己的需要进行缩检扩检或作相关检索。

3 .3 输出格式的不同

全文数据库对原文的显示及下载一般采用不同的特定格式 , 在初次检索前往往要注意下载解压并安装浏览器以便使用。有的提供通用格式 , 如Springer -Link 数据库原文显示采用 PDF 格式或 H TM 格式。有的数据库甚至采用自主研制开发的专用浏览器 , 如 CNKI 系列数据库原文采用 CA J 格式。

文摘索引型数据库其输出结果比较简单 , 没有专用特定的格式。