第5章第1节-数字化报刊资源及其检索系统
- 格式:doc
- 大小:14.58 MB
- 文档页数:26
数字出版基础笔记第一章数字出版概述第一节数字出版的概念2005年举办的“第一届中国数字出版博览会”标志着我国出版业驶入了数字出版的快车道。
一、数字出版的概念及其演变(一)数字出版的定义工作定义:指利用数字技术今夕内容编辑加工,并通过网络传播数字内容产品的一种新型出版方式,其主要特征为内容生产数字化、管理过程数字化、产品形态数字化和传播渠道数字化。
主要形态:电子图书、数字期刊、数字报纸、数字音乐、网络动漫、网络游戏、网络原创文学、网络地图、网络教育出版物、数据库出版物、手机出版物等。
数字技术是指借助一定的设备将图、文、声、像等各种信息转化为计算机系统能够识别的二进制数字“0”“1”后进行采集、加工、存储、传送、传播、还原的技术。
注意:数字技术如果只用于出版的某些业务环节,并不能被称为数字出版。
按需印刷,可将其视为数字出版的一个环节。
(二)电子出版的含义《电子出版物管理规定》的定义:以数字代码方式,将有知识性、思想性内容的信息编辑加工后存储在固定物理形态的磁、光、电等介质删个,通过电子阅读、显示、播放设备读取使用的大众传播媒体,包括只读光盘(CD-ROM、DVD-ROM等)、一次写入光盘(CD-R、DVD-R 等)、可擦写光盘(CD-RW、DVD-RW等)、软磁盘、硬磁盘、集成电路等,以及总署认定的其他媒体形态。
2008年发布的ISO9707标准中,对电子出版物的解释是:以数字形式出版并通过互联网访问或物理形态承载的文献,包括电子书、数字期刊和数据库。
(三)网络出版的含义《互联网出版管理暂行规定》中的界定:指互联网信息服务提供者将自己创作或他人创作的作品经过选择和编辑加工,登载在互联网上或者通过互联网发送到用户端,供公众浏览、阅读、使用或者下载的在线传播行为。
1.互联网出版是数字出版活动的形式之一。
与其他出版形式的区别:从根本上说,只是在于A.出版物的载体形式、B.物质生产方式和C.将出版物提供给消费者的方式不同。
中国报纸资源全文数据库/portal/cumtb/index.do说明:校园网ip的用户直接登录地址即可使用,无需登录;如果使用收藏等个性功能可自助注册用户登录。
机构代码为:cumtb简介:中国报纸资源全文数据库是方正阿帕比技术有限公司联合全国各大报社开发的以国内报纸资源为主体的全文数据库系统,是国内首个整报完整收录的报纸全文数据库!也是国内首个集文章内容全文检索和在线报纸原版翻阅为一体的报纸全文数据库!该数据库不仅通过适合报纸资源的专业分类体系和检索方法为用户提供全国各大权威报纸内容级查询、检索服务,还将提供原版原式的报纸浏览和基于报纸资源的其它增值服务。
目前已经入库285种,每月新上架25~30种,覆盖了60%以上的报业集团报纸,如经济日报、解放日报、新民晚报、北京晚报等。
中国报纸资源全文数据库收录的报纸均获得了报社等出版机构的正式授权,没有任何版权风险。
中国工具书资源全文数据库/cumtb说明:校园网ip的用户直接登录地址即可使用,无需登录;如果使用收藏等个性功能可自助注册用户登录。
机构代码为:cumtb简介:“中国工具书资源全文数据库”是一个以条目型数据为主体、检索为主要功能的数据库产品,旨在成为以专业、权威工具书资源为主体的全文检索型数据库产品。
该数据库适用于各类专业人员对专业知识的检索与引证,同时也适用于普通用户的学习与参考。
该产品目前精选收录国内各大出版社出版的精品工具书资源2000余种,其中包括像《辞海》、《汉语大词典》、《中国大百科全书》等在国内公认的精品工具书。
中国年鉴资源全文数据库/cumtb说明:校园网ip的用户直接登录地址即可使用,无需登录;如果使用收藏等个性功能可自助注册用户登录。
机构代码为:cumtb简介:中国年鉴资源全文数据库是由北京方正阿帕比技术有限公司与中国出版工作者协会年鉴工作委员会共同发起,得到中国年鉴界公认并积极参与的中国主流专业的年鉴全文数据库。
所收录的年鉴覆盖了我国国民经济及社会发展的各个领域和地区,已形成较权威的中和反映我国国情地情的信息资源体系。
第一章概说1、文献信息资源,在载体形式上,包括纸质文献和电子资源。
2、一次文献是依据作者本人的研究或研制成果创作的文献,即通常所说的“原始文献”、“第一手资源”。
一次文献在形态上具有多样性,在内容上具有原创性,在出处上具有分散性。
3、二次文献是按一定的方法对一次文献进行整理加工,以使之有序化而形成的文献,主要包括目录、索引、文摘等。
二次文献通常又被称为“检索性文献”、“线索性文献”。
4、三次文献是对大量相关文献进行综合分析而形成的评述研究性文献,如综述、述评等。
三次文献在内容上具有综合性,在功效上具有参考性。
5、传统的文献检索工具体系由印刷版工具书构成。
6、电子化的检索工具是以数据库的形式出现的,数据库类型有数值型数据库、事实型数据库、文献型数据库。
7、部首法首创于东汉时期著名学者许慎的《说文解字》。
8、在现有的电子版检索工具中,检索词主要有两大类:字段词和任意词以数值型数据库、事实型数据库和书目数据库出现的电子版检索工具,检索词是字段词。
以全文数据库出现的电子版检索工具,检索词可以是“任意词”。
9、“循环衍生法”包括定义衍生法、语素衍生法、语境衍生法。
10、现有的中文电子版检索工具一般都设有高级检索功能,较多地使用的检索技术是布尔逻辑检索、截词检索和位置检索,体现出的检索特点是组配检索、模糊检索和限定检索。
11、逻辑“与”(and)符号表示为“*”。
表示“同时包含”关系。
逻辑“或”(or)符号表示为“+”。
表示“分别包含”关系。
逻辑“非”(not)符号表示为“-”。
表示“排除其他”关系。
12、中文检索引擎的检索方式主要有两种:一是分类方式,二是关键词方式。
13、文献信息资源的引证标注有3种情况:注释、引文出处、参考文献。
14、文后参考文献著录的国家标准是1987年5月《文后参考文献著录规则》15、文后参考文献列表可以采用“顺序编码制”,也可以采用“著者——出版年制”。
16、《中国学术期刑(光盘版)检索与评价数据规范》(CAJ-CD规范)用单字母方式标识纸张型参考文献类型,如专著—M、论文集—C、报纸文章—N 、期刊文章—J、学位论文—D、报告—R;用双字母方式标识电子型参考文献和非纸张型载体的电子文献,如数据库—DB,磁带—MT、光盘—CD、联机网络—OL 。
一、河南数字图书馆使用方法(1)点击河南省图书馆网站: 进入河南省图书馆主页面。
(2)在用户登录处填写用户名和密码进入用户登录。
(3)在用户登录成功后,点击“馆外读者入口”或“河南数字图书馆“蓝色部分。
馆外用户:即河南数字图书馆的所有持证读者,当读者在公网比如自己家中上网时,读者可根据读者证号在河南数字图书馆图书馆首页登录,平台根据读者来源到河南数字图书馆自动化管理系统读者库中查询,通过后读者可使用河南数字图书馆的数字资源。
馆内用户:即在河南省图书馆和各地市公共图书馆内上网的读者,通过建立的河南省公共图书馆局域网IP地址列表,采用IP地址认证的方式,IP地址范围内的上网用户可以自动登录。
(4)进入河南数字图书馆页面。
(5)通过相应的登录方式进入资源列表页面后,可采取两种检索方式对数据库进行使用。
一是可通过“一键检索”跨库检索,所有数据库检索到的不同载体资源将会列表显示。
二是可根据自己想要查找的内容进入相应数据库,根据每个数据库的检索方式进行检索、浏览、下载。
在使用数据库时,部分数据库需通过相应的专门阅读器进行阅读,如果用户电脑没有安装相应的阅读器,请根据提示,下载安装后即可阅览。
二、河南数字图书馆数据库使用指南2.1 博看畅销期刊数据库博看畅销期刊数据库作为目前全球第一中文报刊网,收录了3000多种40000多本畅销期刊杂志,我们经常订阅的杂志几乎都囊括其中。
博看网内容丰富,涵盖面广,每天更新70-100本杂志,每年可以增加20000本以上。
新刊上线时间基本上与纸版杂志上市时间同步。
所有的过刊仍然都保存,可以采取与现刊同样的方式阅读。
博看网除了有原文原貌的多媒体版,还提供电子版、语音版、下载版等多种阅读方式以满足不同读者的需求。
博看数据库的阅读界面像一本翻开的杂志,在当前页面上左击鼠标可放大阅读,再左击鼠标又缩回到原来的比例;在界面左侧右击往前翻页,右侧右击往后翻页;在放大的界面翻页亦是如此。
放大阅读前,在阅读界面右上方,有“单页放大”框,在这种状态下点击左键,可以单页放大;点击“单页放大”,更换为“双页放大”,这时再点击左键放大,即可同时放大两页阅读。
第一、二章定义:(1)信息P3 广义:信息源于世界一切事物及其运动,它是事物存在状态及其运动形式的特征;狭义:信息是人们对事物存在状态及运动形式的陈述,它常以语言、文字、图形、数据等形式表现出来,供人们传递处理和利用。
(2)文献(记录有知识的一切载体) (3)信息检索P49 :就是根据一定的需要,运用科学的方法利用检索工具或参考工具书。
从大量的信息集合中查找特定的信息或信息线索的过程。
(4)信息检索语言:是指用来描述、组织信息记录,进行信息检索的标志系统知识点:信息的分类(按加工深度分)P6一次文献信息:一切原始的信息包括决议、报告、记录、心得、经验、消息、创作和研究成果等二次文献信息:对原始文献信息加工处理后的信息包括卡片、目录、索引、文摘等检索工具书三次文献信息:通过二次文献信息提供的线索多某一范围内的一次信息进行分析研究而加工成的第三个层次的文献信息包括手册、百科全书、年鉴、名录、指南等参考工具书(能区别,能举例)文献检索分类:P49按检索方式分:手工检索机器检索按检索对象分:文献检索事实检索数据检索文献检索如:查找“会计电算化在企业中的应用”方面的信息或文章。
事实检索如:禽流感最早出现在哪些国家数据检索如:某一年我国的自然出生人数和死亡人数。
(注:多出现在填空、选择、判断题,要会举例,会区别)信息检索主要方法:P51-521)顺查法(时间上,远→近)如撰写中国收税史的问题,就是需要从古代、近代、现代和当代各种有关信息中柱期查找才能查全常用法:2)逆查法(时间上,近→远)3)抽查法(抽查一定时期的资料)例如如果要获取电子计算机的有关信息,只要把目光聚集到20世纪40年代以来的数十年时间就可以了。
追溯法;循环法:信息检索效果评价P53查全率查准率漏检率误检率响应时间输出方式5、检索语言按基本属性分为P57分类检索语言(在我国,分类检索语言以《中国图书馆分类法》为代表)主题检索语言《中图法》知识:P60-61将所有知识分为五个基本部类:马克思主义、列宁主义、毛泽东思想、邓小平理论部类;哲学、宗教部类;社会科学部类;自然科学部类;综合性图书部类。
第五章报刊资源与论文资料的查考第一节数字化报刊资源及其检索系统20世纪90年代中期以来,中国报刊资源及其检索工具数字化、网络化的进展迅速。
具体表现,一方面是一些传统的、影响大的印刷版报刊资源检索工具大都实现了数字化、网络化,形成了电子版与印刷版并存的局面;另一方面,出现了一批脱离印刷形态而基于计算机和网络环境的报刊资源检索系统。
到目前为止,查考20世纪80年代以后的中国报刊资源,完全或主要依靠电子版检索工具已经基本上可以满足需要。
一、中国期刊全文数据库(CJFD)清华大学开发研制的“中国期刊全文数据库”是目前国内有代表性的报刊资源检索系统之一。
该系统1996年开始投入使用,目前有光盘版(简称“CAJ—CD”)和网络版(简称“中国期刊网”)两种形式。
全文数据库收录国内6000多种核心与专业特色中英文期刊的全文。
到2004年初,已经积累了1994年至今的全文文献800多万篇,题录1500万余条,分9大专辑,126个专题文献数据库,被称为是“目前世界上最大的连续动态更新的中国期刊全文数据库”。
全文数据库的网络版通过CNKI知识网络服务平台系统建立了中国期刊网镜像站点,经过授权后,为通过互联网的使用者提供网上检索服务。
网络版数据每日更新。
全文数据库的光盘版每月每专辑出版一期(文史哲双月出版),与印刷版期刊基本同步发行,被称为是“当今世界上最大的集成化全文电子期刊”。
中国期刊全文数据库划分的9个专辑是:·理工A辑(数理科学)·理工B辑(化学化工能源与材料)·理工C辑(一般工业技术)·农业辑·医药卫生辑·文史哲辑·经济政治与法律辑·教育与社会科学辑·电子技术及信息科学辑中国期刊全文数据库网络版的基本使用方法是:论文资料检索→论文资料下载→使用专用阅读器阅览。
数据库的主要功能包括:(1)基本检索以字段词作为检索词进行检索。
该数据库系统目前为文献确立的字段包括:·篇名·作者·关键词·机构·中文摘要·引文·基金·全文·中文刊名·ISSN ·年·期·主题词在进行基本检索时,可以作两方面的限定:一是检索时限限定(1994年~目前),二是检索结果的排序方式限定。
排序方式有3种:一是不限定排序方式,二是限定按相关度排序,三是限定按文献的发表时间排序。
三是每页记录条数的限定,即对显示界面容纳内容的限定。
检索结果可以直接显示的,首先是命中文献的题名列表;点击题名,可以直接显示文献的内容提要。
若要阅读全文,需要点击文献提要栏内的“下载”标记,将文献下载保存到计算机磁盘,在计算机已安装专用阅读器阅读“Cajviewer”的情况下(专用阅读器可以随时下载安装),便可即时阅读。
例如,查考张岱年先生发表的有关“国学研究方法”的论文,基本过程如图5.1.1。
(2)类聚检索数据库中与命中文献有相关关系论文的链接检索。
包括:·同类文献。
数据库中与命中文献性质相同的论文。
·引用文献。
命中文献引用过的数据库中的文献。
·被引用文献。
命中文献被数据库中的文献引用的情况。
图5.1.2是《经济全球化与中国文化发展的道路》一文的同类文献检索结果。
类聚检索功能的设立,为相关文献源的拓展和文献的定量分析提供了方便。
(3)二次检索以字段词在检索结果中进行再次检索。
在上面的图 5.1.1中,以作者“张岱年”、时间“1994~2004”为检索条件,命中结果有91篇文献。
在这一结果中,以“国学”为篇名字段词进行二次检索,命中的结果缩小为3篇。
查准率大为提高。
(4)高级检索该系统的“高级检索”即布尔逻辑检索,可以进行不同字段检索词的逻辑“与”、逻辑“或“、逻辑“非”的组配检索。
图5.1.3以相同的字段检索词进行了不同的逻辑组配,检索结果不一样。
(5)全文检索以任意词为检索词对数据库中所有文献全文的检索。
全文检索可以在基本检索界面内进行,也可以将检索条件组配起来在“高级检索”界面内进行。
图5.1.4是将全文任意词“天人合一”、“机构”字段词“北京大学”和“中文刊名”字段词“北京大学学报”以逻辑“与”组配以后进行检索。
图5.1.3(6)检索词字典在高级检索界面提供作者、关键词、机构、基金、中文刊名、主题词6个检索词字典。
检索词字典是具有检索功能的检索词列表。
它将数据库收录的文献的相关字段按一定顺序加以排列,并具有快速检索和自动添加到检索界面的功能。
使用检索词字典,便于浏览数据库包含的相关检索词,也便于准确选择、快速添加需要的检索词。
如图5.1.5 是在“关键词”检索词字典中检索与“信息检索”相关的关键词。
如果确定用于检索的关键词是“社科信息检索”,只要点击该词,则自动切换到高级检索界面,并且检索词被自动添加到相应的文本框内。
图5.1.4图5.1.5二、中文科技期刊全文数据库这是国内另一个有代表性的大规模数字化期刊全文检索系统。
由重庆维普资讯公司开发,习惯上简称为“重庆维普”。
重庆维普资讯有限公司是科技部西南信息中心下属的一家大型的专业化数据公司,是我国较早开展中文资源数据库研制开发的单位之一。
早在1989年,重庆维普就开发出了软盘版的“中文科技期刊数据库”,90年代初,实现了产品的光盘化,90年代末又推出了网络版产品。
目前,数据库产品有有全文版、文摘版和引文版3种。
中文科技期刊全文数据库入库期刊达8000多种,涉及的时限从1989年开始至今,积累的数字化期刊文献近800万篇。
数据库覆盖的学科范围,分为自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报7个专辑,27个专题。
专题细目如下:该数据库的主要特点是,入库期刊数量多,时间跨度长;覆盖的学科范围以自然科学、工程技术、管理学科为主;不能提供全文数据的资源较同类数据库相对较少。
数据库的使用方法和“中国期刊网”基本相同,也是需要安装专用阅读器才能进行全文阅读。
数据库的主要功能和使用方法如下:(1)分类检索该数据库有比较强大的分类检索功能。
分类表镶嵌于数据库首页。
点击类目名称,分类体系逐层展开,直至相应的篇目列表。
(2)高级检索即不同检索字段的逻辑组配检索。
可选字段共有9个,分别是:关键词、刊名、作者、第一作者、机构、题名、文摘、分类号和任意字段。
同时可以进行检索限定,包括学科范围限定、期刊范围限定(“全部期刊”、“重要期刊”或“核心期刊”)、查找时限限定。
高级检索是该数据库的主要检索途径。
(3)传统检索在中文科技期刊全文数据库中,所谓“传统检索”实际上是一个具有综合检索功能的界面,如图5.1.6。
在这个界面中,单个检索词的简单检索、多个检索词的逻辑组配检索、二次检索等都可以进行,也可以进行期刊范围、检索时限的限定。
值得注意的是以下3种检索方法。
·整刊检索即以刊物为单位,查考该刊物每一期所发表的文章。
通过点击“中刊库分类导航”和“中刊库刊名导航”列表,都可以实现这一功能。
这一功能,为了解某一刊物的整体面貌提供了方便。
·关键词字段的同义词扩展。
在“检索入口”选择“关键词”字段的前提下,选中“同义词”选项,如果数据库的同义词表中有该检索词的同义词,就会自动显示,供选择添加。
如图5.1.7,输入的关键词是“电脑”,显示的同义词是“计算机”、“微电脑”,选择添加“计算机”,查考结果就是数据库中所有关键词包含了“电脑”和“计算机”的文献。
关键词的同义词扩展,是实现智能化检索的重要手段,对确保查全率有重要意义。
图5.1.6·作者字段的同姓名区分。
这一功能的原理与同义词扩展类似,是用来对数据库中涉及的同姓名作者加以区分的。
在“检索入口”选择“作者”或“第一作者”的前提下,选中“同名作者”选项,如果输入的作者有同名,系统自动显示同名作者列表,以供选择。
如图5.1.8,是名为“张红”的同姓名作者列表。
通过列表提供的作者单位信息,就可以准确地选择目标作者。
这一功能对缩小检索范围、提高查准率有重要意义。
图5.1.8三、CGRS全文检索系统天宇资讯开发的“CGRS全文检索系统”是以中国人民大学书报资料中心编辑的《复印报刊资料》和《报刊资料索引》为主要内容的网络版报刊资源检索系统,习惯上简称为“人大报刊检索系统”。
复印报刊资料是一种在国内人文社科领域影响较大的报刊资源检索工具。
目前选收范围为全国3000多种公开出版发行的报刊,划分为100多个专题。
印刷版按专题主要以月刊和双月刊的周期出版。
《复印报刊资料》的内容是分专题选录报刊论文的原文和篇目出处。
“原文”部分,全文影印各专题范围内的重要论文和重要动态,提供经过选择的原始文献。
选择的基本标准是:含有新观点、新材料、新方法,或具有一定的代表性;反映学术研究或实际工作部门的现状、成就及其发展。
“篇目”部分,全面汇集专题范围内报刊资料的篇目出处,提供的是经过编辑的二次文献。
与同类印刷版检索工具相比,《复印报刊资料》具有鲜明的特点。
在内容上,偏重选收学术性、理论性的资料信息;在编辑形式上,一次文献和二次文献相结合,对研究需求的满足程度较高;专题划分精细,具有较强的针对性。
目前,被《复印报刊资料》全文选收,已经成了国内学术界评价论文质量的基本指标之一。
报刊资料索引是一种以年度为单位分类揭示报刊论文资料出处的线索型检索工具。
它和《复印报刊资料》关系密切——包括了《复印报刊资料》全年各期全文复印及仅列论文篇目出处的全部篇目;但又不完全相同——《报刊资料索引》还收录了《复印报刊资料》限于篇幅而未能反映的篇目。
所以,《报刊资料索引》所揭示的篇目总数大于《复印报刊资料》年度各期篇目之和。
印刷版的《报刊资料索引》按学科、专题分7册编辑出版,另有著者索引1册。
网络版“CGRS全文检索系统”中的“人大全文数据库”是《复印报刊资料》的数字化形式,截至2004年初,收录1995年~2003年间的全文文献近20多万篇;“人大索引类”数据库是《报刊资料索引》的数字化形式,截至2004年初,收录1978年~2002年间的论文题录280多万条。
除上述两部分主体内容外,该系统平台还包括了如下几种数据库:·中国法律法规数据库,收录法律、法规、规范性文件5万多件;·诉讼法索引及全文数据库,收录文献2万多篇;·民事诉讼法学数据库,收录文献600多篇;·中国法律年鉴1987—2002年卷全文数据库;·《文史哲》杂志1951—2002年全文数据库。
CGRS全文检索系统的基本查询是以任意词作检索词进行全文检索,检索的对象数据库可以根据需要选定。
图5.1.9是基本查询的一个过程。