一机读目录格式MARCPowerPointPre
- 格式:pptx
- 大小:173.09 KB
- 文档页数:29
中文图书机读目录数据(MARC)处理细则中文图书机读目录数据(MARC)处理细则前言本手册为中文图书机读目录数据处理细则的简化版,主要使用对象是本系统内初期建立中文图书机读目录的工作人员。
本文编写是以中华人民共和国国家标准《文献著录总则》(GB3792.1)、《普通图书著录规则》(GB3792.2)为依据,同时参照了《国际标准书目著录》(ISBD)相关内容及《中国文献编目规则》(广东人民出版社 1996年出版)等文献。
机读目录格式是以《中国机读目录格式》(WH/T0503-96)为依据,并按字段标识号顺序叙述。
本手册未做详细叙述的部分请参照上述所列的国家及国际标准。
填写各功能块的信息源著录信息源来自文献本身,如文献本身信息不足时,可参考其它资料。
取自文献本身以外的著录信息或编目员自拟的著录信息均须加方括号。
与所著录文献具有永久性联系的信息源优先于仅有临时性联系或易失的信息源。
中文图书著录项目的规定信息源如下:著录项目规定信息源书名与责任说明项书名页或版权页、封面版本项版权页或书名页、封面、出版说明等处出版发行项版权页或书名页、封面、出版说明等处载体形态项整部图书及附件丛书项整部图书附注项任何信息源标准编号与获得方式项任何信息源常用名词术语1、字段:由字段标识符标识的被定义的字符串,它可以包含一个或多个子字段。
2、可变长安段:长度不定的字段,字段长度因字段描述的内容不同而变化。
3、固定长字段:长度固定的字段,字段长度不因字段描述的内容不同而变化。
4、必备字段:机读目录必需具有的字段。
5、可重复性:表示字段可以在一条机读目录中重复使用。
6、字段标识符:用于识别各个字段的三位数字,也称字段号。
7、字段指示符:与变长字段联用的字符,形式为数字或字母。
提供有关字段内容、字段间的关系等及一些附加信息。
8、子字段:字段内所定义的数据单元。
9、子字段标识符:由两个字符组成的代码,用以识别变长字段中的不同子字段。
MARC数据基本知识MARC简介机读目录是机器可读目录的简称,英文为Machine-Readable Catalogue,简写为MARC。
是计算机编目的产品。
它是以代码形式和特定格式结构记录在计算机存贮载体上,能够被计算机识别并编辑输出书目信息的目录形式。
机读目录最早产生于美国。
1961年,美国国会图书馆开始图书馆自动化的设想,随着计算机技术的进步,1963年,美国国会图书馆组织了在内部工作中采用电子计算机技术的可行性调查,1966年1月,产生了《标准机器能读目录款式的建议》,即MARC-1格式,1967年提出MARC-2,它是目前使用的各种机读目录格式的母本。
1969年开始向全国发行MARCII格式书目磁带,并将MARCII格式称为US- MARC,即美国机器可读目录。
作为一种计算机技术发展早期形成的数据格式,这一格式在定义时比较充分地照顾到图书馆书目数据在文献形式描述、内容描述、检索等方面的需要,表现为:字段数量多;著录详尽;可检索字段多;定长与不定长字段结合,灵活实用;保留主要款目及传统编目的特点;扩充修改功能强;并能在实践中不断发展完善。
美国机读目录适合美国国情,英法等国家根据各自情况创建了自己的机读目录,为了进一步协调、促进国际交流,统一各国机读目录格式,国际图书馆联合会在USMARC基础上制订了“国际机读目录通信格式”,即UNIMARC,现在许多国家都采用UNIMARC进行文献编目。
CNMARC简介CNMARC是中国机读目录(China Machine-Readable Catalogue)的缩写,是用于中国国家书目机构同其它国家书目机构以及中国国内图书馆与情报部门之间,以标准的计算机可读形式交换书目信息。
中国机读目录研制于20世纪70年代。
1979年成立了全国信息与文献标准化技术委员会,成立北京地区机读目录研制小组;1982年,中国标准总局公布了参照ISO2709制定的国家标准《文献目录信息交换用磁带格式》(GB2901-82),为中文MARC格式的标准化奠定了基础;1986年UNIMARC 中译本面世。
机读目录格式图书、期刊及光盘的著录方法一、中文图书(一)著录原则按照《普通图书著录规则》(GB3792.2-85)(二)著录内容(1) 001字段(控制记录)010******* 系统可自动生成(2) 010字段@a:ISBN号@b:装订形式(平装可省) @d:CNY:单价(人民币)(3) 100字段处理数据项自动生成。
(4) 101字段作品语种项一般只要求@正文语种项。
(5) 102字段出版国别项@a出版国代码,$b出版地区代码。
(6) 105字段编码数据项一般由系统格式所定。
(7) 106字段形态特征项@a物理形式标识。
常用"r",一般印刷品。
(8) 200字段题名责任项@a:正题名@d:并列正题名@e副题名@f第一责任者@g其它责任者@h分册(辑)号@i分册(辑)名@v卷册号标识。
(9) 205字段版本项@a版次说明(第一可省略)。
(10) 210字段出版发行项@a出版发行地@c出版发行者名称@d 出版发行日期。
(11) 215字段载体形态项@a页数或卷册数@c图表及其它细节@d尺寸或开本。
(12) 225字段丛编项@a正丛编题名@f丛编责任者@v卷标识。
(13) 300字段一般附注项除已有专门附注字段以外的信息,均入此字段,@a附注内容,例:@高等学校教材(14) 303字段著录附注项@a(15) 304字段题名附注项@a本书主编为:××、×××;副主编为:××、×××。
(16) 314字段责任附注项即对著者的说明。
@a张山[1996-],博士,四川农业大学动物医学教授(17) 330字段摘要文摘项即对全书的内容做一概述。
@a本书主要介绍了......(18) 461字段丛编主要用来连接图书所属的丛编的有关信息。
(19) 510字段并列题名项@a(20) 517字段其他题名项@a(21) 606字段普通主题项@a主标目@x主题复分@y地区复分@z 年代复分。
中国机读目录格式说明【记录头标】记录头标是按照ISO 2709的规定设立的。
它包括处理记录时可能需要的有关记录的一般性信息。
整个头标区固定为24个字符长,由固定长数据元素组成,这些数据元素通过字符位置来标识。
固定长数据一览表数据元素名称字符数字符位置(1)记录长度 5 0-4(2)记录状态 1 5(3)执行代码 4 6-9(4)指示符长度 1 10(5)子字段标识符长度 1 11(6)数据基地址 5 12-16(7)记录附加定义 3 17-19(8)地址目次结构 4 20-23(1)记录长度:………………………………头标区…………5个十进制数。
右边对齐,不足5个数字时用零补齐。
本域由软件产生,用户不能修改。
(2)记录状态:………………………………头标区…………代码:c=修改过的记录d=删除的记录n=新记录o=曾为较高层次记录p=曾为不完整的预编记录(3)执行代码:………………………………头标区…………(a)记录类型,1字符代码: a=印刷的文字资料b=手稿性的文字资料(b)书目级别,1字符代码: m=单行本─专著或多卷集。
s=连续出版物─连续发行并趋向无限期连续发行的出版物。
a=分析性资料─物理上包含在另一种资料里的一种资料,它是另一种资料的组成部分。
c=汇编性著作─人为配套的著作集。
(c)层次等级代码,1字符:表示记录和其它记录有层次连接关系,说明在层次中的相对位置以及记录与同一文件中其它记录的从属关系。
代码:空格=层次关系未定0=无层次关系1=最高层记录2=低层次记录(在最高层以下的记录)(d)未定义,空格(4)指示符长度:………………………………头标区…………表示指示符长度的1位十进制数字,CN-MARC格式为2。
用户不可修改。
(5)子字段标识符长度:………………………………头标区…………表示子字段标识符长度的1位十进制数字,CN-MARC格式为2。
用户不可修改。
(6)数据基地址:………………………………头标区…………占5个字符位,用十进制数表示。
图书、期刊及光盘的著录方法一、中文图书(一)著录原则按照《普通图书著录规则》(GB3792.2-85)(二)著录内容(1) 001字段(控制记录)010******* 系统可自动生成(2) 010字段@a:ISBN号@b:装订形式(平装可省) @d:CNY:单价(人民币)(3) 100字段处理数据项自动生成。
(4) 101字段作品语种项一般只要求@正文语种项。
(5) 102字段出版国别项@a出版国代码,$b出版地区代码。
(6) 105字段编码数据项一般由系统格式所定。
(7) 106字段形态特征项@a物理形式标识。
常用"r",一般印刷品。
(8) 200字段题名责任项@a:正题名@d:并列正题名@e副题名@f第一责任者@g其它责任者@h分册(辑)号@i分册(辑)名@v卷册号标识。
(9) 205字段版本项@a版次说明(第一可省略)。
(10) 210字段出版发行项@a出版发行地@c出版发行者名称@d出版发行日期。
(11) 215字段载体形态项@a页数或卷册数@c图表及其它细节@d尺寸或开本。
(12) 225字段丛编项@a正丛编题名@f丛编责任者@v卷标识。
(13) 300字段一般附注项除已有专门附注字段以外的信息,均入此字段,@a附注内容,例:@高等学校教材(14) 303字段著录附注项@a(15) 304字段题名附注项@a本书主编为:××、×××;副主编为:××、×××。
(16) 314字段责任附注项即对著者的说明。
@a张山[1996-],博士,四川农业大学动物医学教授(17) 330字段摘要文摘项即对全书的内容做一概述。
@a本书主要介绍了......(18) 461字段丛编主要用来连接图书所属的丛编的有关信息。
(19) 510字段并列题名项@a(20) 517字段其他题名项@a(21) 606字段普通主题项@a主标目@x主题复分@y地区复分@z年代复分。
第一章导言1、信息组织:亦称为信息资源组织,是根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、处理、序化,并以适当的方式加以提供的活动。
2、信息组织的目的:是根据使用需要建立起信息资源收藏系统和检索工具,以便信息资源开发和利用。
作为一种为了检索利用的需要对信息资源进行有序化组织的活动,它是与信息检索活动密切联系的。
3、信息组织与信息检索的关系(P3)(1)信息组织是信息检索的基础和前提。
(2)信息检索是信息组织的出发点和归宿。
总之,信息组织与信息检索是密切联系,相辅相成的两个环节。
要使信息组织取得较好的效果,必须充分了解系统的检索需要,根据信息资源的特点和用户的使用要求加以实施。
4、按照检索工具的对象和特点,可以分为以下类型:(1)文献目录:是以文献集合中的文献单元为对象,对其进行记录、报道与揭示的工具,包括文献收藏和数目。
前者以一个或多个文献单位收藏的文献为对象加以描述和揭示;后者则以某一领域、地域或者时限内出版的文献为对象进行组织,为用户提供较为全面的文献信息。
(2)索引:是以文献集合中的文献单元或者文献中的信息单元为揭示对象的检索工具,包括图书索引、期刊索引、报纸索引、专利索引、标准索引、档案索引、会议文献索引、词语索引、书后索引等。
(3)机读数据库:是由文献资源为对象的机读记录的有序集合。
这是一种依托现代计算机技术,以机读形势建立的索引系统。
(4)网络搜索引擎:这是一种以网络信息资源为研究对象的检索系统,实际上是数据库的一种特殊形式。
5、按照依据的标识特征,检索工具可以分为两种:一类以信息资源的外部特征为检索依据,提供从资源形势出发进行检索的途径。
常见的这类标识包括:责任者名、题名、机构名、出版地、出版社、标准书号、专利号、档案号、文献登录号等。
另一类则以表达信息主题内容标识为依据,提供从内容角度进行检索的途径。
主要有分类法和主题法两种.分类法以表达信息资源内容的标记符号为标识,按照主题之间的关系进行系统组织;主题法直接以表达文献内容的词语为标识,依据主题字顺等方式检索途径。
国家标准《图书馆机读规范格式》编制说明一、工作简况(一)项目来源MARC格式,是随着计算机自动化的不断发展进步,而研制出来的一种计算机可识别和处理的数据格式。
MARC的问世象征着图书馆编目工作由计算机操作替代手工操作,目前已经作为图书馆及情报部门信息资源的交流和交换必不可少的工具。
2002年,国家图书馆基于国际图联1991年出版的UNIMARC/Authorities 起草了《中国机读规范格式》,作为文化行业标准(WH/T15-2002)。
经过十几年的时间,规范控制领域已经有许多新的发展。
国际图联于2009年出版新版《UNIMARC 手册:规范格式(第3版)》(UNIMARC Manual / Authorities Format, 3rd edition),并且很多国家开始试验虚拟国际规范文档,我国应在该领域与国际接轨,制定国家标准,使得提高编目工作更具有统一的规范。
基于这种情况,制定我国《图书馆机读规范格式》国家标准刻不容缓。
由全国图书馆标准化技术委员会申报,2009年《图书馆机读规范格式》正式立项为国家标准制定计划项目,计划项目编号为20091624-T-357。
标准的制定工作从2010年6月开始启动。
(二)编制单位构成本标准的编制单位为国家图书馆、北京大学图书馆、华东师范大学图书馆。
其中图家图书馆顾犇负责前言、引言、定义、格式设计指南、使用指南,毛雅君负责说明性解释、0—标识字段,王洋负责1—编码信息块,王璐负责3—附注块、4—变异检索点,喻菲负责5—相关检索点;北京大学图书馆喻爽爽负责7—其他语言和(或)文字的规范检索点块、8—信息来源块、9—本国使用块;华东师范大学图书馆张期民负责2—规范检索点块。
国家图书馆顾犇和王洋负责整个文档的汇总工作。
(三)主要工作过程标准任务下达后,成立了标准工作组,制订工作计划,明确工作内容、工作目标,并进行工作分工。
具体制定过程如下:(1)翻译《UNIMARC Manual Authorities Format(3rd edition)》。