第3章 信息著录和标引解剖
- 格式:ppt
- 大小:2.52 MB
- 文档页数:96
档案分类与著录标引档案分类与著录标引一、档案分类的概念及其意义二、档案著录标引三、档案实体分类四、档案分类方案的编制档案事业及其构成广义档案工作包括档案管理工作、档案行政管理工作、档案教育工作、档案科学研究工作、档案宣传工作、档案国际合作与交流工作等。
档案管理工作:档案收集(接收、征集)—整理(分类、有序化)—鉴定(内容、价值、技术状况)—编目与检索—保管—统计—编辑与研究—利用(查询服务、举办展览)一、档案分类的概念及其意义(一)概念1、类和分类类就是具有共同特征的个体集合。
分类即根据事物的异与同,按照一定的标准将其区分开来。
2、档案分类档案分类即根据档案内容和形式的异同,按照一定的分类原则和方法,使用一定的分类标准,对档案进行划分。
3、全宗全宗是一个独立的机关、组织或个人在社会活动形成的全部档案构成的有机整体。
基本含义:(1)全宗是一个有机整体。
(2)全宗是在一定的历史活动中形成的。
(3)全宗是以一定的社会单位为基础而构成的。
全宗类型:组织全宗、人物全宗两种。
全宗形式:独立全宗、联合全宗、全宗汇集、档案汇集四种。
4、立档单位形成档案全宗的单位,又称“全宗形成者”。
一个独立从事活动的机关、组织(或个人)就是一个立档单位,一个立档单位形成的全部档案就构成一个全宗。
构成立档单位的条件:(1)能够依法独立地进行工作、生产、经营、科研、教学等社会职能活动,单独行使相应的职权,并能主要以自已的名义单独对外行文。
(2)设有管理人事的机构或人员,并有一定的人事任免、奖惩权。
(3)设有会计单位或经济核算单位,自己可以编制预算或财务计划。
(二)分类的意义分类是档案整理的核心内容和重要的基础性工作,是档案标准化、规范化工作的具体体现。
通过对浩繁杂乱的档案文件,分门别类,组合成保管单位,固定排列顺序,实现档案的有序化,可以给排架提供依据,为档案检索提供有利条件。
在应用计算机等现代化管理手段中,分类也是一个重要的基础。
信息著录与信息标引一、什么是信息著录1、定义。
“文献是记录有知识的一切载体。
著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。
著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。
”通常意义上讲的著录就是指,按照某种标准化的格式和要求(如MARC),对文献的某些被规定的特征进行描述(如责任者、题名、出版社等),形成一条一条的信息描述项,最后著录的结果就是一条关于该信息资源的书目数据记录。
2.主要类型。
信息著录就是按照某种规则揭示某一信息资源的主要特征,给出信息资源的缩影。
因此对所有的信息资源类型都可以进行著录。
录音资料、电影与录像资料、微缩品、测绘制图资料、电子资源都可以进行著录,但最早也是最普遍的著录形式还是纸质书籍的著录。
3、信息著录的主要方式。
以图书的著录为例。
为了更好的实现信息资源的共享,著录时通常是遵循统一的格式,如,最常见的MARC。
MARC会给出所要著录的款目、使用的符号和代码、著录的格式、著录款目的顺序以及特殊情况下的处理方式(如多责任者、多语种、信息不详、信息明显错误等)。
编目人员要做的就是按照规定,使用受控的语言,逐条填写个款目的内容。
(当然有些款目是不必要填写的,也有相应规定。
)图一、图二给出了MARC工作界面的截图和一条完成的书目记录。
二、信息著录的意义。
1、信息组织的意义。
信息著录是信息组织的一种具体的方法,信息组织实现的意义也就是其所有具体方法的意义,当然也包括信息著录。
信息组织是使无序信息有序化的过程,起最终目的是使主体(人)能够“更好”的利用信息。
这里的“更好”包括更加方便、快捷的检索信息、准确定位所需的特定信息、获得最有价值的信息等,这些也都是信息著录可以实现的效果。
2、信息著录本身的意义。
除了信息著录作为信息组织的具体方式而具有的普遍的意义,它作为一种区别于其他信息组织方式的具体的方法,同时具有它本身的特殊功能。
信息著录所要解决的问题是揭示某一信息整体的、完整的、概要的特征,既包括外在的信息载体的特征的揭示,也包括内在的信息内容特征的揭示。
◆◆_______
◆
____________________________________
◆
____
◆◆◆第二章 文献信息检索基础知识
·11·
分时共同使用的表。
《中图法》的复分表分为:①总论复分表;②世界地区复分表;③中国地区表;④国际时代表;⑤中国时代表;⑥世界种族与民族表;⑦中国民族表;⑧通用时间、地点表。
例如,《英国油画集》为J233(561),“(561)”为英国复分号,《近二年来的肿瘤疗法经验》为R730.5=5,“=5”为时间复分号。
《中图法》整体结构示意图如图2-2所示。
图2-2 《中图法》整体结构示意图
《中图法》的作用有如下几个。
①组织文献排架。
文献的分类号作为排架的依据。
图书馆的文献资料多的有几百上千万册,少的也有十几万册,怎样把这些文献有规律地排放在书架上,还要便于读者查找呢?《中图法》分类体系能够解决这个问题。
我国大多数的图书馆都使用《中图法》来组织文献的排架。
②编制检索系统。
我国大部分的检索系统都具备分类索引。
③通用性。
《中图法》在我国图书情报领域是通用的。
第三节文献的著录和标引
一、文献的著录
1.文献著录的含义
文献著录是指将文献的外部特征和内部特征分析出来,并采用一定的方式将这些特征连接在一起,形成原文的代替品。
这一过程称为文献著录。
文献著录的结果形成条目。
文档一体化系统的数据准备-一著录与标引5 . 1 著录与标引的含义著录是对文件或档案的内容特征和形式特征进行分析、选择和记录的过程。
著录包括著和录两个方面。
著,即标引。
标引是在文件或档案的加工、存贮和检索过程中,将其内容主题的自然语言,转换成规范化的检索语言的过程,标引是针对内容特征而言的。
录,即抄录。
抄录是将文件或档案的形式特征,如作者、时间、文号等照录在著录条目上。
标引使用的是规范化的人工语言,而抄录使用的是文件或档案固有的自然语言。
标引是著录的核心部份,通过标引,使文件或档案的内容信息形成检索标识,管理自动化系统才具有管理和检索功能。
在手工系统中,对文件进行著录,即形成文件登记表或登记卡片,对档案进行著录,即形成各种形式的档案目录。
在管理自动化系统中,文书及档案的著录过程与手工系统仍然是相似的,但它已减少了许多的重复性工作,使著录与标引的效率大为提高。
特别是象S L W S 等将文书及档案的管理合二为一的系统,由于在文书管理阶段即对所发生的文件即时进行了著录,从而,使文件归档时著录工作量大为减少。
在管理自动化系统中,对文件和档案的管理,是通过对文件和档案数据库的管理来实现的。
而数据库的建立,又必须依赖于著录项目的输人。
也就是说,没有这种输入,自动化管理就无从谈起。
这也是我们把著录和标引称为管理自动化系统的数据准备或前处理工作的原因。
著录的质量,直接影响到自动化系统的应用水平。
现在的计算机还不会判断这些特征数据的质量,就如我们常说的,“输入的是垃圾,输出的也是垃圾”著录与标引的工作质量,可以概括为对内容特征和形式特征进行描述及给予检索标识的正确性与全面性程度。
影响著录与标引的正确性和全面性的主要原因有以下几点:(1)主题分析不正确,析出的主题与实际内容不符。
(2)主题分析不充分或无控制,析出的主题少于或多于文件和档案有参考价值的实际内容。
(3)给出的标识符号与主题概念不符,即标识错误或组配错误等。
信息著录与信息标引信息著录与信息标引当今我们正处于一个信息爆炸的时代。
此时信息呈现出几大特点,一是数量多,增长快,尤其是在网络环境下,这一特点表现得更加突出。
例如清华同方的《中国期刊全文数据库》,通过对2006年11月28~30日3天该数据库公布的新增论文数量的统计,平均每天增长23228篇。
由此可见,网络环境下,文献信息资源的数量非常庞大且增长速度惊人。
[1]二是新词层出不穷,据中国语言文字工作委员会做过的一个保守统计,平均每年产生800多个新词语。
[2]在这种资源种类纷繁复杂,标准不一,十分不方便用户使用的情况下。
要有一个方法来描述信息资源是非常必要的,否则,用户在未浏览完信息而只看其外在形式的情况下,是无法了解信息的概况,以判断信息资源是否符合自己的需要的。
因此,信息的著录就显得尤为重要。
著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。
[3]有了信息的著录,用户就可以在未读过文献的情况下,浏览信息著录的结果——款目或目录来对文献信息进行大致了解。
随着信息数量的急剧增多,信息著录的标准化和自动化也越来越成为信息著录的发展方向,其将使得用户在使用信息的款目和目录时更加地快捷和准确。
由此我国也在2004年出版了最新的《新编中国机读目录格式使用手册》,下面就以其为范例对什么是信息著录进行一个解释。
由于《新编中国机读目录格式使用手册》设置了184个字段,我们将主要介绍其数据字段区的常用字段。
如美国作家丹·布朗的小说《数字城堡》,我们要著录这本文献,首先是其001记录控制号:0120********其中0表示受编文献为普通图书,1表示受编文献语种为中文,20**为编目的年(由编目时间决定),******为编目流水号(视具体编目时的顺序决定)。
其次为010国际标准书号和011国际标准连续出版物号字段:010##$a7-02-004814-5$dCNY25.00(由于其不是连续出版物,所以不用011国际标准连续出版物号字段)其中010##表示这是010字段,$a7-02-004814-5表示其ISBN 号,$dCNY25.00表示其定价为人民币25元。
第三章信息著录和标引3.1信息著录的含义和标准一、信息著录的含义信息著录:简称著录,指在组织检索系统时对文献内容和形式特征进行选择和记录的过程。
著录对象是信息,著录结果是款目或记录。
款目:指依据一定的标准方法,对一种文献或信息源的内容价值物质形态进行描述而形成的一条记录。
款目由一条条著录项目组成。
著录项目:用于揭示文献内容和形式特征的记录事项。
信息著录的基本要求:①准确性。
要求著录结果准确全面客观的揭示文献或其它信息源的内容特征或形式特征②规范化。
要求信息著录坚持标准化原则,按照统一的著录项目,著录格式,标识符号进行著录。
二、信息著录的作用1、揭示功能:信息著录主要反映的是文献本身的特征,通过对文献全面系统的分析,揭示出其内容特征和形式特征,将其浓缩于只言片语中,从而表达文献的基本信息。
2、组织功能:信息著录后形成的款目或记录,是编制目录的基础,也是组织数据库数据的基本单元。
文献编目包括信息著录和目录组织两步。
信息著录是对文献内容特征形式特征进行选择记录后形成款目或记录。
目录组织是将这些款目或记录按照一定组织规则编排在一起最终形成检索工具或数据库。
3、检索功能:存储是检索的第一个阶段,即将表达文献特征的有检索意义的标识通过记录组织成手工检索工具或计算机数据库,而表达文献特征的标识需要通过著录和标引来完成。
作为信息著录结果的款目或记录,记载了表达文献特征的各种标识。
三、信息著录的标准《文献著录总则》旨在根据各种类型文献的共同特点,确定文献著录原则、内容、标识符号、格式等的统一规定。
具有指导作用为信息著录提供原则性框架,并不作为文献著录的直接依据。
1、著录项目:①题名与责任者项②版本项③文献特殊细节项④出版发行项⑤载体形态项⑥丛编项⑦附注项⑧文献标准编号及有关记载项⑨提要项2、著录级次:著录文献的详简程度,分为三级:①简要级次,款目仅著录主要项目②基本级次,著录主要项目同时还著录部分选择项目③详细级次,著录全部主要项目和全部选择项目。
知识要点第一章绪论1、什么是信息组织?其成果包括哪些?(了解)2、信息组织的发展阶段(了解)第二章信息组织的形式与类型1、信息组织的主要内容(即步骤)2、什么是著录、标引?3、信息的外表特征、内容特征分别包括哪些?4、信息存取系统的类型和结构5、衡量检索效率的指标6、信息组织的类型(重点、理解)第三章元数据信息描述1、什么是元数据?(了解)3、什么是MARC、MARC元数据?4、MARC中856字段的用途5、什么是DC?DC包括几个核心元素?第四章信息揭示与标引(重点)1、信息标引的类型2、什么是索取号?由什么组成?3、几种主要多媒体数据标引方法的基本原理4、什么是自然语言?什么是受控语言?自然语言区别于受控语言的特点有哪些?5、自然语言组织的类型6、什么是全文检索7、自动标引中影响标引词选择的因素有哪些?涉及的主要技术有哪些?8、自动标引的方法有哪些?其基本思想是什么9、汉语自动分词的方法第五章信息存储与排序1、信息存储的类型(理解)2、从形式特征、内容特征、效用特征三个方面对信息排序的方法分别包括哪些?(理解)第七章分类组织系统(重点)1、什么是分类法?包括哪些类型?2、什么是体系分类法?其主要代表有哪些?3、什么是组配式分类法?其主要代表有哪些?4、什么是体系-组配式分类法?其主要代表有哪些?5、分类法中基本标记符号包括哪些类型?6、常用标记制度包括哪些?7、《中图法》、《科图法》、《DDC》、《UDC》分别采用什么标记符号和标记制度?第八章主题组织系统(重点)1、什么是主题法?主题法有什么特点?2、主题法包括哪些类型?3、主题法参照系统的构成4、几种代表性主题法中哪些是自然语言,哪些是人工语言?5、主题法和分类法的比较6、什么是范畴索引、词族索引?7、什么是后控制?8、如何利用主题组织对搜索引擎进行改造第十章网络信息组织(重点)1、数据挖掘技术在信息组织中的应用2、什么是SGML、XML?具有哪些特性和优势?3、什么是元搜索引擎4、搜索引擎的结构5、搜索引擎对搜索结果进行排序的依据6、搜索引擎的发展趋势选择:16×1.5=24分判断:8×1=8分名词解释:4×3=12分简答:4×8=32分论述:2×12=24分。