信息检索教程第3章 信息著录和标引
- 格式:ppt
- 大小:815.00 KB
- 文档页数:33
作业:查询资料什么是著录,什么是标引,并自行制作一份著录标引,可以是手工著录标引,也可以是机读著录标引。
一.什么是著录1.定义在组织检索系统时,对具体信息的各种形式特征、内容特征及物质形态等进行分析、选择和记录的过程。
通常意义上讲的著录就是指,按照某种标准化的格式和要求(如MARC),对文献的某些被规定的特征进行描述(如责任者、题名、出版社等),形成一条一条的信息描述项,最后著录的结果就是一条关于该信息资源的书目数据记录。
2.著录的基本要求(1)准确化:著录的结果要全面、客观、准确地揭示信息资源的内容特征和形式特征;(2)规范化:要求信息著录坚持标准化著录原则,按照统一的著录项目、著录格式、标识符号等进行著录。
3.著录的作用揭示、组织、检索4.信息著录的标准(1)著录法:关于如何进行著录的具体规定和具体做法。
通常包括著录原则、适用范围、著录项目、著录格式、著录来源、著录文字、标识符号以及各个著录项目的具体细则规定。
(2)常用标准英-美编目条例第2版》(AACR2)、《国际标准书目著录》(International Standard Bibliographic Description)…中国的《文献著录总则》(GB3972.1-83)、《西文文献著录条例》、《连续出版物著录规则》(GB3792.3-85)…MARC、USMARC、CNMARC5.著录格式(1)普通图书卡片式款目著录格式正题名=并列题名:副题名及说明题名文字〔文献类型标识〕/第一责任者;其他责任者.·-版次及其它版本形式/与本版有关的责任者· -文献特殊细节·-出版发行地:出版发行者,出版发行日期(印刷地:印刷者,印刷日期)页数及卷册数:图;尺寸或开本+附件·-(丛编名/责任者,国际标准连续出版物编号;丛编编号·附属丛编)附注国际标准书号;中国标准书号(装订):获得方式提要Ⅰ. 题名Ⅱ.责任者Ⅲ. 主题词Ⅳ.分类号实例乱世佳人=Gone with the wind/(美)米切尔(Mitchell,M.著;黄怀仁,朱攸若译.·-杭州:浙江文艺出版社,1991.41034页;20cm本书另有译名:飘ISBN 7-5339-0367-6:¥10.70Ⅰ. 乱…Ⅱ. ①米…②Mitchell③黄…④朱…Ⅲ.长篇小说Ⅳ.I712.45(2)连续出版物卡片式款目著录格式正题名.分册标识,分册题名=并列题名.并列分册题名:其他题名信息/第一责任者,其他责任者.-版本.-卷期年月标识.-出版地:出版者,出版年.-文献数量;其他形态细节;尺寸+附件.-(丛刊题名;丛刊标识)出版周期附注其他题名分类号主题词ISSN=识别题名6.主要类型信息著录就是按照某种规则揭示某一信息资源的主要特征,给出信息资源的缩影。
信息检索第三章信息著录和标引第三章信息著录和标引3.1信息著录的含义和标准一、信息著录的含义信息著录:简称著录,指在组织检索系统时对文献内容和形式特征进行选择和记录的过程。
著录对象是信息,著录结果是款目或记录。
款目:指依据一定的标准方法,对一种文献或信息源的内容价值物质形态进行描述而形成的一条记录。
款目由一条条著录项目组成。
著录项目:用于揭示文献内容和形式特征的记录事项。
信息著录的基本要求:①准确性。
要求著录结果准确全面客观的揭示文献或其它信息源的内容特征或形式特征②规范化。
要求信息著录坚持标准化原则,按照统一的著录项目,著录格式,标识符号进行著录。
二、信息著录的作用1、揭示功能:信息著录主要反映的是文献本身的特征,通过对文献全面系统的分析,揭示出其内容特征和形式特征,将其浓缩于只言片语中,从而表达文献的基本信息。
2、组织功能:信息著录后形成的款目或记录,是编制目录的基础,也是组织数据库数据的基本单元。
文献编目包括信息著录和目录组织两步。
信息著录是对文献内容特征形式特征进行选择记录后形成款目或记录。
目录组织是将这些款目或记录按照一定组织规则编排在一起最终形成检索工具或数据库。
3、检索功能:存储是检索的第一个阶段,即将表达文献特征的有检索意义的标识通过记录组织成手工检索工具或计算机数据库,而表达文献特征的标识需要通过著录和标引来完成。
作为信息著录结果的款目或记录,记载了表达文献特征的各种标识。
三、信息著录的标准《文献著录总则》旨在根据各种类型文献的共同特点,确定文献著录原则、内容、标识符号、格式等的统一规定。
具有指导作用为信息著录提供原则性框架,并不作为文献著录的直接依据。
1、著录项目:①题名与责任者项②版本项③文献特殊细节项④出版发行项⑤载体形态项⑥丛编项⑦附注项⑧文献标准编号及有关记载项⑨提要项2、著录级次:著录文献的详简程度,分为三级:①简要级次,款目仅著录主要项目②基本级次,著录主要项目同时还著录部分选择项目③详细级次,著录全部主要项目和全部选择项目。
01信息检索教程信息检索教程(08⼈⼤版核⼼知识)第1章信息检索基础1. 1 信息概述1. 2 信息检索的概念和原理1. 3 信息检索系统1. 4 信息检索⽅法1. 5 信息检索效果第2章检索语⾔2. 1 检索语⾔概述2. 2 检索语⾔的理论基础2. 3 分类检索语⾔2. 4 主题检索语⾔2. 5 分类主题⼀体化检索语⾔2. 6 ⽹络信息检索语⾔第3章信息著录和标引3. 1 信息著录的含义和标准3. 2 机读⽬录与元数据3. 3 信息标引的含义和步骤3. 4 分类标引和主题标引3. 5 ⾃动标引第4章参考⼯具书概述4. 1 参考⼯具书的概念与特点4. 2 参考⼯具书的种类与排检⽅法4. 3 参考⼯具书的数字化第5章参考⼯具书使⽤5. 1 图书与知识型信息检索5. 2 数据与事实型信息检索第6章计算机信息检索概述6. 1 计算机信息检索的含义和特点6. 2 计算机信息检索策略6. 3 信息检索技术第7章联机检索7. 1 联机检索系统概述7. 2 主要联机检索系统简介第8章光盘检索8. 1 光盘检索系统8. 2 主要光盘数据库选介第9章⽹络信息检索概述9. 1 ⽹络信息资源分布9. 2 ⽹络信息检索原理与⽅法9. 3 ⽹络信息检索相关标准9. 4 ⽹络信息检索发展趋势第10章⽹络信息检索⼯具10. 1 ⽹络信息检索⼯具的发展和类型10. 2 搜索引擎10. 3 ⽹络资源⽬录10. 4 元搜索引擎第11章⽹络数据库检索11. 1 ⽹络数据库概述11. 2 国外⽹络数据库检索⽰例11. 3 中⽂⽹络数据库第12章特种⽂献检索12. 1 科技报告检索12. 2 会议⽂献检索12. 3 学位论⽂检索12. 4 专利⽂献检索12. 5 标准⽂献检索12. 6 档案⽂献检索注:本复习资料以注重基础概念以及实践应⽤的考察⽬标为标准。
其他参考书⽬:《信息检索教程》——刘廷元、邵卫东交通⼤学出版社《信息检索》——马⽂峰国家图书馆出版社《信息组织(第3版)》——马张华清华⼤学出版社《信息描述》——杨⽟麟⾼等教育出版社第1章信息检索基础【本章要点】●解释信息的含义与特征●论述信息的分类●介绍信息检索的概念●阐述信息检索的原理●讨论信息检索系统●梳理信息检索⽅法●探讨信息检索效果评价1. 1 信息概述1.1.1.1信息的含义:信息链(补充知识,09华南师范名解):(Information Chain)由事实(Facts)→数据(Data)→信息(Information)→知识(Knowledge)→“情报”、“智能”(Intelligence)五个链环构成。
信息著录与信息标引一、什么是信息著录1、定义。
“文献是记录有知识的一切载体。
著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。
著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。
”通常意义上讲的著录就是指,按照某种标准化的格式和要求(如MARC),对文献的某些被规定的特征进行描述(如责任者、题名、出版社等),形成一条一条的信息描述项,最后著录的结果就是一条关于该信息资源的书目数据记录。
2.主要类型。
信息著录就是按照某种规则揭示某一信息资源的主要特征,给出信息资源的缩影。
因此对所有的信息资源类型都可以进行著录。
录音资料、电影与录像资料、微缩品、测绘制图资料、电子资源都可以进行著录,但最早也是最普遍的著录形式还是纸质书籍的著录。
3、信息著录的主要方式。
以图书的著录为例。
为了更好的实现信息资源的共享,著录时通常是遵循统一的格式,如,最常见的MARC。
MARC会给出所要著录的款目、使用的符号和代码、著录的格式、著录款目的顺序以及特殊情况下的处理方式(如多责任者、多语种、信息不详、信息明显错误等)。
编目人员要做的就是按照规定,使用受控的语言,逐条填写个款目的内容。
(当然有些款目是不必要填写的,也有相应规定。
)图一、图二给出了MARC工作界面的截图和一条完成的书目记录。
二、信息著录的意义。
1、信息组织的意义。
信息著录是信息组织的一种具体的方法,信息组织实现的意义也就是其所有具体方法的意义,当然也包括信息著录。
信息组织是使无序信息有序化的过程,起最终目的是使主体(人)能够“更好”的利用信息。
这里的“更好”包括更加方便、快捷的检索信息、准确定位所需的特定信息、获得最有价值的信息等,这些也都是信息著录可以实现的效果。
2、信息著录本身的意义。
除了信息著录作为信息组织的具体方式而具有的普遍的意义,它作为一种区别于其他信息组织方式的具体的方法,同时具有它本身的特殊功能。
信息著录所要解决的问题是揭示某一信息整体的、完整的、概要的特征,既包括外在的信息载体的特征的揭示,也包括内在的信息内容特征的揭示。
信息著录与信息标引信息著录与信息标引当今我们正处于一个信息爆炸的时代。
此时信息呈现出几大特点,一是数量多,增长快,尤其是在网络环境下,这一特点表现得更加突出。
例如清华同方的《中国期刊全文数据库》,通过对2006年11月28~30日3天该数据库公布的新增论文数量的统计,平均每天增长23228篇。
由此可见,网络环境下,文献信息资源的数量非常庞大且增长速度惊人。
[1]二是新词层出不穷,据中国语言文字工作委员会做过的一个保守统计,平均每年产生800多个新词语。
[2]在这种资源种类纷繁复杂,标准不一,十分不方便用户使用的情况下。
要有一个方法来描述信息资源是非常必要的,否则,用户在未浏览完信息而只看其外在形式的情况下,是无法了解信息的概况,以判断信息资源是否符合自己的需要的。
因此,信息的著录就显得尤为重要。
著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。
[3]有了信息的著录,用户就可以在未读过文献的情况下,浏览信息著录的结果——款目或目录来对文献信息进行大致了解。
随着信息数量的急剧增多,信息著录的标准化和自动化也越来越成为信息著录的发展方向,其将使得用户在使用信息的款目和目录时更加地快捷和准确。
由此我国也在2004年出版了最新的《新编中国机读目录格式使用手册》,下面就以其为范例对什么是信息著录进行一个解释。
由于《新编中国机读目录格式使用手册》设置了184个字段,我们将主要介绍其数据字段区的常用字段。
如美国作家丹·布朗的小说《数字城堡》,我们要著录这本文献,首先是其001记录控制号:0120********其中0表示受编文献为普通图书,1表示受编文献语种为中文,20**为编目的年(由编目时间决定),******为编目流水号(视具体编目时的顺序决定)。
其次为010国际标准书号和011国际标准连续出版物号字段:010##$a7-02-004814-5$dCNY25.00(由于其不是连续出版物,所以不用011国际标准连续出版物号字段)其中010##表示这是010字段,$a7-02-004814-5表示其ISBN 号,$dCNY25.00表示其定价为人民币25元。
信息标引与检索
信息标引与检索是信息组织与检索中的重要概念。
信息标引是指在分析文献内容的基础上,用某种检索语言把文献主题以及其他有意义的特征标识出来,作为文献存储与检索依据的一种文献处理过程。
而信息检索则是指从有序的信息集合中查找用户所需特定信息的过程。
信息标引的主要目的是为了方便信息检索,提高检索效率。
在信息标引中,需要选择合适的检索语言,对文献进行主题分析,并从中提取出关键的主题词或关键词,以便能够准确地表达文献的主题内容。
这些主题词或关键词可以用于构建索引或数据库,以便用户能够通过输入关键词进行检索,快速找到所需的信息。
信息检索则是通过一定的技术和方法,从信息集合中查找到与用户查询条件相匹配的信息。
在信息检索中,需要设计高效的检索算法和索引结构,以便能够快速、准确地查找到相关信息。
同时,还需要对检索结果进行排序和展示,以便用户能够快速找到所需的信息。
总的来说,信息标引和信息检索是相互关联的两个过程。
信息标引是信息检索的前提和基础,信息检索则是信息标引的最终目的和应用。
通过信息标引和信息检索,可以帮助用户快速、准确地找到所需的信息,提高信息利用的效率和效果。