信息组织—第七章 分类标引与分类检索工具
- 格式:ppt
- 大小:2.65 MB
- 文档页数:95
第一章1、信息采集:是指根据特定的目标和要求,将分散在不同时空域的有关信息,通过特定的手段和措施采掘和汇聚的过程。
它涉及一切信息工作中的信息采集活动,包括企业和其他组织的管理者们为了实现决策、管理和控制等目标所进行的信息采集。
2、信息采集渠道:①大众传播媒体②文献③政府机构④合作伙伴⑤消费者⑥信息中介结构3、信息采集方法:问卷调查、访谈、实验研究、文献收集4、信息组织与信息检索的关系:信息检索是根据特定的需求,运用某种检索工具,按照一定的方法,从大量的信息中查找出所需信息的过程。
对信息检索进行完整描述,一般必须包括信息组织和检索两个方面。
在信息检索系统中,信息组织是依据信息资源的主题内容和特征,将无序的信息组织成有序集合。
信息组织是信息检索的基础和前提。
信息组织根据用户需要,以信息资源的一定单元为处理对象,依据预先制定的规范,对其特征加以记录,并进行标引和必要的记录,然后将这些信息记录,按照规定的方式输入检索系统。
第二章1、信息组织:就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。
2、信息组织基本内容:按照信息组织的活动类型分“信息选择、信息分析、信息描述与揭示、信息存储”按照信息组织的流程分“信息的筛选和鉴别、信息的分类和排序、信息的著录和标引、信息的编目和组织、信息的分析和研究”3、信息描述与揭示方法:一是著录,主要描述文献信息的形式特征;二是标引,主要揭示文献信息的内容特征。
4、信息组织的类型:信息组织可归为语法信息组织、语义信息组织和语用信息组织三大类型。
从广义上看,信息采集阶段的信息组织主要是一种语用信息组织;信息组织阶段的信息组织属综合型信息组织;信息检索和开发阶段的信息组织则属于优化型语用信息组织。
5、一次信息、二次信息、三次信息:一次信息是人们研究或创造性成果的直接记录,一般指公开出版的图书、期刊论文、研究报告、会议文献、学位论文、专利说明书、网上未经过处理的电子化信息等。
第一章1:什么是类、分类、图书分类、分类标准?类:具有某种共同属性的事物的集合分类:根据事物的属性进行的区分和类聚并按照相互关系进行组织的活动图书分类:依据一定的分类体系,根据图书内容的学科属性或其他特征分门别类的系统的揭示与组织图书馆馆藏的方法分类标准:一类事物彼此之间的共同点称为分类标准2.如何确定图书分类标准的使用次序?(1)要符合读者的检索习惯和检索要求(2)要适应具体国家的实际情况(3)要遵守学科专业分类的一般规则3.什么是等级列举式分类法,有哪些优缺点?含义:将所有类目组织成一个等级系统,并采用尽量列举的方式编制的分类法优点:(1)根据用户的使用需要按学科专业有层次的揭示文献,类目展开比较系统(2)采用等级列举方式将分类结构加以完整显示,类目体系概括直观,易于掌握和使用(3)标记符号简短明了,号码单纯,适合组织图书分类排架,也适合组织分类检索工具缺点:(1)不能详尽无疑的揭示各种复杂主题,无法满足确切分类的需要(2)列举式类表的等级结构,单线序列和先组式的标记,使类表具有一定的凝固性,不能根据需要随时调整,不能进行多角度检索(3)列举式类表的静态结构具有一定的拘束性,无法根据现代科学的发展自动生成新类,难以与科学的发展保持同步,必须经常修订(4)大型等级列举式的分类法,一般类目详尽,但篇幅较大4.分面组配分类法的基本思想和优缺点?基本思想:任何复合主题都可以分解为相应的单元概念,同样也可以通过相应单元概念的组合加以表达,根据这一特点,分类法编制时没有必要详尽列举所有主题只要在类表中按照范畴列出各种基本概念,并分别配于相应号码,使用时先分析文献主题,根据主题分析的结果,通过相应概念的组配,表达文献主题,以各个概念标识的组合表示该主题在分类体系中的次序优点:(1)可以通过基本概念的组配充分揭示现代文献中的复合主题,对文献内容进行专指标引(2)分面标引具有较强的表达性,可以通过表达出主题成分所属的分面,便于根据不同需要调整组配次序,进行多元检索(3)对科学的发展具有较强的适应性,可以通过组配方式表达新产生的复杂主题与科学发展保持同步(4)类表的篇幅较小,便于控制、管理、增补、修订缺点:(1)类表的类目体系是隐含的,不直观的(2)标记符号通过组配才能得到,标引难度高,要求分类人员具有较高的专业素养(3)分面标记的成分往往比较复杂,号码冗长,不适宜用于组织文献排架,主要用于组织检索工具第二章1.什么是分类表。
第一章1. 什么是信息组织?P1信息组织,亦称为信息资源组织,是根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其成为有序化集合的过程。
2. 数据数据是原生态的,即未经过处理的。
信息则是经过人类处理的数据。
3. 检索工具的类型 P6按照系统中所用的标识是否进行控制,检索工具可以分为受控检索系统与自然语言检索系统两种。
按照系统中标识组配的特点,检索系统可以分为先组式和后组式两种。
4. 检索语言检索语言是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。
5. 信息组织的研究领域总体上包括三个层次。
a) 理论层面:研究信息组织的基本规律和理论基础,为规范层面和方法层面提供理论指导。
b) 规范层面:研究信息组织的基本规律和理论基础,为规范层面和方法层面提供理论指导。
c) 方法层面:指信息资源组织技术方法,包括操作的技术方法、信息组织的管理、具体标引规则、描述规则等。
其作用是按照信息资源组织的要求进行操作、实现信息资源系统的组织。
第二章1.检全率亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检索系统中与该提问相关的实有信息资源总量之比。
2.检准率亦称查准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检出的信息资源总量之比。
3.对词汇的控制通常包括:①同义控制;②词义控制;③词间关系控制;④还包括词量控制,词组选择和使用的控制,以及专指度控制等。
4.常用的相关因素包括:引用关系、链接关系、用户需求。
5.相容关系是指至少有一部分外延相同的概念之间的关系,包括:①同一关系;②包含关系;③交叉关系。
6.不相容关系是指不存在共有外延的概念之间的关系,包括:①矛盾关系;②反对关系;③并列关系。
第三章1.信息描述的含义:是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质资源形态等进行分析、选择、记录的活动。
作业名称:信息组织第1次作业(2) 出卷人:SA作业总分:100 通过分数:60标准题总分:100 标准题得分:100详细信息:题号:1 题型:多选题(请在复选框中打勾,在以下几个选项中选择正确答案,答案可以是多个)本题分数:2内容:超文本技术在网络引擎中的作用主要体现在()A、改进主题之间多维关系的揭示B、从多个角度组织信息资源C、进行轮排,亦即多表列类D、设置镜像类目学员答案:ABCD本题得分:2题号:2 题型:判断题本题分数:2内容:网络分类体系中对同位类的排列主要有两种方式:按字顺排序和按检索频率排序。
1、错2、对学员答案:2本题得分:2题号:3 题型:判断题本题分数:2内容:在网络分类体系中设置镜像类目的重要意义和作用是,在使分类法保持必要的层次性和系统性的同时,为网络用户提供了不同的检索途径,增强了分类体系的灵活性和适用性。
1、错2、对学员答案:2本题得分:2题号:4 题型:多选题(请在复选框中打勾,在以下几个选项中选择正确答案,答案可以是多个)本题分数:2内容:网络分类体系广泛地采用了()技术和()技术,可以根据需要,有选择地同时建立多个引用次序的类目体系,以满足广大网络用户不同的需要。
A、超文本B、链接C、搜索引擎D、轮排学员答案:AB本题得分:2题号:5 题型:多选题(请在复选框中打勾,在以下几个选项中选择正确答案,答案可以是多个)本题分数:2内容:《中图法》的修订原则概括起来主要包括()A、稳定性原则B、与知识发展同步原则C、文献保证原则D、用户保证原则学员答案:ABCD本题得分:2题号:6 题型:判断题本题分数:2内容:《中图法》的五个基本部类为:马克思主义、列宁主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书。
1、错2、对学员答案:2本题得分:2题号:7 题型:单选题(请在以下几个选项中选择唯一正确答案)本题分数:2内容:判断“苹果的食品加工技术”属于下面四个类目中的哪一类()A、农业科学B、生物科学C、医药、卫生D、轻工业学员答案:D本题得分:2题号:8 题型:判断题本题分数:2内容:UDC的修订分为两个层次,即常规修订和彻底修订,而且,努力促进类表逐步向分面发展,建立组配结构。
《中国图书馆分类法》体系结构●宏观结构(编制说明、基本大类表、简表、详表、复分表、索引、使用手册)●微观结构(类号、类名、类级、注释、参照)基本部类与基本大类●五个基本部类1.马克思主义、列宁主义、毛泽东思想、邓小平理论2.哲学3.社会科学4.自然科学5.综合性图书●22个基本大类复分表●通用复分表(对主表类目起复分作用,不单独使用,一般均列在主表之后,8个)1.总论复分表(将所用的复分号(连同"-")加在主表分类号码后)2.世界地区表3.中国地区表4.世界时代表5.中国时代表6.世界种族与民族表7.中国民族表8.通用时间、地点复分表●专类复分表(供类目细分时组配使用,列于相应的大类之下)仿分(一种以统一的方式处理共性子目的方法,有类似专类复分表的作用)《中图法》的标记符号与标记制度●标记符号:✓基本符号:字母、数字✓辅助符号:“.”、“/”、“[]”、“-”、“()”、“=”、““””、“〈〉”、“∶”、“{}”等“.”间隔符号用于类号的数字部分的间隔,从左到右每三位数字之后加一圆点例:I247.5,K837.125.6“/”起止符号在主表或复分表中用于表示概括一组相连类号的起止区间,或在注释中表示类目仿分的类号区间或参见类目的范围例:K3/7,K815注释“[]”交替符号用以标记交替类目,表示该类目为选择使用的类目例:[B835]“-”总论复分号凡主表类目使用总论复分表复分组号时,须将“-”与总论复分表中的类号一起加在主类号后,例:《物理学词典》O4-61但是也有个别类目借用总论复分号的形式进行配号,例:O4-0“()”国家、地区区分号当某类目需要依地区、国家区分,但类目无注释规定可依地区表复分时,可将“世界地区表”或“中国地区表”中的有关类号用()括起,加在主类号之后例:《日本的智能机器人技术》TP242.6(313)“=”时代区分号当某类目需要依时代区分,但类目无注释规定可依时代表复分时,则可将“国际时代表”或“中国时代表”中的有关类号加在主类号之后,中间用“=”联结例:《宋代的瓷器研究》K876.3=44““””民族区分号如某类目需要依民族细分,但类目无注释依“世界种族与民族表”或“中国民族表”复分时,则可将种族或民族号码置于“”中,加在主类号之后例:《中国彝族竹编制品》TS959.2“214”“〈〉”通用时间、地点区分号若某类目需按通用时间、地点复分,则将“通用时间、地点区分表”的有关类号置于“〈〉”内,加在主类号之后例:《春季饮食养生》R247.1<111>“∶”组配符号用于联结两个相关的主类号,合成一个组配类号,《中图法》要求按有关注释的规定使用“:”例:根据TP399的注释使用“:”“+”联合符号“+”之后的一段号码是对类分图书的类目进一步细分,整个类号用以类分资料;该辅助符号只出现在分类表中,不出现在标引中例:Q983的下位类“{}”停用符号置于{}内的类号是前一版本中用于标引的分类号,现已停用例如:{D018}消灭阶级剥削(停用;4版改入D011阶级的产生与消亡)●标记制度:层累标记制、顺序标记制●标记技术:八分法、双位制、借号法、预留空号法、对应编号法、字母标记法《中图法》的复分表与组号技术(通用复分表专类复分表类目仿分)通用复分表●总论复分表将各学科门类的共性区分内容编列入此,实际上为通用主题和通用文献类型复分表,收入各种通用性主题类型和文献类型,除主表、专类复分表或仿分中已列出了同样的类目外,原则上主表的各级类目都可以根据需要使用复分号由“-”加数字组成(《图书馆学辞典》G25-61 )总论复分表的使用要点:1)主表中任何一级类目均可使用,复分时直接将复分号(连同“-”)加在主类号后例:《文献分类指南》G254.11-622)主表中某些类目具有该表的内容,或已列有专类者,不再使用本表复分。
1.检索工具的分类(1)按照信息搜集方法分类按照信息搜集方法的不同,搜索引擎系统可以分为三大类:1)目录式搜索引擎(Directory Search Engine)以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。
信息大多面向网站,提供目录浏览服务和直接检索服务。
该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。
这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory。
2)机器人搜索引擎(Crawler-Based Search Engine)由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。
服务方式是面向网页的全文检索服务。
该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。
这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google。
3)元搜索引擎(Meta Search Engine)这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。
服务方式为面向网页的全文检索。
这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。
这类搜索引擎的代表是WebCrawler、InfoMarket。
目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。
例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索”便搜索人工分类库,选择”网页搜索”便搜索机器人搜索引擎的索引库。
第一章一、名词解释1、文献:是用一定的技术手段把一定的信息内容记录到一定载体上形成的存储型传递媒体。
2、著录:对表示文献内容、外表形式和物质形态的特征进行分析、选择和记录的过程。
标引:指在分析文献内容和情报提问的基础上,用某种索引语言或标志符号把文献的主题概念及其他有检索意义的特征标示出来,作为情报存储和检索依据的处理过程。
按照索引语言或标示符号的类型,可分为分类标引,主题标引和非主题标引。
3、款目:依据一定的方法,对表示文献内容,外表形式和物质形态的特征所做出的记录。
4、信息组织的必要性即为什么要学习信息组织?a.知识和信息的海量新和无限性与人的精力和时间的有限性形成了尖锐的矛盾;b.知识和信息的无序性和污染性与人类使用的选择性也形成了尖锐的矛盾;c.越来越多的人意识到,“原始信息本身并不能产生价值” ,只有对信息资源采用相应的方法加以控制和处理才能使人们实现对其合理开发和有效利用,而信息组织则是解决这一问题的根本方法和关键措施之一;d.深入研究与解决关于信息组织的系列问题是十分必要的。
5、信息组织(信息序化或信息整理):利用一定的科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
6、信息组织的基本专业要求是?a.信息内容有序化;b.信息流向明确化;c.信息流速适度化。
7、耗散结构论是比利时学者普里高津提出来的;协同论是德国物理学教授海尔曼. 哈肯提出来的。
知识理论——H.E. 布里斯提出来的。
知识组织可分为主观知识的组织和客观知识组织两种类型。
8、专指度:是指我们在信息揭示的主题标引中对信息中各个主题的内容和方面的展示过程。
9、按照信息组织的组织对象把信息组织分为信息资源组织和检索工具;依据信息组资源的注意内容,主要分为分类法和主题法。
第二章1、七分法是我国出现最早的一部图书分类体系,始创于汉代的《七略》,后现于南朝的《七志》和梁朝的《七录》。