主题图技术与相关知识组织方法的比较研究
- 格式:pdf
- 大小:609.87 KB
- 文档页数:7
收稿日期:2007—08—20作者简介:蔡敏(1973—),女,毕业于武汉大学信息管理学院,中国工程物理研究院科技信息中心馆员,从事信息服务工作,发表论文3篇。
三种常用参考文献管理软件比较研究蔡敏(中国工程物理研究院,绵阳621900)〔摘要〕参考文献管理软件集参考文献的检索、收集、整理以及导入、导出功能于一体,帮助用户高效管理和快速生成参考文献,善加利用能够令研究工作事半功倍。
本文介绍了EndNote, Biblioscape 和NoteExpress三种常用参考文献管理工具的主要功能,并分析比较了三者的异同,为用户了解和选择适合的文献管理软件提供参考。
〔关键词〕参考文献管理软件; EndNote; Biblioscape; NoteExpress〔Abstract〕The reference management software has many powerful functions, including reference searching,importing, managing and citing, which makes it helpful in documentation and paperwriting. This paper introduces themain functions of three kinds of popular used reference management software as EndNote, Biblioscape and NoteExpress,and then compares the similarities and differences that can help researchers choose the most appropriate one for their us-age.〔Key words〕reference management software; EndNote; Biblioscape; NoteExpress〔中图分类号〕G250·76〔文献标识码〕C〔文章编号〕1008-0821 (2007) 10-0176-04 1概述科学研究离不开查阅文献,查阅文献之后不善加管理和利用,如入宝山而空手归。
《中国图书馆分类法》讲义《中图法》是一部综合性分类表,也就是说《中图法》是能够供所有学科专业文献标引和检索使用的标引语言。
1975年10月科学技术文献出版社正式出版《中图法》第一版,1999年3月北京图书馆出版社出版第四版,全称也从《中国图书馆图书分类法》改为《中国图书馆分类法》。
2001年夏北京图书馆出版社出版了第四版的电子版,称为《中国图书馆分类法》(第四版)电子版1.0版。
1.《中图法》的编制原则第一,以马列主义毛泽东思想为指导,以科学技术发展水平和文献出版的实际为基础,将科学性、实用性、思想性有机地统一。
第二,以科学分类和知识分类为基础,依照从总到分、从一般到具体、从理论到应用的原则构建逻辑系统。
分类体系与类目设置既要保持相对稳定性,又要考虑有一定的动态性,及时反映新学科、新主题的发展,并允许对其结构与类目作一定的调整,以满足不同的需要。
第三,标记符号力求简明、易懂、易记、易用;标记制度力求灵活实用,有较好的结构性,以揭示体系分类法的本质特征。
第四,兼顾作为编制分类检索工具的规范与作为文献分类排架的规范的双重职能。
第五,兼顾不同类型、不同规模图书馆和文献信息机构类分不同类型文献的需要。
2.《中图法》的分类体系《中图法》的分类体系是指基本部类与基本大类的构成及其序列以及所有类目相互联系与相互制约形成的等级结构。
而基本部类与基本大类的构成及其序列是《中图法》最基本的分类体系。
《中图法》按照毛泽东关于“什么是知识?自从有阶级的社会存在以来,世界上的知识只有两门,一门叫做生产斗争知识,一门叫做阶级斗争知识。
自然科学、社会科学,就是这两门知识的结晶,哲学则是关于自然知识和社会知识的概括和总结。
”的论断,将知识门类分为“哲学”、“社会科学”、“自然科学”三大部类;马列主义、毛泽东思想、邓小平理论是指导我们事业的理论基础,故作为一个基本部类列于首位;此外,考虑到文献本身的特点,对于一些内容庞杂、类无专属,无法按某一学科内容性质分类的图书,概括为“综合性图书”,作为一个基本部类,置于最后。
概念图及其应⽤所谓“概念图(Concept-Map)”,是⼀种⽤节点代表概念、连线表⽰概念间关系的图⽰法。
换句话说,就是指利⽤图⽰的⽅法来表达⼈们头脑中的概念、思想和理论等,是把⼈脑中隐形知识显性化、可视化,便于思考、交流和表达,也被称作思维地图、思维导图(Mind-Map)。
也可以这样说,⼈类使⽤的⼀切⽤来表达⾃⼰思想的图⽰⽅法都是“概念图”。
“思维导图”的称呼直接说明这是引导⼈们思维的图,把这种图⽰⽅法的意义挑明了。
把概念图作为⼀种教学原理、理论,⽽不仅仅是辅助性的经验、⼿段,主动⾃觉地运⽤到教学活动中,来帮助师⽣提⾼教学质量,是由美国康乃尔⼤学教育系的诺⽡克(Josehp D.Novak)教授提出的。
诺⽡克教授认为,“意义学习”是将新的概念同化到已有的认知结构中,概念图对学习者和教师同样重要,可以在教学活动中帮助师⽣的认知活动,有助于整合新旧知识,在⼤脑中构建知识⽹络。
诺⽡克博⼠根据奥苏贝尔(David P.Ausubel)的学习理论,“有意义的学习是将新的概念同化到已有的认知结构中”,在1960年代着⼿研究概念图技术,并使之成为⼀种教学的⼯具。
事实上,概念图的⽤途极其⼴泛。
它除了⽤作辅助学⽣学习的⼯具外,还是教师和研究⼈员分析评价学⽣对知识的理解和构建的⽅法,也是⼈们产⽣想法(头脑风暴),设计结构复杂的超媒体、⼤⽹站以及交流复杂想法的⼿段。
⼀、概念图的理论基础概念图的理论基础是奥苏贝尔的学习理论。
奥苏贝尔认为新知识的学习取决于新旧知识能否达到意义的同化。
换⾔之,知识的构建是通过已有的概念对事物的观察和认识开始的。
学习就是建⽴⼀个概念⽹络,不断地向⽹络增添新内容。
奥苏贝尔的另⼀个重要观点是有意义学习。
为了使学习有意义,学习者个体必须把新知识和学过的概念联系起来。
新知识必须和学习者现有的认知结构产⽣相互作⽤。
有意义学习与死记硬背截然不同。
尽管死记硬背也能把新信息纳⼊知识的结构,但是,它缺乏新知识与知识结构的相互作⽤。
分类法与主题法一、分类法分类系统分为聚类和归类两个子系统:聚类是指按照信息资源的特点和使用需要,通过区分和类聚建立起类目体系的过程;归类是指依据建立的分类体系进行类分信息资源的过程。
聚类的结果是建立科学、合理的、类目体系,如各种文献分类法等,聚类是归类的前提条件,是分类组织的重要依据和工具;而归类系统则是聚类系统的具体应用,它体现了聚类过程的实际存在意义。
信息资源分类法的类型按照编制方式分为:等级列举式、分面组配式、列举——组配式。
(一)等级列举组配式等级列举式分类法是一种将所有的类目组织成一个等级系统,并且采用尽量列举的方式编制的分类法。
类目体系组成一个树状结构,按照划分的层次,列举详细类目,以缩格表示类目等级关系,最后形成一个等级链。
常见的有《杜威十进制分类法》(DDC)、《中图法》等。
(1)杜威十进分类法(Dewey Decimal Classification,DDC)杜威十进分类法是广为全球各地图书馆使用的分类法。
这个分类系统最早在1873年时Melvil Dewey有此分类构想,而于1876年正式出版。
负责DDC出版的是Forest Press,而它于1988年成为OCLC下的一个部门。
DDC已被全球超过135个国家的图书馆使用,并且被翻译逾30种语言,包括阿拉伯文、中文、法文、希腊文、希伯来文、意大利文、波斯文、俄文、西班牙文及土耳其文等。
在美国,有95%的公共图书馆及学校图书馆、25%的学院及大学图书馆及20%的专门图书馆使用DDC。
此外,DDC更能用来组织网际网络上的各种资源。
杜威十进制图书分类法于1876年首次发表,历经22次的大改版后,内容已有相当程度的修改与扩充。
最新的版本为2004年版。
该分类法以三位数字代表分类码,共可分为10个大分类、100个中分类及1000个小分类。
除了三位数分类外,一般会有两位数字的附加码,以代表不同的地区、时间、材料或其他特性的论述,分类码与附加码之间则以小数点“.”隔开。
分类法与主题法的异同一、分类法的特点分类法是一种基于类别的信息组织方法,它将信息按照一定的标准进行分类,以便于管理和检索。
分类法通常采用等级结构,从总类到子类,逐级细分,形成一个层次结构。
分类法的特点如下:1.标准化:分类法通常采用统一的分类标准,使得信息能够按照一致的方式进行归类。
2.层级性:分类法具有明显的层级结构,从上到下,从总到细,形成一个清晰的层次体系。
3.稳定性:分类法一旦确定,通常不会轻易改变,以保证信息的稳定性。
4.人工干预:分类法的制定通常需要人工干预,根据专业知识和经验进行分类。
5.适用于大量信息:分类法适用于大量信息的组织和检索,能够提高信息检索的效率和准确性。
二、主题法的特点主题法是一种基于关键词的信息组织方法,它将信息按照主题进行组织,便于用户按照主题进行检索和获取信息。
主题法的特点如下:1.灵活性:主题法具有较强的灵活性,可以根据需要随时添加新的主题。
2.面向用户:主题法的制定通常需要考虑用户的需求和使用习惯,以便于用户快速找到所需信息。
3.适用于多媒体信息:主题法适用于多媒体信息的组织,如图片、音频、视频等。
4.语义关联:主题法注重信息的语义关联,能够将相关的信息聚类在一起。
5.技术依赖:主题法的实现通常需要借助相应的技术和工具,如语义分析、聚类算法等。
三、分类法与主题法的异同比较分类法和主题法是两种不同的信息组织方法,它们在某些方面存在共同点,但在其他方面则存在明显的差异。
具体来说,两者的异同比较如下:1.基础理念:分类法和主题法都以提高信息检索效率和准确性为目的,但它们的基础理念略有不同。
分类法注重信息的逻辑层次和分类标准,而主题法则更注重信息的语义关联和用户需求。
2.适用范围:分类法适用于大量信息的组织和检索,特别是在图书馆、档案馆等领域得到了广泛应用。
而主题法适用于多种媒体信息的组织,如网络搜索引擎、多媒体数据库等。
3.制定方式:分类法的制定通常需要人工干预,需要专业人员根据专业知识和经验进行分类。
科学知识图谱应用研究概述廖胜姣肖仙桃知识图谱是可视化显示知识资源及其关联的一种图形,可以绘制、挖掘、分析和显示知识间的相互关系,在组织内创造知识共享的环境,从而最终达到促进知识交流和研究深入的目的。
从20世纪50年代至今,科学知识图谱的研究已经有几十年的历史。
科学知识图谱出现之前,科学计量学家们一直努力在寻找一种同传统方法相比,具有更大的客观性、科学性、数据的有效性和高效率的新方法来研究科学学科的结构与进展。
科学知识图谱出现之后,其相关的理论与应用研究不断涌现。
本文试图从应用的角度对科学知识图谱的研究与发展状况进行一个系统的梳理,具体从应用领域、研究机构与网站以及绘图软件方面着手。
1应用研究现状从20世纪50年代开始兴起的各种文献计量方法为科学知识图谱的出现奠定了坚实的理论基础,是科学知识图谱理论与方法的“根”。
如今,知识图谱已经成为计量学领域的一个新兴分支,活跃在各个领域的研究中。
笔者将从应用领域、研究机构和软件方面阐述科学知识图谱的应用研究状况。
1.1应用领域方面科学知识图谱的应用领域很广,从科研到教学到社会问题的解决等,无不渗透。
1.1.1应用于科研领域笔者认为,知识图谱最早是在科研领域活跃起来的。
在知识图谱中,学科前沿之间的交互关系是以空间的形式展现出来的。
研究发现,科学引文与被引文之间往往有着学科内容上的联系。
通过引文聚类分析,特别是从引文间的网状关系进行研究,能够探明有关学科之间的亲缘关系和结构,划定某学科的作者集体,分析推测学科间的交叉、渗透和衍生趋势,还能对某一学科的产生背景、发展概貌、突破性成就、相互渗透和今后发展方向进行分析,从而揭示科学的动态结构和某些发展规律。
这里仅列举近些年知识图谱的一些应用研究情况。
White,McCain,Garfield,Boyack,Huang等对知识图谱的用途进行了不断的扩充,得出知识图谱的主要应用有:文献、专利的结构分析;学科动态、社会网络、领域发展分析等;Shiffrin等认为,涉及到展开的学科间科学区域的知识图谱旨在绘制图形、挖掘、分析、分类、导航以及显现知识等等。
国外主题图研究综述【原文出处】现代图书情报技术【原刊地名】京【原刊期号】200712【原刊页号】39~44【分类号】G9【分类名】图书馆学、信息科学、资料工作【复印期号】200803【英文标题】Review of Research on Topic Maps AbroadLiu Dan Bao Ping【作者】刘丹/包平【作者简介】刘丹,包平,南京农业大学信息科技学院。
(南京 210095)【内容提要】通过对相关论文与网站资源的调查,试图对国外主题图技术的研究状况进行较为系统的梳理和概括,并在此基础上,提出对国内此领域发展的几点建议。
【摘要题】国际信息【关键词】主题图/知识管理/Web应用/语义挖掘【正文】【分类号】G623.5如何利用数字化信息组织技术解决信息获取,为信息需求者提供真正所需要的信息资源,目前已经成为国际上知识组织领域一个重要的研究方向。
主题图(Topic Maps)作为一种新兴的数字化知识组织技术,在网络信息组织领域逐渐显现出它的独特性,吸引着专家学者的探索与研究。
本文通过调查国外主题图相关研究论文的状况和访问主题图相关研究性网站,获得相关期刊论文124篇,相关图书章节59节;笔者将这些文献分为3个主要领域:主题图基础理论研究、主题图技术工具研究和主题图实际应用研究,分别对3个领域进行了较为系统的整理分析,并在此基础上提出对国内主题图发展与研究的几点建议。
1 关于主题图的基础理论研究主题图的基础理论研究主要包括主题图标准体系的建立与研究、主题图结构及特征要素的研究、主题图与其他知识表现技术的比较和互操作研究等方面。
1.1 主题图标准体系的建立与研究ISO标准组织一直在致力于推进主题图标准体系的建立和研究。
主题导航地图(Topic Navigation Maps)是主题图的前身,诞生于GCA研究所(现以IDEAlliance著称)的一次关于HyTime的应用研讨会上[1],他们试图用HyTime展现书后索引的知识结构,并希望能够自动合并不同的索引,这次会议的思想即被称为主题导航地图。
课题查询的方法课题查询是指通过计算机技术对文献数据库、知识图谱等数据源进行检索,获取与特定主题或问题相关的文献、研究成果和技术信息的一种技术。
本文将介绍课题查询的方法,包括常用的技术和工具,以及如何进行课题查询的分析和结果展示。
常用的技术和工具课题查询的技术和工具多种多样,以下介绍一些常用的技术和工具:1. 自然语言处理(NLP)技术自然语言处理技术可以对文本数据进行分析和处理,包括词性标注、句法分析、命名实体识别等。
使用NLP技术进行课题查询可以获取文献的标题、摘要、关键词等信息,并对这些信息进行分析和比较。
2. 知识图谱技术知识图谱技术是一种基于语义理解和知识表示的方法,可以将实体、关系和属性等信息组织成一张图谱。
使用知识图谱技术进行课题查询可以获取文献中涉及的所有实体和关系,并对这些信息进行分析和比较。
3. 数据库技术数据库技术可以对数据进行存储、管理和查询,包括关系型数据库和非关系型数据库。
使用数据库技术进行课题查询可以获取文献和研究成果的信息,并对这些信息进行存储和分析。
如何进行课题查询的分析和结果展示课题查询的分析和结果展示非常重要,以下介绍如何进行课题查询的分析和结果展示:1. 确定查询需求在开始进行课题查询之前,需要明确查询的需求,包括查询的主题、问题、关键词等。
这样可以确保查询的准确性和有效性。
2. 选择合适的技术和工具根据查询需求,选择合适的技术和工具进行查询。
常用的技术和工具包括自然语言处理技术、知识图谱技术、数据库技术等。
3. 查询结果的分析和展示查询结果的分析和展示非常重要,可以使用可视化工具对查询结果进行展示,包括文献的标题、摘要、关键词、作者、机构、出版时间等信息。
还可以使用交互式工具对查询结果进行深入分析,包括文献的相关性、相似度、推荐文献等。
4. 结果的导出和存储最后,将查询结果导出和存储到数据库或文件中,以便后续的分析和展示。
可以根据不同的需求,使用不同的数据库或文件格式进行存储。
对小学数学教学中主题图的研究【摘要】主题图是现代小学数学教学的一大特色,主题图的运用给教师教学和学生的学习数学带来了很大的方便和提高了教学的有效性。
教学中主题图的运用,学生可以在乐趣中学习数学思想,提高自身的思考能力和解决问题的能力,对培养学生的问题意识和探究能力很有帮助。
但是在小学数学教学中主题图的应用过程中,还存在一些问题,不能将主题图的作用和效果发挥到最佳,这就需要对主题图进行适当的动态化、简单化和具体化等等,来进行更有效的教学。
【关键词】小学数学主题图教学1. 前言为了让学生从实际的生活经验出发,体验到将实际问题抽象成数学模型的过程,并且在数学解题中加以应用,使学生的思维能力和价值观等多个方面在这些过程中得到提高,在小学数学的教学中添加了大量的主题图。
主题图就是利用了学生已有的经验为主题场景来串联数学的教学内容,将所要解决的数学问题、所要学习的知识内容和带有浓浓生活情谊的图画融于一体,使数学具有生活气息,使学生在感觉亲切的同时,理解了生活,并且让学生对数学的学习充满了信心,而且对于老师来讲,给老师的教学也添加了不少的资源乐趣。
将主题图运用到小学数学教学中以来,就给教学带来了很大的变化,但是存在一些小学数学教师在教学中对主题图的运用不是很恰当,存在对主题图的理解和内涵把握不准确的情况,影响了主题图发挥最大的作用,不能在教学中进行更有效的运用。
本文针对小学数学教学中对主题图的不恰当应用进行了合理的分析,并且给出了相应的策略。
2. 主题图简介2.1主题图的价值1)提高了学生的问题意识。
小学数学教学中的主题图对于提高学生的问题意识有着十分重要的作用。
教师可以引导学生对主题图中的相关教学问题进行探讨,从中激发小学生对数学的兴趣和感受到数学与生活的联系,培养学生的问题意识。
在带有主题图的新教材中,对于学生熟悉的生活情景,提出一些关于学生身边的事情的有关的数学问题。
2)提高了学生的探索精神。
主题图的应用为学生参与到教学过程中提供了很多的机会,主题图从学生的经验和已学的知识出发,给学生们提供了大量的乐趣学习数学的活动。
主题图技术与相关知识组织方法的比较研究马建霞(中科院国家科学图书馆兰州分馆 甘肃730000) 文 摘 通过简单介绍主题图的定义及其核心概念,与相关的知识组织方法,如索引、词汇表、叙词表、分类法、概念图,以及语义网中的知识表现等进行了比较。
关键词 主题图 知识组织 索引 词汇表 叙词表 分类法 概念图 知识表现Co m para ti ve Study Between Top i c M ap and Rel a ted Knowledge O rgan i za ti on M ethod M a J i a nx i a(The Lanzhou B ranch of the Nati onal Science L ibrary,Gansu730000)Abstract After an general intr oducti on t o t op ic map and it’s i m portant concep ts,an comparative study a mong t op ic map and the related knowledge organizati on methods such as index,gl ossary,the2 saurus,taxonomy,concep t map and knowledge rep resentati on was carried out.Key words:T op ic map,Knowledge organizati on,I ndex,Gl ossary,Thesarurs,Taxonomy, Concep t map,Knowledge rep resentati on1 前言主题图是一种新兴的数字化知识组织方式。
在X ML Top ic Map(XT M)1.0规范中[1],主题图被定义为一系列以主题、联系和范围组成的主题图节点,这些节点以符合XT M或者其他规范(HyT m)的文件形式或者以满足XT M加工需求的内部应用的方式存在。
概括地说,主题图是一种用于描述信息资源的知识结构的数据格式,它可以定位某一知识概念所在的资源位置,也可以表示知识概念间的相互联系。
[2]主题图实际上在信息资源的上层构建了一个结构化的语义网,它独立于技术平台,描述主题之间的关系及主题与具体资源的联系,通过揭示概念之间的关系,将用户指引到相关的资源。
建构主题图,其目的在于建立一个个人化的知识导航界面,并给使用者一个能快速掌握轻松学习知识的操作界面。
主题图被誉为信息管理和知识管理之间的桥梁,是信息世界中的GPS定位仪,它可以提供信息资源的直观的导航。
[3,4]对于主题图技术的定义,我认为,狭义地讲,主题图技术就是如何用主题图标记并展现信息资源知识结构,并将该知识结构与信息资源集合相关连的方法;广义而言,主题图技术包括在主题图构建过程中的本体分析、主题图XT M文件的生成、编辑、存储、主题图的可视化展示等主题图的各种应用中以及主题图与其它知识表示技术互操作中所用到的技术和方法。
[22]目前国际上对与主题图技术的研究主要在以下几个领域:主题图标准体系的建立与研究,主题图在知识管理中的应用,主题图的可视化、主题图的应用工具、主题图与其他知识表现技术的比较与互操作、主题图及其本体的构建方法等。
国内对主题图技术的研究和应用刚刚启动。
2 主题图技术核心概念现实世界中的客观事物往往具有其自身的某些特征,比如名称、位置、存在的特定范围以及一事物和其他事物之间的联系等,这些事物在主题图中的反映就是一组主题。
这些主题同样也包含自身的特征集合,最基本的特征是:主题的名称,主题所在的资源实体(出处)以及它与其他主题间的关联。
一个主题图就是一个由主题、关联性以及资源实体(出处)组成的集合体。
主题图中关键的概念是主题(t op ic)、关联(as2 s ociati ons)和出处(occurrence),另外还有主题的标记(identity)、分面(facet)、范围(scope)。
[5-7]742007年第2期(Vol.26.No.2) 图书馆杂志(L ibrary Journal)3 主题图与相关知识组织与表现技术的比较在计算机信息管理领域,知识管理是以某一组织范围内对知识的产生、传播、储存、应用、共享为研究对象的理论和方法。
知识管理中的关键问题是知识如何被组织,正是对知识的编码和有序化决定了知识是否可以被获得。
主题图技术是知识的产生和传递过程中的一种知识编码组织技术。
[5]自从美国图书馆学家布利斯(H.E.B liss)提出知识组织理论以来,国内外学者对于知识组织进行了大量的研究:蒋永福认为:知识组织是指对事物的本质及事务间的关系进行揭示的有序结构,即知识的序化,通俗地说,是对知识客体进行的诸如整理、加工、揭示、控制等一系列组织化过程及其方法。
[8]王知津认为:知识组织是对知识进行整序和提供,既能处理大量的现有知识,又能相对降低存储知识的物理载体文献的盲目增长以免知识过于分散化。
所以提供文献、评价科学文献和系统表述以生成新的便于利用和获取的有序化知识单元的处理系统就是知识组织。
[9]A.Sigel认为:“知识组织”是使知识集合增值的一种跨学科领域的文化活动。
知识组织是研究如何组织概念和概念之间的相互关系,从而以一种有序的形式把握知识,并使这种知识易于传播和利用的主题领域。
[11]而J.D.Anders on则认为:知识组织是对文献的内容、特征、目标的描述,并组织这些描述,使这些文献和其中的内容能够被人们检索到。
知识组织包括索引、文摘、编目、分类、记录管理、书目和创建文本和书目数据库。
这一概念以文献为中心,而不是以知识结构为中心。
这一观点认为知识必须具体化为文献或文本后(显性知识后)再经由特定方式将文献内含的知识层面进行抽取、标引,进而建立一套系统化作业模式与原则理论,这些活动正是图书馆学中的分类编目、索引等理论与实务所覆盖的层面。
[11]总之,知识组织的理论建立在知识单元———概念的基础上,知识是以知识单元(概念)及许多语词或句子的可能组合来表达。
知识组织是将无序或分散的特定知识,根据一定的原则与方法,使之有序、集中、定址,以方便知识的提供、利用和传播。
科学知识组织系统中,除了科学文献组织系统(等级分类系统、分面分类系统、索引系统)以及学科体系知识组织系统(教科书、百科全书、综述、述评)外[10]还有科学术语知识组织系统,人工智能知识组织系统、模拟空间的知识组织系统。
在知识组织领域人们认为某种程度的词汇控制至关重要,因而知识组织非常关注分类法、叙词表和本体论的研究和利用。
Hodge将数字图书馆的知识组织系统分为:术语集(ter m list)包含权威档、词汇表(gl ossaries)、地名词典、字典;分类系统包括标题表、分类表(taxonomy);关系词群(包括叙词表、语义网络和本体)。
主题图这种知识组织方式继承了索引、词汇表、叙词表、本体、分类表等知识组织方式的特征,并吸取了人工智能领域的ont ol ogy、语义网的思想,这使得它能够比较好地适应数字化环境中的知识组织。
下面,将就与主题图密切相关的知识组织方式进行对比分析,以此展现主题图技术的理论基础和思路。
3.1 索引索引是某一文献集合包含的文献单元或概念的系统性指南,这些文献单元或概念分别被描述在按照某种共知或规定的可查顺序(如字母顺序、年代、数字等)排列起来的款目上[13]。
“它通常不提供信息或者知识内容本身,只提供一种指示系统,使读者或用户能准确地找出文献或信息集合中的特定信息,它以具体主题、观点、事物、概念、名称、语词、符号为对象,对文献内容做深入发掘和全面揭示,给使用者明晰的指引。
”国际标准化组织I S O1975年《文献工作-出版物索引》(I S O999-1975)[13]中规定索引的结构:索引款目(包括标目、说明语、存储地址)、索引的参照系统(包括参照(见参照、参见参照、见至参照、反参照)、标目注释)。
例如:图2的索引摘自一本有关歌剧的图书,其中,包括了索引款目、索引的参照系统,根据标目的类型不同用不同的印刷字体表示出来,该标目的出处用页码表示,而且根据标目的类型不同和出处的类型不同用不同的印刷字体或者颜色表示出来。
其中见参照表示一个主题的不同表达方式,参见参照表示与该主题有关联的主题。
主题图吸收了索引中的基本思想。
主题图中的主题对应于索引中的索引款目,联系对应于索引中的参照系统,标目的出处对应于主题图中的出处(occurrence),主题图用范围(scope)定义了某个概念或者概念之间的关系有效的范围。
主题图比传统的索引更进一步的是,主题图认84图书馆杂志(L ibrary Journal) 2007年第2期(Vol.26.No.2)为所有的联系和出处都是主题,而且这些主题是有类别的。
主题图所反映的联系类型更为丰富,而且,主题图通过PSI(Published Subject I ndicat or)机制提供了不同的索引之间方便的合并机制。
[5]图1 索引与主题图3.2 词汇表词汇表是一个难理解的或专业化的词的列表,这些词后还有它们的定义。
不象索引指向主题出现的地方,词汇表中的“出处”是以某个主题的定义的方式出现,它可能包含如见或参见参照这样的附加信息,或者给出其用法或者发音的指南,但是其关键的构件是主题和他的定义。
词汇表中仅仅对某个概念进行定义,对于概念和概念之间的联系反映不充分,而且不能将概念和与这个概念相关的信息资源联系起来。
在主题图中不仅能用res ource Data机制来表示对概念的定义,实现词汇表的功能,还可以展现概念之间的关系,并将概念和与它相关的信息资源联系起来。
[5]3.3 叙词表叙词表是一个特定领域中的相关的词的网络。
这个网络包括交叉参考,并给出了词之间的关系。
为了描述在有多个同义词时应选的首选词,叙词表依赖于受控词表的概念。
叙词表主要用于检索时的后控制和标引时的自动或辅助选择索引词,是提高查全率和查准率、实现多语种检索和智能化概念检索的重要途径。
叙词表的目的是帮助用户在当他们头脑中有个概念时找到相应的词,而字典被用来给用户提供他们不熟悉的概念的信息。
叙词表强调了索引的其他方面,它是某个特定领域中相关词汇的网络,尽管其中也可能包括其他的诸如定义、使用样例的信息,其关键的特征还是词汇之间的联系。
给定一个词,叙词表会给出它的同义词、上位词和下位词以及其他相关词。
特别需要指出的是,叙词表中词间的关系被分为用、代、属、分、族、参几类。
主题图吸收了叙词表在词汇控制方面的思想,可以用采用基本名basena me和别名variant na me定义或者直接定义的方式来定义叙词表中的用代关系,实现词汇控制,并在传统叙词表的用、代、属、分、族、参的简单关系基础上,具有灵活定义概念间关系的类型的功能,使用者可以根据领域概念的特点灵活地定义概念之间的关系。