中国知网知识组织模式研究
- 格式:pdf
- 大小:1.08 MB
- 文档页数:4
基于知识图谱的我国知识库构建研究可视化分析仇岗【摘要】文章采用文献计量和知识图谱可视化的方法,通过对中国知网数据库18年来知识库构建领域相关文献进行定量统计,利用CiteSpaceⅢ信息可视化软件对知识库构建领域进行可视化分析.文章分别从时间分布、核心作者分布、核心机构分布、研究热点和研究前沿等方面对知识库构建领域进行可视化分析和研究,以期对相关研究和实践创新提供借鉴和参考.【期刊名称】《新疆师范大学学报(自然科学版)》【年(卷),期】2019(038)002【总页数】8页(P33-40)【关键词】知识库构建;知识图谱;可视化;CiteSpace【作者】仇岗【作者单位】昌吉学院,新疆昌吉 831100;山东大学,山东济南 250100【正文语种】中文【中图分类】TP3-05在当今这个信息爆炸的时代,知识库从用户解决问题的需要出发,通过对特定领域的知识采用一定的知识获取方式收集起来,随后以某种或多种知识表示方式,实现在计算机中组织、存储、管理,并最终应用于实际问题。
而知识库构建在整个知识库中的作用尤为重要。
目前知识库构建已成为理论界和实务界研究的热点课题之一。
文章将利用Cit eSpaceⅢ信息可视化工具形象化地对国内知识库构建领域进行定量研究和可视化分析。
本研究可以让国内知识库构建领域的研究者了解现有研究状况以及该研究在未来的发展趋势,指导其研究工作。
1 相关研究CiteSpaceⅢ是美国德莱赛尔大学信息科学与技术学院的陈超美博士用Java语言开发出来的可视化分析软件。
该软件可以通过对学科领域文献信息的可视化分析和研究,使该学科领域研究者能够更直观地辨识出学科领域的现状及发展趋势[1]。
目前CiteSpaceⅢ软件在知识图谱的可视化研究中得到了广泛的应用。
如魏瑞斌针对国内知识图谱期刊论文的外部特征和内容特征进行了可视化分析,研究表明国内知识图谱研究处于起步阶段,研究人员和机构相对集中,研究论文的合著率较高,研究主题鲜明[2]。
基于CiteSpace的国内家校合作研究可视化分析李明;郭瑞迎【摘要】以中国知网(CNKI)数据库1999~2016年间收录的家校合作领域的学术论文为研究对象,运用CiteSpaceⅢ可视化软件、Bicomb2.0共词分析软件和SPSS软件,对时间分布、研究机构分布、核心作者以及研究热点等方面进行了梳理,得出如下结论:研究起步晚但后劲足;机构分布不均且研究群体差异大;研究成果少且层次低;研究主题繁多且不聚焦.【期刊名称】《教学研究》【年(卷),期】2017(040)006【总页数】7页(P27-33)【关键词】家校合作;知识图谱;CiteSpaceⅢ;可视化【作者】李明;郭瑞迎【作者单位】陕西师范大学教育学院,陕西西安 710062;陕西师范大学教育学院,陕西西安 710062【正文语种】中文【中图分类】G459苏霍姆林斯基说过:“最完备的社会教育是学校—家庭教育。
”[1]基础教育领域的家校合作研究始于19世纪末,源于欧美发达国家,到20世纪80年代末逐渐受到我国教育研究者的关注,成为一种加强家庭和学校对话的互助方式。
国际21世纪教育委员会主席雅克·德洛尔(Jaques Delors)在联合国教科文组织的报告中指出:“家庭和教育系统的关系有时被认为是对立的关系,在某些发展中国家,由学校传授的知识可能与家庭的传统价值相对立;同样,处境很差的家庭往往把学校看作一个陌生的世界,他们既不了解学校的规约,也不了解学校的用途。
因此,家长和教师之间必须进行真实的对话,儿童的协调发展要求学校教育和家庭教育互相补充。
”[2]家校合作不仅弥补了单纯的家庭教育和学校教育的局限,甚至成为解决当前农村隔代教育问题的有效途径。
家校合作已经成为世界各国教育研究和学校教育改革的一个主题, 是教育发展的一个趋势[3]。
近年来,国内家校合作研究逐渐兴起,并引起学术领域和实践领域的关注。
本文以中国知网(CNKI)为文献来源,通过绘制知识图谱,对国内家校合作研究的时空分布、研究热点及其变迁进行可视化分析,梳理国内家校合作的理论基础、研究现状以及发展趋势,以期为推动我国家校合作研究走向深入提供借鉴。
国内机构知识库研究综述以机构知识库的相关状况为研究对象,分别从机制、模式、策略三方面阐述其国内研究现状。
指出机构知识库的研究还需要进一步深入,主要包括:机构知识库内容的管理与维护需引起重视,知识产权问题需要思考,资源建设策略需要完善,机构知识库联盟发展模式及自存储模式需要实证研究。
标签:机构知识库;建设机制;建设模式;建设策略1 引言机构知识库(Institutional Repository,简称IR)又称机构典藏库、机构库等,是学术机构为捕获并保存机构的智力成果而建立的面向机构和社区的数字资源库[1]。
吴建中于2004发表“图书馆VS机构库”,拉开我国机构知识库研究的序幕。
此后,机构知识库建设在国内逐步成为研究机构和大学的研究热点。
各位专家学者纷纷从不同的视角出发,对这一课题进行了深入研究,但尚没有从机制、模式、策略等宏观层面介绍机构知识库建设情况的文献。
因此,文章以“机构知识库建设”为主题,在中国知网中国知识资源总库、维普数据库分别检索到相关学术论文214篇、67篇,对这些论文从机制、模式、策略角度对国内机构知识库建设情况进行梳理和研究,以期对今后国内的机构知识库实践有所启示。
2 国内机构知识库建设机制从国内机构知识库建设的实践来看,技术已不再是关键问题,相关政策和相应的支撑机制乃是机构知识库得以持续健康发展的根本。
邓君分别从机构知识库形成的动力机制、促进其发展的协调激励机制、保障其质量的控制机制到推动其利用的共享机制进行深入阐述[2]。
洪梅、马建霞研究了激励机制以激励作者自愿提交他们的作品[3]。
陈琳分析了机构知识库建设的战略机制、组织机制、政策机制、管理服务机制、激励机制和技术机制[4]。
通过文献梳理可以看出,关于机构知识库建设机制方面,国内的研究还比较少。
目前国内学者从以下两个方面对机构知识库建设机制进行研究:(1)机构知识库运行机制,如激励机制、组织机制、控制机制等。
其中激励机制是学者们的研究热点。
收稿日期:2011-03-04基金项目:吉林大学基本科研业务费哲学社会科学研究项目(2009JC047)作者简介:马捷(1973-),女,辽宁锦州人,博士,副教授,主要从事知识组织研究.中国知网知识组织模式研究马捷1,2,刘小乐1,郑若星1(1.吉林大学管理学院,吉林长春130022;2.吉林大学信息资源研究中心,吉林长春130022)摘要:中国知网是世界上全文信息量规模最大数字图书馆。
分析了中国知网当前的知识组织模式:数据库、主题树、知识库和分类主题一体化模式。
结合知识组织技术的发展,提出中国知网可以进一步采用基于本体的知识组织模式、主题图和超维知识组织模式,提高知识服务水平。
关键词:知识组织;中国知网;主题图中图分类号:G350文献标识码:A文章编号:1007-7634(2011)06-0843-04Reseach on Knowledge Organization Mode of CNKIMA Jie 1,2,LIU Xiao-le 1,ZHENG Ruo-xing 1(1.Management School of Jilin University,Changchun 130022,China;rmation Resource ReseachCenter of Jilin University,Changchun 130022,China)Abstract :CNKI is a Digital Library which owns the most full text information quantity in the world.The article analyze the knowledge organization model of CNKI,they are Database model 、Topic-Specific Tree model 、Knowledge Base model and Classification and Subject Integration model.With the development of knowledge organization technology,the author put forward three new knowledge organization models that can be used on CNKI,they are Knowledge Organization Model Based on Ontology 、Topic Map Model and Super Dimension Organization KI can improve its knowledge service level through using thesenew models.Keywords :knowledge organization;CNKI;theme map 数字图书馆是以知识概念为支撑的一种信息服务和知识服务环境【1】,其知识组织方式是在传统的信息组织方式基础上发展起来的。
数字图书馆的知识组织不仅仅是文献分类标引或各种事实数据的有序排列【2】,还需要为用户提供知识检索,为用户提供智能化的知识服务,即知识组织已经成为数字图书馆研究的核心问题。
中国知网作为世界上全文信息量规模最大的“CNKI 数字图书馆”,一直致力于整合知识信息资源,为海内外各行各业提供知识与情报服务。
对中国知网的知识组织模式进行分析和研究,借鉴其有益经验,探索深化发展途径,对于提升数字图书馆的知识组织程度,深化服务水平,具有重要价值。
1中国知网概述中国知网,即中国国家知识基础设施(China Na ⁃tional Knowledge Infrastructure ,CNKI ),以实现全社会知识资源传播共享与增值利用为目标,是全球领先的数字出版平台。
中国知网通过产业化运作,为全社会知识资源高效共享提供丰富的知识信息资源和有效的知识传播,是一个资源丰富的数字化学习平台。
中国知网目标,一是能够将数字图书馆的信息资源大规模的整合起来从而提高知识资源的利用价值;二是建设数字化的知识服和知识资源深度开发情报科学Vol.29,No.6June,2011第29卷第6期2011年6月的平台,为全社会提供资源共享、数字化学习、知识检索、社会学习建设知识创新信息化条件;三是为知识资源生产出版部门创造互联网出版发行的市场环境与商业机制,大力促进文化出版事业、产业的现代化建设与跨越式发展【3】。
中国知网提供的服务内容丰富,主要有中国知识资源总库的各种数据库检索,提供CNKI 源数据库、外文类、工业类、农业类、医药卫生类、经济类和教育类多种数据库。
数字出版平台提供学科专业数字图书馆和行业图书馆的订购和检索服务。
同时中国知网还提供文献数据评价以及包括文献检索、数字检索、工具书检索、翻译助手、专业主题、学术资源、学术统计分析等各种知识检索,极大地丰富了学术资源。
多种知识组织模式对于中国知网服务目标的实现起着非常重要的作用。
2中国知网的知识组织模式分析知识组织是在图书馆学、情报学的分类系统和叙词表研究的基础上发展起来的,是文献信息组织的延续和升华。
知识组织以知识单元为加工单位,它不仅揭示文献的学科、主题内容,而且更注重揭示文献所载的知识单元。
知识组织将文献和信息中所包含的知识内容用语词和概念表达,采用知识工程中的知识表达方法进行知识标引和组织,能更有效的对网络信息进行组织与检索【4】。
通过知识挖掘、知识发现、推送技术、智能搜索等多种智能技术和软件技术对信息进行精简,可以发现隐含在信息中的有用知识单元并组织成知识库,进而借助一定的知识组织工具,形成有序化的知识组织体系,为用户提供知识服务。
2.1数据库模式数据库是在计算机存储设备上合理存放的相互关联的数据集合。
中国知网采用组织数据库或者各种表及文件的方法来组织知识库,如顺序文件、索引文件、多重链接表文件、倒排文件及散列文件等。
知识库系统将从组织结构上支持中国知网的数据库管理。
中国知网将学术研究、工具书检索、各种专业行业知识仓库等资源融入到不同类型的数据库中组织起来,采用标准的记录格式存储,提供统一的检索入口。
数据库中的文献资源以主题词、关键词、作者、全文、参考文献等多种途径进行文献标引,组织文献信息资源。
数据库模式可以对中国知网中的知识进行优化处理,提高知网数据操作灵活性。
同时可以高速处理大量结构化和非结构化数据,并且以信息项作为数据的最小存取单位,组织规范化的数据。
图1显示了知网知识组织的数据库模式:图1中国知网知识组织数据库模式图2.2主题树模式主题树是一种可供检索和查询的等级式主题目录,以超文本链接的方式将不同学科、专业、行业和区域的信息按照分类或主题目录组织起来。
主题树提供一种界面机制,用户利用这个界面,通过主题目录间接地连接并使用多个实际的数据资源。
中国知网数据库检索界面左侧以学科领域进行分类,形成学科分类导航系统,利用导航系统可以逐步选择学科领域缩小检索范围从而提高检索的准确性。
另外期刊导航、专业性的知识库、行业知识仓库也是按照不同行业区域信息进行的分类。
主题树模式将知识资源按照某种事先确定的概念体系结构进行分类,用户可根据需要逐层选择自己需要的知识内容,直至最后将信息资源搜索完全,并且这种方式简单易用,屏蔽了用户的复杂性,树形的浏览界面对用户来讲目的性强,检索方便快捷。
中国知网将这种树形的主题目录与数据库相联系,在数据库中,利用主题树缩小检索范围,检索到需要的网络信息资源。
2.3知识库模式知识库系统能够从组织结构上支持数字图书馆的知识组织。
目前多是由数据库系统从组织结构上组织数字信息,但数据库技术不能提供数据信息之间的知识关联【5】。
中国知网的科普知识总库、文艺作品总库、医院知识仓库等都是专业性质的知识库,提供各种知识之间的关联从而帮助用户提高检索的效率。
知识库可以采用顺序文件、索引文件、倒排文844情报科学29卷件等形式组织数字文件,用户通过索引检索到知识信息及全文信息。
2.4分类主题一体化模式分类法和主题法是传统的知识组织方法,是图书馆学研究的宝贵财富。
中国知网的知识组织借鉴了分类主题法的思想。
中国知网的学科分类、以及数据库检索中的关键词、主题检索、作者检索等均是在分类、主题标引的基础上组织信息资源,形成有序化的知识库,从而提供信息检索服务的。
通过智能化的控制词表,可以实现作者语言与用户语言的控制和转换。
自动标引系统可将采自信息源的作者语言转换为标引语言;查询系统则可以把用户语言转换为标引语言,使用户语言与作者语言通过标引语言达到最佳的匹配。
知网通过计算机技术建立知识分类体系与控制词表的系统联系,将标引语言与用户语言匹配统一,实现语词检索,并可以把大量无用信息过滤掉,结果更接近用户的需求,大大提高检索效率。
中国知网的知识组织运用了多种方法,以分类法、主题法为基本工具,将知识资源进行标引,形成基于数据库、主题树、知识库、分类主题一体化等多种有序化的知识体系,为用户提供多种检索方式。
3中国知网新的知识组织模式再探尽管知识知网的知识组织模式在实践当中具有较强的应用性,但仍然存在信息格式的异构、各种内容交叉重复、知识关联程度低【6】以及知识非统一性和知识服务的价值性等问题。
随着知识服务的范围、深度的不断拓展,可以将本体论的理念和技术、主题图方法等知识组织理论和技术引入到中国知网的知识组织模式构建中,努力实现语义化的知识检索,提升这一典型数字图书馆的知识服务水平。
3.1基于本体的知识组织模式本体为特定领域的学者提供概念化术语,是概念化和结构化的明确表示与描述【7】。
本体能够更全面、深入地揭示领域概念及概念间的关系,作为具有全球规范性和共享性的概念空间,通过映射、整合等手段为语义分类提供有效的途径【8】,成为知识组织的有力工具,是语义网的重要组成部分。
本体可以作为知网的知识组织方式,为知网的语义检索奠定基础。
建立基于本体的中国知网知识组织模式的一般思路为:针对知网中的不同学科领域构建领域本体,将领域本体中的概念术语及知识关联进行语义分类,建立索引存储到语义空间。
而检索方式是基于本体的概念检索,将构建好的领域本体作为检索系统的语义概念层,用户以本体库中的语词关系为基础进行检索。
中国知网可以运用本体理念和技术,针对不同的学科领域,将领域内的概念、概念间的关系加以表示和描述,形成领域本体,基于领域本体揭示领域知识结构,构成基于本体的知识库。
通过计算机语言程序,借助语义相关和扩展标记语(xm1),编制数字图书馆本体知识集成系统。
这种知识组织模式能够有效解决信息检索中的查全率和查准率问题及知识的共享和复用等问题。