国内知识图谱研究综述与评估20042010年
- 格式:doc
- 大小:569.00 KB
- 文档页数:21
收稿日期:2013-08-28基金项目:本文系国家自然科学基金项目“基于语义网格的数字图书馆个性化推荐模型研究”(项目编号:71003032)、湖北省教育厅人文社会科学基金项目“知识图谱技术在管理科学与工程学科分析中的应用研究”(项目编号:13g248)、湖北省人文社会科学重点研究基地———湖北农村社会管理创新研究中心基金项目“农村信息化知识图谱构建研究”和湖北工业大学2009年度博士科研启动基金项目“基于语义网格的数字图书馆个性化推荐研究”(项目编号:BSQD0921)的研究成果之一。
作者简介:孙雨生(1980-),男,讲师,博士,硕士生导师,研究方向:信息系统工程、数字图书馆技术、电子商务技术,发表论文35篇,主编教材1部。
·信息计量学研究与应用·国内知识图谱研究进展———基于CiteSpace Ⅱ的分析孙雨生 仇蓉蓉 邓 兴(湖北工业大学管理学院,湖北武汉430068)〔摘 要〕本文以CNKI 为数据源,用CiteSpace Ⅱ的关键词聚类和突变词检测功能,客观全面分析了国内知识图谱研究热点及相关学者、研究前沿及热点与前沿的演化,以揭示国内知识图谱研究进展。
〔关键词〕知识图谱;CiteSpace Ⅱ;共词分析;研究热点;研究前沿;VOSviewerDOI :10.3969/j .issn .1008-0821.2014.01.019〔中图分类号〕TP399;G202 〔文献标识码〕A 〔文章编号〕1008-0821(2014)01-0084-05Research Development of Mapping Knowledge Domains in China———Analysis Based on CiteSpace ⅡSun Yusheng Qiu Rongrong Deng Xing(School of Management ,Hubei University of Technology ,Wuhan 430068,China )〔Abstract 〕With the CNKI as data source ,this article made use of the keyword clustering and burst detection function of CiteSpace Ⅱ,anal yzed research hotspots and related scholars ,research frontier and the evolution bet ween hotspots and frontiers objectively and comprehensively ,in order to reveal the research develop ment of mapping knowledge domains in China .〔Key words 〕mapping knowledge domains ;CiteSpace Ⅱ;co -word analysis ;research hotspot ;research frontier ;VOSviewer 作为一种可从宏观、中观、微观层面可视化揭示学科、领域、主题发展概貌的方法,知识图谱可辅助学者多角度直观审视领域研究主体(含机构)及其合作、研究热点及前沿、研究结构和现状、研究范畴等,其理论及应用研究逐渐成熟,成为科学计量、信息计量、文献计量等领域新兴研究热点,发文量近年来成倍增长,呈J 型曲线走势。
国内知识管理模型研究综述
陈兰杰
【期刊名称】《科学与管理》
【年(卷),期】2010(030)001
【摘要】近年来,知识管理逐渐成为企业组织竞争及生存的主要措施.文章对国内知识管理模型进行了系统的归纳和分析,指出了国内企业知识管理模型存在的不足,并对知识管理模型研究趋势进行了展望,以期对国内知识管理实践和研究有所裨益.【总页数】7页(P9-15)
【作者】陈兰杰
【作者单位】中国人民大学信息资源管理学院,北京,100872;河北大学管理学院,河北,保定,071000
【正文语种】中文
【相关文献】
1.国内知识检索研究综述 [J], 张澜; 张蓉
2.国内知识付费研究综述 [J], 金小璞;徐芳;张慧敏
3.建筑学视阈下国内乡村人居环境研究综述——基于建筑类期刊文献的知识图谱分析 [J], 贾晓浒;轩长征;杨春虹
4.基于知识图谱的国内事件旅游规划与管理研究综述 [J], 郝芳;林丹
5.近十年国内教育人工智能研究综述--基于CiteSpace知识图谱分析 [J], 郭莹莹;刘丹
因版权原因,仅展示原文概要,查看原文内容请购买。
第 22卷第 5期2023年 5月Vol.22 No.5May 2023软件导刊Software Guide医学知识图谱研究综述刘悦悦,李燕(甘肃中医药大学信息工程学院,甘肃兰州 730000)摘要:知识图谱是一个古老又崭新的课题,是知识工程在新时代的新形态,也是当前人工智能的重要研究方向之一。
知识图谱应用于医疗领域在一定程度上对医疗数据以及医患之间的治疗过程起到了很大的助推作用。
针对医学知识图谱的构建,从医学数据源、医学知识抽取、医学知识融合、医学知识表示、医学知识存储、医学知识推理、医学质量评估7个方面结合相关文献展开叙述;然后总结医学知识图谱在临床决策支持诊断、医学知识普及、医学问答系统以及智能语义搜索方面的应用;最后就目前医学知识图谱面临的挑战进行讨论,以期为其进一步发展构建提供参考。
关键词:医学知识图谱;构建技术;人工智能;大数据DOI:10.11907/rjdk.221641开放科学(资源服务)标识码(OSID):中图分类号:TP391 文献标识码:A文章编号:1672-7800(2023)005-0241-07Review of Medical Knowledge Graph ResearchLIU Yue-yue, LI Yan(School of Information Engineering, Gansu University of Traditional Chinese Medicine, Lanzhou 730000,China)Abstract:Knowledge graph is an old and new topic,a new form of knowledge engineering in the new era,and one of the important directions of artificial intelligence.The application of knowledge graph in the medical field has played a great role in pushing the medical data and the treatment process between doctors and patients to a certain extent.The feature of this paper is the construction of medical knowledge graph,from seven aspects:medical knowledge data source,medical knowledge extraction,medical knowledge fusion,medical knowledge representa‐tion,medical knowledge storage,medical knowledge reasoning,and medical quality assessment,and then summarizes the application of medi‐cal knowledge graph in clinical decision support diagnosis,medical knowledge popularization,medical question answering system and intelli‐gent semantic search,and finally discusses the current challenges faced by medical knowledge graph,in order to provide reference for the de‐velopment and construction of medical knowledge graph.Key Words:medical knowledge graph; construction technology; artificial intelligence; big data0 引言大数据(也称巨量资料)时代,医疗数据量以几何级数的形式高速增长,数据增长速度可以用“爆炸式”来形容。
知识图谱综述表示、构建、推理与知识超图理论一、本文概述知识图谱作为一种结构化的知识库,集成了来自多个来源的信息,通过实体、概念和关系来组织和呈现现实世界中的复杂知识。
近年来,随着大数据和技术的快速发展,知识图谱已成为信息抽取、自然语言处理、智能问答、推荐系统等多个领域的研究热点。
本文旨在全面综述知识图谱的表示、构建、推理及其与知识超图理论的联系。
文章首先介绍知识图谱的基本概念和应用背景,随后深入探讨其表示方法、构建技术和推理算法,并在此基础上分析知识超图理论与知识图谱的内在关联。
本文的综述将为相关领域的研究者提供全面、深入的理论支持和实践指导。
二、知识图谱的表示知识图谱的表示是知识图谱构建和应用的关键环节。
它涉及到如何将现实世界中的实体、属性、关系等复杂的信息结构转化为计算机可以理解和处理的数据结构。
知识图谱的表示方式主要分为两大类:符号表示和分布式表示。
符号表示:符号表示是传统的知识表示方法,主要包括一阶谓词逻辑、描述逻辑、语义网络等。
这种表示方式能够清晰地描述实体间的复杂关系,易于人类理解和解释。
然而,符号表示在处理大规模知识图谱时存在效率低下的问题,难以处理模糊和不确定的知识。
分布式表示:为了克服符号表示的不足,近年来分布式表示方法逐渐受到关注。
分布式表示方法将实体和关系表示为低维稠密的向量,通过向量运算来模拟实体间的关系推理。
这种方法能够有效地处理大规模知识图谱,并且在处理模糊和不确定知识方面具有一定的优势。
其中,TransE、TransH、TransR等翻译模型是分布式表示中的代表性方法,它们在链接预测、实体分类等任务中取得了显著的效果。
随着深度学习技术的发展,基于神经网络的知识表示方法也逐渐兴起。
这类方法通过训练神经网络来学习实体和关系的表示,能够捕获更丰富的语义信息。
例如,卷积神经网络(CNN)和循环神经网络(RNN)等模型被应用于知识图谱的表示学习中,取得了良好的效果。
知识图谱的表示方法经历了从符号表示到分布式表示再到基于神经网络的知识表示的发展历程。
国内混合式学习研究热点的知识图谱分析作者:董小玉来源:《青年时代》2020年第17期摘要:本文通过可视化分析中国知网2010年到2020年混合式学习相关文献,明确该研究的热点,为国内相关领域的教育研究者提供直观的研究整体结构。
以中国知网检索数据为研究样本,通过分析发现有关翻转课堂、教学模式、mooc和spoc的研究是我国混合式研究一直关注的主题;未来的研究热点是雨课堂、深度学习、教学改革。
关键词:混合式学习;混合教学;知识图谱;可视化分析;中国知网一、引言混合式学习,有时又称混合教学,认为学习是一种混合、非单一的形式,通过将传统的教师与学生面对面的授课方式和学生网络学习的优势相结合,实现最有效的学习。
混合式学习最早被应用于远程教育、成人教育和企业教育。
我国最早对混合式学习进行阐述的是祝智庭教授,随着高校教育信息化的发展和数字化校园的建设,混合式学习逐渐被引入学校教育教学中,并且未来极有可能影响高等教育变革。
二、数据来源与研究工具以“混合式学习”“混合学习”“混合教学”“混合式教学”为检索关键词,以核心期刊和CSSCI 为期刊类别,时间设定为2010年—2020年,在中国知网上共检索到相关文献753篇。
以CiteSpace(5.5R2版本)软件作为研究工具,可视化分析混合式学习相关文献。
三、数据分析文献数量的变化是评价一个知识领域研究状况的重要指标之一。
753篇文献的可视化分析结果显示:我国的混合式学习研究呈增长趋势,从2014年开始显著增长;混合式学习已经成为当前教育领域的一个研究热点。
(一)关键词词频分析关键词图谱可以帮助研究人员分析研究热点以及热点的变化。
关键词是对研究内容的凝练,一个领域的研究热点可由关键词的频率体现而来,频次越高,说明其所受关注度越大。
如果某些关键词在某领域反复出现,那么其就是该领域研究的热点主题。
本文753篇文献经过CiteSpace可视化分析软件数据转换,绘制出研究热点聚类知识图谱,共得到136个关键词节点和由136个关键词组成的409条连线,如图1所示。
知识图谱⽂献综述(第四章实体关系学习)1. 任务定义、⽬标和研究意义 关系定义为两个或多个实体之间的某种联系,实体关系学习就是⾃动从⽂本中检测和识别出实体之间具有的某种语义关系,也称为关系抽取。
关系抽取的输出通常是⼀个三元组(实体 1,关系,实体 2)。
例如,句⼦“北京是中国的⾸都、政治中⼼和⽂化中⼼”中表述的关系可以表⽰为(中国,⾸都,北京),(中国,政治中⼼,北京)和(中国,⽂化中⼼,北京)。
关系抽取是知识图谱构建和信息抽取中的⼀个关键环节,具有重要的理论意义和⼴阔的应⽤前景,为多种应⽤提供重要的⽀持,主要表现在: (1)⼤规模知识图谱的⾃动构建。
很多互联⽹应⽤都需要知识图谱的⽀撑,这个知识图谱不仅包含 WordNet、HowNet 等常识知识图谱中的通⽤语义知识,⽽且包含百科全书、领域知识图谱中的领域语义知识。
如果能把多源异构知识集成为⼀个⼤的知识图谱,将可能提⾼很多互联⽹应⽤系统的性能,并开创语义⽹时代的很多应⽤。
现有的知识图谱如 WordNet、HowNet 和 CYC 等⼤多数依靠专家⼈⼯编撰。
随着互联⽹的发展,知识呈爆炸式增长,⼈⼯构建知识图谱特别是构建领域知识图谱时遇到了很⼤困难,不仅费时费⼒,⽽且存在知识覆盖率低、数据稀疏和更新缓慢等问题。
利⽤关系抽取技术,知识图谱可以根据结构化的抽取结果⾃动⽣成。
典型的例⼦有:Freebase、Yago 和 BDpedia。
(2)为其它信息获取技术提供⽀持。
1. 对信息检索提供⽀持:可以对复杂的查询进⾏关联搜索和推理,提供智能检索结果。
例如,对于“⾝⾼ 170 以上的中国射⼿座明星”,有了关系抽取技术的⽀持,通过知识图谱构建,就可以通过推理的⽅法获得结果。
图 1 展⽰了百度搜索引擎对“⾝⾼ 170 以上的中国射⼿座明星”查询返回的结果,这个结果的背后就受到⼤规模知识图谱的⽀撑。
2. 对问答系统提供⽀持:在问答中,关键步骤是建设⼀个领域⽆关的问答类型体系并找出与问答类型体系中每个问答类型相对应的答案模式,这就需要关系抽取技术的⽀持。
我国高等教育统计研究的前沿热点与发展趋势基于C N K I 文献的可视化知识图谱分析王 晓(成都师范学院党政办公室,四川成都 611130)*摘 要:利用C i t e S pa c e 软件,对C N K I 数据库收录的20世纪80年代至今关于高等教育统计的相关文献进行统计分析㊂结果表明:研究文献数量逐渐增多,但实证研究居多㊁研究群体分散;研究主题热点集中在统计指标体系设计㊁统计信息化建设㊁统计问题与对策及统计数据管理等方面;互联网和大数据驱动的高等教育统计改革㊁统计数据质量核查㊁国内外高等教育统计对比研究将成为研究前沿㊂关键词:高等教育统计;知识图谱;可视化分析d o i :10.3969/j.i s s n .2095-5642.2020.12.010中图分类号:G 649.2 文献标志码:A 文章编号:2095-5642(2020)12-0071-09高等教育统计是国家教育统计的组成部分,是高校制定计划政策㊁领导科学管理决策的基础工作,是全面反映高校各项教育事业发展的 晴雨表 ㊂在大数据时代,高等教育统计工作发挥的作用更加充分,也被赋予更高的要求㊂2018年‘教育统计管理规定“的颁布,标志着国家首次以法规的形式对统计工作提出明确要求㊂新形势下,如何让教育统计工作更加优质高效地服务于教育管理决策和社会发展尤为重要㊂高等教育统计自提出以来,学术界涌现出大批优质研究成果,奠定了坚实的研究基础㊂本文拟对高等教育统计研究现状进行系统梳理,厘清研究总体态势和发展趋势,以期为该领域的理论研究和实践操作提供参考㊂一㊁概念界定我国教育统计工作始于1954年,当时由教育部下设机构具体负责全国教育基本信息的统计㊁分析和发布㊂伴随着教育事业体制机制改革,教育统计指标内容不断丰富,程序手段日益规范㊂目前,我国已形成了以教育事业统计和教育经费统计为主体,以各专项统计为补充的中国教育统计体系[1]㊂本文所研究的高等教育统计专指高等教育基层事业统计,是指由教育部发展规划司组织实施的,对各级各类高等学校(机构)基本情况㊁学生情况㊁教职工情况和办学条件四部分数据进行收集㊁整理㊁汇总㊁分析和公布的一项年度统计工作㊂此项工作于每年9月开始,以自上而下逐级布置㊁自下而上逐级汇总的方式开展,统计资料由省级教育行政主管部门审核汇总后统一报送教育部㊂二㊁样本来源与研究工具本文将研究对象限定为国内高等教育事业统计研究,选取C N K I 数据库收录的全部期刊作为数据来源,17*收稿日期:2020-07-21作者简介:王 晓(1993 ),女,四川达州人,助教,硕士,研究方向:高等教育管理㊂成都师范学院学报2020年12月以 高等教育统计 高校教育统计 高等教育事业统计 作为检索主题,检索时间截至2020年2月23日㊂人工筛选剔除无效文献后,选取162篇文献作为研究样本㊂运用可视化软件C i t e S p a c e进行数据处理,绘制高等教育统计研究主要研究力量㊁关键词共现㊁主题词突现㊁时区分布等知识图谱,并深入研读文献进一步分析总结我国高等教育事业统计的研究热点和前沿趋势㊂三、高等教育统计研究总体态势(一)文献时间分布纵观发文数量变化(见图1),可以了解高等教育统计研究的演变过程㊂总体而言,有关高等教育统计的研究文献数量呈现波动起伏的趋势㊂20世纪80年代初期首次出现关于高等教育统计的研究,2005年以前文献数量均在5篇以下,2008年达到第一个高峰,此后出现了 断崖式下跌 ,2011年以后又逐渐备受重视,直至2018年发文共计82篇,2019年一年就达到23篇㊂图11980-2020年高等教育统计研究发文量年度分布曲线图笔者认为,发文数量的起伏变化与我国对教育统计的高度重视㊁教育统计政策规定的颁布及高等教育发展的环境形势密切相关㊂1986年发布的‘教育统计工作暂行规定“标志着以部门规范性文件规范引导教育统计工作㊂20世纪末期的高校扩招,导致原有的统计指标体系已经不能适应高等教育发展新形势㊂2004年,教育部印发‘普通高等学校基本办学条件指标“,进一步明确普通高等学校本科教学工作评估指标体系,引导上级部门和高校自身对办学水平和教育质量做出更加科学客观的评价㊂2018年相继颁布‘防范和惩治统计造假弄虚作假督察工作规定“‘教育统计管理规定“,重申依法依规做好教育统计的重大意义,教育统计工作法治化建设迈上了新台阶㊂大数据时代的到来对充分发挥数据挖掘技术在高等教育统计数据中的作用提出了新的挑战和要求㊂如何从智能化㊁个性化等方面为高校的有效决策㊁科学管理提供智慧型信息服务,引发了诸多学者和教育统计工作者的思考㊂(二)主要研究力量分布1.作者分析对作者的发文量进行统计分析,可以了解高等教育统计研究领域中的核心作者群体㊂表1是发表论文产量排名前10的作者㊂就文献研究机构的统计结果来看,从事高等教育统计研究的多是高校一线教育统计工作人员,也有少数教育主管部门相关人员开展的本土研究,如辽宁省教育厅教育信息中心丁特关于辽宁省27第36卷(总第334期)王晓:我国高等教育统计研究的前沿热点与发展趋势高等教育事业统计队伍的现状分析㊂负责统计工作具体事务的多为非专职专业人员,未接受专业理论培养培训,这可能导致对教育统计工作的理论思考较少㊁实践探索较多㊂表高等教育统计研究排名前的发文作者利用C i t e S p a c e软件对作者进行共现分析,可以展现作者间的合作情况㊂图2是高等教育统计研究发文作者的合作网络图谱㊂结果显示,网络密度为0.0042,仅有少数作者有一定合作关系㊂比如徐云庆和张维康2人为同一单位,在20世纪90年代合作完成了关于高等教育统计改革的3篇文献;以张铭㊁朱华武㊁袁光敏㊁张彩虹㊁蒋科为中心的团队研究了教育统计信息在高等教育宏观和微观管理中的价值及利用情况,以张铭㊁陈冬林为中心的团队完成了‘构建高等教育统计综合指标体系的设想“一文㊂图2高等教育统计研究作者合作网络图谱2.研究机构分析高等教育统计的研究机构网络图谱(见图3)显示,自2000年以来,黑龙江旅游职业技术学院㊁辽宁工业大学图书馆㊁云南民族大学成果最多,其次是南京航空航天大学㊁哈尔滨理工大学等高校㊂就合作关系而言,除了以华东师范大学为中心㊁以新疆医科大学为中心㊁以厦门大学为中心的研究团队外,其他研究机构分布相对零散,合作关系不太紧密㊂37成都师范学院学报2020年12月图3高等教育统计研究机构网络图谱(三)主题分析关键词是文章主题高度概括的结晶,关键词的频次和中心度大小在一定程度上反映着该领域的研究主题及其影响度㊂综合表2和图4可知,除了 高等教育统计 外, 教育统计 高校 对策 大数据 指标体系 统计数据 等都是高频关键词,中心度也相对较高㊂尤其是进入21世纪以来, 高校管理 大数据 等成为研究的热点问题㊂表高等教育统计研究高频关键词统计47第36卷(总第334期)王晓:我国高等教育统计研究的前沿热点与发展趋势图4高等教育统计研究关键词共现知识图谱四、高等教育统计研究热点与前沿(一)研究热点研究热点是某个研究领域的一组文章所共同聚焦的话题或主题,通常会在一定时间内高频出现并产生内部链接关系㊂为进一步了解高等教育统计研究热点,在共现分析基础上绘制了关键词聚类共现图谱(见图5)㊂根据关键词知识图谱聚类分析的结果,结合文献进行深入分析发现:高等教育统计研究以高等教育统计㊁高校管理㊁统计指标为核心,多方发散,主要包括高校图书馆㊁信息化建设㊁大数据㊁高等教育统计质量㊁高等教育统计问题及对策等内容,具体表现为以下几个方面㊂1.关于高等教育统计指标体系的研究科学的高等教育统计是真实㊁客观反映高校综合办学状况和高等教育整体发展态势的重要前提,这有赖于合理完善的统计指标体系㊂指标体系是否清晰完整,指标内容是否科学合理,决定着国家高等教育统计预期目标的实现程度和高校整体发展水平的体现程度㊂2002年,教育部提出了涵盖学年㊁学校㊁学生㊁教职工㊁资产与校舍五大部分的高等教育年度统计指标体系,比较客观地反映了高等教育发展的规模㊁内容和结构,但仍不能适应形势的变化㊂随着高等教育体制机制的深化改革,调整不切实际的指标,设置更加合理的指标,制定一套真正适合高校发展规律㊁系统反映高校发展水平㊁合理指引高校发展方向的指标体系和调查报表尤为必要㊂有研究者就指出,现行的指标内涵不全面㊁不清晰㊁不切实际,指标统计时点欠周全㊂还有研究者就部分专项指标存在的不足进行了阐述,比如刘振义等人关于高等教育统计中图书统计问题的考量㊁梁娉婷关于高校师资和学生指标设置的思考㊂顾健还对美国教育统计中心的图书馆数据统计展开调查,借鉴反思我国大学图书馆调查存在的不足㊂2.关于高等教育统计信息化建设的研究无论从统计流程规范高效还是数据价值挖掘运用,大数据给高等教育统计工作信息化的改革创新提供了诸多机遇和无限挑战㊂借鉴西方国家教育数据获取和利用的体制机制,对于我国教育管理信息化建设具有重要意义㊂诸多研究者重点探讨了国外教育统计信息管理的组织机构㊂吴旻瑜等人介绍了美国国家教育统计中心的历史沿革㊁组织机构和相关运作情况,张艳丽的研究也涉及这些方面㊂李斌对美国国家教育统计中心的机构体制㊁统计模式㊁指标体系的介绍,展现了国外教育统计机构的发展情况㊂还有研究者专门研究国外的教育数据系统建设,如王兴宇对美国高等教育综合数据系统数据来源㊁数据采集和数据利用等运行机制要素的分析介绍,从顶层设计㊁技术引进㊁分析应用和文化培育等方面提供借鉴㊂周爱苹㊁王霞等人则对我国高校教育统计信息化平台建设的问题㊁对策及未来发展方向作了阐述㊂彭雪涛从高校教育统计的现状与57成都师范学院学报2020年12月存在的问题为切入点,分析教育统计面临的技术大环境,探讨了美国院校研究中的智能技术,总结了我国高等教育统计在观念意识㊁管理合力㊁专业队伍和技术保障等方面的发展趋势㊂张瑜等人探讨了大数据在教育领域的发展现状和在教育统计中的应用现状,提出了有序开放教育统计数据㊁加快构建教育大数据平台㊁高效推动教育信息化与教育大数据的有机衔接和大力加强统计队伍建设的发展愿景㊂还有研究者用大数据的模式对 数据孤岛 现象作了深入思考㊂3.关于高等教育统计问题及对策的研究高等教育统计是反映高校发展状况的 听诊器 ,统计工作开展成效如何?预期目标是否实现?遇到了哪些阻碍对现状的了解分析也是研究者极为关注的一大焦点㊂诸多研究者将高等教育统计工作存在的问题归为四个方面:一是统计意识不够主动强烈㊂无论是领导者还是统计工作人员,对待教育统计工作缺乏足够重视㊁主动思考的意识,更多是被动接受㊁按步完成,疲于应付㊁交表了之, 用数据说话 的思想并未真正渗透到管理决策中去㊂二是统计制度不够健全完善㊂教育统计作为典型的行业统计缺乏相关的行业法律法规,教育统计工作开展流于形式㊁一片混乱,直至‘教育统计管理规定“等文件的颁布才进一步推动了教育统计法治化建设㊂三是统计队伍不够稳定专业㊂统计工作机构多是相关部门兼职,工作人员身兼数职,人手严重不足㊁业务不够精通㊁培训缺乏持续,统计工作质量确需提升㊂四是资源共享不够及时有效㊂部门各自为政㊁协调不力,数据共享意识不足,既导致指标的口径范围不一,又增加统计的工作量;同时对于所有信息资源的组织管理不善,数据信息化建设比较落后㊂4.关于高等教育统计数据管理的研究王青逯提出, 我国教育事业统计工作每年调查的指标数量之多,范围之广,数据量多达55亿条㊂ [1]如何在海量数据中有效识别数据质量并得以充分运用,真正将高质量的数据变成科学决策和高效管理的参考依据这是大数据时代教育统计工作最关键的一环㊂有研究者提出建立经常性统计数据质量核查制度,不断提升统计数据质量,董锡臣则对教育事业统计数据质量分析与核查工具软件进行了技术分析㊂杨毅等人认为基于高效的采集㊁及时的转化,方可提升对统计数据的使用效益㊂余亚辉等人通过对比国内外情况,分析数据挖掘技术在我国高等教育统计中的运用现状㊂关于高等教育统计数据的使用,杨钢跃㊁杨小华㊁李丹丹等人的研究介绍了高等教育统计与教学评估的关系,戴世英㊁蔡品等人则重点分析了高等教育统计在高校教育教学管理中的应用情况㊂李文文针对目前高校教育统计存在的问题,找到提升教育统计数据质量和价值的路径㊂图5高等教育统计关键词聚类共现图谱67第36卷(总第334期)王晓:我国高等教育统计研究的前沿热点与发展趋势(二)研究趋势分析某一研究领域的学术前沿可以通过关键词突现图谱与时区分布图进行分析㊂为了解我国高等教育统计研究的热点及在不同时期的变化,在C i t e s p a c e关键词聚类共现分析基础上,进一步绘制我国高等教育统计关键词突现图谱(见图6)和时区分布图(见图7)㊂图6高等教育统计研究排名前10的关键词突现图谱图7高等教育统计研究关键词时区分布图根据关键词突现图谱和时区分布图,深入阅读文献,总结得出我国高等教育事业统计研究演进趋势分为三个阶段㊂1.以构建指标体系为导向的探索期20世纪80年代至21世纪初期,高等教育事业统计处于起步阶段,科学㊁系统㊁客观的统计指标体系是77成都师范学院学报2020年12月全面了解掌握高等教育发展整体状况的载体㊂1996年颁布了‘核定普通高等学校招生规模办学条件“‘ 红 ㊁ 黄 牌高等学校办学条件标准“,2004年对其修订后颁布‘普通高等学校基本办学条件指标“和‘监测办学条件指标“㊂围绕这一政策文件,诸多学者关注了高等教育统计指标体系调整的理论研究㊁高等教育评估背景下的统计指标体系实证研究㊁高等教育事业办学条件统计指标研究等内容㊂2.以服务教育管理为导向的成熟期高等教育事业统计工作是国家教育行政部门的一项 例行公事 ,更是学校综合评价㊁科学规划和民主管理的基础工作㊂在相对完善的统计指标体系基础上收集海量数据,但如何将这些数据转化为有效信息? 2008年起,部分研究者关注了这一问题,多聚焦于高等教育统计在教学评估㊁人才培养水平评估㊁高职院校管理等领域的广泛运用㊂3.以转变统计模式为导向的创新期2015年,我国首次提出 实施国家大数据战略 ;2016年, 十三五 规划进一步细化战略目标和任务; 2017年,十九大报告提出 推动互联网㊁大数据㊁人工智能和实体经济深度融合 ㊂无论是统计内容完善㊁统计手段更新㊁统计平台建设还是统计结果运用等,大数据时代的到来都对教育统计的改革与创新提出了新的要求和挑战㊂这一时期,研究者重点关注了高等教育事业统计数据挖掘与分析㊁高等教育统计信息化㊁ 互联网+ 时代教育统计工作创新开展的路径等方面㊂五、研究结论随着互联网㊁云计算㊁人工智能等信息技术的飞速发展和广泛应用,高等教育也迎来了信息的大爆炸时代㊂对海量教育统计数据的充分挖掘和运用,成为诸多高校制定政策规划㊁评估发展绩效㊁加强自身建设的重要源头㊂本文运用C i t e S p a c e软件对1980-2020年期间我国高等教育事业统计相关研究进行了梳理㊂第一,研究数量上,我国高等教育事业统计愈来愈受关注,研究成果数量呈波动起伏,但总体态势良好㊂尤其是在2005年以后(除2008年外),相关研究数量持续增长,这与国家政策法规的健全完善和各级教育行政部门及高等学校的高度重视息息相关㊂研究成果数量有一定程度增加,但明显存在不足㊂从样本来源看,绝大多数文献都发表在普通刊物,权威核心刊物成果较少㊂因此,要进一步加大高等教育统计研究力度,不断提升研究成果层次㊂第二,研究方式上,诸多文献是经验交流,探讨了高等教育统计实践工作中存在的问题㊂对研究力量的分析结果显示研究者身份多为高校一线兼职统计工作人员,这意味着高等教育统计研究的经验之谈仍占多数,来自专家学者的理论探讨相对较少㊂研究力量分布相对分散,机构之间的合作和联系较少,导致研究成果比较零散,不利于开展深度研究㊂高等教育统计要进一步强化理论研究,为教育统计工作的科学规范开展提供强有力的理论支撑;要加强学术团体建设,形成研究合力,产出更多高水平创新性的研究成果㊂第三,研究主题上,已有研究主题聚焦在统计指标体系设计㊁统计信息化建设㊁统计问题及对策以及统计数据管理等4个方面,涵盖面较广㊂自高等教育统计提出至今,已有研究者从数据的收集㊁分析到运用做了大量的探讨㊂有文献关注了国外教育统计体制机制的宝贵经验,为我国教育统计信息化建设提供借鉴㊂也有研究者着眼于信息化时代教育统计模式的创新㊂实际上,教育现代化给教育统计的现代化带来了重大机遇,精准统计成为教育统计的必然追求㊂要继续关注互联网和大数据驱动的高等教育统计改革,聚焦高等教育统计数据质量核查,强化国内外高等教育统计对比研究,取他山之石,攻自身之玉,为高等教育统计服务于管理决策提重供科学的参考㊂87第36卷(总第334期)王晓:我国高等教育统计研究的前沿热点与发展趋势参考文献:[1]王青逯.健全教育统计职能,服务教育科学发展[J].现代教育科学,2008(6):22-25.[2]刘琪,方振邦.美国大学统计服务决策工作简析 以斯坦福大学为例[J].中国高等教育,2019(8):62-64.[3]李益平,周荣荣.说说大数据时代的高等教育统计工作[J].中国统计,2018(10):13-15.[4]李文文.提高高等教育事业统计数据质量及价值的路径[J].大学教育,2018(4):41-43.[5]钟玮.我国高等教育统计工作改革与创新研究[J].统计与管理,2014(1):40-41.[6]张振助.国际教育指标及统计的比较与借鉴[J].复旦教育论坛,2009(5):50-55.R e s e a r c hF r o n tH o t s p o t s a n dT r e n d s o fH i g h e rE d u c a t i o nS t a t i s t i c s i nC h i n a:AV i s u a l i z e dK n o w l e d g eG r a p hA n a l y s i sB a s e do nC N K IL i t e r a t u r eWA N G X i a o(G e n e r a lA d m i n i s t r a t i o nO f f i c e,C h e n g d uN o r m a lU n i v e r s i t y,C h e n g d u,S i c h u a n611130,C h i n a) A b s t r a c t:As t a t i s t i c a l a n a l y s i sw a s m a d eo f t h ea c a d e m i c p a p e r s i nC N K Id a t a b a s es i n c et h e1980s w i t hh i g h e r e d u c a t i o n s t a t i s t i c a s t h e s u b j e c t b y t h e u s e o f C i t e s p a c e.T h e r e s u l t s s h o wt h a t t h e n u m b e r o f r e s e a r c h i s o n t h e i n c r e a s ew i t hm o r e e m p i r i c a l r e s e a r c h a n dw i d e l y d i s p e r s e d g r o u p s,a n d t h e r e s e a r c h f o-c u s i sm a i n l y o ns t a t i s t i c a l i n d e xs y s t e m,i n f o r m a t i o nc o n s t r u c t i o n,t h e p r o b l e m sa n dc o u n t e r m e a s u r e s, a n dd a t am a n a g e m e n t.I n t h e f u t u r e,t h e r e f o r mo f h i g h e r e d u c a t i o n s t a t i s t i c s d r i v e nb y I n t e r n e t o r b i g d a-t a,d a t a q u a l i t y v e r i f i c a t i o n,a n d c o n t r a s t i v e r e s e a r c ha t h o m e a n d a b r o a dw i l l b e t h e r e s e a r c h f r o n t.K e y w o r d s:h i g h e r e d u c a t i o ns t a t i s t i c s;k n o w l e d g e g r a p h;v i s u a l i z e d a n a l y s i s(编辑:赵华校对:罗布)97。
国内知识图谱研究综述与评估:2004-2010年* 汤建民/余丰民 2012-9-21 10:11:12 来源:《情报资料工作》2012年01期
【英文标题】Review and Evaluation of Knowledge Mapping Research in
China: 2004-2010
【作者简介】汤建民,男,1967年生,浙江树人大学科学计量学研究中心主任、教授,杭州310015;余丰民,1976年生,浙江树人大学图书馆副研究馆员,杭州310015
【内容提要】 文章综合运用词频统计、共词分析及可视化技术等文献计量方法,分析了国内知识图谱研究的整体现状,包括论文的总量分布、发表期刊分布、作者分布、机构分布、基金资助分布及论文研究热点等,并综合归纳了论文研究的主要内容。在此基础上,对该研究领域的现状和存在的问题进行了综述和评估,并提出了相应的对策。
This paper combines word frequency analysis, co-word analysis and visualization to demonstrate the general situation of knowledge mapping study in China. The authors discuss the distribution of papers, published journals, authors, organizations and funds as well as the focus of the existing papers and sum up main contents of the study. On this basis, the paper reviews and evaluates the status of the research and its existing problems, puts forward relevant counter-measures. 【关 键 词】知识图谱/文献计量/可视化/词频统计/共词分析mapping of knowledge/bibliometric/visualization/word frequency statistics/co-words analysis
1、研究目的和意义 知识图谱(Mapping of Knowledge)是显示科学知识的发展进程与结构关系的一种图形[1],是当今科学计量学、信息计量学、文献计量学以及情报计量学等学科共同关注的前沿学术领域之一。由于知识图谱方法能较直观地解读人类知识,有利于隐性知识的挖掘,目前已被广泛应用于人文社会科学与自然科学领域。
有关知识图谱的由来,陈悦博士和刘则渊教授认为,科学知识图谱的产生同绘图学和地图学有一定关系[1]。据有关文献介绍,早在20世纪70年代,美国国家基金会就出版了关于科学基金的地理分布报告,这被认为是国外最早研究知识地图的文献之一[1]。此后,知识地图在大量基于数据库的绘制工具推动下,突破了仅描述知识地理分布的局限,逐渐发展成为内涵更加丰富的知识图谱。2003年,美国科学院组织的“知识图谱测绘”(Mapping Knowledge Domains)大会的召开则标志着专家们对知识图谱绘制开始了大规模的深入研究。在该会议上,来自不同领域的专家发表了20多篇学术论文,介绍了有关知识图谱的最新研究成果[1]。自此以后,知识图谱领域的学术研究逐渐兴起。
在国内(大陆地区),大连理工大学是较早地(约2004年)从科学计量学的视角引进“科学知识图谱”方法的研究机构,他们在此领域已经开展了大量研究并取得了较为丰富的成果,为推动国内该领域的研究做出了很大的贡献[2]。在他们的影响下,国内参与该领域研究的人员和研究机构、发表的论文和应用的领域越来越多,呈现出日益繁荣的局面。但是,由于国内开展这方面研究的时间不长,误用、错用、盲目使用等情况也时有出现,并已经引起有关学者的一些疑问和忧虑[3]。我们认为,基于近年知识图谱领域的已有研究,分析其现状、明确其问题、考察其趋势、提出其对策,即对该领域的已有研究进行一次“科学学”视角的回顾性、反思性考察研究已经提上日程。
通过查阅文献,我们发现,除了任红娟、张志强已经对国外知识图谱的研究状况进行了文献计量分析[4],以及廖胜姣[5]、秦长江[6]、梁秀娟[7]等对国内知识图谱方法的研究作了一些定性为主的综述外,到目前为止,还没有文献对国内知识图谱领域的所有研究论文进行过系统的、定量为主的综述,特别是没有对2009年,2010年的相关文献进行过综述和评估,而这两年又恰是国内发表知识图谱论文数量激增、最能反映国内目前研究水平的一个时间段。鉴于此,本文拟为弥补此缺憾而作。本文研究的主要内容是:国内知识图谱领域的研究总体上达到什么样的程度,主要的研究机构有哪些,主要的研究学者有哪些,近年的研究热点是什么,存在的问题主要有哪些,今后的发展趋势怎样等,以期对该领域相关研究工作的进一步开展能有所帮助。
2、研究方法与数据收集 学术期刊作为科研成果的重要发布渠道,是科研工作者的首选,因此本文选择国内收录期刊较全的数据库——CNKI中国学术期刊网络出版总库作为数据源。
为尽量收齐样本,本文确立了“先粗后精、先大后小”的取样策略。具体方法是:先选择“知识图谱”、“知识地图”、“可视化”和“社会网络分析”等作为检索词,以“篇名或关键词”为途径分别进行检索,检索时间为2004-2010年,共检索出6641条记录(检索时间:2011年2月20日),输出的题录字段有“篇名、作者、作者单位、关键词、基金项目、摘要、刊名、发表年、第一作者”共9项。由于绝大多数论文并非属于文献(科学)计量学知识图谱研究领域,为此又对这些论文进行严格的人工筛选,最后确认264篇论文作为本文文献计量研究的数据样本。
本文研究的主要方法是:先用词频统计以及基于共词分析的可视化知识图谱等文献计量方法研究论文的产出结构和研究热点,然后通过逐篇阅读重要论文,运用内容分析法来分析论文的主题、内容、方法和研究进展等,最后归纳分析得出结论。
3、论文产出结构分析 3.1论文总量分布 对264篇论文的年度分布统计表明,最早的相关论文是2004年由中山大学信息管理系胡利勇和陈定权发表在《情报杂志》第11期的《引文分析可视化研究》。该文认为,引文网络可以通过聚类的分析方法,用直观的网络图形式显示出来。很明显,文中的“网络图”便是后来称为科学知识图谱的一种。2005年,该领域论文共有6篇,其中大连理工大学的陈悦和刘则渊合著的《悄然兴起的科学知识图谱》一文在国内首次使用了“科学知识图谱”一词。2006年以后,论文数量有较快的增长,到2010年已达到年发文百篇以上的规模(因CNKI数据录入有滞后现象,实际数量应该超过100篇)。 3.2发表期刊分布 经统计,264篇论文分别发表在90种期刊上,其中发表1篇论文的有52种,发表2篇的有18种,发表3篇的有5种,发表4篇及以上的共有15种。表1列出了发表论文数在3篇及以上的期刊。由表1可以看出,这些期刊绝大多数属于图书情报及科技管理领域期刊,并以核心期刊居多,而且也不乏像《中国图书馆学报》、《情报学报》、《科学学研究》、《科研管理》等国家一级学术期刊。
对90种期刊的所属领域大致归类,我们还发现,知识图谱研究论文主要发表在图书情报类和科技管理类期刊中,其次是一些高校的学报,见表2。值得注意的是:教育学领域期刊也占到了全部期刊类别的12%强,发表的论文数量则超过了5%,这说明,教育学科已成为知识图谱方法的一个重要应用领域。
3.3作者分布 经统计,264篇论文中共有合著论文195篇,合著率高达73.8%;共有作者595人次,篇均作者数达到2.2人(见表3)。
如果在统计中不分作者排名情况,把所有作者都统计在内,那么264篇论文共有作者327位,其中发表论文在6篇及以上的作者有16位,除浙江树人大学的汤建民、武汉大学的马费成和河北大学的陈兰杰外,其余13位均来自大连理工大学。
如果单纯按第一作者统计,发现共有159位不同作者,其中发表1篇论文的作者有125位,发表2篇的作者有9位,发表3篇的作者有7位,发表4篇的作者有8位,发表5篇及以上的作者有10位。表4列出了发表论文在5篇及以上的10位高产作者及其所在机构。由表可见,大连理工大学在前10名中占了7席,可见其研究力量的强大。
3.4机构分布 经统计,第一作者所在机构共有82家,其中高校系统75家,科学院、情报所系统6家,还有一家是高等教育学会。可见,知识图谱的研究力量主要集中在高校。表5列出了11个发表论文在4篇及以上的机构。
由表5可知,大连理工大学的研究成果数量遥遥领先,约占全部论文的1/3,不愧为国内“知识图谱”研究的先行者。
另外,如果进一步结合表5的“第一作者人数”进行考察,则可以发现:各研究机构的论文发表篇数与第一作者人数大多是相对均衡的,但浙江树人大学的7篇论文全是由其科学计量学研究中心主任汤建民教授一人所发,显示出该机构的第一作者人数明显偏少,说明其成员的研究力量还没有很好地发挥出来,今后应加大人才培养力度。
3.5基金资助分布 264篇论文中共有139篇论文受到239个基金项目资助(有些论文拥有不止一项基金),占论文总量的52.9%,总篇均资助达0.9项,这是一个非常高的基金资助率。其中,国家社会科学基金和自然科学基金达到106项,占全部基金项目的45%;教育部、省级和校级课题也不在少数;部分论文还参与了国际合作,