2020年中国知识图谱行业研究报告
- 格式:pdf
- 大小:2.22 MB
- 文档页数:45
第24期2020年12月No.24December,20200 引言近年来,国家对于人工智能的发展也越来越重视,2017年7月,国务院发布《新一代人工智能发展规划》,在该文件中明确指出了人工智能的发展对于教育行业发展的重要性。
2018年5月,教育部发布了《教育信息化2.0行动计划》,再次强调了发展智能教育的重要性,开启了智能教育时代。
2020年3月,美国高等教育信息化组织发布的《2020年地平线报告:教与学版》,再次强调了人工智能技术在教育中的重要作用。
1 数据来源与研究方法1.1 数据来源研究数据的收集来源于中国知网(CNKI )数据库,在高级检索页面中主题词设定为“人工智能”并含“教育”。
学科设定为“社会科学Ⅱ辑”中的社会科学理论与方法、社会科学及统计学、教育理论与教育管理、高等教育;“信息科技”中的无线电电子学、电信技术、计算机硬件技术、计算机软件及计算机应用和互联网技术。
时间跨度为2010年1月1日至2020年3月15日。
期刊来源选取“核心期刊”和“CSSCI ”。
共检索到914篇,剔除不符合主题的文献,共得到792篇作为研究样本。
1.2 研究方法本研究利用CiteSpace V 软件进行可视化分析,绘制了2010年以来国内人工智能教育的作者、机构合作图谱,关键词共现图谱等,对现有的文献进行定量和定性分析。
知识图谱是通过“图”和“谱”的双重特征与性质,基于科学知识对象显示其发展进程和结构关系,通过可视化知识图形和序列化的知识谱系,呈现知识元或知识群之间网络结构互动交叉演化或衍生等诸多复杂的关系。
本文除了采用文献研究法之外,还采用了对比分析法,通过对不同的文献进行对比分析,了解人工智能教育的应用现状以及特点。
摘 要:近年来,随着科技的发展,人工智能已经成为人们生活中不可忽略的一个部分。
在教育行业中,也有越来越多的教育单位选择使用人工智能技术开展教育工作,但是目前国内针对人工智能教育的应用却依旧存在一定的问题,亟待改善和解决。
第49卷第1期2021年1月河海大学学报(自然科学版)Journal of Hohai University(Natural Sciences)Vol.49No.1Jan.2021DOI :10.3876/j.issn.10001980.2021.01.005 基金项目:国家重点研发计划(2018YFC0407901);安徽省高等学校自然科学研究重点项目(KJ2019A1277)作者简介:冯钧(1969 ),女,教授,博士,主要从事数据管理㊁智能数据处理与数据挖掘㊁水利信息化研究㊂E⁃mail:fengjun@ 通信作者:杭婷婷,副教授㊂E⁃mail:httsf@引用本文:冯钧,杭婷婷,陈菊,等.领域知识图谱研究进展及其在水利领域的应用[J].河海大学学报(自然科学版),2021,49(1):26⁃34.FENG Jun,HANG Tinting,CHEN Ju,et al.Research status of domain knowledge graph and its application in water conservancy[J].Journal of Hohai University(Natural Sciences),2021,49(1):26⁃34.领域知识图谱研究进展及其在水利领域的应用冯 钧1,杭婷婷1,2,陈 菊1,王云峰1,王秉发1,张 涛1(1.河海大学计算机与信息学院,江苏南京 211100;2.无人机开发及数据应用安徽高校联合重点实验室,安徽马鞍山 243031)摘要:首先总结现有领域知识图谱的研究现状㊂其次,介绍领域知识图谱的发展趋势㊂然后,梳理水利领域知识图谱的构建难点,提出包含知识表示㊁抽取㊁融合㊁推理和存储等关键模块的水利领域知识图谱研究框架,并简要概括上述各模块的研究内容㊂最后,指出领域知识图谱构建存在的表示形式单一㊁抽取样本稀少㊁多源知识冲突㊁规则表示困难和数据管理低效等问题,认为合理化表示㊁准确全面抽取㊁实时性融合㊁可解释推理和高性能存储是下一步水利知识图谱的研究方向㊂关键词:领域知识图谱;水利领域;大数据;知识表示;知识抽取;知识融合;知识推理;知识存储中图分类号:TP391.1 文献标志码:A 文章编号:10001980(2021)01002609Research status of domain knowledge graph and its application in water conservancyFENG Jun 1,HANG Tinting 1,2,CHEN Ju 1,WANG Yunfeng 1,WANG Bingfa 1,ZHANG Tao 1(1.College of Computer and Information ,Hohai University ,Nanjing 211100,China ;2.Key Laboratory of Unmanned Aerial Vehicle Development and Data Application of Anhui Higher Education Institutes ,Maanshan 243031,China )Abstract :Firstly,this study summarized the current research status of the domain knowledge graph.Secondly,the development trend of the domain knowledge graph was introduced.Then,this study sorted out some difficulties in the construction of water conservancy knowledge graph,proposed a research framework including main modules such as knowledge representation,extraction,fusion,reasoning,and storage,and briefly summarized the research content of each module.Finally,the construction of domain knowledge graph encountered some problems,such as the single representation,the extraction sample sparse,the multi⁃source knowledge conflict,the rule representation difficulty,and the inefficient data management.Therefore,the rationalized representation,accurate and comprehensive extraction,real⁃time fusion,interpretable reasoning,and high⁃performance storage are regarded as the next research direction of water conservancy knowledge graph.Key words :domain knowledge graph;water conservancy;big data;knowledge representation;knowledge extraction;knowledge fusion;knowledge reasoning;knowledge storage随着人工智能研究的不断发展,人工智能的主要发展方向经历了从拥有快速计算和记忆存储能力的运算智能,到拥有视觉㊁听觉㊁触觉等感知能力的感知智能,正在迈向拥有理解和思考能力的认知智能㊂知识图谱和以知识图谱为代表的知识工程系列技术是认知智能的核心㊂知识图谱本质是一种揭示实体之间关系的语义网络,可以对现实世界的事务及其相关关系进行形式化描述[1],它强大的语义处理和互联组织能力,对有效描述数据间的关联关系进而打破信息孤岛的局面具有一定的现实意义㊂目前,在一些领域已经出现了面向领域的知识图谱,例如电影领域的IMDB [2]㊁生物医学领域的BMKN [3]㊁新闻领域的ECKG [4]㊁健康领域的SHKG [5]等㊂从已有的领域知识图谱看,构建领域知识图谱需要借鉴通用知识图谱的方法,同时还需要依靠特72第1期冯 钧,等 领域知识图谱研究进展及其在水利领域的应用定行业数据,具有特定的行业意义,领域知识图谱的构建是当前知识图谱研究的一个重要方向和趋势㊂随着水利信息化及其水利信息技术的发展,水利领域长期业务实践积累了实时监测㊁遥感遥测㊁水文气象㊁水利工程㊁社会经济等多源异构水利大数据,实现了水利监测从点到面的转变,从静态到动态的拓展㊂随着信息采集和传输技术的飞速发展和领域信息化的进程,领域数据不断更新,数据量日益增加,数据间语义不一致也屡见不鲜㊂多源异构数据呈现出海量㊁动态㊁内容多样㊁处理复杂的特点㊂如何让分布存储管理的㊁语义各异的数据能够互联,充分发掘领域数据价值,促进信息资源的高效利用,是推进智慧水利[6]的关键,也是水利信息资源查询推荐,语义搜索,智慧防汛[7⁃8]和智慧水资源管理[9]等应用的基础,对于提高水利领域智能化管理水平㊁辅助管理者进行决策分析具有非常重要的意义[10]㊂因此,水利领域知识图谱研究既具有重要的理论意义,也具有显著的实用价值㊂本文总结领域知识图谱构建的研究现状,包括构建方式㊁应用现状等方面的进展;介绍近年来领域知识图谱构建的发展趋势;对水利领域知识图谱构建工作进行展望,提出研究框架和具体的研究内容㊂1 领域知识图谱构建研究现状知识图谱按照覆盖范围可分为通用知识图谱和领域知识图谱㊂通用知识图谱面向通用领域,以常识性知识为主,其构建过程高度自动化㊂其关联的大多数是静态的㊁客观的㊁明确的三元组事实性知识㊂领域知识图谱面向某一特定领域,以行业数据为主,其构建过程半自动化㊂其关联的不仅包含静态知识,也涉及一些动态知识㊂本文主要探讨领域知识图谱构建㊂1.1 领域知识图谱的构建方式在领域知识图谱的构建方式方面,目前主要有自顶向下和自底向上2种构建方式㊂自顶向下方式是针对特定的行业,由该行业专家定义好顶层本体与数据模式,再将抽取到的实体加入到知识库中㊂国内外现有的本体建模工具以Protégé㊁PlantData为代表㊂Protégé是一套基于RDF(S),OWL等语义网规范的开源本体编辑器,拥有图形化界面,适用于原型构建场景㊂PlantData是一款商用知识图谱智能平台软件㊂该软件提供了本体概念类㊁关系㊁属性和实例的定义和编辑,屏蔽了具体的本体描述语言,用户只需在概念层次上进行领域本体模型的构建,使得建模更加便捷㊂自底向上方式主要依赖开放链接数据集和百科网站,从这些结构化的知识中进行自动学习,直接将抽取数据中发现的实体㊁关系以及属性合并到知识图谱中[11]㊂自顶向下的方法有利于抽取新的实例,保证抽取质量㊂而自底向上的方法则能发现新的模式㊂因此,目前大部分领域知识图谱的构建方式是自顶向下和自底向上相结合的方式㊂1.2 领域知识图谱的应用现状领域知识图谱通常用来辅助各种复杂的分析应用或决策支持㊂目前,在大多数领域中均存在领域知识图谱的应用㊂因为应用场景和应用目的不同,不同领域的应用形式也有所不同㊂下面将从知识应用的角度出发,介绍相关领域知识图谱的应用现状㊂a.电商知识图谱的应用㊂电商知识图谱的主要应用场景就是导购㊂导购就是让消费者更容易找到他想要的东西㊂为此,电商知识图谱学习了大量的行业规范与国家标准,对一些专业词汇进行了更细致的解决㊂另外,它还可以从公共媒体和专业社区中识别出近期热词㊂当消费者输入相关热词之后,可以出现跟热词相关的商品㊂与此同时,电商知识图谱还可以通过场景构建,实现与场景相关的商品推荐㊂b.医疗知识图谱的应用㊂医疗知识图谱的主要应用包括医疗过程智能辅助㊁医学科研以及患者服务等方面㊂其中医疗过程智能辅助是通过医疗知识图谱实现临床辅助决策㊁合理用药等智能服务㊂医学科研是基于医疗知识图谱,辅助医务工作者实现疾病风险预测㊁药物研发等应用服务㊂患者服务是根据患者过去的就医记录以及相关的医疗知识,为患者提供健康知识推送和健康评估等日常服务㊂c.企业知识图谱的应用㊂企业知识图谱通过异常关联挖掘㊁最终控制人等方式为行业客户提供风险管理㊂其中异常关联挖掘是通过路径分析㊁关联探索等操作,挖掘企业之间的异常关联,减少企业经营风险和资金风险㊂最终控制人是寻找持股比例最大的股东,最终追溯至自然人或者国有资产管理部门,向行业用户提供更准确的智能服务㊂d.创投知识图谱的应用㊂创投知识图谱主要应用包含知识检索和可视化决策支持㊂其中知识检索是由机器完成用户搜索意图识别,向用户提供准确检索答案㊂可视化决策支持是通过图谱可视化技术对公司82河海大学学报(自然科学版)第49卷的全方位信息,投资机构的投资偏好等进行展示,为投融资决策提供支持㊂总的来说,知识图谱与各行业的深度融合已经成为一个重要趋势㊂在这一过程中,涌现出一系列的领域应用,可以解决行业痛点问题㊂2 领域知识图谱构建的发展趋势领域知识图谱构建的主要过程包括知识表示㊁知识抽取㊁知识融合㊁知识推理和知识存储等5个方面㊂尽管目前相关原理和应用都已经取得了较好的成果,但仍在快速发展之中㊂近年来,领域知识图谱的发展趋势发生了一系列的变化,主要表现在:a.在知识表示方面,现阶段一般采用三元组表达事实知识㊂但是,在决策㊁推理等相关应用中,需要依赖于大量专家知识㊁动态知识进行辅助判断,而专家知识的表示已经超出了常规知识表示的范畴㊂在大数据的赋能下,知识表示的重心将逐步过渡到动态知识是必然趋势㊂b.在知识抽取方面,现阶段的研究主要集中在纯文本信息抽取方面㊂在训练样本较为丰富的情况下,基于神经网络的抽取模型可以取得较好的抽取效果㊂但是,领域知识多数处于小样本㊁零样本以及面向开放域的抽取环境下,知识抽取的重心将逐步过渡到小样本㊁零样本信息抽取是必然趋势㊂c.在知识融合方面,现阶段的研究主要聚焦于知识融合过程中的某一部分或者只关注知识融合的模式,冲突检测㊁实体对齐㊁属性对齐和属性真值发现过程的研究缺乏连续性㊂另外,随着大量新增知识的更新,知识融合的重心将逐步过渡到新增知识的实时融合是必然趋势㊂d.在知识推理方面,现阶段的研究主要采用基于规则㊁逻辑的方法挖掘领域图谱中隐含的知识或纠正错误的知识㊂但是,该方法对规则的依赖度高㊂图神经网络是连接主义与符号主义的有机结合,不仅使深度学习模型能够应用在图这种非欧几里德结构上,还为深度学习模型赋予了一定的因果推理能力[12]㊂知识推理的重心将逐步过渡到面向图结构的深度推理是必然趋势㊂e.在知识存储方面,现阶段一般利用传统的关系型数据库存储领域知识图谱㊂但是,针对低选择性㊁复杂查询效率低的问题,知识存储的重心将逐步过渡到分布式RDF查询优化是必然趋势㊂3 水利领域知识图谱构建3.1 水利领域知识图谱构建的难点a.在水利知识表示方面,领域应用不仅需要静态知识,也需要动态知识㊂如何对抽取出来的静态知识和动态知识进行合理表示是当前面临的主要技术难点㊂另外,有很多知识和事实有时间和空间条件,从时空纬度扩展知识表示也是需要解决的技术难点㊂b.在水利知识抽取方面,纯文本信息抽取是当前面临的主要难点㊂部分文本抽取算法在公共数据集上取得了较好的实验结果,但普遍存在应用到水利领域中扩展性不好等问题㊂难点在于如何根据领域知识图谱的小样本特性,构建基于小样本的有效模型㊂c.在水利知识融合方面,主要存在以下难点:(a)实体对应不准确,同一实体名在不同数据源中常含有歧义,数据源中存在严重的多源指代问题[11];(b)不同数据源关于相同实体的相同属性存在表述差异[13];(c)不同数据源为同一实体的同一属性提供的属性值存在冲突[11]㊂d.在水利知识推理方面,由于现有水利领域的应用需要高准确性地从图谱中获取信息,因此基于描述逻辑和规则的推理方法能有效用于水利知识推理㊂难点在于如何设计基于一阶谓词逻辑的推理规则用于知识推理㊂e.在水利知识存储方面,主要存在以下难点:(a)随着水利数据不断丰富,RDF数据规模日益增加,现有的集中式数据管理系统难以满足对大规模RDF数据的存储和查询性能需求,需要高性能的分布式数据管理系统[14]来实现对大规模RDF数据的存储㊁索引和查询处理;(b)现有的分布式数据管理系统,对特定类型的查询进行了优化[15],但对水利领域常涉及的低选择性㊁大直径查询的查询效率低;(c)现有的分布式数据管理系统不能动态适应工作负载[16]的变化㊂3.2 水利领域知识图谱的总体框架为解决上述水利领域知识图谱构建研究的5个难点,并实现建立水利领域知识图谱的目标,本文提出了第1期冯 钧,等 领域知识图谱研究进展及其在水利领域的应用如图1所示的研究框架㊂在该研究框架下,首先对水利知识表示进行研究,建立2种不同的表示形式;其次,针对不同类型的水利数据,研究相对应的水利知识抽取方法;然后,研究了水利知识融合和推理的具体方法;最后,在充分利用水利大数据和相关存储技术的基础上,对水利领域知识进行存储,支撑相关应用㊂图1 水利领域知识图谱构建研究框架Fig.1 Modeling framework of domain knowledge graph in water conservancy3.3 水利领域知识图谱构建的研究内容水利领域知识图谱的构建流程可以被归纳为5个模块,即水利知识表示㊁水利知识抽取㊁水利知识融合㊁水利知识推理以及水利知识存储㊂水利知识表示是将水利知识表达成计算机可存储㊁可计算的结构化知识㊂水利知识抽取可以从大量结构化㊁半结构化和非结构化的水利数据中提取知识要素㊂水利知识融合可以消除实体㊁关系㊁属性与对象之间的歧义,并为水利知识图谱更新旧知识或补充新知识㊂水利知识推理是在已有水利知识的基础上进一步挖掘隐含知识或者缺失事实,从而丰富㊁扩展水利知识库㊂水利知识存储是设计有效的存储模式来支持对水利数据的有效管理㊂3.3.1 水利知识表示三元组是知识图谱的一种通用表示形式[17],由2个具有语义连接关系的水利实体和实体间关系组成,是水利知识的直观表示㊂三元组的基本形式主要包括(实体1,关系,实体2)和(实体,属性,属性值)等㊂概念主要指水利对象类,例如水资源分区㊁流域分区㊁湖泊㊁测站㊁河流㊁水库及水电站等;实体是知识图谱中的最基本元素,例如湖西区㊁长江流域㊁汾湖㊁吴江水厂㊁太浦河㊁青山水库㊁龙头水电站等;关系存在于不同实体之间,例如属于㊁位于㊁流入㊁包含等;属性主要指对象可能具有的特征及参数,例如湖泊代码㊁湖泊名称㊁跨界类型等;属性值指对象特定属性的值,例如FH407㊁FHBA1B00000M㊁跨省等㊂表1 太湖描述的三元组表示Table 1 Triple representation of Taihu Lake 基本形式实体1关系实体2(实体1,关系,实体2)太湖流域太湖流域太湖流域太湖流域包括包括包括包括苏南地区杭嘉湖地区上海市大陆部分宣城的小部分地区基本形式实体属性属性值(实体,属性,属性值)太湖流域太湖流域太湖流域太湖流域太湖流域太湖流域太湖流域太湖流域总面积水面积河道总长河道密度地形地势河道比降水流流速 3.69万km 25551km 212万km 3.3km /km 2碟状平坦小缓慢通过一个全局唯一的ID 号来标识实体,实体间内在特征通过属性属性值来进行刻画,实体之间的关联通过关系来描述㊂三元组的存在表示一个已有的事实㊂例如关于太湖的描述为:太湖流域包括江苏省苏南地区㊁浙江省杭嘉湖地区㊁上海市大陆部分(不含崇明㊁长兴㊁横沙三道)和安徽省宣城的小部分地区,总面积3.69万km 2㊂流域水面积5551km 2;河道总长约12万km,河道密度达3.3km /km 2㊂流域地形呈周边高㊁中间低的碟状地形,地势平坦,河道比降小,水流流速缓慢㊂太湖的描述可以通过表1的三元组进行表示㊂所有三元组合可以并构成一个图(图2),其中节点表示实体,有向边表示实体之间的关系,不同的关系边的标签不同㊂3.3.2 水利知识抽取在水利信息技术飞速发展的今天,水利知识大量存在于水利信息系统的结构化数据㊁半结构化的表格㊁网页以及非结构化的文本数据中㊂针对不同类型的水利数据,采用不同的知识抽取方法㊂对于结构化数据,研究基于D2R 技术的知识图谱构建方法,利用信息系统中的结构化对象数据,抽取出静态对象及其相关关92河海大学学报(自然科学版)第49卷图2 水利知识表示示意图Fig.2 Schematic diagram of knowledge representation in water conservancy系㊂结构化数据抽取如图3(a)所示,基本步骤包括:(a)通过分析关系型数据库判断可以建立联系的2张表是否有外键关联㊂如果没有外键关联,需要人工设置外键或者在映射文件中写入外键㊂(b)建立了外键关系之后,将2张表映射成RDF 之后就可以实现语义互联㊂通过上述一系列操作,可以将2个实体之间存在的关系进行合理表示㊂对于半结构化数据,利用包装器将分布在互联网上半结构化的HTML 页面中的属性和属性值抽取出来㊂半结构化数据抽取如图3(b )所示,基本步骤包括:(a)HTML 页面清洗及解析㊂将页面转换为DOM 树形结构㊂(b)页面去噪㊂去除页面中与主题信息无关的其他信息㊂(c)包装器自动生成㊂自动获取需求信息节点的XPath 路径,定义规则模板,结合XPath 路径表达式实现抽取规则的自动构造㊂通过上述一系列操作,可以抽取出与实体有关的属性和属性值信息㊂对于非结构化数据,利用基于远程监督和神经网络的方法抽取出水利文本中的知识㊂非结构化数据抽取如图4(c)所示,基本步骤包括:(a)采用远程监督的方法利用知识库自动生成标注数据,再通过离群点检测的方法去除其中的错误标注㊂(b)采用基于监督学习的神经网络方法,先在标注好的数据上进行训练,再对未标注的数据进行测试,抽取出未标注文本中包含的实体和它们之间的关系㊂通过上述一系列操作,可以补充知识图谱中所需要的一些静态知识和动态知识㊂3.3.3 水利知识融合鉴于百科类网站具有一个页面围绕一个实体进行描述㊁页面组织结构相对统一㊁信息质量相对较高的特点,百科类网站成为领域知识库进行知识融合的主要数据来源[18],其信息框中的关于实体的属性-属性值对是对该页面实体信息的高度提炼㊂对不同百科中描述相同实体的知识卡片进行融合,可以获得关于水利对象的更全面㊁质量更高的知识㊂针对前述关于多知识库融合的难点,研究基于中文维基百科㊁百度百科㊁互动百科的知识卡片的水利知识融合方法㊂图4所示为水利知识融合流程㊂通过基于多特征的命名实体消歧㊁基于词典的属性对齐和基于贝叶斯分析的属性真值发现模块,消除实体㊁关系㊁属性及其对象之间的歧义,最终获得跟水利对象有关的属性及相应的属性值㊂图5是三大百科以及本地知识库对于水利对象 太湖”融合后的查询结果㊂蓝色的方块代表初步形成的水利领域知识图谱,红色的方块代表中文维基百科,黄色的方块代表百度百科,绿色的方块代表互动百科㊂从 太湖”的融合结果可以看出,本地水利领域知识图谱提供的信息资源具备良好的行业覆盖面和行业深度,为水利知识图谱的构建提供了核心支撑㊂中文维基百科则更多地从专业领域对其进行描述,提供的更多是较严谨的知识㊂百度百科和互动百科的知识卡片存在很多重复,且覆盖的属性更符合普通大众的娱乐需要,如关于太湖的适宜游玩季节㊁建议游玩时长㊁门票价格等㊂3.3.4 水利知识推理知识推理旨在从图谱已有的知识推理得到新的事实[19]㊂由于水利知识来源多样化,水利知识和数据的收集局限于终端采集方式而缺乏整体性,需要结合水利知识推理方法,来对相关知识进行补充㊂例如,水利领域知识图谱中存在由不同数据源得到的2个三元组:(太湖,出口,太浦闸)和(太浦闸,属于,太浦河),可以利用知识推理来获取新的事实知识(太湖,流入,太浦河)㊂目前主要的领域知识推理的方法有:基于规则推理的方法[20]㊁基于本体推理的方法[21⁃22]㊁基于表示模型的方法[23⁃25]㊁基于神经网络的方法[26]㊂通过对水利领域的业务需求进行分析,可以发现水利领域知识图谱需要为即时查询㊁决策提供支撑,因此决定了水利领域知识图谱构建的高准确性要求㊂另外,水利领域知识图谱的层次性较强,根据管理单位㊁地理空间㊁河网管网的分层关系可以在实际应用场景中将图谱切分,以降低搜索空间㊂结合水利知识图谱存在的高准确性要求和可切分特点,最适合的知识推理方法是基于规则推理的方法㊂该方法通过结合现有的一些水利领域知识,手工定义一些推理规则,去服务水利知识推理㊂其具体过程如下:(a)在概念层,通过一阶谓03第1期冯 钧,等 领域知识图谱研究进展及其在水利领域的应用图3 水利知识抽取示意图Fig.3 Schematic diagrams of knowledge extraction in water conservancy13河海大学学报(自然科学版)第49卷图4 水利知识融合流程Fig.4 Flow chart of knowledge fusion in waterconservancy图5 水利知识融合示意图Fig.5 Schematic diagram of knowledge fusion in water conservancy表2 水利知识推理规则Table 2 Rules of knowledge reasoning in water conservancy 编号推理规则含义1(河流,流入,水库),(水电站,属于,水库)→(水电站,位于,河流)水电站在水库所在的河流上2(泵站,拥有,取水口),(泵站口,位于,湖泊),(湖泊,属于,流域分区)→(取水口,属于,流域分区)取水口属于泵站所在湖泊的流域分区3(桥梁,位于,河段),(河段,属于,河流)→(桥梁,横跨,河流)桥梁横跨河段所属的河流词逻辑表示定义相关推理规则㊂(b)在实例层,再通过实例去实例化推理规则,找到符合推理规则的关系事实㊂表2为部分推理规则及其相关含义㊂3.3.5 水利知识存储水利知识存储的优化目标是减少冗余数据的存储,提高查询的效率㊂为了达到上述目标,采用以下处理手段:(a)针对集中式系统难以满足对大规模水利RDF 数据的存储和查询处理的问题,采用了一个无共享的集群,以分布式的方式处理大规模RDF 数据㊂(b)针对水利领域涉及的低选择性㊁大直径查询效率低,对查询工作负载伸缩性差的问题,研究了基于垂直划分和哈希划分的混合关系存储模式㊂通过监控查询工作负载中的频繁模式,使用频繁模式指导水利RDF 数据进行增量重划分,以提高对查询工作负载的伸缩性㊂(c)通过设置代价评估模型,进行代数优化和连接顺序优化,从而优化分布式查询的效率㊂水利知识存储流程如图6所示㊂该流程首先对经过质量评估后的水利知识进行基于主语的哈希划分形成三元组表(TT);然后,对哈希划分后的三元组表进行垂直划分,形成只包含主语-宾语列的垂直划分表(VP);最后,通过查询监控器监控查询工作负载,挖掘频繁模式,对频繁模式所对应的垂直划分表进行半连接计算,形成频繁谓词扩展垂直划分表(FP⁃ExtVP)㊂上述不同类型的表都以Parquet 格式存储到集群的各23。
2021·01我国地域辽阔,气候变化多样,经过历史的沉淀和演变,各个地域逐步形成了千姿百态的村落景观。
这些村落景观也是不同时代、不同地域文化变迁综合的象征。
在全国城镇化进程不断加速的今天,村落景观文化也受到了巨大的冲击和破坏。
早在19世纪60年代末,第二次工业革命发生后,西方国家的工业快速发展,人口快速增长,城市加速扩张,历史村落景观面临着诸多方面的冲击。
此时,国外一些国家的学者就已经开始对村落景观进行多层面的、系统性的研究[1]。
由于自然学科与人文学科在彼此的发展道路上出现了一定的交集,针对景观开展的人文性研究在逐渐增加。
国外研究者有的通过关注生态功能,联合地理、社会及人类等多种综合型学科来进行村落文化景观保护的相关研究[2]。
有的学者通过对景观规划理论与方案的研究,来实现村落自然环境与生态的保护[3-4],并针对多目标村落土地利用规划与景观生态设计提出了新思想和方法论[5]。
大量文献反映出国外学者通过上述研究方法和视角,注重结合景观文化与传统村落中的生态功能问题,非常值得国内研究人员借鉴和思考。
然而,基于中国知网CNKI 数据库对村落景观进行检索,可以发现其近年来的研究内容主要集中在相关政策层面的梳理、村落景观的物质层面的保护以及相关实证项目案例的辨析,对于全球范围内该领域的研究趋势的分析还是缺乏关注和研究。
为了更好地把握和认识村落景观近20年来的研究进展和基本框架,探寻未来国际视野下村落景观领域的研究趋势、前沿和热点,本研究基于Web of Science 数据库资源,通过文献计量学方法针对村落景观研究领域的有关文献进行量化分析,以此为该领域的后续研究的开展提供参考。
一、数据来源与分析方法(一)数据来源本文检索村落景观的数据范围来源于美国的科学情报研究所(Institute for Scientific Information )出版的Web of Science 数据库中的文献。
2021,31(2)郭和刚 我国尿素行业研究知识图谱分析 櫴櫴櫴櫴櫴櫴櫴櫴櫴櫴櫴櫴櫴櫴櫴櫴毷毷毷毷综 述评 论我国尿素行业研究知识图谱分析郭和刚 中国成达工程有限公司 成都 610041摘要 以中国知网2010~2020年尿素行业相关文献为数据源,采用citespace软件进行技术领域和研究热点可视化分析,发现近十年我国尿素行业研究共形成了尿素工艺、尿素装置(装备)两个重点技术领域,尿素工艺技术领域的研究热点为二氧化碳汽提法、水溶液全循环法和尿素增值技术;尿素装置(装备)技术领域的研究热点为尿素合成塔和尿素水解解吸系统。
目前我国尿素行业正处于创新发展、转型升级的关键时期,需要提高行业整体技术水平、环保水平和优化产品结构。
关键词 尿素 工艺 装置 知识图谱郭和刚:高级工程师。
2005年毕业于四川大学应用化学专业。
从事化工工艺设计及工程咨询工作。
联系电话:(028)65537113,18010657113,E-mail:guohegang@chengda com。
我国粮食产量的增加与氮肥施用存在正相关关系[1],其中尿素是我国粮食增产和不断发展的重要基础。
虽然尿素生产是一门古老而传统的生产技术,但大型尿素生产装置的工程配套技术却是尖端技术工程化的结晶。
分析近年来我国尿素行业相关文献,厘清领域内的研究热点及其演化,有利于掌握尿素相关技术的发展动态,对提高尿素行业整体技术水平、环保水平和优化尿素相关产品结构有重要的指导意义。
1 研究数据与方法以“尿素生产”为研究主题在中国知网进行文献检索,检索时间范围为2010~2020年,共检索出3500篇期刊论文,作为本研究样本文献。
Citespace是由美国陈超美教授[2]研发的一款学术动态追踪软件,运用文献计量学的方法,从大量文献中给出热点技术领域及其研究趋势和演化方向,并以可视化图谱的方式加以呈现。
2 知识图谱分析基于3500篇文献生成的知识图谱见图1。
可见近十年我国尿素行业共形成了尿素工艺、尿素装置(装备)两个重点技术领域。
基于知识图谱的电网工程建筑信息模型质量检查方法目录一、内容描述 (2)1.1 研究背景 (2)1.2 研究意义 (3)1.3 文献综述 (4)二、知识图谱理论基础 (5)2.1 知识图谱概述 (6)2.2 知识图谱构建方法 (7)2.3 知识图谱应用领域 (9)三、电网工程建筑信息模型概述 (9)3.1 电网工程建筑信息模型定义 (10)3.2 电网工程建筑信息模型特点 (11)3.3 电网工程建筑信息模型作用 (12)四、基于知识图谱的电网工程建筑信息模型质量检查方法 (13)4.1 质量检查指标体系构建 (15)4.1.1 数据准确性指标 (16)4.1.2 数据完整性指标 (17)4.1.3 数据一致性指标 (18)4.1.4 数据及时性指标 (19)4.2 基于知识图谱的质量检查流程 (20)4.3 质量检查算法设计与实现 (21)4.3.1 关系抽取算法 (22)4.3.2 实体识别算法 (24)4.3.3 图谱匹配算法 (25)4.4 质量检查结果可视化展示 (25)五、案例分析 (26)5.1 案例背景介绍 (28)5.2 基于知识图谱的质量检查过程 (29)5.3 检查结果分析与改进措施 (30)六、总结与展望 (31)6.1 研究成果总结 (32)6.2 研究不足与局限 (33)6.3 未来研究方向展望 (34)一、内容描述随着智能电网和电力物联网的快速发展,电网工程建筑信息模型(BIM)在工程设计、施工及运营维护中的应用日益广泛。
BIM模型质量参差不齐,严重影响了项目的顺利进行和后期运维的效率。
开展基于知识图谱的电网工程建筑信息模型质量检查方法研究,对于提高BIM模型质量、保障电网工程建设质量具有重要意义。
本文的研究成果为电网工程BIM模型的质量检查提供了新的思路和方法,有助于提高电网工程建设质量和管理水平,为智能电网的发展奠定坚实基础。
1.1 研究背景随着科技的发展和城市化进程的加快,电网工程建筑信息模型(BIM)在电力行业中的应用越来越广泛。
n C tinfo security网域动态2020年第8期\_________________________________________________________________________________________________________“2020CCF中国信息系统战略研讨会(FISS)”在贵阳召开2020年7月3日,由中国讨算机学会(CCF)主办,中国计算机学会信息系统专业委员会、贵州大学和贵州省计算机学会承办的“2020CCF中国信息系统战略研讨会(FISS)暨信息系统专委会工作会议”在贵阳成功召开。
会议采用线上线下同步的方式进行,线下进行现场报告,线上通过腾讯会议和Bilibili平台进行实况直播,高峰时参与人数超过8000人。
会议由CCF信息系统专委会秘书长、天津大学王鑫教授主持。
开幕式上,贵州大学计算机科学与技术学院院长秦永彬教授致欢迎辞。
他首先介绍了学院的基本情况,对参会嘉宾、专委会各位委员以及参会人员表示热烈欢迎。
随后,CCF信息系统专委会主任、东北大学于戈教授代表专委会致辞。
本次CCF-FISS会议同时也是CCF信息系统专委会走进高校系列学术报告会的第1期,围绕信息系统与知识图谱进行,邀请周傲英教授、王昊奋研究员、赵翔副教授作特邀学术报告。
来自高校、科研机构和企业的近300名参会代表通过腾讯会议在线参与。
华东师范大学副校长、“智能+”研究院院长、数据科学与工程学院院长周傲英教授以“数据赋能企业数字化转型”为主题,重点探讨了在大数据时代,如何理解数据价值,如何通过数据推动企字化转型。
同济大学“百人计划”王昊奋特聘研究员以“基于KG的认知智能中台思考及产业化实践”为题,围绕知识图谱中台概念,分享了金融、军工、传媒等行业从知识平台到认知智能中台转变升级的相关案例,介绍了统一知识表示及存储、人机协同数据建模、敏捷智能应用构建架构等关键际国防科技大学信息系统工程重点实验室赵翔副教授以“大规模知识图谱自动构建”为主题,围绕传统知识抽取方法的不足,引入联合抽取策略,并结合基于知识平移的约束,提高知识获取效率和精度。
(2023)中国知识图谱行业研究报告(一)
中国知识图谱行业研究报告
概述
•2023年中国知识图谱市场规模有望突破100亿元
•知识图谱是指利用图谱模型来表示知识的一种知识表示方法•目前国内知识图谱产业正在经历快速发展阶段
技术趋势
•基于知识图谱的智能问答系统将逐渐取代基于搜索引擎的问答方式
•基于知识图谱的智能客服系统将成为企业数字化转型的重要组成部分
•知识图谱与人工智能、区块链等技术的结合将会带来更多的应用场景
市场前景
•教育领域:利用知识图谱打造个性化、智能化的教育平台
•医疗领域:利用知识图谱构建医疗知识库和智能辅助诊断系统•金融领域:利用知识图谱加强风险控制和客户管理
行业热点
•知识图谱数据可视化工具的研发
•知识图谱自动化构建技术的提升
•知识图谱标准化和融合技术的发展
未来展望
•未来几年内,中国知识图谱市场有望保持高速增长态势
•知识图谱产业将成为人工智能发展的重要支撑
•未来,知识图谱将成为企业数字化转型的重要基础设施之一
主要挑战
•知识图谱数据的质量和规模问题
•知识图谱应用场景的局限性问题
•知识图谱行业标准和规范的缺失问题
发展策略
•加强知识图谱相关人才的培养和引进
•加强知识图谱产业生态建设,促进行业标准化和融合
•推动知识图谱技术与其他技术的深度融合,拓展应用场景
结语
中国知识图谱产业正处于高速发展期,面临诸多机遇和挑战。
未来,随着技术的成熟和应用场景的拓展,知识图谱将会为各个行业带来更多的智能化解决方案,推动数字化转型和经济发展。
审计质量研究综述———基于Citespace知识图谱分析王佳丽吴晓琳(通讯作者)卫萌周通新疆科技学院摘要:注册会计师审计是提升资本市场会计信息可信度的重要制度安排,审计质量也历来受到理论与实务界的关注。
本文利用Citespace 知识图谱分析方法,对近三十年来注册会计师审计质量研究文献(选取CNKI 数据库中核心期刊)进行梳理。
通过从发文量变化趋势、作者知识图谱、关键词共线等,分析审计质量的基本发展脉络及热点趋势,对未来研究提出展望,以期为相关领域学者提供一定的文献参考。
关键词:审计质量;知识图谱;研究综述CPA Audit plays an important role in improving the credibility of accounting information in the capitalmarket and the audit quality has traditionally drew great attention from both theoretical and practical circles.In the paper,by using Citespace,all the research literature on the CPA Audit Quality (selected from the CNKI database )from the past 30years will be sorted out.By analyzing keywords,volume of the publications and author's knowledge usw.to identify the trend of the audit quality and hot topics,give an outlook on the further research and provide literature reference in the relevantfield.Audit Quality;Knowledge Map;Research Review 一、引言注册会计师审计是维护市场经济秩序、提高信息质量的重要制度安排。
收稿日期:2018-08-23基金项目:国家自然科学基金青年项目 基于公众网络参与的民生公共政策第三方动态评估机理与方法研究 (项目编号:71503195);陕西省社会科学基金青年项目 基于公众网络参与的陕西民生公共政策第三方动态评估研究 (项目编号:2015R020)㊂作者简介:马续补(1983-),男,讲师,博士,硕士生导师,研究方向:社会化媒体与公共政策量化分析㊂刘玮(1975-),女,副教授,博士,研究方向:网络信息计量与评价㊂秦春秀(1980-),女,教授,博士,硕士生导师,研究方向:知识组织与检索㊂㊃信息计量与科学评价㊃基于知识图谱的我国政策评估研究主体㊁知识基础㊁研究热点与演进分析马续补㊀刘㊀玮㊀秦春秀(西安电子科技大学经济与管理学院,陕西西安710071)摘㊀要:[目的/意义]对政策评估研究脉络进行可视化分析,对研究人员全面了解我国政策评估领域的研究现状,推动我国特色新型智库建设具有重要意义㊂[方法/过程]以中国社会科学引文索引(CSSCI)收录的政策评估领域639篇文献为研究对象,采用文献计量方法与VOSviewer知识图谱分析软件,识别政策评估领域的研究主体㊁知识基础㊁研究热点与演化路径㊂[结果/结论]构建了作者共现知识图谱识别出了该领域的主要科研团队和合作情况;构建了文献共被引知识图谱,识别出该领域3个维度的知识基础;构建了关键词共现知识图谱,挖掘出该领域的3个研究热点,在此基础上叠加关键词平均出现年份,识别出研究热点的演化路径㊂关键词:政策评估;研究主体;知识基础;研究热点;VOSviewerDOI:10.3969/j.issn.1008-0821.2019.03.019 中图分类号 G250 252㊀文献标识码 A㊀文章编号 1008-0821(2019)03-0166-12AnalysisoftheResearchAgents,KnowledgeBase,ResearchFocusandEvolutiononPolicyEvaluationBasedonKnowledgeMappingMaXubu㊀LiuWei㊀QinChunxiu(SchoolofEconomyandManagement,XidianUniversity,Xi an710071,China)Abstract:[Purpose/Significance]Researchonthehistory,currentsituationanddevelopmentdirectionofpolicye⁃valuationhasgreatsignificanceforresearcherstofullyunderstandtheresearchstatusofpolicyassessmentinourcountryandpromotetheconstructionofnewtypeofChinesethinktanks.[Method/Process]Basedon639literaturesonpolicyevalua⁃tionfromChinaSocialSciencesCitationIndex(CSSCI),thepaperutilizedbibliometricsandknowledgemapanalysissoft⁃wareVOSviewertoexploretheresearchagents,knowledgebase,researchfocusandevolutiononpolicyevaluation.[Re⁃sult/Conclusion]Thepapertconstructedtheco-authorshipmaptorevealthecoreresearchteamsandthecooperationpat⁃ternofthepolicyevaluationarea;Constructedtheco-citationmapthatcanidentifythethreedimensionsknowledgebaseofthisarea;Constructedtheco-occurrencemapofauthorkeywordsthatcanidentifythreeresearchfocusofthisarea.Onthisbasis,theaverageoccurrenceyearsofkeywordswereoverlaid,andtheevolutionpathsofresearchfocuswereidentified.Keywords:policyevaluation;researchagents;knowledgebase;researchfocus;VOSviewer㊀㊀公共政策是政府公共主体解决深化转型时期各种社会矛盾潜在隐患的主要载体,中国特色新型智库作为第三方机构开展政策评估是党和政府科学民主依法决策的重要支撑,也是国家治理体系和治理能力现代化的重要内容[1]㊂2013年9月,国务院委托全国工商联对鼓励民间投资 新36条 的落661 2019年3月第39卷第3期现代情报JournalofModernInformationMar.,2019Vol 39㊀No 3实情况进行评估㊂2014年6月至8月,国务院再次对稳增长促改革调结构惠民生的19类60项政策措施落实情况进行第三方评估㊂党的十八届四中全会指出 对部门间争议较大的重要立法事项,由决策机关引入第三方评估 ㊂2015年1月中共中央办公厅㊁国务院办公厅印发了‘关于加强中国特色新型智库建设的意见“,指出充分发挥中国特色新型智库的咨政建言㊁理论创新等功能, 探索政府内部评估与智库第三方评估相结合的政策评估模式,增强评估结果的客观性和科学性 ㊂2017年5月民政部等9部门联合出台了‘关于社会智库健康发展的若干意见“,指出社会智库是中国特色新型智库的重要组成部分,可以向党政机关提供决策评估㊁政策解读㊁政策方案等智库产品㊂十九大报告再次提出 加强中国特色新型智库建设 ㊂近年来,中国科学院㊁中国社科院㊁国务院发展研究中心㊁国家行政学院㊁中国科协等中国特色新型智库,受中央政府委托,分别完成了 大众创业万众创新 ㊁ 政府信息公开制度 ㊁ 增加公共产品和服务供给 ㊁ 促进民间投资 ㊁ 精准扶贫 等政策落实情况的第三方评估,参与重大改革方案和政策实施效果的评估已经成为新常态㊂2017年9月第三方评估第5次成为国务院常务会议议题,李克强总理再次指出开展第三方评估对提高公共政策绩效具有把脉会诊和促进完善的积极作用,是督查工作的重要补充㊂因此通过文献计量与信息可视化分析技术,识别政策评估领域的研究主体㊁知识基础㊁研究热点与演化路径,可以使各智库和该领域其他研究人员全面了解我国政策评估领域的研究现状,选择合适的研究团队进行合作提升研究能力,找寻高价值文献提升研究手段和方法,把握研究热点和演化路径定位研究方向,对于推动我国特色新型智库建设具有重要意义㊂1 数据来源、研究工具与方法1 1㊀数据来源中国社会科学引文索引(CSSCI)的文献题录是我国唯一包含引文信息的中文期刊数据库,可以为文献共被引分析提供数据来源㊂因此本文选择CSSCI数据库检索政策评估领域的文献,检索条件设定为((政策same评估)㊁(政策same评价)㊁(政策and内容分析)㊁(政策and量化分析)㊁(政策工具)),时间跨度选择 1998-2017 ,经过滤筛选与政策评估无关数据后共获取639篇文献的题录信息㊂数据检索时间为2017年12月15日㊂1 2㊀研究工具随着可视化技术和工具的日益成熟,知识图谱技术越来越多地用于分析知识结构㊁探索研究热点㊁研究前沿及其演进[2]㊂美国德雷塞尔大学陈超美开发的Citespace㊁荷兰莱顿大学NeesJanvanEck等开发的VOSviewer[3]是目前常使用的知识图谱文献计量分析软件㊂国内外文献中基于Citespace的文献计量分析已经成熟,如魏晓峰(2013)㊁孙建军(2014)分别采用Citespace分析了国外信息可视化领域㊁链接分析领域的知识基础㊁研究主体㊁研究热点与前沿[4]㊂国外文献中基于VOS⁃viewer的文献计量分析也已经成熟,该软件网站上罗列了460篇论文,如KarolienvanNunena等(2018)采用VOSviewer分析了安全文化领域的知识基础㊁研究主体㊁研究热点及演化等[5],但国内的分析主要停留在通过关键词共现分析识别研究热点㊂因此一方面出于可以为我国学者使用VOS⁃viewer进行文献计量分析提供借鉴;另一方面出于VOSviewer软件分析结果比Citespace与WebofSci⁃ence数据更为接近[6],且VOSviewer不需要复杂的参数设置就可以呈现出可视化较好的知识图谱,本文选择VOSviewer对我国政策评估领域的文献进行可视化计量分析㊂VOSviewer通过网络可视化㊁叠加可视化㊁密度可视化3种视图展现作者(机构㊁国别)合作网络分析㊁关键词共现分析㊁引文(期刊㊁作者㊁机构㊁国别)分析㊁文献(期刊㊁作者㊁机构㊁国别)耦合分析㊁文献(期刊㊁作者)共被引分析等内容㊂在作者合作网络(期刊共被引㊁文献共被引㊁关键词共现)知识图谱的网络可视化视图中,每个圆圈代表一个作者(期刊㊁引文㊁关键词),圆圈和字体越大代表该对象发文数量(被引次数㊁被引次数㊁出现次数)越多;两个圈之间连线越粗代表两者合著次数(共被引次数㊁共被引次数㊁共现次数)越多,距离越短表示两者7612019年3月第39卷第3期基于知识图谱的我国政策评估研究主体㊁知识基础㊁研究热点与演进分析Mar.,2019Vol 39㊀No 3之间的关系和相似性越高;并用颜色区分不同的聚类㊂叠加可视化视图与网络可视化视图唯一不同在于,其用颜色表示平均年份㊁平均引用次数等信息,而不是表示相同的聚类㊂密度可视化视图,分为项目密度可视化和聚类密度可视化两种视图类型,在项目密度可视化视图中图谱呈现蓝㊁绿㊁红3种颜色,每个项目(期刊㊁引文㊁关键词等)附近的项目越多,权重越高则该项目所在区域越呈现红色,反之越呈现蓝色;在聚类密度可视化中,项目密度按照在各自聚类中的权重独立显示,用颜色区分不同的聚类,区域的项目越多,权重越高则该区域的颜色越亮㊂1 3㊀研究方法本文以1998-2017年间CSSCI数据库中收录的国内政策评估领域文献为研究对象,以VOSviewer知识图谱文献计量分析软件为工具,采用以下方法分析我国政策评估领域的研究主体㊁知识基础㊁研究热点与演化路径等㊂1)基于我国政策评估领域文献的年发文量,统计分析该领域的成长规律㊂2)基于我国政策评估领域文献的作者数据,统计分析该领域的核心作者和高产出研究机构,使用VOSviewer的作者合作网络分析功能绘制高产作者的合作网络知识图谱,识别该领域的主要科研团队和合作情况㊂3)基于我国政策评估领域文献的引文数据,采用VOSviewer的文献共被引分析功能,绘制该领域的文献共被引知识图谱,识别该领域的知识基础㊂4)基于我国政策评估领域文献的关键词数据,采用VOSviewer的关键词共现分析功能,绘制该领域的关键词共现知识图谱,挖掘该领域的研究热点和演化路径㊂2㊀结果分析2 1㊀政策评估研究的成长规律对比分析我国政策评估领域639篇文献的年发文量(见图1)发现,我国政策评估研究大体可以分为起步㊁成长㊁成熟3个阶段㊂1998-2005年为起步期,少量学者开始进行这方面研究,发文量不大但总体呈上升趋势,2002年后趋向平稳㊂2006-2015年为成长期,大量学者进入这一研究领域,发文量快速增长,到2015年时达到发文高峰㊂2016年后进入成熟期,发文数量依然很大,但开始呈现下降趋势㊂图1㊀年发文量及合著情况对比分析㊀2 2㊀政策评估领域的主要研究团队及合作情况2 2 1㊀核心作者分析639篇论文共有1074位作者,发文最多的是清华大学苏竣教授,共发表11篇(不分署名次序),根据普赖斯定律,核心作者发文数m=0 749∗nmax=2 48(其中nmax为发文最多作者的论文数),因此将文章数量为3篇及以上的作者定为核心作者,统计得到核心作者有34人,占全部作者总数的3 17%㊂其中发文5篇以上的作者是苏竣(11)㊁黄萃(10)㊁傅雨飞(6)㊁张国兴(5)㊁张永安(5)㊁李健(5)㊂2 2 2㊀发文机构分析639篇论文共有728个发文机构,发文10篇以上的高产机构包括中国人民大学(25)㊁清华大学(20)㊁华中科技大学(18)㊁北京师范大学(16)㊁华东师范大学(14)㊁南京大学(12)㊁浙江大学(12)㊁武汉大学(12)㊁北京大学(11)㊁厦门大学(11)㊁东北大学(10)㊁上海交通大学(10)㊂2 2 3㊀合著分析平均每篇论文合作人数为1 68人(1074人/639篇),合著率为63 69%(合著407篇/639篇),从图1中可以看出,初期只是少部分学者进入该领域,学者之间合作率不高,且波动性较大;随着研究深入,注入了大量的研究血液,发文量开始增加,学者间交流互动也明显增多,从2004年开始,合著率基本保持在50%以上,尤其到2017年,达到91 49%㊂861 2019年3月第39卷第3期现代情报JournalofModernInformationMar.,2019Vol 39㊀No 3对1074位作者,选择最少发表论文篇数为 2 ,共有128位作者满足条件,使用VOSviewer对这128位作者进行合作网络分析,形成合作网络图谱如图2所示,可以看到政策评估领域的研究人员形成了14人组成的科研团队㊁6人组成的科研团队以及4人组成的科研团队各1个,3人组成的科研团队9个,2人组成的科研团队18个㊂结合作者的个人经历可以看出稳定的科研团队合作关系多是由师生传承形成的一致研究方向带来的,比如苏竣㊁黄萃等形成的14位成员科研团队;李健㊁李祥飞等形成的6位成员合作网络;郭菊娥㊁张国兴等形成的4位成员科研团队;彭纪生㊁仲为国等形成的3位成员科研团队㊂图2㊀作者合作网络可视化图谱苏竣教授团队的合作网络叠加论文平均发表年份形成的知识图谱如图3所示(用颜色表示该作者发表论文的平均年度),从图中可以看出苏竣教授团队的政策量化分析研究开启于与赵筱媛的研究,赵筱媛师从清华大学苏竣教授做博士后研究,2005年发表了从政策工具视角分析公共科技政策的会议论文(2007年期刊论文出版),开启了两位学者的公共政策量化分析研究之路㊂随后,来自武汉大学的黄萃在和苏竣教授做博士后研究期间开始接触这一领域,2011年带领其在浙江大学公共管理学院的两位硕士研究生程啸天㊁施丽萍发表2篇该领域的论文;武汉大学校友㊁浙江大学和清华大学的同事李江,2015年开始涉足该领域,两者合作发表了3篇该领域的论文;黄萃的硕士研究生赵培强,博士研究生任弢也先后在该领域开展研究,2015-2017年间发表了5篇该领域的论文;中央财经大学张剑,北京理工大学叶选挺在清华大学做博士后研究时开始接触该领域,两人与黄萃㊁苏竣在2014-2016年间合作发表了3篇该领域的论文㊂虽然赵筱媛开启了苏竣教授团队在该领域的研究,但由于在中国科学技术信息研究所的工作需要,其一直在竞争情报方面进行研究,直到2014年再次带着自己的研究生发表了1篇该领域的论文,2016年㊁2017年和来自中国农业大学图书馆在中国科学技术信息研究所做博士后研究的赵勇,合作发表了2篇该领域的论文㊂(注:王娟娟㊁张伟由于同名原因需要剔除)图3㊀成员数最多的合著网络叠加可视化图谱961 2019年3月第39卷第3期基于知识图谱的我国政策评估研究主体㊁知识基础㊁研究热点与演进分析Mar.,2019Vol 39㊀No 32 3㊀发表及引用期刊分析2 3 1㊀核心期刊分析根据CSSCI来源期刊所属类别统计,政策评估领域论文主要分布在管理学㊁经济学㊁教育学等8类期刊中,载文量所占比例为86 54%㊂从这8类期刊在政策评估研究的起步期㊁成长期㊁成熟期载文量来看(见图3),管理学㊁高校综合性学报以及图书馆㊁情报与文献学期刊对这类文献的关注度持续增加;经济学类期刊在不同时期载文量所占比例比较稳定;教育学㊁综合社科期刊㊁政治学以及环境科学类期刊对这类文章的刊发量明显下降㊂其中载文量最大的前10种期刊为科技进步与对策(30)㊁中国行政管理(28)㊁科技管理研究(21)㊁中国科技论坛(19)㊁科学学与科学技术管理(14)㊁教育发展研究(12)㊁情报杂志(11)㊁科学学研究(11)㊁管理世界(10)和中国软科学(9)㊂2 3 2㊀期刊共被引分析639篇文献共有7311篇引文,来源于3469个期刊或出版社,选择最少被引用次数为 20 ,共图4㊀不同期刊类别载文量所占比例趋势图㊀有33个出版物满足条件㊂设定共被引关系强度规范化方式㊁分辨参数㊁聚类成员最少数目为(Lin⁃Log/Modularity㊁1㊁5),使用VOSviewer的模块化聚类算法[3]对这33个出版物进行共被引分析,形成期刊共被引网络图谱如图5所示㊂图5㊀期刊共被引网络可视化图谱㊀㊀㊀从图5中可以看出,政策评估领域的知识基础主要来自于4个类别的出版物:以管理世界㊁中国行政管理等为代表的宏观管理类期刊;以科学学研究㊁中国软科学等为代表的科技管理类期刊;以经济研究㊁AmericanEconomicReview等为代表的经济金融类期刊;以中国人民大学出版社㊁北京大学出版社等为代表的政策评估基本理论类图书㊂2 4㊀基于文献共被引的政策评估领域知识基础识别科学工作者的引用行为是科学活动中普遍存在的现象,两篇(多篇)论文同时被一篇或多篇文071 2019年3月第39卷第3期现代情报JournalofModernInformationMar.,2019Vol 39㊀No 3献所引用,则这两篇(多篇)论文具有共被引关系,因此通过文献共被引图谱的分析可以找出高被引的有价值文献,识别该领域的知识基础㊂639篇文献共有7311篇引文,选择最少被引用次数为 5 ,共有34篇引文满足条件㊂设定共被引关系强度规范化方式㊁分辨参数㊁聚类成员最少数目为(Fractionalization㊁1㊁5),使用VOSviewer的模块化聚类算法对这34篇引文进行共被引分析,形成文献共被引的网络可视化和项目密度可视化知识图谱如图6㊁图7所示㊂图6㊀文献共被引网络可视化图谱㊀注:作者根据原图添加了部分由于折叠没有显示的项目图7㊀文献共被引项目密度可视化图谱㊀㊀㊀从图6可以看出政策评估领域形成了以邓恩2002(陈振明2003)㊁Rothwell1985(赵筱媛2007)㊁彭纪生2008(刘凤朝2007)为代表的3个聚类,根据每类中的大多数文献对各聚类命名,形成 政策评估基本理论 (维度1)㊁ 政策工具与政策量化分析(维度2)㊁政策协同与演变(维度3)3个维度的知识基础㊂在图7的项目密度视图中,颜色越红代表该区域的权重越高,因此选择红色和黄色区域的文献形成各维度的知识基础(如表1所示)㊂从图6可以看出维度2与维度3之间的距离要比两者和维度1之间的距离要近;从图7的密度视图中可以看出维度2与维度3已经融为一体,维度1在一个单独的区域,因此这两者之间的关系相近程度要高于和维度1之间的关系相近程度㊂这是因为这两个维度都属于政策方案评估领域的研究,在研究方法上都采用了内容分析法对公共政策文本进行量化分析,只不过前者侧重于政策工具视角的政策量化分析,后者侧重于政策协同和演变,因此这两者的关系相近程度,要高于和诠释政策评估定义㊁标准以及指标等内容的维度1之间的关系相近程度㊂从文献来源来看,维度1领域的文献主要是学术专著和教材,另两个领域的文献主要是学术期刊,并且维度2的学术专著(李纲,2007;豪利171 2019年3月第39卷第3期基于知识图谱的我国政策评估研究主体㊁知识基础㊁研究热点与演进分析Mar.,2019Vol 39㊀No 3表1 我国政策评估领域知识基础维㊀度所在区域代㊀㊀表㊀㊀文㊀㊀献被引次数政策评估基本理论红色邓恩.公共政策分析导论.北京:中国人民大学出版社,200224陈振明.政策科学 公共政策分析导论.北京:中国人民大学出版社,200323VEDUNGE.PublicPolicyandProgramEvaluation.NewBrunswickandLondon:TransactionPublishers,199719陈庆云.公共政策分析.北京:北京大学出版社,200614黄色陈振明等.公共政策分析.北京:中国人民大学出版社,200211林水波等.公共政策.台湾:台湾五南图书出版公司,200110袁振国等.教育政策学.南京:江苏教育出版社,20017牟杰等.公共政策评估:理论与方法.北京:中国社会科学出版社,20067高兴武等.公共政策评估:体系与过程.中国行政管理,2008,(2)5政策工具与政策量化分析红色RothwellR等.ReindusdalizationandTechnology.London:LogmanGroupLimited,198534赵筱媛等.基于政策工具的公共科技政策分析框架研究.科学学研究,2007,(1)28黄萃等.政策工具视角的中国风能政策文本量化研究.科学学研究,2011,29(6)19李燕萍等.改革开放以来我国科研经费管理政策的变迁㊁评介与走向 基于政策文本的内容分析.科学学研究,2009,(10)14张雅娴等.技术创新政策工具及其在我国软件产业中的应用.科研管理,2001,22(4)11张韵君等.政策工具视角的中小企业技术创新政策分析.中国行政管理,2012,(4)9黄色豪利特等.公共政策研究:政策循环与政策子系统.北京:三联书店,200616李钢等.公共政策内容分析方法:理论与应用.重庆:重庆大学出版社,200714政策协同与演变红色彭纪生等.中国技术创新政策演变与绩效实证研究(1978-2006).科研管理,2008,29(4)25刘凤朝等.我国科技政策向创新政策演变的过程㊁趋势与建议:基于我国289项创新政策的实证分析.中国软科学,2007,(5)18陈劲等.创新政策:多国比较和发展框架.杭州:浙江大学出版社,20056黄色汪涛等.基于内容分析法的科技创新政策协同研究.技术经济,2013,32(9)6傅广宛等.量化方法在我国公共政策分析中的应用进展研究 以最近六年来的进展为研究对象.中国行政管理,2009,(4)6特,2006)比期刊文献和维度1的关系相近程度要高㊂从文献类型来看,梳理量化方法㊁内容分析法的综述类论文(傅广宛等,2009;刘伟,2014)比应用基础类论文与学术专著之间的关系相近程度也更高一些㊂2 5㊀基于关键词共现的政策评估领域研究热点及演化分析㊀㊀关键词是作者对论文内容或研究方法的精炼化概括,通过对高频关键词共现图谱的分析,可以得到该领域的研究热点及研究热点的演化路径㊂639篇文献共有1611个关键词,选择最少出现次数为 5 ,共有41个关键词满足条件㊂设定共现关系强度规范化方式㊁分辨参数㊁聚类成员最少数目为(Fractionalization㊁1㊁5),使用VOSviewer的模块化聚类算法对这41个关键词进行共现分析㊂形成政策评估领域关键词共现网络可视化和聚类密度可视化知识图谱如图8㊁图9所示㊂从图8㊁图9可以看出形成了以政策评估(政策评价)㊁政策工具㊁政策协同为代表的3个聚类,结合引文分析结果对各聚类命名,形成 传统视角的政策评估标准㊁指标与方法 (热点1)㊁ 政策工具视角的政策量化分析 (热点2)㊁ 政策协同视角的政策量化分析 (热点3)3个研究热点㊂热点2在位置上位于热点1和热点3之间,这是因为热点3和热点2都属于政策方案评估;热点2在政策量化分析时采用的政策工具分类标准来271 2019年3月第39卷第3期现代情报JournalofModernInformationMar.,2019Vol 39㊀No 3图8㊀关键词共现网络可视化图谱㊀图9㊀关键词共现聚类密度可视化图谱㊀371 2019年3月第39卷第3期基于知识图谱的我国政策评估研究主体㊁知识基础㊁研究热点与演进分析Mar.,2019Vol 39㊀No 3自于热点1的研究成果;热点3采用和热点2相同的内容分析法,测度分析政策协同,而这些内容并不是热点1的研究主题,因此热点3和热点2之间的关系要比和热点1的关系更加紧密㊂从图中也可以看出虽然热点2是基于政策工具视角分析政策方案的可行性,但货币政策㊁货币政策工具并属于该热点的主要研究内容㊂各研究热点包含的关键词如表2所示㊂表2 政策评估领域的研究热点研究热点关键词(频次)传统视角的政策评估标准㊁指标与方法政策评估(129)㊁政策评价(79)㊁科技政策(12)㊁教育政策(10)㊁技术创新(7)㊁教育公平(7)㊁农民工(6)㊁政策执行(6)㊁评估标准(6)㊁义务教育(5)㊁指标体系(5)㊁政策效应(5)㊁科技创新(5)㊁评估方法(5)政策工具视角的政策量化分析政策工具(88)㊁内容分析(36)㊁内容分析法(28)㊁公共政策(27)㊁政策(17)㊁政策分析(14)㊁政策文本(13)㊁量化分析(10)㊁创业政策(8)㊁产业政策(7)㊁战略性新兴产业(7)㊁政策演进(7)㊁文本分析(6)㊁货币政策(6)㊁信息政策(5)㊁分析框架(5)㊁货币政策工具(5)政策协同视角的政策量化分析创新政策(17)㊁政策协同(14)㊁公共政策评估(12)㊁评估(8)㊁政策目标(7)㊁科技创新政策(7)㊁政策演变(6)㊁知识产权政策(6)㊁政策测量(5)㊁节能减排(5)2 5 1㊀研究热点一:传统视角的政策评估标准㊁指标与方法学者们对政策评估的类型㊁标准㊁模式㊁指标与方法,影响政策绩效的主要因素以及改善政策执行建议等方面开展了大量研究㊂政策评估主要有政策方案评估㊁政策过程评估和政策效果评估3种观点[7]㊂VedungE(1997)按照 组织者 不同将政策评估模式分为效果㊁经济和专业化3类[8],赵莉晓(2014)基于 效果模式 下的 综合评估模式 ,建立了创新政策评估的理论框架[9]㊂邓恩(2002)提出政策评估标准包括效果㊁效率㊁充足性㊁公平性㊁回应性和适宜性[10],陈振明(2003)则认为是生产力㊁效益㊁效率㊁公正和政策回应度等5个标准[11]㊂在政策方案评估方面,王会宗等(2016)测算了维持经济稳定增长的最优出生率,指出我国为实现 新常态 经济的稳定增长,需要 全面放开二胎 政策[12]㊂在政策过程评估方面,王再进等(2017)针对中国科技创新政策内容及特点,基于事实评估与价值评估相结合的评估理念,构建了涉及政策制定㊁执行和效果各环节的政策全过程评估框架[13]㊂在政策效果评估方面,李素利等(2015)以目标和顾客导向为评估模式,从适当性㊁公平性和回应性3个维度构建了社会保障政策执行效果测度模型[14]㊂在改善政策执行方面,胡俊波(2014)从政策知晓度㊁利用度㊁难易度等5个维度构建了评估指标体系,评估农民工返乡创业扶持政策的宣传㊁推广㊁落实效果,并通过对四川省的实证测算提出相关政策建议[15]㊂2 5 2㊀研究热点二:政策工具视角的政策量化分析政策文件是政府表达政策意图和政策过程的客观凭证[16],很多学者已采用内容分析法量化政策文件,在此基础上通过梳理政策演进过程挖掘政策启示㊁基于政策工具视角分析政策方案可行性和优缺点㊁对比分析不同国家(地区)政策文件差异3个角度,为政策优化提供建议㊂在基于政策演进特征提出政策建议方面,李燕萍等(2009)采用内容分析方法探讨了我国改革开放以来的42项科研经费管理政策的政策变迁与走向[17]㊂孙蕊等(2015)构建了产业发展和政策支持二维分析框架,分析了我国战略性新兴产业40项政策的特征[18]㊂在基于政策工具视角提出政策建议方面,目前普遍采用的政策工具分类是RothwellR等(1985)提出的供给㊁环境和需求3种类型政策工具[19]㊂赵筱媛等(2007)从政策工具㊁科技活动类型和科技活动领域3个维度构建了科技政策三维分析框架[20],是我国从政策工具视角分析公共政策的奠基代表作㊂黄萃等(2011)从政策工具和产业价值链两个维度构建了风能政策二维分析框架,剖析了我国目前风能政策工具选择存在的问题[21]㊂豪利特等提出政策工具分为自愿型㊁混合471 2019年3月第39卷第3期现代情报JournalofModernInformationMar.,2019Vol 39㊀No 3。