关键词共词分析、聚类分析和多维尺度分析
- 格式:doc
- 大小:13.50 KB
- 文档页数:2
水科学研究的关键词共词聚类分析韩宇平;袁皖华;肖恒【摘要】水科学涉及的范围十分广泛,已涌现出大量研究成果.对已发表的学术论文进行统计分析,对于明晰水科学发展的现状具有重要意义.然而,目前采用文献计量学方法开展的研究还比较少.本文在收集大量水科学研究相关期刊论文的基础上,采用Bibexcel统计分析了文献资料中的关键词,构建了由62个高频关键词组成的共词矩阵,利用网络分析、多维尺度分析和聚类分析等不同统计方法,初步归纳出近十年来水科学研究中的热点和研究现状.结果表明:气候变化、水资源承载力、水资源管理、水环境容量、水环境质量等方面研究成果相对较多;围绕大型水利工程如南水北调工程和水安全问题的研究均有所增多;研究中更加注重区域的可持续发展和生态环境保护;形成了一些研究热点地区.【期刊名称】《华北水利水电学院学报》【年(卷),期】2015(036)004【总页数】6页(P20-25)【关键词】水科学;关键词;共词分析;网络分析;聚类分析;多维尺度分析【作者】韩宇平;袁皖华;肖恒【作者单位】华北水利水电大学,河南郑州450045;华北水利水电大学,河南郑州450045;华北水利水电大学,河南郑州450045【正文语种】中文【中图分类】TV74;TM615通信作者:肖恒(1982—),男,江苏徐州人,讲师,博士,主要从事气候变化对水文水资源影响方面的研究.“水科学”(Water Science)是最近二十年来出现频率很高的一个词,已经渗透到社会、经济、生态、环境、资源利用等许多方面,也派生出许多新的学科或研究方向,成为学术研究和科技应用的热点.相应地,每年涌现出大量期刊论文,既给学者的研究工作提供了便利,但同时也给文献的管理与分析利用带来了不便[1].因此,有必要对所包含的学科主题和热点进行系统科学的梳理.左其亭 [2-3]将水科学划分为:水文学、水资源、水环境、水安全、水工程、水经济、水法律、水文化、水信息、水教育等各有侧重且相互交叉的10个具有较强关联性的研究领域,并分别对这10个方面做专题研究进展报告,及时总结了当前水科学研究的最新进展.然而,目前运用文献计量学方法来分析水科学研究中的热点与现状的成果还比较少.而这些少数研究也只侧重于水科学研究中的某一方面(如水资源领域[4])进行文献分析探讨.因此,本文利用《CNKI中国学术期刊网络出版总库》中的文献资料,采用Bibexcel统计分析涉及水科学期刊论文中的关键词,选取高频关键词构建共词矩阵,通过网络分析、多尺度分析和聚类分析等统计方法,揭示水科学研究中的热点与研究现状.1.1 资料来源从表1中可以看出,2005—2007年论文数量逐年增加(1 764~2 244篇),2008—2013年在2 600篇以上,2014年论文数量相对较少,这主要是因为开始检索的时间为2015年1月初,2014年12月份发表的部分论文未纳入统计之中.从各研究领域的论文数量上看,水资源领域期刊论文数量最多,为1 129~1 823篇,平均约1 477篇;其次是水环境领域,发表论文477~875篇,平均约714篇.这2个领域约占统计的10个水科学领域论文总量的90%,论文数量在年际上的变化主要由这2个领域论文数量所引起.2010年左右,关于水文学、水环境和水安全等的研究显著增多,一定程度上反映出国家水安全战略需求重点关注的方面(如洪涝、干旱等极端水文事件研究).涉及水经济、水法律、水文化、水信息、水教育等领域的论文数量相对较少,特别是水教育领域自2011年才有期刊论文出现,论文数量1~2篇.从表2中可以初步归纳出近十年来涉及水科学相关研究的文献具有如下特点:1)水环境、水资源承载力、可持续发展、水文学、水文化等出现频次超过100次,表明这些领域(方向)是水科学工作的重点,研究成果较多.2)虽然国内对研究气候变化、水生态文明、水文化等方面研究起步较晚,但是在变化环境下的水资源脆弱性评价和适应性、气候变化下的水资源承载能力、水生态系统的保护、水文化的宣传和普及等方面的研究得到较快发展.3)方法层面的应用研究较多.如层次分析法、主成分分析法、分布式水文模型、系统动力学、熵权法、BP神经网络、集对分析等关键词出现频次较高,这一方面表明一些较为成熟的方法得到了广泛应用;另一方面表明新的技术方法也在不断发展.4)形成了一些研究热点地区.按流域划分,主要集中在黄河流域(如全流域、渭河流域、黑河流域等)和长江流域(如全流域、汉江流域、太湖流域等);按行政区域划分,以北京市为研究区的研究最多.此外从水利工程角度分析,以研究三峡水库和南水北调工程的居多.从图1中可以看出,水环境、水资源承载力、可持续发展、水文学、水资源管理、指标体系等节点较大,处于节点的中心位置,在一定程度上反映出近十年来水科学研究的主题和主要内容.具体来说:1)水文学与气候变化的联系最为紧密,这表明,气候变化下的水文过程的响应及机理研究是当前研究的热点问题.2)水资源管理与管理模式、系统动力学、优化配置等关系较为密切,表明关于水资源管理的研究从系统动力学、优化配置技术方法层面和从管理的角度开展的较多. 3)水资源承载力与指标体系、系统动力学、主成分分析法、层次分析法等联系较为密切,表明关于水资源承载力方面的研究主要侧重于计算方法.4)水环境与水环境质量、水污染、可持续发展、水环境容量、对策等联系较为密切,表明水环境方面的研究侧重于从可持续发展的角度探讨水环境质量和水环境容量,以及相应的对策研究.1)水文学领域.研究内容侧重于气候变化、水循环、生态水文及水资源安全等,研究区域多选择半干旱地区的黑河流域和我国重大水利工程(如三峡水库),研究方法上主要采用(水文)模型进行模拟分析.2)水资源领域(方法部分).围绕区域的可持续发展,侧重开展水资源承载力、生态环境评价等研究,研究区域集中在干旱区,如石羊河流域及黄河流域.采用的方法主要是建立指标体系,多以熵权法确定指标权重,运用层次分析、主成分分析、模糊综合评价等方法进行综合评价.3)水资源领域(管理部分).流域方面侧重水资源管理模式的研究,研究区集中在长江流域,同时注重考虑流域生态需水问题;城市方面注重水资源利用的研究,地理信息系统技术在城市数字化过程中也得到了较为广泛的应用.4)水环境领域.研究围绕地表、地下水环境的容量、质量、管理等方面展开,研究区域主要是太湖流域.5)水工程领域.研究侧重于与南水北调工程相关的地质勘探、相关设备、工程监测、工程影响因素等方面.6)其它领域.研究成果较为集中地体现在采用系统动力学方法研究北京市的水环境承载力.水科学的涉及范围十分广泛,很多方面仍处于探索阶段,对水科学的学科体系、研究框架的认识还很不足,相应的关于水科学研究的成果层出不穷,文献数量越来越多.本文在收集大量文献基础上,构建由62个高频关键词组成的共词矩阵,利用网络分析、多维尺度分析和聚类分析等不同统计方法,初步归纳出近十年来水科学研究中的研究热点和研究现状.①在水文学领域中关于气候变化方面的研究、在水资源领域中关于水资源承载力和水资源管理方面的研究、在水环境领域中关于水环境容量和水环境质量方面的研究在当前研究成果中占较大比例;②围绕大型水利工程(如南水北调工程)的水工程领域的研究,以及国家日益重点关注的水安全问题的水安全领域的研究均有所增多;③水科学相关研究中更加注重区域的可持续发展和生态环境保护;④各方面的研究中都形成了一些研究热点地区.致谢:本文第一作者自2013年以来参加了由郑州大学左其亭教授主编的《中国水科学研究进展报告》系列丛书的编写工作,在编写过程中认识到用数学方法描述水科学研究进展的直观性和科学性,先期以“水资源学”为研究对象撰写的《水资源学研究的关键词共词聚类分析》一文已发表,本文则在前期研究的基础上扩展到整个水科学研究领域.在此,感谢左其亭教授及其领导的《中国水科学研究进展报告》编写团队对本文提出的指导意见![1]任智军,朱东华,谢菲.科技文本的可视化分析研究[J].北京理工大学学报(社会科学版),2007,9(1):13-17.[2]左其亭.中国水科学研究进展报告2011—2012[M].北京:中国水利水电出版社,2013.[3]左其亭.中国水科学研究进展报告2013—2014[M].北京:中国水利水电出版社,2015.[6]舒琅.基于社会网络分析的项目管理学科热点和主流知识群的研究[D].杭州:浙江大学,2010.[7]FRY J,TALJA S.The intellectual and social organization of academic fields and the shaping of digital resources[J].Journal of Information Science,2007,33(2):115-133.。
教育信息化热点问题探究摘要研究数据选自期刊《中国电化教育》和《电化教育研究》2011年文献中研究内容与“教育信息化”相关的76篇学术论文,运用共词聚类、多维尺度分析等研究方法,研究分析教育信息化的研究热点,并对相关问题进行探讨。
关键词教育信息化;共词聚类;教育技术中图分类号:g434 文献标识码:a 文章编号:1671-489x(2012)27-0009-03perspective on 2011 hot issues of educational//liu ting abstract research on 76 articles which relevant to educational informatization that from china educational technology and e-education research, using co-word cluster analysis method and multidimensional scaling analysis method. reveal the hot research topics through analysis, and then probe into the related issues.key words educational informatization; co-word clustering; educational technologyauthor’s address harbin normal university, harbin, china 1500251 研究设计1.1 数据来源与研究方法“教育信息化”一词在1999年中共中央国务院发表的《关于深化教育改革全面推进素质教育的决定》中被提出,至今已取得显著的成绩,对我国教育改革发展产生重要影响。
本文以中国期刊网全文数据库为数据平台,以教育技术学核心期刊《中国电化教育》和《电化教育研究》期刊2011年全年文献为数据源,检索主题或关键字为“教育信息化”,最终确定76篇文献作为有效数据。
国内“ChatGPT+教育”研究热点、主题及启示--基于共词分
析的可视化研究
郑小军;张美虹
【期刊名称】《广西职业技术学院学报》
【年(卷),期】2024(17)3
【摘要】近两年来,ChatGPT及其与教育的融合引发了热议。
研究选取了中国知网(CNKI)中文期刊数据库的311篇“ChatGPT+教育”文献,运用共词分析法,通过高频关键词分析、社会网络分析、聚类分析和多维尺度分析等方法,探析国内“ChatGPT+教育”的发展现状。
研究发现,ChatGPT生成原理、人机协同、教育数字化转型和数字素养等是该研究领域的热点。
ChatGPT对教育生态的影响、ChatGPT与教育变革论、ChatGPT赋能教育数字化及ChatGPT的教育伦理风险与对策论是当前“ChatGPT+教育”研究的4个主题。
研究认为,未来“ChatGPT+教育”研究需加强理论研究,夯实理论基础;质性研究与实证研究并举;加强跨学科研究,拓宽研究视角;构建学术研究共同体。
【总页数】13页(P19-31)
【作者】郑小军;张美虹
【作者单位】南宁师范大学职业技术师范学院;广西职业教育发展研究中心
【正文语种】中文
【中图分类】G724.4
【相关文献】
1.国内外STEM教育研究主题热点及发展趋势——基于共词分析的可视化研究
2.国内外深度学习研究主题热点及发展趋势——基于共词分析的可视化研究
3.国内外STEM教育研究主题热点及发展趋势——基于共词分析的可视化研究
4.国内外深度学习研究主题热点及发展趋势——基于共词分析的可视化研究
因版权原因,仅展示原文概要,查看原文内容请购买。
多维数据的分组和聚类分析方法及应用研究随着数据产生和积累的飞速增长,多维数据的分组和聚类分析变得日益重要。
这些分析方法帮助人们理解和发现数据背后的模式和关系,从而为决策提供基础和洞察力。
本文将介绍多维数据的分组和聚类分析的常见方法,并探讨它们在不同领域的应用研究。
1. 多维数据分组分析方法多维数据分组分析的目标是将数据集划分为不同的组,使得每个组内的成员具有相似的特征。
以下是几种常见的多维数据分组分析方法:1.1. K-means聚类K-means聚类是一种基于距离的分组方法,将数据集划分为K个类别,使得每个数据点与其所属类别的质心之间的距离最小化。
该方法适用于连续变量和欧几里得距离度量的数据集。
K-means聚类具有简单、高效的优点,但对初始聚类中心的选择敏感。
1.2. 层次聚类层次聚类是一种自底向上或自顶向下的分组方法,通过计算样本间的距离或相似度来确定聚类结构。
该方法生成一个树形结构,可视化地表示不同类别之间的关系。
层次聚类不需要预先指定类别数量,但对于大规模数据集计算复杂度较高。
1.3. 密度聚类密度聚类方法基于数据点周围的密度来划分组,将样本点密度较高的区域作为一个组,较低的区域作为另一个组。
该方法可以识别复杂的聚类形状和噪声数据,适用于非凸数据集。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种常见的密度聚类方法。
2. 聚类分析方法聚类分析的目标是将数据集划分为若干个不相交的子集,每个子集中的数据点在某种意义上具有相似性。
以下是几种常见的聚类分析方法:2.1. 分层聚类分层聚类是一种基于相似性度量的聚类方法,将数据集划分为多个子集,类别数量从1逐渐增加到N。
该方法可通过树状图表示不同层级之间的相似性关系。
分层聚类的优点是不需要预先指定聚类数量,但对于大规模数据集计算复杂度较高。
2.2. 期望最大化(EM)算法EM算法是一种基于概率模型的聚类方法,通过迭代生成最大似然估计的方法来拟合数据分布。
我国人工智能教育的研究热点与趋势分析——基于共词分析的可视化研究朱广袤 乜勇(陕西师范大学 教育学院,陕西 西安 710062)摘 要:人工智能与教育的融合引发教育领域新一轮研究热潮。
本文选取国内近十年来教育技术学专业领域CSSCI 检索源期刊中与人工智能教育相关的239 篇论文为研究对象,利用Bicomb 2.0、Ucinet 6.0及SPSS 20.0软件,采取共词聚类、词频分析、多维尺度分析及社会网络分析等方法,对我国人工智能教育的研究现状与研究热点进行了详细分析,最后对未来研究趋势进行了讨论。
关键词:人工智能;人工智能教育;文献计量分析;可视化研究中图分类号:G434 文献标志码:A 文章编号:2096-0069(2019)05-0008-06教育”“人工智能教育”“教育人工智能”“人工智能技术,教育”“人工智能教育应用”“人工智能教育系统”“人工智能课程”“人工智能学科”等为主题词,来源限定为国内教育技术学专业领域CSSCI 检索源期刊,检索时间为2009年到2018年。
经统计,本研究检索到相关论350篇,经筛选后最终纳入分析的样本论文数为239篇。
本研究将这239篇论文的题录信息以NoteFirst 格式导出,以SPSS 20.0、Ucinet 6.0和Bicomb 2.0 [2]为研究工具,采用知识图谱及共词分析方法进行分析。
(二)研究过程具体路线图如图1(见下页)所示。
二、研究结果与分析(一)高频关键词词频统计与分析将样本文献信息导入Bicomb 2.0,进行关键词提取操作。
最后得到718个关键词,根据普赖斯公式[3]收稿日期:2019-05-16作者简介:朱广袤(1995— ),男,安徽亳州人,陕西师范大学教育学院教育技术专业硕士研究生,主要研究方向为信息技术教育应用;乜勇(1970— ),男,青海贵德人,陕西师范大学教育学院教育技术系主任、教授、博士生导师,主要研究方向为信息技术教育应用、网络与远程教育。
16种常用的数据分析方法汇总数据分析是从大量数据中提取、转化和整理信息的过程,以便更好地理解现象、问题和现象背后的原因。
在数据分析中,有多种方法可以用于收集、处理和分析数据。
以下是16种常用的数据分析方法汇总。
1.描述性统计分析:描述性统计分析是对数据集进行总结和描述的方法,包括计算平均值、中位数、众数、标准差和百分位等。
2.相关性分析:相关性分析用于确定两个或多个变量之间的关系,通过计算相关系数来判断变量之间的线性关系。
3.回归分析:回归分析用于研究自变量与因变量之间的关系,以预测因变量的值。
常用的回归方法包括线性回归、多元回归和逻辑回归等。
4.时间序列分析:时间序列分析用于研究随时间变化的数据,包括趋势分析、季节性分析和周期性分析等。
5.聚类分析:聚类分析用于将一组相似的数据点分为不同的群组,通过相似性度量和聚类算法来确定数据点之间的关系。
6.因子分析:因子分析用于确定一组变量的共同因素,从而减少变量的数量并简化数据集。
7.判别分析:判别分析用于确定分类变量之间的差异,以识别可以用来区分不同分类的关键变量。
8.多维尺度分析:多维尺度分析用于在多个维度上对数据进行可视化和分析,以确定数据之间的相似性和差异性。
9.交叉表分析:交叉表分析用于研究两个或多个变量之间的关系,通过计算频率表和卡方检验来确定变量之间的关联性。
10.因果关系分析:因果关系分析用于确定一个变量对另一个变量产生影响的关系,通过设计实验和进行因果推理来确定变量之间的因果关系。
11.ANOVA分析:ANOVA(方差分析)用于比较两个或多个组之间的差异性,通过计算F统计量和进行假设检验来确定差异是否显著。
12.简单抽样分析:简单抽样分析用于从一个大的总体中选择一个代表性的样本,以便进行更快和更简便的数据分析。
13.对比分析:对比分析用于比较两个或多个变量之间的差异和相似点,以揭示它们之间的模式和趋势。
14.敏感度分析:敏感度分析用于确定一个变量对另一个变量的敏感程度,以评估不确定性对结果的影响。
关键词共词分析、聚类分析和多维尺度分析
功能:
1、寻找近几年研究热点(热点图),为论文的选题做准备
2、直接为论文服务
方法举例:
关键词:自闭症
研究工具:Bicomb共词分析软件、、excel、中国知网(CNKI)
研究进程:
A:中国知网(官网)-左上“资源总库”-左上“中国学术期刊网络出版总库”
主题:自闭症,年限范围:2000-2014,来源类别:全选-检索
每页显示:50-一页页全选后再删除一定不要研究的文献-尽量多选择文献(最好全部)
导出/参考文献-全选-导出-自定义(支持需输出更多文献信息)-全选-导出-保存-txt
打开txt-编辑-全部替换(前面英文删除)-另存为txt-编码:ANSI【多操作几遍,不然提取不出来或会出现00000,而不是00000,00001,00002等】
B:书目共现分析系统-增加(右上角)-项目编号:1-格式类型:cnki中文txt-提取-选择文档-关键字段:关键词-提取(红色)-统计-关键字:关键词-∑统计-矩阵-关键字:关键词-≥5≤280-词篇矩阵-生成-导出至txt-保存
C:打开SPSS-文件-打开文本数据-下一步-删除第一行-度量标准:“名义”变为“度量”-分析-分类-系统聚类-V1标准个案-V2到Vn变量-统计量:选择“合并进程表”“相似性矩阵”-绘制:树状图-方法(二分类-Ochiai)-结果:近似矩阵(最大的表格)导出到excel-多维尺度分析【树状图如果是虚线,可能是spss版本问题或其他问题】
D:SPSS-excel导入-打开数据-excel-删除第一行-删除1:、2:、3:、4:、5:、、、-复制粘贴到变量视图-度量标准:“名义”变为“度量”-字符串变为数值【第一个分类不要改字符串】-分析-度量-多维尺度最后一个ALSCAL-变量移动-从数据创建距离-度量(E)-标准化:Z 得分-选项:组图。