关键词共词分析、聚类分析和多维尺度分析

水科学研究的关键词共词聚类分析

水科学研究的关键词共词聚类分析韩宇平;袁皖华;肖恒【摘要】水科学涉及的范围十分广泛,已涌现出大量研究成果.对已发表的学术论文进行统计分析,对于明晰水科学发展的现状具有重要意义.然而,目前采用文献计量学方法开展的研究还比较少.本文在收集大量水科学研究相关期刊论文的基础上,采用Bibexcel统计分析了文献资料中的关键词,构建了由62个高频关键词组成的共词矩阵,利用网络分析、多维尺度分析和聚类分析等不同统计方法,初步归纳出近十年来水科学研究中的热点和研究现状.结果表明:气候变化、水资源承载力、水资源管理、水环境容量、水环境质量等方面研究成果相对较多;围绕大型水利工程如南水北调工程和水安全问题的研究均有所增多;研究中更加注重区域的可持续发展和生态环境保护;形成了一些研究热点地区.【期刊名称】《华北水利水电学院学报》【年(卷),期】2015(036)004【总页数】6页(P20-25)【关键词】水科学;关键词;共词分析;网络分析;聚类分析;多维尺度分析【作者】韩宇平;袁皖华;肖恒【作者单位】华北水利水电大学,河南郑州450045;华北水利水电大学,河南郑州450045;华北水利水电大学,河南郑州450045【正文语种】中文【中图分类】TV74;TM615通信作者：肖恒(1982—),男,江苏徐州人,讲师,博士,主要从事气候变化对水文水资源影响方面的研究.“水科学”(Water Science)是最近二十年来出现频率很高的一个词，已经渗透到社会、经济、生态、环境、资源利用等许多方面，也派生出许多新的学科或研究方向，成为学术研究和科技应用的热点.相应地，每年涌现出大量期刊论文，既给学者的研究工作提供了便利，但同时也给文献的管理与分析利用带来了不便[1].因此，有必要对所包含的学科主题和热点进行系统科学的梳理.左其亭 [2-3]将水科学划分为：水文学、水资源、水环境、水安全、水工程、水经济、水法律、水文化、水信息、水教育等各有侧重且相互交叉的10个具有较强关联性的研究领域，并分别对这10个方面做专题研究进展报告，及时总结了当前水科学研究的最新进展.然而，目前运用文献计量学方法来分析水科学研究中的热点与现状的成果还比较少.而这些少数研究也只侧重于水科学研究中的某一方面(如水资源领域[4])进行文献分析探讨.因此，本文利用《CNKI中国学术期刊网络出版总库》中的文献资料，采用Bibexcel统计分析涉及水科学期刊论文中的关键词，选取高频关键词构建共词矩阵，通过网络分析、多尺度分析和聚类分析等统计方法，揭示水科学研究中的热点与研究现状.1.1 资料来源从表1中可以看出，2005—2007年论文数量逐年增加(1 764～2 244篇)，2008—2013年在2 600篇以上，2014年论文数量相对较少，这主要是因为开始检索的时间为2015年1月初，2014年12月份发表的部分论文未纳入统计之中.从各研究领域的论文数量上看，水资源领域期刊论文数量最多，为1 129～1 823篇，平均约1 477篇；其次是水环境领域，发表论文477～875篇，平均约714篇.这2个领域约占统计的10个水科学领域论文总量的90%，论文数量在年际上的变化主要由这2个领域论文数量所引起.2010年左右，关于水文学、水环境和水安全等的研究显著增多，一定程度上反映出国家水安全战略需求重点关注的方面(如洪涝、干旱等极端水文事件研究).涉及水经济、水法律、水文化、水信息、水教育等领域的论文数量相对较少，特别是水教育领域自2011年才有期刊论文出现，论文数量1～2篇.从表2中可以初步归纳出近十年来涉及水科学相关研究的文献具有如下特点：1)水环境、水资源承载力、可持续发展、水文学、水文化等出现频次超过100次，表明这些领域(方向)是水科学工作的重点，研究成果较多.2)虽然国内对研究气候变化、水生态文明、水文化等方面研究起步较晚，但是在变化环境下的水资源脆弱性评价和适应性、气候变化下的水资源承载能力、水生态系统的保护、水文化的宣传和普及等方面的研究得到较快发展.3)方法层面的应用研究较多.如层次分析法、主成分分析法、分布式水文模型、系统动力学、熵权法、BP神经网络、集对分析等关键词出现频次较高，这一方面表明一些较为成熟的方法得到了广泛应用；另一方面表明新的技术方法也在不断发展.4)形成了一些研究热点地区.按流域划分，主要集中在黄河流域(如全流域、渭河流域、黑河流域等)和长江流域(如全流域、汉江流域、太湖流域等)；按行政区域划分，以北京市为研究区的研究最多.此外从水利工程角度分析，以研究三峡水库和南水北调工程的居多.从图1中可以看出，水环境、水资源承载力、可持续发展、水文学、水资源管理、指标体系等节点较大，处于节点的中心位置，在一定程度上反映出近十年来水科学研究的主题和主要内容.具体来说：1)水文学与气候变化的联系最为紧密，这表明，气候变化下的水文过程的响应及机理研究是当前研究的热点问题.2)水资源管理与管理模式、系统动力学、优化配置等关系较为密切，表明关于水资源管理的研究从系统动力学、优化配置技术方法层面和从管理的角度开展的较多. 3)水资源承载力与指标体系、系统动力学、主成分分析法、层次分析法等联系较为密切，表明关于水资源承载力方面的研究主要侧重于计算方法.4)水环境与水环境质量、水污染、可持续发展、水环境容量、对策等联系较为密切，表明水环境方面的研究侧重于从可持续发展的角度探讨水环境质量和水环境容量，以及相应的对策研究.1)水文学领域.研究内容侧重于气候变化、水循环、生态水文及水资源安全等，研究区域多选择半干旱地区的黑河流域和我国重大水利工程(如三峡水库)，研究方法上主要采用(水文)模型进行模拟分析.2)水资源领域(方法部分).围绕区域的可持续发展，侧重开展水资源承载力、生态环境评价等研究，研究区域集中在干旱区，如石羊河流域及黄河流域.采用的方法主要是建立指标体系，多以熵权法确定指标权重，运用层次分析、主成分分析、模糊综合评价等方法进行综合评价.3)水资源领域(管理部分).流域方面侧重水资源管理模式的研究，研究区集中在长江流域，同时注重考虑流域生态需水问题；城市方面注重水资源利用的研究，地理信息系统技术在城市数字化过程中也得到了较为广泛的应用.4)水环境领域.研究围绕地表、地下水环境的容量、质量、管理等方面展开，研究区域主要是太湖流域.5)水工程领域.研究侧重于与南水北调工程相关的地质勘探、相关设备、工程监测、工程影响因素等方面.6)其它领域.研究成果较为集中地体现在采用系统动力学方法研究北京市的水环境承载力.水科学的涉及范围十分广泛，很多方面仍处于探索阶段，对水科学的学科体系、研究框架的认识还很不足，相应的关于水科学研究的成果层出不穷，文献数量越来越多.本文在收集大量文献基础上，构建由62个高频关键词组成的共词矩阵，利用网络分析、多维尺度分析和聚类分析等不同统计方法，初步归纳出近十年来水科学研究中的研究热点和研究现状.①在水文学领域中关于气候变化方面的研究、在水资源领域中关于水资源承载力和水资源管理方面的研究、在水环境领域中关于水环境容量和水环境质量方面的研究在当前研究成果中占较大比例；②围绕大型水利工程(如南水北调工程)的水工程领域的研究，以及国家日益重点关注的水安全问题的水安全领域的研究均有所增多；③水科学相关研究中更加注重区域的可持续发展和生态环境保护；④各方面的研究中都形成了一些研究热点地区.致谢:本文第一作者自2013年以来参加了由郑州大学左其亭教授主编的《中国水科学研究进展报告》系列丛书的编写工作，在编写过程中认识到用数学方法描述水科学研究进展的直观性和科学性，先期以“水资源学”为研究对象撰写的《水资源学研究的关键词共词聚类分析》一文已发表，本文则在前期研究的基础上扩展到整个水科学研究领域.在此，感谢左其亭教授及其领导的《中国水科学研究进展报告》编写团队对本文提出的指导意见！[1]任智军,朱东华,谢菲.科技文本的可视化分析研究[J].北京理工大学学报(社会科学版),2007,9(1):13-17.[2]左其亭.中国水科学研究进展报告2011—2012[M].北京:中国水利水电出版社,2013.[3]左其亭.中国水科学研究进展报告2013—2014[M].北京:中国水利水电出版社,2015.[6]舒琅.基于社会网络分析的项目管理学科热点和主流知识群的研究[D].杭州:浙江大学,2010.[7]FRY J,TALJA S.The intellectual and social organization of academic fields and the shaping of digital resources[J].Journal of Information Science,2007,33(2):115-133.。

教育信息化热点问题探究

教育信息化热点问题探究摘要研究数据选自期刊《中国电化教育》和《电化教育研究》2011年文献中研究内容与“教育信息化”相关的76篇学术论文，运用共词聚类、多维尺度分析等研究方法，研究分析教育信息化的研究热点，并对相关问题进行探讨。

关键词教育信息化；共词聚类；教育技术中图分类号：g434 文献标识码：a 文章编号：1671-489x(2012)27-0009-03perspective on 2011 hot issues of educational//liu ting abstract research on 76 articles which relevant to educational informatization that from china educational technology and e-education research, using co-word cluster analysis method and multidimensional scaling analysis method. reveal the hot research topics through analysis, and then probe into the related issues.key words educational informatization; co-word clustering; educational technologyauthor’s address harbin normal university, harbin, china 1500251 研究设计1.1 数据来源与研究方法“教育信息化”一词在1999年中共中央国务院发表的《关于深化教育改革全面推进素质教育的决定》中被提出，至今已取得显著的成绩，对我国教育改革发展产生重要影响。

本文以中国期刊网全文数据库为数据平台，以教育技术学核心期刊《中国电化教育》和《电化教育研究》期刊2011年全年文献为数据源，检索主题或关键字为“教育信息化”，最终确定76篇文献作为有效数据。

我国管理科学与工程博士学位论文的共词聚类分析

工博学论的词类析程士位文聚分
杨昌明 ’教授王
军３博士生（、中国地质１
３（、７集大学（武汉）经济管理学院武汉４０）４２义马煤业（团）
股份有限公司河南义马
西安
◆
４２０３７３０、陕西维德科技股份有限公司
３３６５
３３８６３３５７３３４８３３３９３４３０３４２１
不确定性
绩效
２５５．２
２８５
仿真
风险控制复杂阿络价值链
２２
２２２２２２
支持向量机２８５４指标体系壹本机构产业结构定价２５，５５
方法，合信息技术研究解决社会、经济、结
设条件是：文章的关键词是文章主题内容的浓缩，共词文章数量越多，表
明这类关键词 “ 距
ｇ可持续发展５筋结掏方程模型３４９１３
遗传算法５２评价指标体系３４９７０４ｌ敦据挖掘５２１２８１知识管理５２２２ｇ
序号关键词
表１管理科学与工程博士学位论文高频关键词表
词序关键词
诃序
援号
关键词
词撷
之间的内在关系，探索管理科学与工
程专业博士学位论文研究现状、热点和变化趋势等，以期对今后的研究有
术如因子分析、聚类分析和多维尺度分析等，则可以按这种 “ 离”将一个学科内距

共词分析法的基本原理及实现

1、建立词库：首先需要对文本中的词汇进行分词和标注，建立词汇库。这个步骤可以通过一些现有的分词工具和词典来完成。
2、计算共现频率：在建立词汇库的基础上，对于每一对词汇，计算它们在文本中共同出现的频次。
3、构建相似度矩阵：根据词汇之间的共现频率，可以计算出它们之间的相似度，从而构建一个相似度矩阵。
4、应用聚类算法：使用一些常用的聚类算法，如K-means、层次聚类等，根据相似度矩阵将词汇聚成一个类别。
5、分析聚类结果：对聚类结果进行分析，可以发现文本的主题和热点，进一步挖掘文本数据的有用信息。
总之，共词分析法作为一种有效的文本挖掘方法，可以广泛应用于信息处理和文本分析中。共词聚类分析法作为其中的一种重要方法，具有简单易行、可操作性强等特点，可以发现文本的主题和热点以及词汇之间的关联程度，为深入研究文本数据提供更多有用信息。随着大数据时代的到来，共词分析法将会得到更加广泛的应用和发展。
等是机器学习的核心概念，同时还可以了解到机器学习在不同领域的应用情况。这些信息可以作为文章论述的基础，使文章内容更具说服力和可信度。
总结共词分析法是一种有效的文本挖掘和分析工具，可以帮助我们揭示文本中词汇之间的关联和规律，提取有用的知识结构。它的优点在于可操作性强、适用范围广，能够从大量文本数据中挖掘出有用的信息。
2、基于主题的共词分析
基于主题的共词分析能够更深入地挖掘文献之间的和相似性。该方法首先通过主题建模技术（如LDA、PLSA等）从文献中提取主题，然后对每个主题进行共词分析。该方法适用于领域分析和主题挖掘等场景。
3、基于实体和关系的共词分析
基于实体和关系的共词分析能够从文献中提取实体和实体之间的关系，并对这些实体和关系进行共词分析。该方法适用于知识图谱构建、实体关联和领域知识挖掘等场景。

国内“ChatGPT+教育”研究热点、主题及启示--基于共词分析的可视化研究

国内“ChatGPT+教育”研究热点、主题及启示--基于共词分
析的可视化研究
郑小军;张美虹
【期刊名称】《广西职业技术学院学报》
【年(卷),期】2024(17)3
【摘要】近两年来,ChatGPT及其与教育的融合引发了热议。

研究选取了中国知网(CNKI)中文期刊数据库的311篇“ChatGPT+教育”文献,运用共词分析法,通过高频关键词分析、社会网络分析、聚类分析和多维尺度分析等方法,探析国内“ChatGPT+教育”的发展现状。

研究发现,ChatGPT生成原理、人机协同、教育数字化转型和数字素养等是该研究领域的热点。

ChatGPT对教育生态的影响、ChatGPT与教育变革论、ChatGPT赋能教育数字化及ChatGPT的教育伦理风险与对策论是当前“ChatGPT+教育”研究的4个主题。

研究认为,未来“ChatGPT+教育”研究需加强理论研究,夯实理论基础;质性研究与实证研究并举;加强跨学科研究,拓宽研究视角;构建学术研究共同体。

【总页数】13页(P19-31)
【作者】郑小军;张美虹
【作者单位】南宁师范大学职业技术师范学院;广西职业教育发展研究中心
【正文语种】中文
【中图分类】G724.4
【相关文献】
1.国内外STEM教育研究主题热点及发展趋势——基于共词分析的可视化研究
2.国内外深度学习研究主题热点及发展趋势——基于共词分析的可视化研究
3.国内外STEM教育研究主题热点及发展趋势——基于共词分析的可视化研究
4.国内外深度学习研究主题热点及发展趋势——基于共词分析的可视化研究
因版权原因，仅展示原文概要，查看原文内容请购买。

共词分析法的基本原理及EXCEL实现_储节旺

第29卷第6期 2011 年 6 月
情报科学
Vol.29,No.6 June,2011
共词分析法的基本原理及 EXCEL 实现
储节旺,郭春侠
(安徽大学管理学院，合肥安徽 230039)
摘要：共词分析法是文献研究的重要方法之一，在国内外众多学科领域都获得了广泛应用。人们
主要采用 spss、ucinet 等软件等进行构建作者和关键词矩阵以分析文献数据，但这些软件比较难以
共词分析法主要是对同一篇文献中词汇对或名
收稿日期：2011-03-01 基金项目：国家社科基金项目（10BTQ035）;安徽大学创新团队项目（SKTD010B）作者简介：储节旺(1969-)，男，安徽岳西人，教授，博士，主要从事知识管理、教育管理、科技管理研究；郭春侠(1973-)，女，河
北固安人，副教授.
法分列出关键词，并将所有关键词进行排列，统计得
出 I1=434。
因此 T=25.7，为阀值为 26，即核心关键词只有
知识管理、图书馆、知识经济三个。这显然不能反映
研究的根本问题。出现该问题的原因主要是所选期
1 共词分析法的基本原理
共词分析方法最早在 20 世纪 70 年代中后期由法国文献计量学家提出的，其思想来源于文献计量学的引文耦合与共被引概念。1986 年法国国家科
学研究中心的 Callon M 和 Law J 等人出版了第一部关于共词分析法的学术专著【1】。共词分析经过 20 多年的发展，已经被广泛应用到人工智能、科学计量学、信息科学和信息系统、信息检索等领域许多领域，取得了重要研究成果。
关键词的共词矩阵构建好以后，可以直接求出相关系数。操作方法是：选择工具栏→工具→数据分析→相关系数。R 型聚类分析是以相关系数为基础进行的聚类，必须对相关系数进行显著性检验。将在某一置信度α之下显著相关的元素归为一类。一般情况下，α值越大，相关元素个数会越多，因此可以逐渐增大显著水平α值，将显著相关的元素逐一归类并画出谱系图，即为学科研究的知识图谱，或者说可视化。

多维数据的分组和聚类分析方法及应用研究

多维数据的分组和聚类分析方法及应用研究随着数据产生和积累的飞速增长，多维数据的分组和聚类分析变得日益重要。

这些分析方法帮助人们理解和发现数据背后的模式和关系，从而为决策提供基础和洞察力。

本文将介绍多维数据的分组和聚类分析的常见方法，并探讨它们在不同领域的应用研究。

1. 多维数据分组分析方法多维数据分组分析的目标是将数据集划分为不同的组，使得每个组内的成员具有相似的特征。

以下是几种常见的多维数据分组分析方法：1.1. K-means聚类K-means聚类是一种基于距离的分组方法，将数据集划分为K个类别，使得每个数据点与其所属类别的质心之间的距离最小化。

该方法适用于连续变量和欧几里得距离度量的数据集。

K-means聚类具有简单、高效的优点，但对初始聚类中心的选择敏感。

1.2. 层次聚类层次聚类是一种自底向上或自顶向下的分组方法，通过计算样本间的距离或相似度来确定聚类结构。

该方法生成一个树形结构，可视化地表示不同类别之间的关系。

层次聚类不需要预先指定类别数量，但对于大规模数据集计算复杂度较高。

1.3. 密度聚类密度聚类方法基于数据点周围的密度来划分组，将样本点密度较高的区域作为一个组，较低的区域作为另一个组。

该方法可以识别复杂的聚类形状和噪声数据，适用于非凸数据集。

DBSCAN（Density-Based Spatial Clustering of Applications with Noise）是一种常见的密度聚类方法。

2. 聚类分析方法聚类分析的目标是将数据集划分为若干个不相交的子集，每个子集中的数据点在某种意义上具有相似性。

以下是几种常见的聚类分析方法：2.1. 分层聚类分层聚类是一种基于相似性度量的聚类方法，将数据集划分为多个子集，类别数量从1逐渐增加到N。

该方法可通过树状图表示不同层级之间的相似性关系。

分层聚类的优点是不需要预先指定聚类数量，但对于大规模数据集计算复杂度较高。

2.2. 期望最大化（EM）算法EM算法是一种基于概率模型的聚类方法，通过迭代生成最大似然估计的方法来拟合数据分布。

我国人工智能教育的研究热点与趋势分析——基于共词分析的可视化研究

我国人工智能教育的研究热点与趋势分析——基于共词分析的可视化研究朱广袤乜勇（陕西师范大学教育学院，陕西西安 710062）摘要：人工智能与教育的融合引发教育领域新一轮研究热潮。

本文选取国内近十年来教育技术学专业领域CSSCI 检索源期刊中与人工智能教育相关的239 篇论文为研究对象，利用Bicomb 2.0、Ucinet 6.0及SPSS 20.0软件，采取共词聚类、词频分析、多维尺度分析及社会网络分析等方法，对我国人工智能教育的研究现状与研究热点进行了详细分析，最后对未来研究趋势进行了讨论。

关键词：人工智能；人工智能教育；文献计量分析；可视化研究中图分类号：G434 文献标志码：A 文章编号：2096-0069（2019）05-0008-06教育”“人工智能教育”“教育人工智能”“人工智能技术，教育”“人工智能教育应用”“人工智能教育系统”“人工智能课程”“人工智能学科”等为主题词，来源限定为国内教育技术学专业领域CSSCI 检索源期刊，检索时间为2009年到2018年。

经统计，本研究检索到相关论350篇，经筛选后最终纳入分析的样本论文数为239篇。

本研究将这239篇论文的题录信息以NoteFirst 格式导出，以SPSS 20.0、Ucinet 6.0和Bicomb 2.0 [2]为研究工具，采用知识图谱及共词分析方法进行分析。

（二）研究过程具体路线图如图1（见下页）所示。

二、研究结果与分析（一）高频关键词词频统计与分析将样本文献信息导入Bicomb 2.0，进行关键词提取操作。

最后得到718个关键词，根据普赖斯公式[3]收稿日期：2019-05-16作者简介：朱广袤（1995— ），男，安徽亳州人，陕西师范大学教育学院教育技术专业硕士研究生，主要研究方向为信息技术教育应用；乜勇（1970— ），男，青海贵德人，陕西师范大学教育学院教育技术系主任、教授、博士生导师，主要研究方向为信息技术教育应用、网络与远程教育。

16种常用的数据分析方法汇总

16种常用的数据分析方法汇总数据分析是从大量数据中提取、转化和整理信息的过程，以便更好地理解现象、问题和现象背后的原因。

在数据分析中，有多种方法可以用于收集、处理和分析数据。

以下是16种常用的数据分析方法汇总。

1.描述性统计分析：描述性统计分析是对数据集进行总结和描述的方法，包括计算平均值、中位数、众数、标准差和百分位等。

2.相关性分析：相关性分析用于确定两个或多个变量之间的关系，通过计算相关系数来判断变量之间的线性关系。

3.回归分析：回归分析用于研究自变量与因变量之间的关系，以预测因变量的值。

常用的回归方法包括线性回归、多元回归和逻辑回归等。

4.时间序列分析：时间序列分析用于研究随时间变化的数据，包括趋势分析、季节性分析和周期性分析等。

5.聚类分析：聚类分析用于将一组相似的数据点分为不同的群组，通过相似性度量和聚类算法来确定数据点之间的关系。

6.因子分析：因子分析用于确定一组变量的共同因素，从而减少变量的数量并简化数据集。

7.判别分析：判别分析用于确定分类变量之间的差异，以识别可以用来区分不同分类的关键变量。

8.多维尺度分析：多维尺度分析用于在多个维度上对数据进行可视化和分析，以确定数据之间的相似性和差异性。

9.交叉表分析：交叉表分析用于研究两个或多个变量之间的关系，通过计算频率表和卡方检验来确定变量之间的关联性。

10.因果关系分析：因果关系分析用于确定一个变量对另一个变量产生影响的关系，通过设计实验和进行因果推理来确定变量之间的因果关系。

11.ANOVA分析：ANOVA(方差分析)用于比较两个或多个组之间的差异性，通过计算F统计量和进行假设检验来确定差异是否显著。

12.简单抽样分析：简单抽样分析用于从一个大的总体中选择一个代表性的样本，以便进行更快和更简便的数据分析。

13.对比分析：对比分析用于比较两个或多个变量之间的差异和相似点，以揭示它们之间的模式和趋势。

14.敏感度分析：敏感度分析用于确定一个变量对另一个变量的敏感程度，以评估不确定性对结果的影响。

关键词共词分析法_高等教育研究的新方法_郭文斌

1839
从表 1 可以看出，频次大于等于 20 的有 52 个关键词，占关键词总数的 3． 25% ，其出现的频次合计为 1839 次，词均 35． 37 次，占关键词总频次（ 15976）的 11． 51% 。这些高频关键词表述的研究内容，是 2000 － 2012 年《教育研究》发表文章的核心内容。从高频关键词分布顺序可看出，《教育研究》涉及的前 10 个研究热点依次为：高等教育（ 107）、基础教育（ 69）、教育公平（ 63 ）、教育改革（ 59 ）、教师（ 59）、教育研究（ 54）、课程改革（ 52）、教师教育（ 52）、教育发展（ 48）、教育理论（ 44）。这一统计
关键词：关键词；共词分析；高等教育研究；知识图谱
一、引言
随着研究成果的激增，数字化期刊的盛行及互联网使用的便捷化，可以通过网上搜索引擎快捷的查询并获得这些成果。在应对海量数字信息的今天，传统文献计量和综述方式，不仅耗费时间、效率低下、查询资料的时间跨度短，而且难以全面搜集海量文献信息，造成文献研究偏于定性归纳、过于主观。［1］激增的数据背后隐藏着许多重要的信息，缺乏挖掘数据背后隐藏的知识的手段，导致了 “数据爆炸但知识贫乏 ”。［2］如何在浩如烟海的数字文献中，将这些零散的信息全面、快速综合起来，挖掘出有深度的信息为我所用，已经成为众多研究者关注的热点。随着计算机技术的不断提升，以及数理统计方法的完善，研究者使用计算机进行数据挖掘（ Data Mining，DM）的能力得以大大提升。在此背景下，科学知识图谱开始成为当前国际科学计量学领域热门的方法之一。它是通过将科学计量学的引文分析方法与可视化技术相结合达到对信息的有效组织和利用，生成新的知识。［3］该方法首先，通过计算机和互联网搜索引擎强大的自动查询功能，在极短的时间里面完成对海量信息的准确查询。其次，通过计算机对已查询到的海量分散信息进行文献计量

数据分析方法五种

数据分析方法五种第一篇：数据分析方法简介数据分析指的是对大量数据进行采集、整理、清洗、验证、处理、分析和展示的过程。

在现今的数据爆炸时代，数据分析愈发重要。

在数据分析过程中，需要使用一系列数据分析方法，以帮助我们更好地理解、描述和解释数据。

下面，我们将介绍五种常用的数据分析方法。

一、数据可视化数据可视化指的是将大量的数据通过图形、图表等方式展示出来，以便于人类更好地理解和解释这些数据。

在数据可视化过程中，需要注意图形的准确性、完整性以及易读性。

数据可视化可以帮助我们更好地分析和解释时间序列、趋势、关联性等数据信息。

二、聚类分析聚类分析是一种无监督学习方法，它能够将数据集中的对象按照一定的规则划分到不同的类别中。

聚类分析通常适用于涉及到多个变量的复杂问题，能够帮助我们确定数据中的独立组以及它们之间的区别。

三、假设检验假设检验是一种重要的统计学方法，它可以根据样本数据推断总体的性质，包括总体均值、标准差、比例等等。

假设检验通常需要关注样本的大小、对总体的假设、显著水平等因素。

四、回归分析回归分析能够分析自变量和因变量之间的关系，并探究两种变量之间的函数形式、斜率和截距等特征。

在回归分析过程中，需要考虑变量之间的相关关系、异常值和多重共线性等问题。

五、决策树决策树分析是一种数据挖掘方法，它能够根据一组数据特征预测出结果。

决策树分析通常需要考虑特征选择、样本分类、剪枝优化等因素。

决策树分析可以有效地帮助我们从一堆数据中发现隐藏的模式，从而提供决策支持和预测能力。

以上是五种常见的数据分析方法。

我们需要注意的是，不同的数据分析方法可能适用于不同类型的数据分析问题，需要结合实际问题加以考虑。

同时，在数据分析过程中，还需要注意数据的质量，确保分析结果具有可靠性和有效性。

国内SPOC研究热点和发展趋势分析r——基于词频分析法、共词聚类法和多维尺度分析法的研究

国内SPOC研究热点和发展趋势分析r——基于词频分析法、共词聚类法和多维尺度分析法的研究冯甜甜;马炅【期刊名称】《中国教育信息化·高教职教》【年(卷),期】2018(000)006【摘要】本文以2014年1月1日到2017年12月31日为时间节点,在教育技术学领域SPOC研究方向选取了423篇论文为研究对象,利用Bicomb 2.0软件生成了SPOC的高频关键词和共词矩阵;并利用SPSS软件进行共词分析,对近4年国内SPOC研究现状与发展趋势进行了量化分析与总结.本文研究发现,国内SPOC研究主要围绕两条主线和四个研究热点进行.两条主线是SPOC的理论特点和SPOC教学模式的设计与实现;四个研究热点是SPOC教学模式、SPOC教学设计、SPOC应用及SPOC的在线学习.而对发展趋势的预测认为,未来SPOC的应用领域将更加趋于专业化,更注重教学效率的提高,SPOC将有可能替代MOOC成为在线学习的主流,小规模、个性化的在线学习将成为未来发展的主流趋势.【总页数】5页(P5-9)【作者】冯甜甜;马炅【作者单位】西北民族大学教育科学与技术学院,甘肃兰州730030;西北民族大学教育科学与技术学院,甘肃兰州730030【正文语种】中文【中图分类】G434【相关文献】1.我国智慧教育领域的研究热点与发展趋势分析——基于词频分析法、共词聚类法和多维尺度分析法 [J], 王米雪;张立国2.国内SPOC研究热点和发展趋势分析——基于词频分析法、共词聚类法和多维尺度分析法的研究 [J], 冯甜甜;马炅;3.我国中学地理核心素养研究热点的嬗变与演进——基于词频分析法、共词聚类法和多维尺度分析法的研究 [J], 刘斌;王涛耕;刘桂侠4.国内学前融合教育研究热点及趋势分析——基于CNKI文献关键词的词频和共词网络分析 [J], 刘静静5.我国心血管护理研究的热点及趋势—基于共词聚类及多维尺度分析法 [J], 张瑛;管玉香因版权原因，仅展示原文概要，查看原文内容请购买。

共词分析法研究共词分析的过程与方式

共词分析法研究共词分析的过程与方式一、本文概述共词分析法是一种广泛应用于信息科学、图书馆学、社会学、管理学等领域的文献计量学方法。

它通过统计和分析一组词汇在特定领域文献中共同出现的频次，揭示这些词汇之间的关联性和聚类性，从而反映该领域的热点主题、研究趋势和知识结构。

本文旨在深入探讨共词分析的过程与方式，包括数据准备、共词矩阵构建、聚类分析、结果解读等关键环节，以期为相关领域的研究者提供一套系统、实用的方法论参考。

在本文中，我们首先将对共词分析法的基本原理进行简要介绍，阐述其相较于其他文献计量学方法的独特优势。

随后，我们将详细介绍共词分析的具体步骤，包括如何从海量文献中筛选和提取关键词，如何构建共词矩阵并计算关键词之间的关联强度，以及如何运用聚类分析等统计方法对共词矩阵进行解读和可视化展示。

我们将通过实例分析，展示共词分析法在实际研究中的应用效果，并探讨其可能存在的局限性和改进方向。

通过本文的阐述，我们期望能够帮助读者更加深入地理解共词分析法的核心思想和操作步骤，掌握其在实际研究中的应用技巧，从而推动该方法在相关领域的研究中得到更广泛的应用和发展。

二、共词分析法的理论基础共词分析法是一种基于文献计量学的方法，它的理论基础主要源自信息科学、文献学和情报学等领域。

该方法通过统计和分析一组关键词或主题词在同一篇文献中共同出现的频次，来揭示这些关键词或主题词之间的关联程度，从而反映某一学科或领域的热点、结构和发展趋势。

共词分析法的理论基础主要包括词频分析理论、共现分析理论和聚类分析理论。

词频分析理论认为，关键词的出现频次能够反映其在某一学科或领域的重要性，频次越高，说明该关键词越受关注，其研究价值也越大。

共现分析理论则强调关键词之间的关联性，认为如果两个关键词在同一篇文献中频繁共现，那么它们之间就存在一定的关联或相似性。

聚类分析理论则是将共现频次较高的关键词进行聚类，形成不同的主题或研究领域，从而揭示学科或领域的结构和发展趋势。

不同办园体制下幼儿教师生存状态的知识图谱

不同办园体制下幼儿教师生存状态的知识图谱摘要：幼儿教师是学前教育的重要实施者，也是学前教育质量的重要保障。

幼儿教师的生存状态不仅影响其自身的教学效果，也会间接影响幼儿。

提升幼儿教师的职业认同，间接支持学前教育事业的发展，对学前教育质量的提升具有促进作用。

为更直观地展示幼儿教师在不同办园体制下的研究结果，为未来提高教师职业幸福感提供支持，本文采用关键词共词分析法，利用Bicomb软件及SPSS软件绘制热点知识图谱。

关键词：幼儿教师生存状态热点知识图谱在教师职业队伍中，幼儿教师作为一个特殊群体，在社会经济的转型时期承受着更大的职业风险和压力，尤其是大量国企、民营幼儿园在追求经济利益的过程中忽视教育规律和幼儿教师的劳动特点，存在着牺牲教师切身利益的现象。

近年来，我国的幼儿教师数量存在锐减趋势，不同办园体制下的教师队伍生存也存在差异。

如工作过于忙碌，工作时间长，教育教学任务繁重，工作压力大，且常处于精神高度紧张的状态，严重影响了幼儿教师的身心健康和教育教学质量。

由此，我们有必要关爱幼儿教师的生命质量，关心幼儿教师的生存状态。

一、研究方法1.资料来源首先，进入中国学术期刊出版总库，检索主题为“幼儿教师生存状态” “幼儿教师生存现状” “教师生存状态”的所有文献，共检索出312篇文献。

然后，剔除相关的重合或者无效文献，最终获得有效文献24。

篇。

2.研究工具本研究使用Bicomb共词分析软件和SPSS20. 0 系统软件。

具体操作如下：首先，从数据库中选取相关文献，以文本形式进行保存，在运行过程中转换编码。

其次，在Bicomb软件中创建项目、数据导入与提取，通过统计等程序最终生成矩阵。

再次, 将信息读入SPSS20.0中，进行聚类分析，形成聚类树图。

最后，通过分析、度量等方法进行多维尺度分析，形成大的热点图谱［七3.研究过程研究的相关步骤如下：第一，依据所提取的文献数据，确定相关的高频关键词；第二，通过软件的方式，构建相关高频关键词的共词矩阵；第三，把高频关键词导入SPSS20. 0进行聚类分析操作；第四，进行多维尺度分析和社会网络分析；第五，对软件得出的图谱进行分析与解读［2］o二、研究结果与分析1.高频关键词词频排序及分析经过关键词排序，我们把这一主题下的热点关键词总结如下：生存状态、教师、幼儿教师、农村、乡村教师、因素、对策。

江苏省高职院校图书馆学术研究知识图谱分析

2021 年1 月第1期总第467期内蒙古科技与经济Inner Mongolia Science Technology & EconomyJanuary2021No.1TotalNo.467江苏省高职院校图书馆学术研究知识图谱分析王桂梅（苏州卫生职业技术学院图书馆，江苏苏州215009$摘要：选取了江苏公办高职院校图书馆2006年至今发表的学术论文为样本，运用关键词共词分析法，通过SATI 、UCINET 、NETDRAW 、SPSS 软件将高职院校图书馆的学术研究聚类分析分为7个类团主题，并用多维尺度分析直观地绘制了学术研究成果的向心度和密度，结果表明：图书馆管理模式、服务模式、数字资源建设、队伍建设等是高职院校图书馆学术研究的热点方向，学科服务、用户教育、信息素养是其薄弱环节％关键词:高职院校图书馆；学术研究；共词分析；知识图谱中图分类号：G251. 2（253）文献标识码:A 文章编号：1007 — 6921 （2021） 01 — 0126 — 03教育部2015年印发的《普通高等学校图书馆规程》指出高等学校图书馆是学校的文献信息资源中心，是为人才培养和科学研究服务的学术性机构，是学校信息化建设的重要组成部分，是校园文化和社会文化建设的重要基地（这一论述表明高校图书馆学术水平是衡量图书馆建设水平的重要指标（江苏省是我国高等教育大省，其中高等职业教育占据了半壁江山（2006年前后，高职院校图书馆凭着教育部对江苏省高职院校进行人才培养工作水平评估的机会，普遍都进行了新馆建设和人才引进工作，改善了办馆条件，提高了图书馆馆员的学历层次，提升了馆员服务能力和业务素质（笔者曾在 2011年对省内54所公办高职高专图书馆在评估期间的科研状况，使用传统文献分析法从发文年限、发文数量、文献被引、作者合著等指标进行过统计分析.1/，经过近10年时间的平稳发展，笔者再次从文献计量学角度梳理50余所公办高职院校图书馆学术研究的特点，用定量和定性相结合的研究方法，将研究结果可视化#得到更加直观的感性认识#为各图书馆进一步提升服务能力和学术研究水平服务（I技术方法与数据处理II研究方法笔者使用关键词共词分析法，借助SATI 文献题录分析软件和 UCINET 、NETDRAW 社会化网络分析软件，提取关键词、构建相异矩阵并进行可视化处理，再利用SPSS19. 0软件进行聚类和多维尺度分析，分析江苏高职院校图书馆学术研究的特点（共词分析法是一种内容分析的方法，主要是通过对能够表达某一学科领域研究主题或研究方向的专业术语共同出现在一篇文献中的现象的分析，判断学科领域中主题间的关系，从而展现该学科的研究结构⑵，文献关键词和主题词是最常用的共词分析对象（1 2 关键词采集与处理数据采集于CNKI 中文期刊数据库，时间限定"2006年至今&学科领域限定“图书情报和数字图书馆&以第一作者单位“高职院校名称+图书馆”为检索词，兼顾部分院校名称调整，数据清洗后最终获得1 310篇相关文献，导入SATI 文献题录分析软件提取关键词，本次研究选取频次大于等于10次的关键词为样本数据，共计有47个（关键词社会化网络知识图谱如图1所示，每一个圆代表一个关键词节点，节点大小表示关键词出现频次的高低，节点之间连线粗细表示关键词之间关系强弱（总体上看# 高频关键词有图书馆、高校图书馆、高职院校图书馆、信息服务、数字图书馆、图书馆员、读者服务、网络环境等，一定程度上代表了 10年间高职院校图书馆的研究主体和研究重点（节点连线较粗的有图书馆与高职院校、高职院校图书馆与读者服务、高职院校图书馆与信息服务等，反映了包括信息服务、读者服务等各类型服务研究是高职院校图书馆的研究热点与重点（图1关键词共现网络知识图谱2 知识图谱分析2. 1 构建相异矩阵关键词数值矩阵处理是绘制知识图谱的基础# 为消除多值共现矩阵中频次悬殊对统计结果造成的影响，常用做法是将多值矩阵转化为元素值在收稿日期 2020—06—15基金项目：苏州卫生职业技术学院院级课题一般项目“图书馆空间改造与资源利用的影响机制研究"（编号:szwzy201719） %作者简介：王桂梅（1983 — ）,女，大学本科，苏州卫生职业技术学院图书馆馆员%・126・王桂梅・江苏省高职院校图书馆学术研究知识图谱分析2021 年第1 期区间取值的相似矩阵⑶。

共词分析法研究共词聚类分析法的原理与特点

共词分析法研究共词聚类分析法的原理与特点一、本文概述本文旨在深入探讨共词分析法及其重要应用——共词聚类分析法的原理与特点。

作为一种在文献计量学、内容分析和信息科学等领域广泛应用的文本分析方法，共词分析法通过对文献中共同出现的词汇进行分析，揭示出词汇之间的内在关联和知识结构。

而共词聚类分析法则是在此基础上，利用聚类算法对共词矩阵进行聚类，进一步挖掘出主题结构、研究热点和发展趋势。

本文将首先介绍共词分析法的基本原理和方法步骤，然后重点阐述共词聚类分析法的实现过程、优势和局限性，以期为读者提供全面而深入的理解，并为其在相关领域的实际应用提供指导和参考。

二、共词分析法的理论基础共词分析法是一种基于文献计量学的分析方法，其理论基础主要包括词频分析、共现分析和聚类分析三个部分。

词频分析是共词分析法的基础。

通过统计特定领域文献中词汇的出现频率，可以揭示出该领域的研究热点和趋势。

高频词汇往往代表了该领域的研究重点和方向，而低频词汇则可能反映了新的研究动向或未受足够关注的领域。

共现分析是共词分析法的核心。

它通过分析同一篇文献中不同词汇的共同出现情况，来揭示这些词汇之间的关联性和相关性。

共现频率高的词汇对往往具有紧密的内在联系，可能代表着同一研究主题或方向的词汇群体。

聚类分析是共词分析法的重要手段。

通过运用聚类算法，可以将共现频率高的词汇对进行聚类，形成不同的聚类群体。

这些聚类群体反映了文献中不同研究主题或方向的分布情况，有助于研究者快速识别出该领域的主要研究方向和热点。

共词分析法的理论基础包括词频分析、共现分析和聚类分析三个部分。

通过这些分析手段，共词分析法能够有效地揭示出文献中词汇的关联性、相关性以及研究主题和方向的分布情况，为研究者提供有力的研究工具和方法。

三、共词聚类分析法的原理共词聚类分析法是一种基于共词分析的信息挖掘方法，它通过对特定领域文献中词汇共现情况的统计和分析，揭示出该领域的研究热点、研究前沿和发展趋势。

[汉语,主题]对外汉语研究主题分析

对外汉语研究主题分析随着我国经济的持续发展和综合国力的不断增强，汉语热已经在世界范围内形成。

对外汉语这一领域的研究也逐渐深入。

为了能更科学地了解对外汉语在近十年的研究现状和发展方向，本文以在线文献为实例，通过计量、社会网络分析等方法来展开此项研究。

作为了解一个领域研究现状的一种重要途径，文献统计分析对于把握学科研究结构和发展趋势的作用不容小觑。

一、数据采集中国知网是目前国内最大的汇集各种学术资源的网络平台，提供CNKI源数据库、外文类、工业类、农业类、医药卫生类、经济类和教育类多种数据库。

其中综合性数据库为中国期刊全文数据库、中国博士学位论文数据库、中国优秀硕士学位论文全文数据库、中国重要报纸全文数据库和中国重要会议文论全文数据库。

核心期刊则具有代表性、前沿性、权威性，在核心期刊上发表的论文在很大程度上揭示了国内在对外汉语领域的研究成果及研究方向。

本文以中国知网中的核心期刊为数据源，采用文献计量学的方法，在中国知网中通过全文高级搜索对外汉语，在文献的哲学与人文科学学科领域内选择中国语言文字下的语言学及汉语，同时，由于研究对外汉语的论文数量比较庞大，因此本文所选的论文时间跨度在2006年到2015年之间。

论文数量如图1所示，这十年间发表在核心期刊上的相关论文数量没有太大的变动。

同时，本文整理了论文发表数量排在前10的核心期刊，具体名称如表1。

二、数据分析笔者基于论文关键词共词分析法，以搜集到的3378篇论文为数据，对关键词聚类与多维尺寸分析结果，可以呈现出对外汉语的研究主题，并利用社会网络分析方法，通过绘制共现网络知识图谱，可以进一步揭示该研究领域结构的内部联系及其特征。

共词分析法是内容分析法的一种，其认为两个能够表达论文主题内容的词条在一篇论文中同时出现，则表达二者具有一定的共现关系，共现词数越多，则关系越强。

聚类分析和多维尺度分析法，用来构建聚类图和多维尺度图谱，聚在一起的若干关键词可构成一个研究主题领域。