引文分析法共词分析法浅析
- 格式:ppt
- 大小:914.50 KB
- 文档页数:40
2021年第12期(总第21134摘要:本文提出关键词利用策略的优化方案,解决小数量级概念失焦、关键词组概念缺失等问题,优化共词分析结果,以发现潜在研究热点,拓展研究热点主题识别的深度。
关键词利用策略优化方案在高频词共词分析的基础上,引入关键词与关键词组相结合的处理方案,通过调整数据集范围,实现共词分析结果优化。
实证部分以“主动健康”主题为例,使用DDA 软件,完成基于关键词利用策略优化方案的共词分析,探测主动健康的学科主题热点。
在初始发现的5类研究领域、12个热点之外,基于关键词利用策略优化方案的共词分析扩展识别了7个潜在热点话题,补充发现5个复合词组表达的研究概念。
关键词利用策略优化方案令小数量级概念聚焦形成类团,在聚类过程中得到表达,令关键词组代表的概念得到完整呈现。
关键词:共词分析;关键词;关键词组;主动健康;优化方案;DDA 中图分类号:G250.252 DOI :10.3772/j.issn.1673-2286.2021.12.006引文格式:马宇驰,牟冬梅,杨鑫禹. 优化关键词利用策略的共词分析研究[J]. 数字图书馆论坛,2021(12):34-40.* 本研究得到国家自然科学基金项目“信息链视域下电子病历数据驱动健康服务供给侧决策的路径与模式研究”(编号:71974074)资助。
学科知识结构揭示模型将学科知识结构模块分为低中高三个层级,其中对关键词、主题词、标题词、特征词等节点的共词分析是揭示中层级知识结构的主要技术方法,在数据整合与智慧服务领域起到发现学科研究热点、探究学科发展进程的作用[1]。
结合时间轴属性,共词分析能在纵向上反映一段时间内专业领域的动态发展演化历程,在横向上反映某个时间节点静态知识单元分布结构[2],揭示了领域的基本特征,对该领域的研究人员有重要的指导作用[3]。
共词分析方法基本分为6个环节,即确定分析问题、术语词源选择、高频词选定、术语相关计算、多元统计分析及统计结果分析[4]。
通用引文网络分析方法研究引言随着信息技术的不断发展以及大数据时代的到来,科学研究的范式也发生了变化,研究者们开始逐渐意识到科研合作和互动对科学研究的重要性。
然而,如何衡量合作与互动的程度以及它们对科学研究的影响,一直以来都是一个困扰科学家的难题。
通用引文网络分析方法将有助于解决这个难题。
一、现有的研究方法的不足传统的科研数据分析主要以作者为单位进行统计,分析研究的主要是作者间的关系,这种方法存在一些不足之处。
例如,在某个研究领域中,一些科学家虽然没有直接合作,但有机会相互交流、分享研究结果,这种交流就可能会对双方产生重要影响,但传统方法无法对此进行很好的分析。
此外,传统方法忽略了研究领域之外的影响,例如政策、经费、政治、时代背景等,这些因素也会影响科学研究的方式和结果。
二、通用引文网络分析方法的概念通用引文网络分析方法是一种基于作者间相互引用关系的分析方法。
该方法将论文看作一个节点,将论文间的引用关系看作边,构建出引用网络。
通用引文网络分析方法显著地超越了传统方法,实现了对多种因素的考虑,不仅引用论文而且引用作者和期刊。
这个方法体现了合作与互动的过程,能够更加全面地反映科研领域内的关系。
三、引文网络在科学研究中的应用引文网络可以用于研究领域的图谱研究,如为了探求学科的结构和发展历程,我们可以用基于引用的图谱分析方法。
基于引用网络的图谱分析方法能够帮助科学家了解学科发展的现状和方向,并提供一些参考意见。
另外,在分析学科核心期刊时,我们可以将引用网络作为一项评价指标,这会对某个期刊在学术界中的重要性和影响力有明确的测量。
引用网络还可以用于发现具有相近研究主题的作者群体。
在相对较小的学科领域内,这种方法特别适用。
基于引用的学科群体发现方法可以帮助科研工作者发现那些兴趣相投,但尚未形成稳定合作关系的学者,从而促进更多有意义的研究合作。
除此之外,引用网络还可以用于对研究领域重要性的评价,通过比较同等领域内的论文网络,识别出科研领域的重要研究点,为其他科学家提供参考。
1、概述引文分析,主要是运用计算机和数学等方法与手段,分析文献之间引证与被引证的知识联系与知识网络。
揭示文献之间知识流动规律的一种方法;知识流动是以知识单元为基本单元的流动。
引文分析由知识流动过程拓展为分析知识元的关系即派生出相关的共引分析,耦合分析,引申出网络分析、知识图谱方法。
(知识是否流动、什么时间开始流动、流动量大小、流速的快慢、流动的方向)。
主要有助于屡清知识发展的脉络;共引分析的主旨是要通过同时被其他文献引用的频次来表达文献间的关系;即某两份文献同时被其他文献引用,其引用的频次越高,表明关系程度越密切;主要有助于明确知识结构2、博特的结构洞理论新观点和新信息一定来自于与其他不同群体中的个体的弱关系;创见的论文引用参考文献,是通过参考文献来实现知识单元的吸收,组织与升华;多视角共引知识图谱,是对共引文献中各个知识单元的游离与重组,在重组中形成新的知识网络、创造新的知识单元;各个知识单元的学科差异性越大,知识单元的重组的创造性越大;3、CiteSpace参数功能的选择简化网络并突出其重要的结构特征;path-finder的作用是简化网络并突出其重要的结构特征;MST(minimum spanning tree)的优点是运算简捷;文献共被引用图谱,是帮助人们通过图谱中的关键节点,聚类及色彩分析某个研究主体的演变;合作图谱,可以发现某个研究领域学者、国家或研究机构之间的社会关系。
共词图谱,有利于人们分析研究热点及热点的演变,尤其配合突变词的使用;学科类别贡献图谱,分析学科知识结构及其演变;作者共被引图,用于分析某个领域内的科学共同体及其演变;期刊共被引可用于研究领域的学科基础及其演变的分析;Citespace软件格式的要求是以Wos数据库的文本数据格式为标准;4、数据可视化图:聚类视图:侧重于体聚类间的结构特征,关键节点及重要连接;时间线视图:侧重于够花聚类之间的关系和某个聚类中文献的历史跨度;时区图:侧重于时间维度上来表示知识演变的视图,,清楚地展示文献的更新和相互影响;Citespace 依据网络结构和聚类的清晰度,提出了模块值(简称Q值)和平均轮廓值(简称S值两个指标;Q值一般在区间[0,1)内,Q>0.3说明划分出来的社团结构是显著的;S>0.5聚类认为是合理的,若S无穷大,则聚类个数通常1,只代表一个研究主题;操作步骤:(1)点击Project-New第二步:登陆:WEB OF SCIENCE/WOS_GeneralSearch_input.do?product=WOS&SID=1E6gg kdKQLnzhPwq6jH&search_mode=GeneralSearch,在所选数据库选择:WEB of Science TM核心合集第三步:选择高级检索,如上图所示,在“高级检索”输入“逻辑语言”;点击红色方框。
引文分析报告1. 引言引言部分应该对本篇引文分析报告进行适当的介绍,包括研究目的、研究背景等,为读者提供了解整篇报告内容的上下文。
2. 文献综述在文献综述部分,应该对相关的文献进行综述,提供引文分析的基础知识和理论背景。
可以介绍引文的定义、作用以及前人在引文分析领域的研究成果等。
3. 引文数据收集与整理本节应当介绍引文数据的收集方法和过程。
引文数据可以包括从数据库、学术期刊等收集得到的引用信息,如作者、标题、日期等。
在整理引文数据时,可以使用适当的数据处理方法,如去重、去噪、标准化等,以确保数据的准确性和一致性。
4. 引文分析方法本部分应该介绍采用的引文分析方法。
常见的方法包括共引分析、引文网络分析、引文路径分析等。
可以说明各种方法的原理和适用范围,并解释为何选择特定的方法进行引文分析。
5. 引文分析结果本节应该对引文分析的结果进行详细的呈现和解释。
可以通过图表的形式展示引文网络、引文路径等信息,以便读者更直观地理解引文数据信息。
在对引文分析结果进行解释时,可以结合引文数据的特点和研究目的,提出合理的解读和分析。
可以关注被引用最多的文献、研究领域的热点问题等方面。
6. 结论在结论部分,应该对引文分析的结果进行总结,并结合研究目的和背景,提出相应的结论和建议。
结论部分还可以对引文分析方法的优劣势进行评价,为进一步的引文分析研究提供思路和参考。
7. 参考文献在报告的最后,列出本次引文分析报告所参考的文献,包括引文分析方法的文献、相关领域研究的文献等。
参考文献应当按照一定的格式编写,如APA格式、MLA格式等。
8. 致谢在报告的最后,可以致谢给予帮助的人和机构,如导师、同事、实验室等。
致谢部分可以表达对他人支持和鼓励的感激之情。