CiteSpace的背景安装步骤数据格式使用过程及其图谱分析
- 格式:pptx
- 大小:4.75 MB
- 文档页数:21
CiteSpace重要术语及其软件分析步骤李杰首都经济贸易大学安全与环境工程学院个人主页:/u/jerrycueb1.CiteSpace 基本术语•CiteSpace:引文空间是一款着眼于分析科学分析中蕴含的潜在知识,是在科学计量学、数据可视化背景下逐渐发展起来的一款引文可视化分析软件。
由于是通过可视化的手段来呈现科学知识的结构、规律和分布情况,因此也将通过此类方法分析得到的可视化图形称为“科学知识图谱”。
BSE和CJD研究领域的演变(引文空间的变化)/blog-496649-482376.html动画下载地址/~cchen/talks/demo/BSE_CJD_1981-2001_transp.exe1.CiteSpace 基本术语•Betweenness centrality:中介中心性是测度节点在网络中重要性的一个指标(此外还有度中心性、接近中心性等)。
CiteSpace中使用此指标来发现和衡量文献的重要性,并用紫色圈对该类文献(或作者、期刊以及机构等)进行重点进行标注。
1.CiteSpace 基本术语•Burst 检测:突发主题(或文献、作者以及期刊引证信息等)。
在CiteSpace中使用Kleinberg, J(2002)年提出的算法进行检测。
1.CiteSpace 基本术语•Citation tree-rings :引文年环–代表着某篇文章的引文历史。
引文年轮的颜色代表相应的引文时间,一个年轮厚度和与相应时间分区内引文数量成正比。
CiteSpace图例1.CiteSpace 基本术语•Thresholds :阈值。
TOP NTOP N%引文数量、共被引频次和共被引系数三个层次上,按前中后三个时区分别设定阈值,其余的由线性内插值来决定2.使用软件分析步骤数据源的选择CSSCICNKIWeb of Science数据采集及数据清洗科学知识图谱绘制合作网络引文网络共现网络共被引分析学科研究进展与趋势学科研究热点与前沿学科核心期刊群学科引文历史学科核心作者群相邻学科间关系2.使用软件分析步骤数据收集154321876。
第1讲CiteSpace与科学知识图谱李杰1,2,陈超美31.上海海事大学海洋科学与工程学院2.上海海事大学科技情报研究所3. Drexel University-College of Computing andInformaticsChen C. Information visualization: Beyond the horizon[M]. Springer Science& Business Media, 2006.配套教程: 李杰, 陈超美著.CiteSpace科技文本挖掘及可视化[M].首都经济贸易大学出版社.2016.作者博客: 李杰博客:/u/jerrycueb;陈超美博客:/u/ChaomeiChen本讲基本内容CiteSpace简介及原理科学知识图谱导览CiteSpace应用现状及问题CiteSpace学习流程及其相关资料软件开发者陈超美,男,1960年9月生于北京。
美国德雷塞尔大学计算机与情报学学院教授,曾先后担任英国布鲁内尔大学客座教授和大连理工大学长江学者讲座教授。
研究方向为信息可视化、科学前沿图谱和科学发现理论。
发表科技论文200余篇,被引超过10000次。
出版著作科学计量学及数据可视化方面的著作近10部,并有多部被翻译成中文。
中文博客:/u/ChaomeiChen学术主页:/~cc345/Why CiteSpace?Google Metrics Array近12%的引用贡献来源于Citespace的一篇典型文献(1167/10005)。
如果加上其他与CiteSpace相关的应用被引,可能会达到30%-50%以上。
https:///citations?user=IjN4HSRsdakC&hl=enCiteSpace简介•陈超美(Chao-mei Chen)教授是美国德雷赛尔大学计算机与情报学教授,从2008年开始担任大连理工大学长江学者讲座教授,同时也是Drexel-DLUT 知识可视化与科学发现联合研究所(美方)所长。
信息计量学CiteSpace使用教程4
5.数据处理窗口展示
数据处理窗口
数据处理窗口即展示了上节提到的Citespace支持的数据库类型。
在数据处理窗口,软件可以完成以下功能:
1.数据格式转换(最为常用)
2.数据获取:获取ADS、arXiv数据,属于citespace内置功能
3.数据处理(较为常用):针对WoS数据,可以进行文件合并、文献去重、分隔符格式转换等。
具体内容如下图所示:
数据处理
1.整理数据(较少使用):使用本功能要求会使用基本的SQL语句,具体界面如下。
整理数据
5. 基本操作流程
使用citespace的基本操作流程如框图所示,涉及到了数据采集、数据处理、导入软件、功能选择、可视化生成图谱和标签提取、图谱解读几个重要步骤。
基本操作流程
下面以文献共被引图谱分析来展示使用CiteSpace的方法:
5.1 前期工作
•获取数据
•数据转换(非WoS数据)
•以CNKI为例
•(1)新建两个文件夹“input”和“output”,将下载的文件放入“input”文件夹中
•(2)Data →Import→CNKI
•(3)Input directory选择“input”文件夹,Output directory选择“output”文件夹
•(4)点击format conversion,完成转换
•建立新工程;
•参数选择(功能面板选择cited reference)。
CiteSpace入门教程在科研工作中,我们常常需要面对海量的文献,如何在这些文献当中找出值得精读、细读的关键文献,挖掘学科前沿,找到研究热点就成为了开展研究之前首先需要解决的问题。
CiteSpace作为一款优秀的文献计量学软件,能够将文献之间的关系以科学知识图谱的方式可视化的展现在操作者面前,既能帮助我们梳理过去的研究轨迹,也能使得我们对未来的研究前景有一个大概的认识。
CiteSpace 又翻译为“引文空间”,是一款着眼于分析科学分析中蕴含的潜在知识,是在科学计量学、数据可视化背景下逐渐发展起来的引文可视化分析软件。
由于是通过可视化的手段来呈现科学知识的结构、规律和分布情况,因此也将通过此类方法分析得到的可视化图形称为“科学知识图谱”。
摘自李杰.CiteSpace中文版指南正如科学计量学界的权威专家刘则渊教授对CiteSpace知识图谱形态的概括一样,“一图展春秋,一览无余;一图胜万言,一目了然”。
近年来,使用CiteSpace开展的研究、发表的论文呈现不断上升的趋势。
根据中国知网的统计,2023年相关论文已经达到388篇;到2023年预测将达到423篇。
使用CiteSpace开展的研究、发表的论文数目变化情况在如此多同质化的文章面前,我们应当如何做好自己的研究才能够不落入俗套,进而脱颖而出呢?我认为,在深入的把握CiteSpace的原理的基础上,熟稔相关操作背后的含义,对CiteSpace软件的应用达到游刃有余,这样才能知道自己的研究需要什么,做到“知己”。
同时了解相关文章的研究套路,清晰他们的研究内容和研究思路,取其精华,规避其错误,做到“知彼”。
下面根据我个人的一些学习的体会和实际使用的情况对CiteSpace使用过程来跟大家做一个基础性的介绍。
使用CiteSpace需要先安装JAVA 8,安装教程参考进入下一个界面,提醒使用者在使用这个软件开展研究的发表论文的时候,别忘了把软件开发者的论文引用上,不同意就用不了,那我们当然选择同意。
CiteSpace介绍与使用1. What is CiteSpace?CiteSpace:引文空间是一款眼着与分析科学分析中蕴含的潜在知识,是在科学计量学、数据可视化背景下逐渐发展起来的一款引文可视化分析软件。
由于是通过可视化的手段来呈现科学知识的结构、规律和分布情况,因此也将通过此类方法分析得到的可视化图形称为“科学知识图谱”。
(摘自李杰.CiteSpace中文版指南)对于我个人而言,学习使用CiteSpace的目的是快速了解所研究方向的“论文图谱”,被引用数是论文是否优质的重要标志,故通过论文引用图谱,我可以知道哪些论文是优质的,哪些论文是具有开创性的,并且具有开创性质的论文一般不会那么复杂,较容易理解,为日后学习打基础。
2.How to use CiteSpace?在本节我将以自己研究方向为例,构建论文引用图谱首先点击StartCiteSpace.bat ,打开CiteSpace。
然后就可以看到如下较为'原生态’的界面。
CiteSpace自身带了一个example,就是Terrorism。
我现在需要新建一个Project,来建立自己的主题项目。
先点上图的1,“New”,进入下图界面。
上图的2,需要分别建立两个文件夹,一个空文件是Project,另一个Data。
这里简要说一下这两个文件夹的作用,Project文件夹是用来保存分析的结果,不需要添加其他内容。
Data文件是存放将要被分析的数据,这个需要我们去检索,下载,然后放到这个文件夹,具体找什么如下图。
首先找 cross modal 主题 2010-2017年的所有论文。
在上两个图可以知,检索结果有3208篇论文,我们现在要做的是将所有记录信息下载下来,由于Web of Science 限制每次只能下载500条记录,故要多次下载,每次变化的是记录范围1至500,501至1000,1001至1500…,将每次下载的文件改名为download_xxx.txt(这是因为CiteSpace只识别以download_为前缀的文件名)下载后的数据文件:有了数据我就可以使用CiteSpace进行引用分析了,还记得最初的那个“原生态”的界面吗?就是它选择年份,2010-2017,时间间隔为1年。