文献计量学实务
- 格式:doc
- 大小:140.50 KB
- 文档页数:15
文献(wénxiàn)计量学(Bibliometrics)文献计量学是以文献体系和文献计量特征为研究(yánjiū)对象,采用数学、统计学等计量方法,研究文献情报的分布结构、数量关系、变化规律和定量(dìngliàng)管理,并进而探讨科学技术的某些结构、特征和规律的一门学科[5-12]。
这一术语(shùyǔ)最早是1969年由英国人A.普里查德(Alan Britchard)提出的。
文献(wénxiàn)计量学中常用的定律有如下几种。
布拉德福定律:布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
文字表述为:如果将科技期刊按其刊载某专业论文的数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个区域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2……的关系。
洛特卡定律:洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写3篇论文的作者数量约为写1篇论文作者数量的1/9;写n篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
齐普夫定律:齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。
若用f表示频次,r表示等级序号,则有fr=C(C为常数)。
人们称该式为齐普夫定律。
_______________________________________________________________________________科技查新方法之文献计量学法的应用文献计量学是用定量的方法研究文献规律的科学。
它是情报学的一个重要分支。
科技查新作为情报研究的重要形式之一,自然也应用了文献计量学方法。
文献计量学方法是对文献和文献工作进行定量研究的方法,是以大量的统计资料为依据,其方法的关键在于“计量”,所以必须进行一系列的统计工作以获得必要的数据。
通常这些统计包括:出版物统计,科学术语统计、著者统计、引证文献与被引证文献统计,文献报道量统计、文献利用情报统计、读者统计等。
科技查新作为一种具有特别内涵的情报研究,采用的统计方法主要为文献报道量统计。
1 应用方式文献报道量统计,主要应用于立项查新与成果查新等,在这些查新中,通过对查新项目所属领域的文献报道量的统计,可以初步了解该领域的研究进展情况。
文献报道量的统计方式根据实际情况可以分为:_______________________________________________________________________________(1)按照国内、国外分别统计;(2)按照时间段统计;(3)按照专利文献、非专利文献统计;(4)结合以上方式统计。
2 应用意义利用文献计量学进行文献报道量的统计,不仅可以对查新项目进行宏观评价,而且可以进一步阐述查新项目的研究意义。
比如我们可以从按时间段统计的文献报道量中看出,该查新项目的相关研究正处于何种阶段,是正处于热点研究阶段,还是已趋于成熟阶段,或处于刚起步阶段等。
根据国内、国外的文献报道量,我们可以在一定程度了解到,与查新项目相关的研究在国内正处于何种阶段,以及与国外的差距有多大。
专利文献的报道量,可以从一定程度上体现国内外对该领域的关注和投入程度、研究的成熟程度、市场情况等。
这些对评价查新项目都具有重要的意义。
文献计量学-详解目录• 1 什么是文献计量学• 2 文献计量学的分析数据• 3 文献计量学的应用分析• 4 我国文献计量学o 4.1 发展历程o 4.2 存在的问题及解决对策• 5 文献计量学的局限性什么是文献计量学文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科。
文献计量学的分析数据文献计量学的分析数据指标取自各种不同的数据源,在机读文献数据库出现之前,对科学文献的定量分析都是以印刷型出版物为分析对象的。
随着各类型电子版出版物的不断涌现,获取分析数据的方法与途径也在不断扩展。
目前,获取分析数据的主要途径有:① 使用机构内部的文件,如:研究报告、年度报告等;② 如果所需信息不包括在书目数据库中,要通过查找原始文献;③ 大规模的分析需要利用商用文献数据库来获取;④ 利用专门为指标统计而提供数据的数据库来获取数据;⑤ 选择与国际上某机构签订协议来获取这方面的服务。
另外,还可以通过一些机构获取有关文献计量学方面的统计分析指标,如:美国费城的ISI和新泽西州的CHI研究公司、荷兰莱顿大学的科学技术研究中心(CWTS)、匈牙利科学院图书馆,以及中国科学院文献情报中心等。
这些机构都设有专门部门,从事与文献计量学有关的开放指标数据源的创新性研究,收集、加工和整理基于文献统计分析的各种指标。
由于各单位统计的指标使用不同的统计方法和不同的来源数据,相互之间可比性较差,所以使用从不同单位获得的数据进行文献计量学研究时,要全面了解具体指标产生的方法和依据,客观衡量和评价每一项分析研究成果。
文献计量学的应用分析作为一个科技评估的工具,文献计量学的测度体系提供了科技成果的各种定量和定性指标。
虽然,这些成果只涵盖了已发表的科学成果,但它们适用于不同的科研层次,小到科学家个人,大到一个学科、机构、地区,甚至国家。
文献计量学在学术期刊评价中的应用研究随着科学研究的发展,越来越多的学术期刊被创建和发行,而学术期刊的质量评价就显得尤为重要。
此时,文献计量学这一工具就成为了评价学术期刊质量的有效方法。
本文将从文献计量学的概念、指标和应用,以及学术期刊评价的实践案例等方面进行分析和探讨。
一、文献计量学的概念文献计量学是一门研究文献中数量和质量特征的科学,该学科的主要任务是制定一些指标和方法,研究出文献的使用、引证和影响情况,为学术研究和科学管理提供理论和方法依据。
二、文献计量学指标文献计量学主要通过两类指标来衡量学术期刊的质量:一是数量指标,主要包括发表文章数量、发文作者数量、期刊机能出版速度等;另一是质量指标,主要包括影响因子、被引频次、期刊自引率、国际合作度等。
其中影响因子是较为重要的指标之一,指的是对一定时间内被某一期刊所发表的文章引用情况加以统计分析的结果,能直接反映出期刊的影响力。
三、文献计量学的应用学术期刊的评价一直备受关注,文献计量学在此方面的应用也越来越广泛。
通过运用文献计量学,可以对学术期刊的发展趋势、作者、被引次数等进行分析,为学术研究提供有益的信息和数据支持。
此外,文献计量学在期刊收录情况、SCI / SSCI收录等方面也发挥了重要的引导作用。
四、实践案例以中国学术期刊为例,该国政府在2006年开始实行了学术期刊评价制度,以期提升国内学术期刊的水平和影响力。
其中,文献计量学是该制度的重要组成部分之一。
具体来讲,对学术期刊的影响因子、被引频次等质量指标进行系统积累和分析,可以为学术期刊的编制改进提供有益的参考意见。
此外,政府对学术期刊评价制度的细节和标准进行不断完善和调整,以期符合时代的需要和实际需求。
总之,在当今时代,学术期刊的质量评价不仅关系到学术环境的建设,也影响到国家科技事业的发展。
因此,运用文献计量学进行学术期刊的评价是非常必要和有益的,能够提高学术期刊的质量水平,促进学术研究的发展。
文献计量学方法文献计量学方法是一种可用于评估科研成果的方法,它基于通过分析文献数量和质量来衡量特定研究领域内知识的产生和发展。
文献计量学方法可用于评估领域内研究人员、期刊、学术机构以及国家之间的影响力和表现。
下面将就文献计量学方法的内容、应用以及常见指标等方面作一详细介绍。
一、文献计量学方法的内容文献计量学方法主要通过对文献的数量、引用次数、权威专家评价等进行测量来评估他们的质量及影响力。
1、文献量的测量文献量是指在一定时间范围内某个领域内出版的论文数量。
文献量通常是用一定的统计指标来表示,最常用的指标是SCI(E) (科学引文索引扩展版,即Web of Science数据库)的公开文献数量,也可通过其他数据库如PubMed、CNKI进行测量。
文献量的测量反应着科学研究的产出量,但文献量大并不一定代表研究领域的兴旺发展。
2、引用次数的测量引用次数是指文章被其他文献引用的次数。
这个度量标准往往被用来衡量文章在学界的影响力。
而且,如果一篇文章在较长时间内被引用很多次,这也说明文章的影响力长期有效。
为衡量影响力,市面上有许多类似H指数、g 因子、i10指数等的指标,可用来衡量研究人员、机构、期刊的影响力。
如H指数(H-index):即某一研究人员的文献发表数 n ,有 n 篇文章至少被引用 h 次,其余文章的引用次数均小于等于 h。
认为 H-指数是目前最为科学、公正的反映研究者学术水平的指标,已成为研究人员的重要指标。
3、国际合作的测量国际合作是指来自不同国家或地区的作者共同完成一篇论文的情况。
通过测量国际合作的次数、占总文献量的比例等指标,可用于测量研究机构或一个研究领域的国际化程度。
此外,在科技创新的过程中,国际化和开放性是重要的因素,可以帮助科学家更好地认识国际领域中新兴的概念、技术、成果等,因此不同国家间的合作越来越受到重视。
二、文献计量学方法的应用文献计量学方法是衡量科学研究成果的一种常用方法,可以找到引领学术研究的主流和热点领域,进而影响政策、决策的制定。
《文献计量学》教学大纲课程编码:11272013课程名称:文献计量学英文名称:Bibliometrics开课学期:8学时/学分:42/2.5(其中实验学时:14)课程类型:专业课(选修)开课专业:信息管理与信息系统专业本科生选用教材:王伟主编:《文献计量学》,吉林大学校内讲义,2006年2月主要参考书:1.罗式胜主编:《文献计量学概论》,中山大学出版社,1994年4月2.丁学东编著:《文献计量学基础》,北京大学出版社,1993年9月3.邱均平编著:《文献计量学》,科学技术文献出版社,1988年12月4.王崇德编著:《文献计量学引论》,广西师范大学出版社,1997年5月5.王伟编著:《文献计量学实习指导》,吉林大学校内讲义,2006年2月执笔人:王伟一、课程性质、目的与任务文献计量学是采用定量的方法,以各类文献为对象,研究文献信息交流过程中存在的数学规律的一门新兴学科。
本课程是信息管理与信息系统教育不可缺少的组成部分。
通过对这门课程的学习,使学生从定量的角度了解和掌握文献信息流的规律性,熟悉文献计量学各定律的形成机制、数学模型、实际意义和应用技能,并对文献的科学管理、服务效果以及科学技术的发展规律进行评价和预测,为从事信息管理和信息研究工作奠定坚实的基础。
二、教学基本要求1.系统掌握文献计量学的基本理论和基础知识。
2.熟练掌握文献计量统计分析工具以及常用光盘数据库数据转换和统计分析技术。
3.注重培养学生科学思维能力,采用理论与实践相结合,理论讲述与课程实习相结合的方法组织教学,培养和提高学生分析问题和解决问题的能力。
4.综合运用所学理论知识和技能,完成一篇能够体现理论教学和实验教学成果的课程论文。
三、各章节内容及学时分配第一章绪论(2学时)教学目的与要求通过本章学习,应使学生了解本学科的产生和发展以及研究目的、研究手段和学科前景;掌握文献计量学的概念;了解文献计量学的研究领域和学科发展前景。
教学内容第一节文献计量学发展的历史沿革一、文献计量学的产生二、文献计量学的发展第二节文献计量学的概念一、国内外有关文献计量学定义的述评二、文献计量学概念的科学表达第三节文献计量学的研究对象和目的一、文献计量学的研究对象二、文献计量学的研究目的第四节文献计量学的研究手段及其在实际工作中的应用前景一、文献计量学的研究手段二、文献计量学在实际工作中的应用前景考核要求了解:文献计量学的历史发展中的重大事件和重要人物。
文献计量学一.科技文献的增长规律什么是科学指标科学指标( Scientific indicators )是指人类科研活动的数量研究首先应确定的定量对象。
科学指标的类型- 人员与机构的数量。
其中人员数量包括科学工作者、工程师、教师和学生的数量等。
机构数量是指各类科研院所、学会及高等学校的数量。
- 科研成果的数量。
其中主要有:重大理论问题突破的次数以及理论在实际应用中获得重要成果的次数等。
- 科研过程及成果记录载体的数量。
其中主要有:科技期刊及其刊载论文的数量;专利文献的数量;科技书籍的数量等。
- 科研资金投入的数量。
主要指直接投入于理论与应用研究的资金数量。
文献指标使用最为频繁,主要原因:- 绝大部分人类科研活动及其成果都是以文献方式记录和贮存。
其它三者都没有与科研活动和成果有如此直接密切的数量关系,单纯的成果数量不能详尽的反映人类取得成果的整个科研过程。
- 与其他指标相比,科技文献数量巨大、易于收集。
这对于主要依靠数学统计方法来揭示存在于科学发展过程中的数学规律的研究人员来说,无疑是一个极大的优点。
- 与其他指标相比,科技文献易于统计分类,可以对各类科研过程进行有选择的定量研究。
文献量度指标1)绝对值指标,是表示文献数量多少的指标。
2)相对值指标,是表示不同部分文献的数量比例的。
3)累计数指标,以文献累积数为依据,因为,各年出版的文献逐年相加而得到的文献累积数总是增加的,就有可能趋于某种、固定的规律,所得到的结果,往往是较为规则的曲线,能用一个较为准确的函数来描述,因而有利于进行文献的定量分析研究。
4)非累积数指标,即一年出版的文献数量,易于受到各种复杂的社会因素的影响,一般来说是波动的,很难确定它是否近似的趋于某种固定的规律,结果往往是一些非规则曲线,难以用某种函数来描述。
文献指数增长模型文献指数增长规律文献指数增长规律的局限性( 1) 科学文献并不总是按指数函数关系增长。
普赖斯指数增长模型与所研究的文献的学科和时间有关。
第三章文献计量学实务 (1)第一节Web of Science (1)第二节运用Excel (2)No.1 文章类型 (5)No.2 语言 (6)No.3 期刊 (6)No.4文章页数 (6)参考文献数 (6)No.5国家分析 (6)No.7国家分析 (9)No.6作者分析 (11)No.7成长趋势 (12)影响因子 (13)作者关键词 (13)研究领域 (14)文献计量模式分析 (14)被引用率 (14)第三节 (14)第四节 (15)第五节 (15)第三章文献计量学实务第一节Web of Science进行搜索:在search框内敲入所需要查找的关键词,不同关键词间用and或or连接。
如通常格式可为:(XX or XX or XX)and XX*。
*可要可不要,表示后续内容可任意。
点击search。
(如:搜索吸附领域粘土的文献,可敲入:(adsorption or sorption) and clay*。
点击Refine your results下的Subject Categories从众多领域中选出所需要关注的领域内的文章,点击VIEW RECORDS。
对所有文献进行了初步筛选。
Add to marked list在网页右下方Output Records:下的Records选择所需要输出的文献序号,ISI一词输出可以最多500篇,所以我们通常选1-500,依次501——1000,等等。
点击右下Add to marked list。
此时网页整上方会出现有红勾的Add to marked list,点击。
Step 1. Select the fields to include in the output下选择所需要输出的数据项。
通常我们做分析时候应选上除cited references和abstract外的所有项。
这两项是由于内容较多,EXCEL 处理起来不便,所以通常不选。
Step 2. Select an option.我们需要选择的是Tab Delimited(Windows).接下来很重要的一步是我们应在“Automatically delete selected records from the Marked List after output is complete.”前打勾,否则在后续输出时候会因对前面输出项目的记忆造成干扰。
点击SAVE TO FILE。
在下个网页中会输出一个记事本(.txt)格式的文档,对其内容全选复制贴贴入新建EXCEL中,便自动输出各项数据。
此时可进行下一查找:直接点击BACK,然后RETURN 即可。
需要注意的是在后续贴入EXCEL时,每次再贴入EXCEL的第一行都是标题,应该删除。
重复执行,最终便可得到我们所需领域的文献数据。
如果我们在电脑里安装有软件Reference Manager或者 EndNote,也可直接将文献输出其中进行管理。
前面的操作基本雷同,只是再Add to marked list后Step 1. Select the fields to include in the output后所选项重点可变为选择Author(s),Title,Title,abstract*,keywords及times cited等所需项。
Step 2. Select an option.我们需要选择的是 Field Tagged.然后在下面小方框打勾,再点击SAVE TO FILE。
第二节运用Excel通过第一节我们对所需查找领域文献全部已经输出为EXCEL形式数据,接下来可对其进行整理分析。
(一)前期处理步骤:1.首要的工作是保存好原始数据,在EXCEL里将其所在sheet命名为OD (original data的缩写),方便我们在后续处理工作中进行核对。
2.数据的初步处理,包括:(1)先从原始数据库中找到我们想要进行分析的部分保留,其它意义不大的可直接删除。
新建一个sheet,将OD的全部数据复制过来,将其命名为D。
可删除的列有:CA,SE,AB,EM,CR,PU,PI,PA,J9,JI,PD,VL,IS,PN,SU,SI,BP,EP,AR,DI,GA 。
(注:各列title所代表的含义见附二。
)(2)可将年份PY进行排列,如从按Z→A降序排序得2006→1995,按A→Z则相反。
因为我们从WOS中所下当年的文献只是一部分,数据不完全,所以在分析的时候,通常删去当年的文献。
快捷方法举例:选定年份PY列,查找2005,找到第一个的上面所有行即为2006年的文献,对其全选删除(鼠标右键+D)即可。
(3)因为我们通常只分析的文章类型为article,所以对DT列可进行同(2)操作,排序后删除除article外的所有文献所在的行。
(4)将最左边第一列改为排列序号:标题PT变为No.;在单元格A2敲入1,A3敲入2,选住A2,A3,双击即得1,2,3,4……依次排列序号。
(小提示:在此步骤前可将所有数据按年份排列,再加序号)3.进一步处理:为方便后续操作,如在国家分析时,EXCEL会把“USA”与“ USA”识别为两个不同的国家,所以之前我们可先进行处理。
用ctrl+ F查找替代功能,将D中的所有“,”换成“,”;“;”换成“;”。
还有在整个EXCEL处理中注意标点都要用英文的标点。
这一步极其重要。
!!!附一常用快捷键:ctrl+↑or↓or ← or →快速到达所在列/行的最上or下/ 左or右一个单元格;(小提示:查找时若从某行或列的有内容单元格选起,则到达位置为最后一个有内容单元格;若即从空白格选起,则到达位置为最后一个空白格相邻的下个有内容单元格。
下面2),3)同,一定要注意操作的连续性)2)shift+↑or↓or ← or →向上or下or左or右选住连续的几列/行;3)ctrl+ shift+↑or↓or ← or →分别向上or下or左or右全选;4)ctrl+ F查找(查找功能默认为大小写不做区分);ctrl+ C 复制;ctrl+ V 粘贴;ctrl+ S保存;ctrl+ Z撤销;5)F4固定;6)Delete 将单元格中内容去除为空白;鼠标右键+D 完全将单元格删除。
附二小技巧1若对某列进行数据透视,其第一行应为标题行,否则EXCEL便把内容的第一行自动作为标题,最简单的是敲入0;2 当某区域有非常多内容(如国家或作者)需处理时,可全选贴入WORD进行处理,可加快运行速度。
3.EXCEL的单元格标准宽度设为8.38。
附二标题的含义:AB AbstractAD Address地址AU Author作者BP Beginning pageBS Book series subtitleC1 Research addressesCI City 城市CP Cited patentCR Cited referencesCU Country国家DE Author keywordsDT Document typeEP Ending pageER End of recordFN File typeGA ISI document delivery numberGP Group Author团体作者ID KeyWords PlusIS IssueJ9 29-character source title abbreviationJI ISO source title abbreviationLA LanguageNR Cited reference countOG Organization组织PA Publisher addressPD Publication datePG Page countPI Publisher cityPN Part numberPS Province/State省/州PT Publication type (e.g., book, journal, book in series) PU PublisherPY Publication yearRP Reprint addressSA Street Address街道地址SE Book series titleSG Suborganization次级组织SI Special issueSN ISSNSO Source (journal title)来源(刊名)SU SupplementTC Times citedTI Title (article title)标题(文章标题)TS Topic专题UT ISI unique article identifierVL VolumeVR File format version numberWP Publisher web addressZP Zip/Postal Code邮政编码(二)具体分析No.1 文章类型常见的文献类型有Article,Correction,Editorial Material,Letter,Note,Review几种。
可在OD中,对DT进行数据透视。
(注意这里是在原始表格OD中分析,以下其他都是在新的表格D中分析)1.在菜单“数据”下选择“数据表和数据透视图”:指定待分析的数据源类型为:Microsoft Office Excel数据列表或数据库;所需创建的报表类型选:数据透视表。
点击“完成”。
2.出现一个sheet:在提示框“数据透视表字段列表”中选择DT,点击“添加到”;再据提示“请将数据项拖至此处”将DT拖入。
3.结果示例如下:新建一个sheet,命名为Da。
将数据透视表内容复制过去,计算各项比例。
可按文章数P从大到小进行排序。
结果示例如下:DT P %Article 1148 97.12352Review 14 1.184433Editorial9 0.761421MaterialLetter 6 0.507614Note 4 0.338409Correction 1 0.08460211825.百分比有效位数处理(注:后续数据分析中若涉及数据百分比,根据需要同此操作,不再重述):通常保留两位有效数字,使用工具“减少小数位数”,可分批处理,如97.12352→97,再1.184433→1.2,再0.338409→0.34等。
No.2 语言同前“No.1 文章类型”操作,对LA进行数据透视,所得新的sheet命名为LA。
No.3 期刊同前“No.1 文章类型”操作,对SO进行数据透视,所得新的sheet命名为SO。
No.4文章页数同前“No.1 文章类型”操作,对PG进行数据透视,所得新的sheet命名为PG。
参考文献数同前“No.1 文章类型”操作,对NR进行数据透视, 所得新的sheet命名为NR。