文献计量学方法
- 格式:ppt
- 大小:168.50 KB
- 文档页数:3
文献计量学研究常用研究方法我折腾了好久文献计量学研究常用研究方法这事,总算找到点门道。
我一开始的时候真的是瞎摸索。
我就知道要找文献,那时候就到处乱搜,像没头的苍蝇一样。
我试过那种最笨的方法,就是直接在搜索引擎里输入关键词,然后从海量的结果里找相关的研究文献。
但是这个方法效率太低了,就好比大海捞针,好多不相关的东西都混在里面。
后来我知道了专业的数据库,像Web of Science啊,这还真就是一个宝藏地方。
不过刚开始用的时候我也犯错了,例如检索词有些设置得特别宽泛,结果出来几千篇文献,根本看不过来。
这就像是你原本只想找个针眼大小的东西,结果人家给你整了一大袋子可能有用的东西,太多了也头疼。
还有的时候我把检索词设得太窄了,又错过很多有用的文献。
后来我就慢慢摸索,把检索词从特别宽泛一点一点变窄,就像调整相机的焦距一样,逐渐找准想要的那个范围。
再就是文献的可视化分析这块,Citespace是我经常用的工具。
刚上手的时候,数据格式总是搞错,它就弹错误给我,我当时都快被烦死了。
我得小心翼翼检查是输入数据的年份范围问题啊,还是数据源格式之类的。
后来我就养成一个习惯,在输入之前先核对好几遍数据的格式,就好像出门前反复检查钥匙有没有带一样。
文献计量学嘛,还得做一些计量指标的统计,像文章的被引用次数。
我之前就是笨办法,一篇篇文章去数它被引用的情况,又累又容易出错。
后来发现有的数据库本身就能直接提供这些指标统计,我才恍然大悟,我白白浪费了那么多时间啊。
还有一块是聚类分析,这部分我到现在有时候还是迷糊。
我知道应该是把相似的文献聚集在一起分析,但是到底依据什么标准聚得更好,这个我还在尝试学习中。
反正就是参数调整一点一点试,看哪个出来的聚类结果最合理,这感觉就像是调收音机的频道一样,一点点挪动找最清晰的台。
我觉得做文献计量学研究,这些数据库啊、工具啊,要多去尝试、多用才能有心得,而且不能怕犯错,错了就想想怎么改,下次就容易成功了。
⽂献计量法与内容分析法的⽐较研究⽂献计量法与内容分析法的⽐较研究⽂献计量法是⼀种以各种⽂献外部特征为研究对象的量化分析⽅法;⽽内容分析法本质上是⽂献计量学⽅法,它是从定性的问题假设出发,应⽤定量的统计分析⼯具对研究对象进⾏处理,然后从统计数据可分析得出有价值的定性结论。
⽂献计量法与内容分析法都是常见的科学研究及情报研究⽅法,两者有⼀定联系,但同时⼜不完全相同,如何正确认识两种⽅法的本质是本⽂要探讨的重点。
1⽂献计量法与内容分析法的差异点⽂献计量法是借助⽂献的各种特征数量,采⽤数学与统计学⽅法来描述、评价和预测科学技术的现状与发展趋势的图书情报学分⽀学科;内容分析法是⼀种对研究对象的内容进⾏分析,透过现象看本质的科学⽅法。
两者存在着⼀些差异点,下⾯从性质、⽅法论基础、研究对象、应⽤领域、研究的侧重点、研究的⽬的和存在的局限性等⼏⽅⾯来⽐较它们的不同之处。
性质不同。
⽂献计量法的特征在于其输出量必定是量化信息内容,是⼀种基于数学和统计学1.1性质不同。
的定量分析⽅法;内容分析法是⼀种对⽂献内容作客观系统的定量分析的专门⽅法,其⽬的在于揭⽰⽂献所含有的隐性情报内容,对事物发展作情报预测,实际上是⼀种半定量研究⽅法,是⼀种基于定性研究的量化分析⽅法。
⽅法论基础。
不同⽂献计量法是以数学和统计学⽅法为⽅法论基础,在其应⽤过程中再利⽤1.2⽅法论基础。
推理和⽐较的⽅法对⽂献的分布趋势进⾏预测;⽽内容分析法的实质在于对⽂献内容所含信息量及其变化的分析,内容分析法虽然也采⽤数学⽅法,但对其运⽤还处于初级阶段,属于半定量化的研究⽅法,其常⽤的⽅法有推理和⽐较。
推理分为趋势推理、共变推理和因果推理;⽐较主要有趋势⽐较、不同内容群⽐较、内容内⽐较、有标准的内容⽐较。
内容分析法是先利⽤推理和⽐较的⽅法,对研究对象的内容特征加以分析,再使⽤数学和统计学的⽅法对分析结果加以验证。
两者的⽅法论基础不同,决定了其研究对象、研究过程和应⽤领域的不同。
文献计量学—普赖斯公式文献计量学是一门研究科学文献的数量、质量、传播和利用等方面的学科。
普赖斯公式是文献计量学中一种常用的衡量文献价值的方法。
本文将介绍普赖斯公式的基本原理、计算方法以及在文献计量学中的应用。
普赖斯公式(Price's Law)是由美国图书馆学家德雷弗斯·普赖斯(Derek John de Solla Price)于1963年提出的。
该公式表达了科学文献作者与其发表的文章数量之间的关系。
普赖斯公式的数学表达如下:n = k * c^α其中,n表示总作者数,k是一个常数,c表示发表文章数,α是一个常数。
普赖斯公式的核心思想是“一小部分人创造了大部分价值”。
在科学研究领域,只有少数科学家能够取得突破性的成果,大部分科学家的贡献相对较少。
普赖斯公式通过定量描述了这种不平衡分布的现象。
根据普赖斯公式,可以计算出发表文章数较多的科学家人数相对较少。
例如,如果α=0.5,那么发表文章数最多的10%科学家人数只占总人数的1%,而发表文章数最多的1%科学家人数只占总人数的0.1%。
这个结果显示了科学研究中的不平衡分布现象。
普赖斯公式在文献计量学中有着广泛的应用。
首先,它可以用来衡量科学家的科研贡献。
通过统计发表文章数,可以评估科学家的学术影响力和贡献程度。
其次,普赖斯公式可以用来评估学术机构的研究能力和水平。
通过统计机构内科学家的发表文章数,可以了解机构的研究实力和影响力。
此外,普赖斯公式还可以用来研究学科的发展趋势和科学合作网络。
通过分析不同领域科学家的发表文章数和合作关系,可以了解学科的研究热点和合作模式。
然而,普赖斯公式也存在一些限制。
首先,该公式只考虑了发表文章数,而没有考虑文章的质量和影响力。
因此,通过普赖斯公式无法全面评估科学家和机构的研究水平。
其次,普赖斯公式假设了一个稳定的科学体系,但实际情况可能存在变化。
科学研究领域的发展和变革可能会影响到普赖斯公式的适用性。
专题文献的计量学研究方法【作者】陈文爱/杨璐/赵瑞刚量化分析是一种重要的研究方法,文献计量学是进行文献定量研究的重要手段,日趋成熟的理论和方法已广泛应用于期刊研究、学科分析、文献质量评价、科学生产率研究等等方面。
应用文献计量学方法对特定研究机构发表论文进行分析,通过专业分布体系、学科发展状况、科研成果分布、科学生产率研究,对揭示研究机构科学生产的组织结构、交流活动情况、学术水平及其发展变化规律提供了量化分析的手段和技术。
特别是随着信息技术和互联网的迅速发展,一批全文期刊数据库研制成功,对文献进行全方位的搜集、整理和分析研究的条件已经成熟。
事实上,采用数据库技术对文献进行搜集、整理、检索和利用是最为有效的途径和方法[1]。
利用文献计量学的理论和方法,对选定的专题文献进行计量学分析,揭示该专题的发展势态、影响力、文献特点,已经成为图书馆学、情报学工作者进行文献计量学应用研究的重要方向,受到越来越多的重视[2]。
1 材料与方法对研究机构所发表的文献进行计量学研究,需要确定样本,建立统计指标,使用数学和统计学工具处理数据,进行归纳和总结。
根据研究和评价的需要,选定进行研究的专题,选择检索词,制定检索策略。
以国内公开发行的期刊、内部出版物以及其他类型文献资料为对象,以网络数据库和图书馆、文献中心为文献源,通过互联网在线检索、计算机光盘检索、人工查找等方式获得著者、著者数、文献量、著者单位、著者所属地区、著作年代、文献源、文献内容等原始数据。
建立原始数据Access数据库,对原始数据进行检查校对,以确保文献数据的唯一性和准确性。
为便于计量分析,从基本数据库演化出一系列辅助字段和辅助数据表,最后把合格数据分离出来另建数据库,作为专题文献统计分析的基础样本[3]。
1.1 样本源样本源的选择和确定,需要考虑所选定研究机构的组织结构和科研特点。
选择样本源的方法有三种:一是以研究机构发表论文的内部统计数字为样本,二是以各类数据库或检索工具为样本源;三是以研究机构出版的刊物为样本源。
文献计量学方法文献计量学方法是一种可用于评估科研成果的方法,它基于通过分析文献数量和质量来衡量特定研究领域内知识的产生和发展。
文献计量学方法可用于评估领域内研究人员、期刊、学术机构以及国家之间的影响力和表现。
下面将就文献计量学方法的内容、应用以及常见指标等方面作一详细介绍。
一、文献计量学方法的内容文献计量学方法主要通过对文献的数量、引用次数、权威专家评价等进行测量来评估他们的质量及影响力。
1、文献量的测量文献量是指在一定时间范围内某个领域内出版的论文数量。
文献量通常是用一定的统计指标来表示,最常用的指标是SCI(E) (科学引文索引扩展版,即Web of Science数据库)的公开文献数量,也可通过其他数据库如PubMed、CNKI进行测量。
文献量的测量反应着科学研究的产出量,但文献量大并不一定代表研究领域的兴旺发展。
2、引用次数的测量引用次数是指文章被其他文献引用的次数。
这个度量标准往往被用来衡量文章在学界的影响力。
而且,如果一篇文章在较长时间内被引用很多次,这也说明文章的影响力长期有效。
为衡量影响力,市面上有许多类似H指数、g 因子、i10指数等的指标,可用来衡量研究人员、机构、期刊的影响力。
如H指数(H-index):即某一研究人员的文献发表数 n ,有 n 篇文章至少被引用 h 次,其余文章的引用次数均小于等于 h。
认为 H-指数是目前最为科学、公正的反映研究者学术水平的指标,已成为研究人员的重要指标。
3、国际合作的测量国际合作是指来自不同国家或地区的作者共同完成一篇论文的情况。
通过测量国际合作的次数、占总文献量的比例等指标,可用于测量研究机构或一个研究领域的国际化程度。
此外,在科技创新的过程中,国际化和开放性是重要的因素,可以帮助科学家更好地认识国际领域中新兴的概念、技术、成果等,因此不同国家间的合作越来越受到重视。
二、文献计量学方法的应用文献计量学方法是衡量科学研究成果的一种常用方法,可以找到引领学术研究的主流和热点领域,进而影响政策、决策的制定。
文献计量学方法共现和聚类
文献计量学是一种定量分析方法,用于研究学术文献之间的关
系和趋势。
其中,共现分析和聚类分析是两种常用的方法。
首先,共现分析是一种用于发现文献中关键词之间关联性的方法。
它通过统计文献中关键词同时出现的频率,来揭示这些关键词
之间的内在联系。
共现分析可以帮助研究者发现研究领域中的热点
问题和关键主题,从而指导后续研究方向的选择和研究重点的确定。
其次,聚类分析是一种将文献按照其特征进行分组的方法。
在
文献计量学中,聚类分析常常被用来将具有相似研究主题或关键词
的文献进行分类,以便于研究者对大量文献进行整理和理解。
通过
聚类分析,研究者可以更好地把握不同研究领域的发展趋势和内在
联系,为自己的研究提供更全面的背景和参考。
总的来说,文献计量学方法中的共现分析和聚类分析都是非常
有益的工具,它们可以帮助研究者更好地理解学术文献之间的关系
和趋势,为研究方向的选择和研究内容的确定提供重要参考。
同时,这些方法也为学术研究的发展和进步提供了有力的支持和指导。
文献计量学与研究方法文献计量学是宏观研究学科中的一门新兴学科,是研究科学文献的数量、质量、结构、发展趋势和模式的一种方法,它采用一定的定量分析方法,对研究对象进行度量、计数和分析,从而对研究对象进行详细的描述、分析和预测。
研究方法是文献计量学掌握的核心技能,是文献计量学研究的基础和前提。
文献计量学的起源可以追溯到二战后,当时研究人员发现文献数量的增加使得科学研究变得更加困难,因此需要一种更加有效的方法来处理大量的文献资料。
文献计量学正是在这种背景下诞生的。
在过去的几十年中,文献计量学已经成为一个独立的学科,并得到了广泛的应用。
它的应用可以涉及多个领域,包括传媒、出版、教育、企业管理、科学研究等等。
文献计量学的方法可以分为两类,一类是基于数据的方法,一类是基于模型的方法。
基于数据的方法包括检索、分析、测量、描述和预测。
检索是指如何利用计算机检索文献库,分析是指如何对文献进行处理和分析,测量是指对文献的数量、质量、结构和发展趋势进行量化和度量,描述是指对文献进行描述和分类,预测是指对文献的发展趋势进行预测和推断。
基于模型的方法包括规模和发展趋势模型、知识结构模型、主题演化模型、作者合作网络模型、引文分析模型等等。
这些方法可以帮助研究人员快速、准确地分析文献和理解领域内的知识结构、特征和规律。
在文献计量学的研究中,研究方法是至关重要的,它决定了研究人员能否对研究对象进行深入和全面的分析,也决定了研究的质量和价值。
文献计量学的研究方法不仅需要掌握统计学和计算机科学的基础知识,更需要精通领域内的专业知识,并深入理解文献计量学的理论框架和方法体系。
在使用研究方法时,研究人员需要考虑多重因素,如数据源选择、文献检索策略、数据处理方法、研究变量的选择和测量方法等。
在文献计量学的研究中,研究方法的发展和创新也是非常重要的。
近年来,由于科学研究的新变革和技术的不断革新,文献计量学也面临着新的挑战和机遇。
如何创新文献计量学的研究方法,从而更好地适应新的需求和发展趋势,成为了一个重要的研究方向。
文献计量学(Bibliometrics)文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科[5-12]。
这一术语最早是1969年由英国人A.普里查德(Alan Britchard)提出的。
文献计量学中常用的定律有如下几种。
布拉德福定律:布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
文字表述为:如果将科技期刊按其刊载某专业论文的数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个区域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2……的关系。
洛特卡定律:洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写3篇论文的作者数量约为写1篇论文作者数量的1/9;写n篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
齐普夫定律:齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。
若用f 表示频次,r表示等级序号,则有fr=C(C为常数)。
人们称该式为齐普夫定律。
普赖斯指数:1971年美国科学学家D.普赖斯提出了一个衡量各个知识领域文献老化的数量指标,即后人所称的“普赖斯指数”。
就是在某一知识领域内,把对年限不超过五年的文献的引文数量与引文总量之比当作指数,用以量度文献的老化速度和程度。
第9 章文献计量学方法9.1 文献计量学方法概述9.1.1文献计量学的产生与发展文献计量学是采用数学、统计学方法定量研究文献信息的分布和变化规律的一门学科。
文献计量研究是以文献为基础的定量分析研究,始于20世纪初。
9.1.2文献计量学的研究对象与特点1.文献计量学的研究对象1)文献体系2)文献计量特征2.文献计量学的特点1)有独到的研究方法和特定的统计规律2)围绕几个核心定律展开文献计量研究3)研究结果的定量输出4)理论与方法形成的周期很长9.1.3文献计量学的发展趋势1)定量化深度和广度发展2)知识体系化方向发展3)应用领域拓宽,重视在科技管理和决策中的应用4)向信息计量发展5)文献计量学、科学计量学和信息计量学合流6)研究手段及工具向现代化发展7)网络信息计量学成为其新的分支和发展方向9.2 文献计量学三大定律文字表述为:某一时间段内,撰写x 篇论文的作者数占作者总数的百分比y(x),与其所撰写的论文数x的平方成反比,故洛特卡定律也称为平方反比定律。
实际使用中,只是在一些学科中近似的符合平方反比规律,而在有些学科中,洛特卡定律就不适用。
从信息分析与预测的角度看,洛特卡定律以及由其推出的普赖斯定律,可以帮助我们鉴别学科研究发展的学者分布情况,并从中获得有价值的启示。
如果将一定时期内刊载某学科论文的期这是早期的经典布拉德福曲线,后来,随着研究的深入,格鲁斯(O.V.Groos)在1967年发现布拉德福曲线在进入直线部分(图9-1中PB)以后,并不总是呈现直线延伸状态,而是要发生弯曲,会出现“格鲁斯下垂”。
9.2.3词频统计定律——齐普夫定律1.齐普夫定律的产生2.齐普夫定律的描述N≥5000),统计其9.3 网络计量学方法1、概念●T. C. Almind认为:网络信息计量学包括了所有实用信息计量和其他计量方法对网络通信有关问题的研究。
●网络信息计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术等对网络信息规律进行计量分析的一门科学。