文献计量学
- 格式:doc
- 大小:182.50 KB
- 文档页数:8
文献计量学综述一、起源及发展早在20世纪初,人们已经开始对文献进行定量化研究,但是当时文献计量学并没有作为一门独立的学科而存在。
直到1969年,英国着名情报学家阿伦.普理查德首次提出术语“Bibliometrics”,这一术语的出现标志着文献计量学的正式诞生。
三阶段:萌芽、发展和分化萌芽(1917-1933)这一时期文献研究人员首创文献统计方法,并在一些学科领域解剖学和化学专业进行了文献计量分析的大胆尝试,取得了一定的成果。
这些研究都为文献计量学的诞生与后期的发展奠定了基础发展(1934- 1960)年注重理论研究与规律发现,着名的文献计量学的三大基本定律中的布拉德福定律以及齐普夫定律就是在这一时期发现的到成熟与分化阶段全面发展与分化时期(1960年至今) 这一时期文献计量学已由狭隘的理论研究发展到了广阔的应用研究和指标的研究,同时涉及的领域和主题也越来越多。
迁移衍生:专利计量学文献计量学网络计量学政策计量学二、概念界定文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法,研究文献信息的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科。
可以定量地揭示某一学术领域的发展历程、研究重点以及未来的研究方向。
目前,文献计量分析已被看作总结历史研究成果、揭示未来研究趋势的一种重要工具。
学科交叉使得文献计量研究内容体系日益丰富。
数学中的图论、社会学中的社会网络分析、物理学中的复杂网络等理论与方法均被移植到文献计量学的研究体系中。
三、三大定律布拉德福定律该定律描述文献分布规律,利用刊载某专业论文的数量来确定该专业的核心期刊,应用于指导文献情报工作和科学评价。
齐普夫定律该定律用以统计文献中的词频,通过文献的词频分析可确定学科或行业的研究热点和研究趋势。
洛特卡定律该定律描述着者人数与所着论文之间的关系。
探讨了科学论文着者分布平衡的规律,在宏观的科学着作活动中,少数作者写出了大量文章,大多数人的着作还是很少的。
文献计量学复习资料第一章绪论1、什么叫文献计量学?其研究对象和基本内容是什么?文献计量学是以文献信息体系为研究对象,采用数学、统计学等计量方法,研究文献信息的分布状况和变化规律,并进而探索科学技术的发展规律的一门分支学科。
研究对象:信息计量学的研究对象目前主要是各种事务信息的数量方面。
其内容包括信息、数据、事件、事务、文本和文献等。
其中,文献信息指特征信息如作者、主题、分类号。
文献体系指一次、二次、三次文献。
基本内容包括三大部分,(1)理论部分:a.文献信息体系的结构研究b.文献信息流的规律研究:“六大规律三大定律”c.文献信息流的数量关系研究d.文献信息工作系统的研究(2)方法部分:三个特征:a.定量分析;b.移植性;c.综合性(3)应用部分:a.应用原理:为什么?b.应用途径:理论、方法c.应用领域:相关领域:科学学、管理、预测;本体领域:图书情报研究和工作2、什么叫科学计量学、信息计量学?文献计量学与科学计量学、信息计量学的关系怎么样?科学计量学:采用定量方法研究科学本身发展规律的科学学的新型分支学科。
信息计量学:采用数学、统计学等定量方法研究信息现象、过程和规律的一门分支学科。
文献计量学与科学计量学的关系:(1)从研究目的来看:两者相同(2)从研究途径来看:文献计量学是从文献入手(3)从研究方法来看:相似——都用定量法文献计量学与信息计量学的关系:相同:交叉的内容;二者关系密切、相辅相成;不同:(1)范围不同;(2)信息计量学任务更加艰巨3、什么叫网络计量学?其产生的背景和基本内容是什么?网络计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示其数量特征和内在规律的一门新兴分支学科。
网络计量学的产生背景:(1)信息资源的电子化、网络化,及网上数据信息数量的激增,既是网络计量学产生的基础和条件,也是要求其产生迫切的需求;(2)电子文献信息资源统计分析的研究成果为网络计量学产生奠定了基础、积累了经验;(3)是学科发展的需要;(4)是网络管理的需要。
文献计量学(Bibliometrics)文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科[5-12]。
这一术语最早是1969年由英国人A.普里查德(Alan Britchard)提出的。
文献计量学中常用的定律有如下几种。
布拉德福定律:布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
文字表述为:如果将科技期刊按其刊载某专业论文的数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个区域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2……的关系。
洛特卡定律:洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写3篇论文的作者数量约为写1篇论文作者数量的1/9;写n篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
齐普夫定律:齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。
若用f 表示频次,r表示等级序号,则有fr=C(C为常数)。
人们称该式为齐普夫定律。
普赖斯指数:1971年美国科学学家D.普赖斯提出了一个衡量各个知识领域文献老化的数量指标,即后人所称的“普赖斯指数”。
就是在某一知识领域内,把对年限不超过五年的文献的引文数量与引文总量之比当作指数,用以量度文献的老化速度和程度。
医学文献计量学医学文献计量学是一门研究医学文献的数量和质量的学科。
随着信息时代的到来,大量的医学文献涌现出来,如何评估和利用这些文献成为了一个重要问题。
医学文献计量学主要关注以下几个方面:1. 文献数量:通过统计某一领域的文献数量,可以了解该领域的发展情况和趋势。
2. 文献质量:通过分析某一领域中高影响力期刊或高被引用文章,可以评估该领域中优秀论文的特征和质量。
3. 学科交叉:通过分析不同领域之间的引用关系,可以了解不同领域之间的联系和相互影响。
4. 科学合作:通过分析不同作者之间合作情况、机构之间合作情况等,可以了解科学合作对于科技创新的促进作用。
医学文献计量学常用指标包括:1. SCI/SSCI收录期刊数:SCI/SSCI是国际上公认的高水平期刊数据库,其收录期刊数是衡量一个国家或地区科技水平的重要指标。
2. H指数:H指数是衡量一个学者学术影响力的指标,它综合考虑了学者的发表数量和被引用次数。
3. 影响因子:影响因子是衡量期刊学术水平的指标,它反映了该期刊所发表论文被引用的程度。
4. 文献耦合度:文献耦合度是衡量不同文献之间联系紧密程度的指标,它可以帮助我们了解某一领域内不同研究方向之间的关系。
在医学领域中,医学文献计量学具有重要意义。
通过对医学文献进行计量分析,可以了解医学领域中不同研究方向和科技创新趋势,为科技政策制定提供参考。
同时,医学文献计量学也可以帮助医生、科研人员等快速找到最新、最优质的医学文献,提高其工作效率和科技水平。
总之,随着信息时代的到来,医学文献计量学已经成为了一个重要而又具有挑战性的领域。
未来,在大数据和人工智能技术的支持下,医学文献计量学将有更广阔的应用前景。
文献计量学在学术研究中的应用分析随着数字化时代的到来,科技发展迅速,越来越多的学术文章正在涌现,这使得学者们能够更好地去了解学术研究的最新进展和趋势。
然而,在海量信息的背景下,如何筛选高质量的学术成果和确保其可信度是一个值得探究的问题。
文献计量学作为一门研究发表文献数量、内容和影响力的交叉学科,已经成为学术评价和研究的重要工具之一。
本文将从文献计量学的定义、数据来源、技术方法以及应用领域等四个方面来探究文献计量学在学术研究中的应用。
文献计量学的定义文献计量学是从数量化角度去研究文献的特征和规律的一门交叉学科。
它主要通过对文献发表数量、引用次数、作者、期刊等方面进行统计分析和评价,以揭示不同学科、不同领域和不同国家之间的学术交流、合作关系以及学术生产力。
它可以对文献产出进行评价,对文献被引用情况进行追踪,从而使研究者更好地了解各学科间的发展现状、热点趋势及学科发展的总体走向。
数据来源文献计量学主要利用学术文献数据库、索引数据库、全文数据库等数据来源,以期通过其大量的数据和信息对学术研究的相关特征进行分析。
其中比较常见的学术文献数据库有Web of Science、Scopus、CNKI等,这些数据库涵盖了从国际著名期刊到国内外学术刊物的大量文献,可有效提供文献计量学数据的获取。
如当我们需要了解某研究领域发展的时候,可以从相关文献数据库中构建领域的文章、作者和他们关于特定研究课题的信息。
技术方法文献计量学采用的技术方法也在不断地发展和改进之中。
当前比较常用的技术方法主要有以下几种:1.所属国家或地区分析:以国家(地区)作为单位,通过分析其文献成果数量、被引用情况、合作关系等方面,反映该国或该地区在学术研究中的地位以及其发展状况。
2.主题分析:以学科、术语、课题等为主题进行分析,通过对文献分析,把握研究领域的热点、趋势和发展。
3.合作关系分析:从多角度考虑,分析文献中作者、机构、国家等合作关系,反映出文献合作的力量和合作类型。
文献计量学名词解释(一)文献计量学名词解释本文将介绍文献计量学中的一些重要名词,并给出相关的解释说明。
1. 文献计量学•文献计量学是对科学文献进行数量和质量分析的学科。
2. 文献计量指标•文献计量指标是用于衡量和评价科学文献影响力和质量的定量指标。
引用频次•引用频次是一篇科学文章被其他文章引用的次数。
•例如,一篇文章被引用了100次,那么它的引用频次为100。
H指数•H指数是科学家的学术影响力指标,既考虑了学者的科研产出数量,也考虑了被引频次。
•例如,某位科学家的H指数为20,表示他至少有20篇文章被引用了至少20次。
影响因子•影响因子是一个期刊的学术声誉和影响力的度量指标,反映了该期刊上发表文章的平均引用频次。
•例如,某期刊的影响因子为3,表示该期刊上刊登的文章平均被引用了3次。
SJR指数•SJR指数是一种用于衡量期刊学术影响力的指标,考虑了该期刊所发表的文章被引用的质量。
•例如,某期刊的SJR指数为2,表示该期刊所发表的文章相对于其他期刊来说具有较高的被引用质量。
3. 检索数据库•检索数据库是存储和管理大量文献信息的电子数据库。
•例如,PubMed是一个著名的生物医学文献检索数据库。
Web of Science•Web of Science是一个综合性学术文献检索平台,涵盖了多个学科领域的文献资源。
•例如,研究人员可以使用Web of Science检索相关领域的科学文献。
Scopus•Scopus是全球最大的摘要和引文数据库,收录了众多学科领域的文献信息。
•例如,研究人员可以使用Scopus检索和获取最新的学术研究成果。
结语以上是一些常用的文献计量学名词及其解释。
这些名词和指标在评价科学文献的影响力和质量时起到了重要的作用。
通过对这些名词的了解,可以帮助我们更好地理解和分析科学研究成果的影响力和质量。
文献计量学一.科技文献的增长规律什么是科学指标科学指标(Scientific indicators)是指人类科研活动的数量研究首先应确定的定量对象。
科学指标的类型- 人员与机构的数量。
其中人员数量包括科学工作者、工程师、教师和学生的数量等。
机构数量是指各类科研院所、学会及高等学校的数量。
- 科研成果的数量。
其中主要有:重大理论问题突破的次数以及理论在实际应用中获得重要成果的次数等。
- 科研过程及成果记录载体的数量。
其中主要有:科技期刊及其刊载论文的数量;专利文献的数量;科技书籍的数量等。
- 科研资金投入的数量。
主要指直接投入于理论与应用研究的资金数量。
文献指标使用最为频繁,主要原因:- 绝大部分人类科研活动及其成果都是以文献方式记录和贮存。
其它三者都没有与科研活动和成果有如此直接密切的数量关系,单纯的成果数量不能详尽的反映人类取得成果的整个科研过程。
- 与其他指标相比,科技文献数量巨大、易于收集。
这对于主要依靠数学统计方法来揭示存在于科学发展过程中的数学规律的研究人员来说,无疑是一个极大的优点。
- 与其他指标相比,科技文献易于统计分类,可以对各类科研过程进行有选择的定量研究。
文献量度指标1)绝对值指标,是表示文献数量多少的指标。
2)相对值指标,是表示不同部分文献的数量比例的。
3)累计数指标,以文献累积数为依据,因为,各年出版的文献逐年相加而得到的文献累积数总是增加的,就有可能趋于某种、固定的规律,所得到的结果,往往是较为规则的曲线,能用一个较为准确的函数来描述,因而有利于进行文献的定量分析研究。
4)非累积数指标,即一年出版的文献数量,易于受到各种复杂的社会因素的影响,一般来说是波动的,很难确定它是否近似的趋于某种固定的规律,结果往往是一些非规则曲线,难以用某种函数来描述。
文献指数增长模型文献指数增长规律文献指数增长规律的局限性(1)科学文献并不总是按指数函数关系增长。
普赖斯指数增长模型与所研究的文献的学科和时间有关。
所研究的学科范围越广泛,符合指数规律的时间就越长。
(2)指数增长规律不能预测文献的未来增长趋势。
这就是说,随着时间的推移,科学文献的增量会趋向无穷大。
这显然是不符合客观规律的。
文献指数增长规律存在局限的原因:(1)对科学文献增长的机理研究不够,难以对影响文献增长的各种因素全面考虑、衡量,并给出恰当的分析和定量的描述。
(2)在确立科学文献的指数增长规律时,没有考虑到文献的日益老化因素。
(3)在统计某年的科学期刊累积总数时,没有排除已停刊的期刊。
(4)普赖斯的指数增长规律只是建立在科学期刊这种出版类型的文献和某些知识领域的文献在他所统计的时间范围内的增长特点的基础上的,不能代替全部。
文献逻辑曲线增长模型所谓的逻辑曲线是指广泛存在于自然界与人类社会中的一类增长模式,在生物学中即为有名的生长曲线。
另外在有限条件下的人口增长、经济发展等过程也属于此类。
与纯粹的指数型增长曲线相比,它被称为饱和的指数增长曲线。
文献逻辑曲线增长模型的局限性1)当科学发展到一定阶段时,科学文献的增长率趋于零,科学文献总量达到了它不可逾越的最大值.这就意味着某个年代后,再也没有新的科学文献产生,这显然又走向了另一个极端,科技文献数量增长速度的减慢,并不意味着科学发展的速度将会下降。
2)它揭示了科学随着时间的延续而经历着一个“前期缓慢发展,中前期加速发展,中后期减速发展,直至后期饱和发展”的过程。
这种所谓的“饱和发展”并不意味着科学发展的终结,而是指科学的发展达到一种系统的动态平衡。
显然,科学发展的这一过程与科学文献的逻辑增长过程是对应的、相辅相成的。
3)从科学史来看,整个科学领域中的每一门学科分别处于诞生、发展、相对成熟等不同历史阶段。
诞生和发展时期文献呈现指数增长,寿命很短。
相对成熟时期,科学文献的增长率变小,曲线变得平缓,文献寿命相对变长。
但是,文献增长率变小,绝不意味着科学发展的停滞,可能意味着该知识领域正面临着新的突破,将产生出更新的分支领域,而内容上更新的文献又将进入一个新的急剧增长时期,此后又会进入一个稳定时期,文献的增长往往会出现几个急剧增长时期和几个相对稳定时期,呈现出错综复杂的格局。
4)一般的说,对不同的学科,描述其文献增长的逻辑曲线中的常数也是不相同的指数和逻辑曲线存在局限性的原因:第一,指数增长模型存在一定的局限性;第二,利用上述两种曲线对科技文献增长所做的预测,依据的是预测学中的趋势外推法,但是科技文献作为科学交流这一复杂系统中的子系统,其增长规律受到许多方面的影响和制约,只有利用系统论的观点对其做系统分析,才可望获得比较合乎实际的结果。
这应该成为我们修正指数曲线和逻辑曲线、探求新的科学文献增长模型的出发点。
科技文献增长的其他模型1 线性增长模型F(t)=bt+a F(t)——t年的文献累积量b——文献的年增长率a——当t=0时的文献数量(理论值)线性增长的特点是:文献量的增长速度为一常数,与文献的初始量无关。
2 分级滑动指数模型模型雷舍指出①每篇科技文献的贡献大小是不一样(质量不一样);②质量不同的文献增长速度也不相同,质量越高的文学其数量增长的速度越慢。
不同质量的文献,其增长速度不同,越重要的文献增长速度越慢。
数量较少的高质量的论文总量是伴随着大量的一般性的论文而同时出现的。
网络信息增长规律新特点(与文献增长规律进行了比较)⏹在研究对象上,文献信息增长规律主要研究文献或图书信息,而网络信息增长的研究对象多种多样,如网络链接、网页/网站和网络文献等;⏹在研究方法上,文献信息增长规律研究采用科学文献计量和数学方法,而网络信息增长规律研究常采用链接分析法,还借助特殊的统计工具,如网络日志;⏹在应用上,文献信息增长规律用来判断和预测科学知识的增长状况;网络信息增长规律应用较广,如评估搜索引擎、控制网络信息等;⏹网络信息的数量变化规律更加复杂,速度更快,文献信息的复制相对来讲变化较慢。
网络信息增长的特点(1)信息在传递中的不守恒性(2)网络信息传递的全达性网络信息增长机制:(1)网络信息总量的增长模型网络信息总量Im由网络节点数n、网络节点的平均信息创新能力A和网络的信息转发轮次数(即时间)m共同决定,即:Im=n[(m-1)n+1]A也就是说,网络信息总量Im与网络节点的信息创新能力A和网络的信息转发轮次数(时间)m成线性函数关系,而与网络节点数n成二次函数关系。
(2)网上真实信息量的增长模型网络上的真实信息量(即非重复信息量,用Ir表示),有如下关系:Ir=mnA即网络上的真实信息数量与网络节点数n、网络节点的信息创新能力A和网络信息转发的轮次数m均呈线性关系.(3)网上泡沫信息量的增长规律网络信息总量中含有大量重复发布的信息(即转发信息量或泡沫信息量,用If表示)If =Im-Ir =n[(m-1)n+1]A-mnA=n(n-1)(m-1)A(4)网络信息的乘数扩张律网络节点数n就是网络信息扩张乘数,正式它把网络信息总量扩张和放大为真实信息量的n倍。
它就是操纵网络信息扩张、造成网上重复信息泛滥的“看不见的手”我们将包括网络信息乘数扩张律在内的上述几个网络信息增长模型统一称为“网络信息增长的乘数扩张模型”二.科技文献的老化规律布鲁克斯肯定老化与分散之间有一定的联系,而且老化与分散均可以由增长率来加以确定,增长速率越快,分散越弱而老化越快。
什么是文献老化科技文献的老化是科技文献随着其“年龄”的增长失去了作为科学情报的价值,以及因此越来越少被科学工作者和专家利用的过程。
文献老化的测度指标(1)半衰期文献老化的半衰期是指某学科(专业)现时尚在利用的全部文献中较新的一半是在多长时间内发表的,即在全部参考文献中50%的文章是在多长时间内发表的。
注意这一定义仅适用于对采用同时法所获得数据的处理。
严格的讲,应称为“中值引文年龄”(mediancitation age)。
半衰期或中值引文年龄短小,说明该学科被引用的近期文献众多,文献新陈代谢频繁,新的近期文献得到大量的应用。
(2)普赖斯指数即指在一个具体学科内,把对年限不超过5年的引文数量与引文总数之比当做一个指标,用以量度文献的老化速度与程度,普赖斯指数越大,文献老化越快。
Pi=近5年被引用的文献数量/被引用的文献总量*100%“普赖斯指数”和半衰期是既有联系又有区别的两个衡量文献老化的指标。
他们都是从文献被利用的角度出发,但以不同的方式来反映文献老化的情况。
普赖斯认为“有现时作用”的引文数量与“档案性”引文数量的比例,是比引文的“一半寿命”更为重要的特征。
文献的“半衰期”只能笼统的衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、甚至某一作者和某篇文献的老化特点。
(3)期刊有益性系数1970年布鲁克斯提出期刊的有益性(Utility)的概念。
所谓一种科学期刊的有益性,是指可望在某种程度上被科学家或专家利用(在书目中被引用)的文章数。
即某一年份某一期刊被用户所利用的文章数。
文献老化的数学模型(1)负指数模型一般的说在一个指定的时期内,被引用的论文数与发表年度服从负指数规律。
(2)巴顿-开普勒老化方程(3)莫蒂列夫修正式(4)布鲁克斯的累积指数模型(5)阿弗拉米斯库方程什么是网络信息老化网络信息资源的老化是指网络信息资源中情报的有效价值随着时间的流逝逐渐衰减,利用率逐步降低直至存档甚至销毁。
网络信息资源老化主要原因:- 网络信息资源的增长- 网络信息的更新- 网络信息的消失- 网络信息的语用衰减- 替代性网络信息的出现- 网络信息的吸引力网络信息老化的特点-快速性- 非载体依赖性- 动态性- 复杂性网络信息老化的测度指标1)半衰期网络信息资源的基本构成元素有半数发生变化所需的时间。
(1)被引半衰期。
针对某个站点的被引用过程而言,可以定义为某一站点的全部信息在某一时间段内被引用或被链接的所有信息中较新的一般式在最近多长时间内发表的。
(2)引用半衰期。
针对某一站点上信息的引用行为而言,可以定义为某一站点的全部信息在某一时间段内引用或链接的所有信息中较新的一半是在最近多长时间内发表的。
(3)静态半衰期。
是指在不考虑增长的情况下,网络信息资源的基本构成元素有半数发生变化的时间。
(4)动态半衰期。
是在考虑增长的情况下,网络信息资源的基本构成元素中较新的一半产生于多长时间内。
(5)宏观网络信息资源半衰期。
指某主题领域网络信息资源所含链接的链宿所指资源中较新的一半是在多长时间内产生的。
(6)微观网络信息资源半衰期。
是指指向该网络信息资源的全部其他网络信息资源的二分之一是在其发布后的多长时间内出现的。
2)普赖斯指数3)生存期是指特定网络信息资源的URL存续时间。