文献计量学六大规律

  • 格式:doc
  • 大小:27.00 KB
  • 文档页数:2

下载文档原格式

  / 5
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文献计量学:文献分布定律,布拉德福定律,词频分布定律,齐普夫定律,科学论文作者分布定律,洛特卡定律,文献增长,科学文献老化,引文分析,情报冗余等。

文献信息源的定量研究开始于20世纪初。在20世纪70年代末,就形成了布拉德福定律、齐普夫定律、洛特卡定律、文献增长规律、文献老化规律、文献引用规律等六大规律,并在后来的研究中得到不断的完善与发展。

布拉德福定律:也称文献分散定律。是由英国文献学家布拉德福(S.C.Bradford)1934 年首先提出。它是定量描述科学论文在相关期刊中集中——分散状况的一个规律。经过后来的许多研究者的修正和研究,发展成为著名的文献分布理论。布氏定律的文字描述为“如果将科学期刊按其刊载某个学科领域的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文量最多的‘核心’区和包含着与核心区同等数量论文的随后几个区,这时核心区和后继各区中所含的期刊数成1:a:a 2 …… 的关系(a>1)。”布氏定律主要反映的是同一学科专业的期刊论文在相关的期刊信息源中的不平衡分布规律。布氏定律的应用研究也获得了许多切实有效的成果,应用于指导文献情报工作和科学评价,选择和评价核心期刊,改善文献资源建设的策略,确立入藏重点,了解读者阅读倾向,评价论文的学术价值以节约经费、节约时间,切实提高文献信息服务和信息利用的效率和科学评价的科学性。

洛特卡定律:是由美国的统计学家、情报学家洛特卡(A.J.lotka)研究出来的描述科学论文作者动态的最早的量化规律。在科研活动中,不同人的科研能力及其成果著述数量肯定是不同的。那么,在同样的一段抽样时间内,不同的科技工作者的论著数量分布有没有什么规律呢?1926 年,洛特卡发表了论文“科学生产率的频率分布”。他在文中统计分析了化学和物理学两大学科中一段时间内科学家们的著述情况,提出了定量描述科学生产率的平方反比分布规律,又被称为“倒平方定律”。其经典公式为:f(x) =(C为常数)上式的意义为:设撰写X 篇论文的作者出现频率为f(X) ,则撰写X篇论文的作者数量与他们所写的论文数量呈平方反比关系。如撰写了2篇论文的作者数量大约是撰写了一篇论文的作者数量的1/4 (即1/2 2 ),写3篇论文的作者数量大约是一篇论文作者数量的1/9(即1/32),写n篇论文的作者数量大约是写一篇论文作者数量的1/n 2。洛特卡定律,探讨了科学论文著者的不平衡分布规律。通过他的研究成果,我们可以明确:在宏观的科学著述活动中,少数作者写出了大量的文章;反之,而大多数人的著述则是不多的。研究科技工作者及其论著间的数量关系有很重要的现实意义。在信息资源管理和信息利用过程中,可以用它来预测著者数量和文献数量,掌握作者的研究动态,提示不同领域中文献现状和趋势,便于对文献信息源进行有效的选择,搜集和科学管理。在科学学中,还可用它来研究科研工作者的创造活动规律,研究人才及其成果分布规律。如普赖斯就从洛特卡定律推论出“杰出科学家数量仅仅是科学家数量的平方根”。

齐普夫定律:是由美国语言学家齐普夫(G.K.Zipf)于1935年研究发现的关于文献中的词频分布规律。其具体表述如下:如果将一篇达到一定长度的文章中的词按其出现频率递减排序,根据频率高低编上相应的等顺序号,次最高的为 1 级,其次为2 级…… ,这样一直到若干级,如果用f 表示词在文章中出现的频率,用r 表示词的等级序号,则有:

fr = c (c 为常数) 应用词频分布规律及其参数,可以预测关键词的数量,计算各词汇的重要程度,对于文献标引与词汇控制、词表的编制、文献信息检索等方面都具有重要的应用价值。文献增长规律:随着科学的不断发展,科学文献的增长也成为一种客观的社会现象。对于这一现象人们在20 世纪初就已注意到。但一直到20 世纪40 年代后,由于当时图书馆管理的需要,特别是科学史研究以及科技情报工作发展的需要,文献增长规律才被研究者重视,取得了一系列研究成果。其中最具代表性的是普赖斯(D.Price )提出的科学文献的指数增长规律。普赖斯在其著作《巴比伦以来的科学》中考察统计了科学期刊的增长情况,发现科学期刊的数量大约每50 年增长10 倍。他以科技文献量为纵轴,以历史年代为横轴,不同

年代的科技文献量的变化过程表现为一根光滑的曲线,这条曲线十分近似地表示了科技文献量指数增长的规律。这就是著名的普赖斯曲线,其表达式为:F(t) = ae bt

其中F (t )表示时刻t 的文献量,a 是统计初始时刻(t=0 )的起始文献量,e=2.718 ,b 是常数,表示持续增长率。从一些实例看,科技文献的指数增长定律作为一个理想模型,在一定程度上正确反映了文献的实际增长情况,但由于没有考虑许多复杂因素对科学文献增长的限制。真正对于实际的应用,该定律还有许多局限性。鉴于此,有些学者又提出了科技文献按逻辑曲线增长的理论,作为对指数增长的一种补充和修正,其方程式为:F(t)= F(t) 代表时刻t 的文献量,K 为文献增长的最大值。其逻辑曲线表明,在科学文献增长的初始阶段,是符合指数增长规律的。但这种增长趋势到一定时期将会减弱。当文献增至最大值的一半时,其增长率开始变小,最后缓慢增长,并以K 为极限。逻辑曲线在描述科学文献增长规律时,取得了一定成功,也仍存在一些缺陷。后来的学者们关于文献增长规律的研究又有许多新成果,还提出了一些新的定量模型。文献增长研究多姿多彩,广泛应用于知识度量与知识管理、科学评价、科技政策制定和科技管理、信息研究、信息管理当中。

文献老化规律:科技文献发表之后,随着时间的推移,相对于科学技术的迅速发展,其内容会起来越“落伍”。文献的老化,就在于随其“年龄”增长,会逐渐失去作为科技情报源的价值,利用率愈来愈低,甚至失去生命力。1958 年美国学者贝尔纳(J.D.Bernal )首先提出用“半衰期”(Half life )来衡量文献老化速度。所谓“半衰期”,是指某学科领域现时尚在利用全部文献中的一半是在多长一段时间内发表的。如中文医学期刊文献半衰期为 4.2 年,则表示现在尚在被使用的这类文献有50% 是在K 1+ae -kbt 近 4.2 年内发表的。文献的“半衰期”因其学科性质、学科稳定性、文献类型不同而有不同的值。文献老化规律还可以用普赖斯指数来衡量。相应的方程式为:C(t)=ke -at C(t) 表示发表了t 年的文献的被利用次数,k 是常数,随学科不同而异,a 为老化率。

目前,关于文献老化规律的研究仍很活跃。文献老化的应用研究有助于指导文献信息源选择、采集,评价馆藏老化程度,评价文献价值等。

文献引用规律:在科学研究的过程中,必然要借鉴前人或他人的相关研究成果。因此,科学文献间也存在一种必然联系。这种相互联系突出地表现为文献间的相互引用。文献引用关系分析是文献引用规律研究的基础,除了文献间的直接引用关系之外,引文分析理论还着重考察文献的其它最具代表性的间接引证关系,包括引文耦合(两篇或多篇文献同时引用一篇或多篇相同文章,称之为引文耦合)、同被引(co-citation,两篇或多篇文献共同被后来的一篇或多篇文献所引用即为同被引)、自引(著者引用自己以前的著述)等,从而研究科学引文的分布结构和规律性。引文量的分析是文献引用规律研究的主要内容,通过量的指标对引文所共同具有的一些基

本要素或特征,如文献类型、学科主题、语种、出版年代、引文来源等进行分析和描

述,可以得出引文量按文献类型分布、按语种的分布、按出版时间的分布、按出版学

科或主题的分布、按作者的分布、按国别、期刊的分布等。引文分析所使用的最主要

的工具是由美国著名的情报学家所创立、现由美国科学情报研究所编制的《科学引文

索引》(SCI )。这是一套庞大的引文索引系统,其“来源出版物”涵盖了自然科学、

技术科学、医学、农业科学和行为科学领域的优秀期刊4000 多种,引文数据包括了

这4000 多种期刊上登载论文所引用的参考文献数据。SCI 还有一个副产品——《期刊

引证报告》(JCR ),它已成为期刊评价的一种最重要的工具。文献引用规律的研究有

着广泛的应用价值,对于文献老化研究、期刊评价、科学评价、科技预测,人才评价

等均有十分重要的意义。