科学计量学的几个定律

  • 格式:doc
  • 大小:333.50 KB
  • 文档页数:38

下载文档原格式

  / 38
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

科学计量学的几个基本定律

1.描述文献增长定律——普赖斯指数

文献增长定律是描述文献数量随时间而有规律地增长。令F表示文献数量,t表示时间,则文献增长定律的数学表达形式为:

F=

f

)(t

式中)(t f的总趋势满足t增大时,F也应相应增大。描述文献增长规律的主要函数是:线性函数、指数函数、逻辑曲线函数等。其中以D.J.普赖斯(Price)建立的指数增长定律最为著名

bt

)(

F=

ae

t

式中,)(t

F为某年)(t的文献累积数量;t为时间(以年为单位);b为文献持续增长率,即每一年文献的增长率。

(半对数坐标,直线实际上指数曲线经对数转换后的结果)

图:《化学文摘》年度文献累积曲线

图:1600—1950年代科学发明的指数增长(据赵红洲)

指数增长规律只有在没有限制或干扰的情况下才会出现,如果受到智力的、物质的和经济的限制,普赖

斯指出文献增长更趋于逻辑曲线。苏联学者弗勒杜茨和B.纳利莫夫提出了著名的逻辑曲线方程式

bt ae K

F -+=1

式中,F(t)表示t 年的文献累积量,K 为F(t)增长的最大值,a 与b 为参数。

2.描述文献老化规律──半衰期,普赖斯老化指数

对于科技文献来说,除物理形态上的破损、载体的变质,随时间流逝,文献所载的科技信息逐渐过时,以致于文献本身不再被使用。老化的量度主要有:

(1)半衰期:所谓半衰期是一个时间概念,意指在该时间内发表了某一学科或领域正在被利用的全部文献一半,或者目前所利用的文献的一半是在该时间内发表的。

进行文献老化研究,可采用引用文献分析法,它是对收集文献后而所附参考文献进行研究。

例如,为了对我国化学期刊文献的老化规律进行研究,首先收集某一年,例如1988年出版的重要化学期刊40种,共得到了2000篇有关论文,然后再统计每篇论文后面所附的参考文献(或称引文),共得25000条参考文献。再按其出版年代进行统计,其结果可用图形表示。图中纵坐标代表引文量,可以采用绝对数量亦可采用相对数量来表示;横坐标为引文出版年龄,所谓出版年龄是指被引文献出版年代与其被引用年代之差。

图:引文量按时间分布曲线

若将上图中纵坐标换为引文累积量,则可得如下图形

图:引文累积量按时间分布图

(2)普赖斯指数:1971年提出。规定年限不超过5年的文献引文数量同引文总量之比作为指数。依据这一指数,可将所有被利用的文献分成两大类:档案性文献、现时应用的文献.年龄超过5年仍被引证的文献则属于现时应用的文献。

例:有A、B两个学科,研究其引用文献的情况。(假设研究时间为2004年底)A学科:假设全部引用文献共674篇,其中发表于近5年的文献为

409篇文献

B学科:假设全部引用文献共2419篇,其中发表于近5年的文献为

1796篇文献

则A学科的普赖斯老化指数为:409/674=60.68%

B学科的普赖斯老化指数为:1796/2419=74.25%

3.论文作者分布规律──洛特卡定律

关于科技文献作者分布规律的描述方式很多,它们的主要目的是考察科技人员的著述能力与文献量之间的关系。其中最著名的是洛特卡定律。

1926年末,美国一家人寿保险公司的统计员A .J .洛特卡(Lotka),以《化学文摘》和《物理学史一览表》为来源资料,考察了1907—19l6这10年间的累积索引。他得出撰写x 篇论文的作者相对频率y(x)的公式

n x C x y )(

格特卡指出“这两个例子表明的指数近似等于2.0。”于是,上式被C .K .齐普夫(zipf)称为“倒平方定律”。但是后人的继续研究表明,指数2仅是一个特例。1974年,J .维拉奇,对不同的学科而言,n 可以从1.2浮动到3.5以上。

根据所得到的结果,洛特卡是这样描述科学工作者人数与其所著论文之间关系的:“……写两篇论文作者数量约为写一篇论文作者数量的1/4;写三篇论文的作者数量约为写一篇论文作者数量的1/9;而写一篇论文作者的数量约为所有作者数量的60%。”科学工作者对科学贡献量的差异是非常大的。大约有60&的人,在其一生中仅发表过一篇论文,而发表论文数量在10篇以上者不足全部作者的1%。

此外,普赖斯的一项研究也支持了上述结果:

4.科技文献离散定律──布拉德福定律

科学论文在科技期刊中的分布是不均匀的,少数期刊中“拥挤”着大量的论文,大量的期刊中“稀释”着少量的论文。1934年英国文献学家S.C.布拉德福(Bradford)明确地指出这种倾向:“对某一主题而言,将科学期刊按刊登相关论文减少的顺序排列时,可以划分为对该主题最有贡献的核心区,以及含有与该区域论文数量相同的几个区域。每个区域里的期刊数量成2

:

n”。(布拉德福定律)(n 是经验数据,布拉德

:1n

福推算n=5)

根据多年的实际工作经验,他猜测,专业文献除密集地登裁于相应的专业期刊(约占1/3)外,还登载于大量的专业边缘(相关的)期刊(约占1/3)和更一般化的期刊(约占1/3)。

(图中:X:期刊累积量的对数;Y相应论文数量的累积量

α为第一区期刊数累积量β:为第一区和第二区期刊数累积量;

γ为一区二区三区期刊数累积量)

例:我们将某一年发表某学科(流媒体)的期刊论文全部收集齐全(只要有一篇就进行统计),然后按照各

期刊发文量的多少将期刊降序排列。假设全部论文数量为1504篇。

期刊1 期刊2 期刊3 期刊4 期刊5 期刊6 刊7…期刊8 期刊9 期刊10 ……期刊期刊期刊……期刊102篇 84篇 79篇 74篇 70篇 50篇 43篇…37篇 28篇 28篇…… 5篇 4篇 4篇…… 1篇(502篇,约占1/3)(499篇:约占1/3)(503篇,约占1/3)核心区相关区一般区

核心区:期刊数P1=7 (约占总期刊数的3.23%)

相关区:期刊数P2=35 (约占总期刊数的16.13%)一般区:期刊数P3=175 (约占总期刊数的80.65%)

(总期刊数为217种)