第三章 科技文献的老化规律
- 格式:doc
- 大小:24.00 KB
- 文档页数:2
第三章科技文献的老化规律文献老化我们采用前苏联情报学家米哈依诺夫的提法作为定义:科技文献的老化是科技文献随着其“年龄”的增长失去了作为科学情报的价值,以及因此越来越少被科学工作者和专家利用的过程。
“老化”是一个过程,是一个动态的概念。
即给定的文献集合在不同的时期将有不同的使用价值。
不能将文献老化等同于废弃不用,废弃不用是一个静态的概念。
文献的老化必定会导致其使用数量随着时间的推移而减少,但文献使用量随时间推移的减少却并不一定仅是由文献老化一种因素造成的。
不同认识观念:-过程观-状态观-过程状态辩证观文献老化的原因:(1)文献中的情报被后来研究证明是错误的;(2)文献中的情报是正确的,但被载有新的,更全面的内容的文献所代替,原有文献的内容已进入了更广泛的交流领域;(3)文献中的情报是正确的,但研究者的兴趣已发生了转移;(4)文献情报是正确的,且被后人普遍接受,一般人们就不会再去查询那些原始文献。
引文分析法是将所研究学科领域在一定时间内的全部文献收集起来,通过统计每篇文章所附的引文的发表时间及其别引用时间等数据来研究该领域内文献老化的情况。
引用文献分析法(同时法,符合状态观)被引文献分析法(历时法,符合过程观)文献老化的测度指标:半衰期普赖斯指数期刊有益性系数(1)半衰期半衰期(Half-life)是首先由英国著名学者贝尔纳(Bernal)在情报科学中采用的。
1958年在华盛顿召开了国际情报科学会议,贝尔纳发表一篇《科技情报传递:用户分析》的论文。
他在描述科技文献使用情况时,借用了化学中放射性衰变的一个术语—半衰期。
(2)普赖斯指数“普赖斯指数”和半衰期是既有联系又有区别的两个衡量文献老化的指标。
他们都是从文献被利用的角度出发,但以不同的方式来反映文献老化的情况。
普赖斯认为“有现时作用”的引文数量与“档案性”引文数量的比例,是比引文的“一半寿命”更为重要的特征。
文献的“半衰期”只能笼统的衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、甚至某一作者和某篇文献的老化特点。
信息计量学习题第一章绪论1.什么叫“信息计量学”?其研究对象和基本内容是什么?2.信息计量学研究的目的和意义何在?3.什么叫“科学计量学”和“信息(情报)计量学”?它们与文献计量学的关系怎样?4.信息计量学是怎样产生的?其发展经历了哪几个阶段?5.我国信息计量学的发展有何特点?其主要趋势如何?6.什么叫“网络信息计量学”?其产生背景和基本内容是什么?第二章信息增长规律1.何谓文献情报流?它具有什么基本特性?2.科学文献量的增长与科学知识量的增长有何关系?3.科学文献指数增长律是怎样发现的?其基本内容是什么?4.简述科学文献逻辑增长律的基本内容及其评价。
第三章信息老化规律1.什么叫文献老化和情报老化?两者有何区别?2.何谓“半衰期”和“普赖斯指数”,两者关系如何?3.简述科学文献老化的两种主要数学模型。
4.科学文献老化的机理是什么?文献老化规律的主要应用有哪些?第四章信息集中与离散分布规律布拉德福定律1.布拉德福定律的产生背景是什么?该定律是怎样形成的?2.简述布氏定律的基本内容。
3.分析布氏定律原理与实际的一致性和差异性,并指出其主要原因。
4.维克利对布氏定律的确立和发展作出了哪些贡献?5.写出布鲁克斯的数学表达式,并说明各符号的含义。
6.布氏定律主要有哪些方面的应用?第五章信息词频分布规律齐普夫定律1.何谓最省力法则?它与图书情报工作有何联系?2.齐普夫定律是怎样形成的?其基本内容是什么?3.简述齐普夫定律发展的主要途径和成果。
4.简述齐普夫定律的主要应用。
第六章信息作者分布规律洛特卡定律1.何谓“科学生产率”,其研究有何意义?2.洛特卡定律是怎样形成的?其基本内容是什么?3.简述洛氏定律的发展和普赖斯定律。
4.简述洛特卡定律的主要应用。
第七章信息计量学的理论基础1.科学文献的分布呈现何种规律性?如何从理论上进行解释?2.信息基本循环模式是什么?3.如何理解布-齐-洛分布的一致性?第八章信息统计分析法1.什么叫信息统计分析方法?其原则要求有哪些?2.信息统计有哪些主要类型?其基本步骤是什么?3.简述信息统计方法的主要应用。
描述科技文献增长规律的六种数学模型(续)科技文献是一种重要的知识资源,通过研究科技文献的增长规律可以更好地了解科技发展趋势和未来发展方向。
近年来,有不少学者利用数学模型来研究科技文献增长规律,下面介绍其中的六种数学模型。
一、指数增长模型这种模型认为科技文献的增长速度符合指数增长规律,即文献数量呈对数增长。
这种模型适用于科技文献增长速度比较快、呈爆炸式增长的情况。
二、S型增长模型这种模型认为科技文献数量随时间的增长呈S型曲线,其中增长缓慢、快速增长和饱和三个阶段。
这种模型适用于科技领域的重大突破时期。
三、寿命分布模型这种模型认为科技文献的产生和消亡都符合某种特定的分布模型,如指数分布模型、幂律分布模型等。
这种模型适用于研究文献的生命周期和寿命。
四、环状增长模型这种模型认为科技文献增长呈现出环状结构,即在一定的时期内,某些主题的文献会呈现持续增长,而另一些主题的文献则会逐渐减少。
这种模型适用于研究不同领域文献的差异性和不同时期的研究热点变化。
五、混沌普适性模型这种模型认为科技文献的数量增长呈现出“分形”结构,具有混沌和非线性特征。
这种模型适用于研究科技文献增长的复杂性和不确定性。
六、机器学习模型这种模型利用机器学习算法对大量文献数据进行分析和模拟,以预测未来文献数量的增长趋势。
这种模型适用于研究科技领域的趋势和未来发展方向。
综上所述,这六种数学模型各有特点,可以根据具体的研究对象和目的灵活选择使用。
对于科技文献学者和科技从业者来说,深入了解科技文献增长规律的研究成果将有助于更好地指导实践工作。
科技情报研究的重要定律⽂献分布定律、词频分布定律、作者分布定律、⽂献⽼化定律、⽂献增长定律、⽂献引⽤定律等六条定律是情报学产⽣和发展的基⽯,它们共同揭⽰了信息爆炸、解释了信息爆炸,并解决了信息爆炸社会中的信息有效利⽤问题,是情报学对信息社会的重要贡献。
⼀、布拉德福定律——⽂献分布定律由英国著名⽂献学家B.C.Bradford于⼆⼗世纪30年代率先提出的描述⽂献分散规律的经验定律。
定律描述:如果将科技期刊按其刊载某学科专业论⽂的数量多少,以递减顺序排列,那么可以把期刊分为专门⾯对这个学科定律描述的核⼼区、相关区和⾮相关区。
各个区的⽂章数量相等,此时核⼼区、相关区,⾮相关区期刊数量成 1:n:n^2的关系。
科学应⽤:确定某⼀领域核⼼期刊⽬录科学应⽤⼆、齐普夫定律——词频分布定律美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
定律描述:如果把⼀篇较长⽂章中每个词出现的频次统计起来,按照⾼频词在前、低频词在后的递减顺序排列,并⽤⾃然数定律描述给这些词编上等级序号,即频次最⾼的词等级为1,频次次之的等级为2,……,频次最⼩的词等级为D。
若⽤f表⽰频次,r表⽰等级序号,则有fr=C(C为常数)。
齐普夫的表达仅适宜于中频词的情况,⾼频与低频词与该表述偏差较⼤。
科学应⽤:识别⽂献核⼼主题,可应⽤于基于内容(知识)的统计、挖掘与关联分析科学应⽤三、洛特卡定律——作者分布定律美国学者A.J.洛特卡在20世纪20年代率先提出的描述科学⽣产率的经验规律,⼜称“倒数平⽅定律”。
定律描述:写两篇论⽂的作者数量约为写⼀篇论⽂的作者数量的1/4;写三篇论⽂的作者数量约为写⼀篇论⽂作者数量的 1/9;写定律描述:N篇论⽂的作者数量约为写⼀篇论⽂作者数量的1/ n2……,⽽写⼀篇论⽂作者的数量约占所有作者数量的60%。
科学应⽤:识别领域核⼼作者,根据作者数量预测领域研究活动活跃程度科学应⽤:在洛特卡定律的基础上,普赖斯提出普赖斯定律和⼀些其他重要结论。
文献计量学:文献分布定律,布拉德福定律,词频分布定律,齐普夫定律,科学论文作者分布定律,洛特卡定律,文献增长,科学文献老化,引文分析,情报冗余等。
文献信息源的定量研究开始于20世纪初。
在20世纪70年代末,就形成了布拉德福定律、齐普夫定律、洛特卡定律、文献增长规律、文献老化规律、文献引用规律等六大规律,并在后来的研究中得到不断的完善与发展。
布拉德福定律:也称文献分散定律。
是由英国文献学家布拉德福(S.C.Bradford)1934 年首先提出。
它是定量描述科学论文在相关期刊中集中——分散状况的一个规律。
经过后来的许多研究者的修正和研究,发展成为著名的文献分布理论。
布氏定律的文字描述为“如果将科学期刊按其刊载某个学科领域的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文量最多的‘核心’区和包含着与核心区同等数量论文的随后几个区,这时核心区和后继各区中所含的期刊数成1:a:a 2 …… 的关系(a>1)。
”布氏定律主要反映的是同一学科专业的期刊论文在相关的期刊信息源中的不平衡分布规律。
布氏定律的应用研究也获得了许多切实有效的成果,应用于指导文献情报工作和科学评价,选择和评价核心期刊,改善文献资源建设的策略,确立入藏重点,了解读者阅读倾向,评价论文的学术价值以节约经费、节约时间,切实提高文献信息服务和信息利用的效率和科学评价的科学性。
洛特卡定律:是由美国的统计学家、情报学家洛特卡(A.J.lotka)研究出来的描述科学论文作者动态的最早的量化规律。
在科研活动中,不同人的科研能力及其成果著述数量肯定是不同的。
那么,在同样的一段抽样时间内,不同的科技工作者的论著数量分布有没有什么规律呢?1926 年,洛特卡发表了论文“科学生产率的频率分布”。
他在文中统计分析了化学和物理学两大学科中一段时间内科学家们的著述情况,提出了定量描述科学生产率的平方反比分布规律,又被称为“倒平方定律”。
其经典公式为:f(x) =(C为常数)上式的意义为:设撰写X 篇论文的作者出现频率为f(X) ,则撰写X篇论文的作者数量与他们所写的论文数量呈平方反比关系。
文献计量学一.科技文献的增长规律什么是科学指标科学指标(Scientific indicators)是指人类科研活动的数量研究首先应确定的定量对象。
科学指标的类型- 人员与机构的数量。
其中人员数量包括科学工作者、工程师、教师和学生的数量等。
机构数量是指各类科研院所、学会及高等学校的数量。
- 科研成果的数量。
其中主要有:重大理论问题突破的次数以及理论在实际应用中获得重要成果的次数等。
- 科研过程及成果记录载体的数量。
其中主要有:科技期刊及其刊载论文的数量;专利文献的数量;科技书籍的数量等。
- 科研资金投入的数量。
主要指直接投入于理论与应用研究的资金数量。
文献指标使用最为频繁,主要原因:- 绝大部分人类科研活动及其成果都是以文献方式记录和贮存。
其它三者都没有与科研活动和成果有如此直接密切的数量关系,单纯的成果数量不能详尽的反映人类取得成果的整个科研过程。
- 与其他指标相比,科技文献数量巨大、易于收集。
这对于主要依靠数学统计方法来揭示存在于科学发展过程中的数学规律的研究人员来说,无疑是一个极大的优点。
- 与其他指标相比,科技文献易于统计分类,可以对各类科研过程进行有选择的定量研究。
文献量度指标1)绝对值指标,是表示文献数量多少的指标。
2)相对值指标,是表示不同部分文献的数量比例的。
3)累计数指标,以文献累积数为依据,因为,各年出版的文献逐年相加而得到的文献累积数总是增加的,就有可能趋于某种、固定的规律,所得到的结果,往往是较为规则的曲线,能用一个较为准确的函数来描述,因而有利于进行文献的定量分析研究。
4)非累积数指标,即一年出版的文献数量,易于受到各种复杂的社会因素的影响,一般来说是波动的,很难确定它是否近似的趋于某种固定的规律,结果往往是一些非规则曲线,难以用某种函数来描述。
文献指数增长模型文献指数增长规律文献指数增长规律的局限性(1)科学文献并不总是按指数函数关系增长。
普赖斯指数增长模型与所研究的文献的学科和时间有关。
第三章科技文献的老化规律
文献老化我们采用前苏联情报学家米哈依诺夫的提法作为定义:
科技文献的老化是科技文献随着其“年龄”的增长失去了作为科学情报的价值,以及因此越来越少被科学工作者和专家利用的过程。
“老化”是一个过程,是一个动态的概念。
即给定的文献集合在不同的时期将有不同的使用价值。
不能将文献老化等同于废弃不用,废弃不用是一个静态的概念。
文献的老化必定会导致其使用数量随着时间的推移而减少,但文献使用量随时间推移的减少却并不一定仅是由文献老化一种因素造成的。
不同认识观念:-过程观-状态观-过程状态辩证观
文献老化的原因:
(1)文献中的情报被后来研究证明是错误的;
(2)文献中的情报是正确的,但被载有新的,更全面的内容的文献所代替,原有文献的内容已进入了更广泛的交流领域;
(3)文献中的情报是正确的,但研究者的兴趣已发生了转移;
(4)文献情报是正确的,且被后人普遍接受,一般人们就不会再去查询那些原始文献。
引文分析法
是将所研究学科领域在一定时间内的全部文献收集起来,通过统计每篇文章所附的引文的发表时间及其别引用时间等数据来研究该领域内文献老化的情况。
引用文献分析法(同时法,符合状态观)
被引文献分析法(历时法,符合过程观)
文献老化的测度指标:半衰期普赖斯指数期刊有益性系数
(1)半衰期
半衰期(Half-life)是首先由英国著名学者贝尔纳(Bernal)在情报科学中采用的。
1958年在华盛顿召开了国际情报科学会议,贝尔纳发表一篇《科技情报传递:用户分析》的论文。
他在描述科技文献使用情况时,借用了化学中放射性衰变的一个术语—半衰期。
(2)普赖斯指数
“普赖斯指数”和半衰期是既有联系又有区别的两个衡量文献老化的指标。
他们都是从文献被利用的角度出发,但以不同的方式来反映文献老化的情况。
普赖斯认为“有现时作用”的引文数量与“档案性”引文数量的比例,是比引文的“一半寿命”更为重要的特征。
文献的“半衰期”只能笼统的衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、甚至某一作者和某篇文献的老化特点。
(3)期刊有益性系数
1970年布鲁克斯提出期刊的有益性(Utility)的概念。
所谓一种科学期刊的有益性,是指可望在某种程度上被科学家或专家利用(在书目中被引用)的文章数。
即某一年份某一期刊被用户所利用的文章数。
文献老化的数学模型
(1)负指数模型
(2)巴顿-开普勒老化方程
(3)莫蒂列夫修正式
(4)布鲁克斯的累积指数模型
(5)阿弗拉米斯库方程
文献老化的几种类型
静态老化:不考虑文献增长因素影响的老化过程
动态老化:考虑文献增长因素影响的老化过程
局部老化:在某一图书馆或文献情报单位文献利用率的降低,研究方法主要运用文献管理统计数据分析方法
普遍性老化:某一学科或世界范围的老化,其研究方法主要运用引文分析法。