文献老化规律
- 格式:ppt
- 大小:1.46 MB
- 文档页数:44
1. 文献计量学:是采用数学统计方法,对各类文献的诸计量特征进行统计分析,进而揭示、研究文献情报规律,文献情报科学管理以及科学发展趋势的一门学科。
2. 质量牵制原则:出版物的增长数量与其质量有关,不同质量的出版物有不同的出版速度;质量高的文献增长速度慢。
3. 文献老化:科学文献随着其年龄的增长,逐渐失去了作为科学情报源的价值,越来越少的被用户利用的过程。
4. 半衰期:某学科现在尚在被使用的全部文献中,较新的一半是在多长时间内发表的。
5. 普赖斯指数:指在某一领域内,出版年龄不超过5 年的被引证文献与被引证文献总数之比。
6. 文献耦合:是指引用文献通过参考文献建立起来的耦合,如果 A 、B 两篇文献共同引用了一篇或多篇相同的论文,则 A 、B 两篇论文的关系即为耦合关系,也叫文献合配。
7 文献信息流:文献所含情报的汇流称文献信息流。
8 文献老化:科技文献随着其"年龄"的增长,其内容日益变得陈旧过时,失去了作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利用的过程。
9 科学生产率:个体科研人员在一定时期内所撰写的论文数量。
10 引文分析:利用各种方法对科学期刊、论文、著者等分析对象的引证和被引证现象进行分析,以揭示其特征和内在规律。
11 影响因子:即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
12 信息计量学:是以信息作为对象进行计量研究的学问,采用数学、统计学等定量方法,对信息基本循环图式所描述的社会化的信息交流过程中的信息组织,存储,分布,传递,相互引用和开发利用等进行定量描述和统计分析,以便揭示社会信息交流过程的数量特征和内在规律。
13 网络信息计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示七数量特征和内资规律的一门新兴学科。
文献信息老化的主要度量指标有哪两个?两者有何异同?文献信息老化的主要度量指标是半衰期和普赖斯指数。
第三章科技文献的老化规律文献老化我们采用前苏联情报学家米哈依诺夫的提法作为定义:科技文献的老化是科技文献随着其“年龄”的增长失去了作为科学情报的价值,以及因此越来越少被科学工作者和专家利用的过程。
“老化”是一个过程,是一个动态的概念。
即给定的文献集合在不同的时期将有不同的使用价值。
不能将文献老化等同于废弃不用,废弃不用是一个静态的概念。
文献的老化必定会导致其使用数量随着时间的推移而减少,但文献使用量随时间推移的减少却并不一定仅是由文献老化一种因素造成的。
不同认识观念:-过程观-状态观-过程状态辩证观文献老化的原因:(1)文献中的情报被后来研究证明是错误的;(2)文献中的情报是正确的,但被载有新的,更全面的内容的文献所代替,原有文献的内容已进入了更广泛的交流领域;(3)文献中的情报是正确的,但研究者的兴趣已发生了转移;(4)文献情报是正确的,且被后人普遍接受,一般人们就不会再去查询那些原始文献。
引文分析法是将所研究学科领域在一定时间内的全部文献收集起来,通过统计每篇文章所附的引文的发表时间及其别引用时间等数据来研究该领域内文献老化的情况。
引用文献分析法(同时法,符合状态观)被引文献分析法(历时法,符合过程观)文献老化的测度指标:半衰期普赖斯指数期刊有益性系数(1)半衰期半衰期(Half-life)是首先由英国著名学者贝尔纳(Bernal)在情报科学中采用的。
1958年在华盛顿召开了国际情报科学会议,贝尔纳发表一篇《科技情报传递:用户分析》的论文。
他在描述科技文献使用情况时,借用了化学中放射性衰变的一个术语—半衰期。
(2)普赖斯指数“普赖斯指数”和半衰期是既有联系又有区别的两个衡量文献老化的指标。
他们都是从文献被利用的角度出发,但以不同的方式来反映文献老化的情况。
普赖斯认为“有现时作用”的引文数量与“档案性”引文数量的比例,是比引文的“一半寿命”更为重要的特征。
文献的“半衰期”只能笼统的衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、甚至某一作者和某篇文献的老化特点。
科技情报研究的重要定律⽂献分布定律、词频分布定律、作者分布定律、⽂献⽼化定律、⽂献增长定律、⽂献引⽤定律等六条定律是情报学产⽣和发展的基⽯,它们共同揭⽰了信息爆炸、解释了信息爆炸,并解决了信息爆炸社会中的信息有效利⽤问题,是情报学对信息社会的重要贡献。
⼀、布拉德福定律——⽂献分布定律由英国著名⽂献学家B.C.Bradford于⼆⼗世纪30年代率先提出的描述⽂献分散规律的经验定律。
定律描述:如果将科技期刊按其刊载某学科专业论⽂的数量多少,以递减顺序排列,那么可以把期刊分为专门⾯对这个学科定律描述的核⼼区、相关区和⾮相关区。
各个区的⽂章数量相等,此时核⼼区、相关区,⾮相关区期刊数量成 1:n:n^2的关系。
科学应⽤:确定某⼀领域核⼼期刊⽬录科学应⽤⼆、齐普夫定律——词频分布定律美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
定律描述:如果把⼀篇较长⽂章中每个词出现的频次统计起来,按照⾼频词在前、低频词在后的递减顺序排列,并⽤⾃然数定律描述给这些词编上等级序号,即频次最⾼的词等级为1,频次次之的等级为2,……,频次最⼩的词等级为D。
若⽤f表⽰频次,r表⽰等级序号,则有fr=C(C为常数)。
齐普夫的表达仅适宜于中频词的情况,⾼频与低频词与该表述偏差较⼤。
科学应⽤:识别⽂献核⼼主题,可应⽤于基于内容(知识)的统计、挖掘与关联分析科学应⽤三、洛特卡定律——作者分布定律美国学者A.J.洛特卡在20世纪20年代率先提出的描述科学⽣产率的经验规律,⼜称“倒数平⽅定律”。
定律描述:写两篇论⽂的作者数量约为写⼀篇论⽂的作者数量的1/4;写三篇论⽂的作者数量约为写⼀篇论⽂作者数量的 1/9;写定律描述:N篇论⽂的作者数量约为写⼀篇论⽂作者数量的1/ n2……,⽽写⼀篇论⽂作者的数量约占所有作者数量的60%。
科学应⽤:识别领域核⼼作者,根据作者数量预测领域研究活动活跃程度科学应⽤:在洛特卡定律的基础上,普赖斯提出普赖斯定律和⼀些其他重要结论。
文献计量学:文献分布定律,布拉德福定律,词频分布定律,齐普夫定律,科学论文作者分布定律,洛特卡定律,文献增长,科学文献老化,引文分析,情报冗余等。
文献信息源的定量研究开始于20世纪初。
在20世纪70年代末,就形成了布拉德福定律、齐普夫定律、洛特卡定律、文献增长规律、文献老化规律、文献引用规律等六大规律,并在后来的研究中得到不断的完善与发展。
布拉德福定律:也称文献分散定律。
是由英国文献学家布拉德福(S.C.Bradford)1934 年首先提出。
它是定量描述科学论文在相关期刊中集中——分散状况的一个规律。
经过后来的许多研究者的修正和研究,发展成为著名的文献分布理论。
布氏定律的文字描述为“如果将科学期刊按其刊载某个学科领域的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文量最多的‘核心’区和包含着与核心区同等数量论文的随后几个区,这时核心区和后继各区中所含的期刊数成1:a:a 2 …… 的关系(a>1)。
”布氏定律主要反映的是同一学科专业的期刊论文在相关的期刊信息源中的不平衡分布规律。
布氏定律的应用研究也获得了许多切实有效的成果,应用于指导文献情报工作和科学评价,选择和评价核心期刊,改善文献资源建设的策略,确立入藏重点,了解读者阅读倾向,评价论文的学术价值以节约经费、节约时间,切实提高文献信息服务和信息利用的效率和科学评价的科学性。
洛特卡定律:是由美国的统计学家、情报学家洛特卡(A.J.lotka)研究出来的描述科学论文作者动态的最早的量化规律。
在科研活动中,不同人的科研能力及其成果著述数量肯定是不同的。
那么,在同样的一段抽样时间内,不同的科技工作者的论著数量分布有没有什么规律呢?1926 年,洛特卡发表了论文“科学生产率的频率分布”。
他在文中统计分析了化学和物理学两大学科中一段时间内科学家们的著述情况,提出了定量描述科学生产率的平方反比分布规律,又被称为“倒平方定律”。
其经典公式为:f(x) =(C为常数)上式的意义为:设撰写X 篇论文的作者出现频率为f(X) ,则撰写X篇论文的作者数量与他们所写的论文数量呈平方反比关系。
文献老化规律《文献老化规律》文献老化规律,简单来说就是随着时间的推移,文献的使用价值或被引用的频率逐渐降低的一种规律。
想象一下文献就像一个个明星。
新出道的明星总是备受瞩目,大家都抢着去看他的表演、听他的歌,各种媒体都在报道他,这就好比新发表的文献,刚出来的时候大家都急于引用,关注度非常高。
但是随着时间的流逝,就像明星逐渐过气一样,文献也会慢慢变得不那么引人注目了。
我们可以把文献看成是水果。
刚摘下来的新鲜水果,色泽鲜艳、口感鲜美,大家都争着购买品尝,这就如同新的文献有着新鲜的观点、数据和研究成果,在学术界就像“香饽饽”一样被人们追捧。
然而,随着时间的推移,水果会慢慢腐烂变质,失去它原本的吸引力,文献也会因为学科的发展、新研究的不断涌现而失去它在前沿领域的“新鲜度”,被引用的次数越来越少。
在现实生活中,这样的例子屡见不鲜。
以计算机科学领域为例,在20世纪80年代关于计算机基础编程的文献,在当时是非常热门的,因为那时候计算机编程刚刚兴起,很多学者和程序员都需要参考这些文献来进行学习和开发。
但是随着技术的飞速发展,到了现在,那些文献已经很少被引用了。
现在的研究更多地集中在人工智能、大数据等新兴领域,新的文献不断涌现,旧的文献就像被时间遗忘在角落里的古董,虽然还有一定的历史价值,但在日常的科研引用中已经逐渐边缘化了。
从数据上来看,根据对某些学科核心期刊文献引用情况的统计,在发表后的前5年,大部分文献会达到引用高峰,之后引用数量就开始逐年递减。
比如在医学领域的一些研究论文,有关新型疾病诊断方法的文献在刚发表后的几年内,被世界各地的医学研究者频繁引用,用来验证、改进或者进一步研究。
可是10年之后,除非是具有非常经典的、开创性的研究成果,否则很少会被再次引用。
文献老化规律在学术界有着非常重要的意义。
对于科研工作者来说,了解这个规律有助于他们及时把握学科前沿动态,知道哪些研究是新的热点,哪些已经是过时的研究方向。
表征文献老化速度的指标
表征文献老化速度的指标主要包括半衰期(H)、普赖斯指数(P)和最大引文年限等。
1. 半衰期(H):这是衡量文献老化程度的重要指标。
具体来说,半衰期被定义为“某期刊或学科现时引用的全部文献(即参考文献)中,较新的一半是在多长时间内发表的”。
这个指标可以用来衡量文献的老化速度,即随着时间的推移,文献被引用的频率会逐渐降低。
2. 普赖斯指数(P):这是由美国学者普赖斯于1971年提出的,用于衡量文献老化速度与程度的指数。
它是指在某一学科领域里,把发表年限不超过5年的引文数量同引文总量之比作为指数。
这个指数越高,说明文献老化速度越快。
3. 最大引文年限:这个指标是指某一文献被引用的最大时间跨度。
一般来说,随着时间的推移,文献被引用的时间跨度会逐渐减小,这也反映了文献老化速度的增加。
此外,文献老化还受到许多其他因素的影响,如文献的增长、文献的类型和性质、学科性质及其发展阶段、用户需求特点和情报环境质量等。
通过研究文献老化问题,可以揭示文献传播的动态规律,指导文献采购、剔旧、排架等;还能对未来文献的利用情况作出预测,进而对整个文献情报的组织管理具有一定指导意义;
还能为科学学及科技史的研究提供定量依据和途径。
如需了解更多关于文献老化的知识,可以咨询情报学专家或查阅相关文献资料。
第三章 文献信息老化规律人们 围绕文献信息老化的机理、量度指标、数学模型及其影响因素主要从三个方面进行研究:一.文献老化理论的研究,进而探索文献信息传播的动态规律二.对研究方法与定量描述方法的研究,以便准确把握老化规律及其动力机制三.对文献信息老化的应用研究,以便更好地指导书刊选购、馆藏优化、排架流通等活动,更快地提高文献利用率和服务效益3.1 文献信息老化的概念对文献信息老化的不同认识观念,可以概括为:过程观、状态观、过程状态辩证观。
3.1.2 一般来说,“老化”包括文献老化和情报老化。
文献老化和情报老化是两个不同的概念。
情报的老化是相对于情报对象而言的,而文献的老化是相对于情报用户而言的。
3.1.3 情报老化的概念?情报的有效价值随时间流逝而衰减的现象。
3.1.4 半衰期的精确定义:定义 3 —8 对∀ X ∈ x ,Pt ()X =21Po ()X ,则称T 为X 的历时半衰期。
定义 3—9 选定某一观测时刻,对∀X ∈ x ,X ={ X ()t t=0,1,2, ,K},如果()()∑=10T t t X P =21()()∑=k t t X P 0,则称T1为X 的平均共时半衰期。
如果 P ()()2T X =21P ()()0,则称T2为X 的分布共时半衰期。
3.1.5 普莱斯指数概念的推广:定义 3-10 对)(()()∑∑∞===∈∀040Pr ,t t X Pt X Pt X x X 为X 的历时普莱斯指数。
定义 3-11 选定某一观测时刻,对 x X ∈∀ , X = .{X.()t t =0 ,1,2,,K },Pr ()X = ())(())(∑∑==k t t t X P t X P 040. 为X 的共时普莱斯指数。
3.2 文献信息老化的量度指标 ?1) 半衰期、普赖斯指数、剩余有益性指标等⑴半衰期的计算:①作图法 ②定量模型计算法.⑵普赖斯指数与半衰期的比较:①一般来说,某一学科或领域文献的“普赖斯指数越大”,半衰期就越短,说明其文献的老化速度就越快。
文献计量学一.科技文献的增长规律什么是科学指标科学指标( Scientific indicators )是指人类科研活动的数量研究首先应确定的定量对象。
科学指标的类型- 人员与机构的数量。
其中人员数量包括科学工作者、工程师、教师和学生的数量等。
机构数量是指各类科研院所、学会及高等学校的数量。
- 科研成果的数量。
其中主要有:重大理论问题突破的次数以及理论在实际应用中获得重要成果的次数等。
- 科研过程及成果记录载体的数量。
其中主要有:科技期刊及其刊载论文的数量;专利文献的数量;科技书籍的数量等。
- 科研资金投入的数量。
主要指直接投入于理论与应用研究的资金数量。
文献指标使用最为频繁,主要原因:- 绝大部分人类科研活动及其成果都是以文献方式记录和贮存。
其它三者都没有与科研活动和成果有如此直接密切的数量关系,单纯的成果数量不能详尽的反映人类取得成果的整个科研过程。
- 与其他指标相比,科技文献数量巨大、易于收集。
这对于主要依靠数学统计方法来揭示存在于科学发展过程中的数学规律的研究人员来说,无疑是一个极大的优点。
- 与其他指标相比,科技文献易于统计分类,可以对各类科研过程进行有选择的定量研究。
文献量度指标1)绝对值指标,是表示文献数量多少的指标。
2)相对值指标,是表示不同部分文献的数量比例的。
3)累计数指标,以文献累积数为依据,因为,各年出版的文献逐年相加而得到的文献累积数总是增加的,就有可能趋于某种、固定的规律,所得到的结果,往往是较为规则的曲线,能用一个较为准确的函数来描述,因而有利于进行文献的定量分析研究。
4)非累积数指标,即一年出版的文献数量,易于受到各种复杂的社会因素的影响,一般来说是波动的,很难确定它是否近似的趋于某种固定的规律,结果往往是一些非规则曲线,难以用某种函数来描述。
文献指数增长模型文献指数增长规律文献指数增长规律的局限性( 1) 科学文献并不总是按指数函数关系增长。
普赖斯指数增长模型与所研究的文献的学科和时间有关。