3文献信息老化规律
- 格式:ppt
- 大小:618.00 KB
- 文档页数:35
1. 文献计量学:是采用数学统计方法,对各类文献的诸计量特征进行统计分析,进而揭示、研究文献情报规律,文献情报科学管理以及科学发展趋势的一门学科。
2. 质量牵制原则:出版物的增长数量与其质量有关,不同质量的出版物有不同的出版速度;质量高的文献增长速度慢。
3. 文献老化:科学文献随着其年龄的增长,逐渐失去了作为科学情报源的价值,越来越少的被用户利用的过程。
4. 半衰期:某学科现在尚在被使用的全部文献中,较新的一半是在多长时间内发表的。
5. 普赖斯指数:指在某一领域内,出版年龄不超过5 年的被引证文献与被引证文献总数之比。
6. 文献耦合:是指引用文献通过参考文献建立起来的耦合,如果 A 、B 两篇文献共同引用了一篇或多篇相同的论文,则 A 、B 两篇论文的关系即为耦合关系,也叫文献合配。
7 文献信息流:文献所含情报的汇流称文献信息流。
8 文献老化:科技文献随着其"年龄"的增长,其内容日益变得陈旧过时,失去了作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利用的过程。
9 科学生产率:个体科研人员在一定时期内所撰写的论文数量。
10 引文分析:利用各种方法对科学期刊、论文、著者等分析对象的引证和被引证现象进行分析,以揭示其特征和内在规律。
11 影响因子:即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
12 信息计量学:是以信息作为对象进行计量研究的学问,采用数学、统计学等定量方法,对信息基本循环图式所描述的社会化的信息交流过程中的信息组织,存储,分布,传递,相互引用和开发利用等进行定量描述和统计分析,以便揭示社会信息交流过程的数量特征和内在规律。
13 网络信息计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示七数量特征和内资规律的一门新兴学科。
文献信息老化的主要度量指标有哪两个?两者有何异同?文献信息老化的主要度量指标是半衰期和普赖斯指数。
第三章科技文献的老化规律文献老化我们采用前苏联情报学家米哈依诺夫的提法作为定义:科技文献的老化是科技文献随着其“年龄”的增长失去了作为科学情报的价值,以及因此越来越少被科学工作者和专家利用的过程。
“老化”是一个过程,是一个动态的概念。
即给定的文献集合在不同的时期将有不同的使用价值。
不能将文献老化等同于废弃不用,废弃不用是一个静态的概念。
文献的老化必定会导致其使用数量随着时间的推移而减少,但文献使用量随时间推移的减少却并不一定仅是由文献老化一种因素造成的。
不同认识观念:-过程观-状态观-过程状态辩证观文献老化的原因:(1)文献中的情报被后来研究证明是错误的;(2)文献中的情报是正确的,但被载有新的,更全面的内容的文献所代替,原有文献的内容已进入了更广泛的交流领域;(3)文献中的情报是正确的,但研究者的兴趣已发生了转移;(4)文献情报是正确的,且被后人普遍接受,一般人们就不会再去查询那些原始文献。
引文分析法是将所研究学科领域在一定时间内的全部文献收集起来,通过统计每篇文章所附的引文的发表时间及其别引用时间等数据来研究该领域内文献老化的情况。
引用文献分析法(同时法,符合状态观)被引文献分析法(历时法,符合过程观)文献老化的测度指标:半衰期普赖斯指数期刊有益性系数(1)半衰期半衰期(Half-life)是首先由英国著名学者贝尔纳(Bernal)在情报科学中采用的。
1958年在华盛顿召开了国际情报科学会议,贝尔纳发表一篇《科技情报传递:用户分析》的论文。
他在描述科技文献使用情况时,借用了化学中放射性衰变的一个术语—半衰期。
(2)普赖斯指数“普赖斯指数”和半衰期是既有联系又有区别的两个衡量文献老化的指标。
他们都是从文献被利用的角度出发,但以不同的方式来反映文献老化的情况。
普赖斯认为“有现时作用”的引文数量与“档案性”引文数量的比例,是比引文的“一半寿命”更为重要的特征。
文献的“半衰期”只能笼统的衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、甚至某一作者和某篇文献的老化特点。
文献计量学:文献分布定律,布拉德福定律,词频分布定律,齐普夫定律,科学论文作者分布定律,洛特卡定律,文献增长,科学文献老化,引文分析,情报冗余等。
文献信息源的定量研究开始于20世纪初。
在20世纪70年代末,就形成了布拉德福定律、齐普夫定律、洛特卡定律、文献增长规律、文献老化规律、文献引用规律等六大规律,并在后来的研究中得到不断的完善与发展。
布拉德福定律:也称文献分散定律。
是由英国文献学家布拉德福(S.C.Bradford)1934 年首先提出。
它是定量描述科学论文在相关期刊中集中——分散状况的一个规律。
经过后来的许多研究者的修正和研究,发展成为著名的文献分布理论。
布氏定律的文字描述为“如果将科学期刊按其刊载某个学科领域的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文量最多的‘核心’区和包含着与核心区同等数量论文的随后几个区,这时核心区和后继各区中所含的期刊数成1:a:a 2 …… 的关系(a>1)。
”布氏定律主要反映的是同一学科专业的期刊论文在相关的期刊信息源中的不平衡分布规律。
布氏定律的应用研究也获得了许多切实有效的成果,应用于指导文献情报工作和科学评价,选择和评价核心期刊,改善文献资源建设的策略,确立入藏重点,了解读者阅读倾向,评价论文的学术价值以节约经费、节约时间,切实提高文献信息服务和信息利用的效率和科学评价的科学性。
洛特卡定律:是由美国的统计学家、情报学家洛特卡(A.J.lotka)研究出来的描述科学论文作者动态的最早的量化规律。
在科研活动中,不同人的科研能力及其成果著述数量肯定是不同的。
那么,在同样的一段抽样时间内,不同的科技工作者的论著数量分布有没有什么规律呢?1926 年,洛特卡发表了论文“科学生产率的频率分布”。
他在文中统计分析了化学和物理学两大学科中一段时间内科学家们的著述情况,提出了定量描述科学生产率的平方反比分布规律,又被称为“倒平方定律”。
其经典公式为:f(x) =(C为常数)上式的意义为:设撰写X 篇论文的作者出现频率为f(X) ,则撰写X篇论文的作者数量与他们所写的论文数量呈平方反比关系。
文献信息老化规律第三章文献信息老化规律人们围绕文献信息老化的机理、量度指标、数学模型及其影响因素主要从三个方面进行研究:一.文献老化理论的研究,进而探索文献信息传播的动态规律二.对研究方法与定量描述方法的研究,以便准确把握老化规律及其动力机制三.对文献信息老化的应用研究,以便更好地指导书刊选购、馆藏优化、排架流通等活动,更快地提高文献利用率和服务效益3.1 文献信息老化的概念对文献信息老化的不同认识观念,可以概括为:过程观、状态观、过程状态辩证观。
3.1.2 一般来说,“老化”包括文献老化和情报老化。
文献老化和情报老化是两个不同的概念。
情报的老化是相对于情报对象而言的,而文献的老化是相对于情报用户而言的。
3.1.3 情报老化的概念?情报的有效价值随时间流逝而衰减的现象。
3.1.4 半衰期的精确定义:定义 3 —8 对? X ∈ x ,Pt ()X =21Po ()X ,则称T 为X 的历时半衰期。
定义3—9 选定某一观测时刻,对?X ∈ x ,X ={ X ()t t=0,1,2, ,K},如果()()∑=10T t t X P =21()()∑=k t t X P 0,则称T1为X 的平均共时半衰期。
如果 P ()()2T X =21P ()()0,则称T2为X 的分布共时半衰期。
3.1.5 普莱斯指数概念的推广:定义 3-10 对)(()()∑∑∞===∈?040Pr ,t t X Pt X Pt X x X 为X 的历时普莱斯指数。
定义 3-11 选定某一观测时刻,对x X ∈? , X = .{X.()t t =0 ,1,2,,K },Pr ()X = ())(())(∑∑==k t t t X P t X P 040. 为X 的共时普莱斯指数。
3.2 文献信息老化的量度指标?1)半衰期、普赖斯指数、剩余有益性指标等⑴半衰期的计算:①作图法②定量模型计算法.⑵普赖斯指数与半衰期的比较:①一般来说,某一学科或领域文献的“普赖斯指数越大”,半衰期就越短,说明其文献的老化速度就越快。
情报科学理论——第3章情报科学的基本定律布拉德福文献分散定律的产生并不是偶然的,而有着一定的客观背景。
作为客观化的信息产品(论文)与其载体——期刊有一种集中与分散的关系。
布拉德福认为,虽然科学有不同学科之分,但它是一个整体,具有同一性。
科学技术的每一个学科都或多或少、或远或近地与其他任何一个学科相关联,因而有一个学科的文献出现在另一个学科的期刊之中的现象,所以文献呈现集中与分散两种趋势。
布拉德福还认为,总是会有若干期刊的内容与某个学科更近一些,而总是会有数量更多的期刊的内容离该学科更远些。
专门面向这个学科的核心期刊——即大量包含该学科论文的那一少部分期刊,在刊载该学科的论文中,载文率一般来说高于别的期刊。
布拉德福就是根据科学具有统一性的原则,从定性上对布拉德福定律进行了描绘。
1.布拉德福定律的区域描述“布拉德福分散定律”(简称布拉德福定律):“如果将科学期刊按其刊载某个学科主题的论文数量以递减顺序排列起来就可以在所有这些期刊中区分出载文率最高的“核心”部分和包含着与核心部分同等数量论文的随后几个区,这时核心区和后继区(称为相关区、边沿区)中所含的期刊数成1:a:a2的关系。
(a>1,称为布拉德福系数,a约等于5)。
布拉德福定律是在对期刊文献的统计基础上得出的规律。
布拉德福曲线是对文献分散现象直观的、对象化的基本描述,构成布拉德福分布理论的现象学研究的核心与基础。
显然,布拉德福定律的区域描述和图像描述是矛盾的。
区域描述是从实际统计的具体数据出发,取近似值而概略地归纳出来的,这完全是一种近似的经验方法。
图像描述所依据的是区域描述的结论完全同样的统计数据,只是图像描述将统计的期刊数据取对数,并利用了三个区中论文数量相等这一个近似条件得到的结论。
因此,从数学观点来看,图像描述是没有任何错误的;从实际应用情况来看,图像描述也非常接近于反映文献的实际分布情况,甚至其近似程度比区域描述更为准确。
文献计量学复习资料第一章绪论1、什么叫文献计量学?其研究对象和基本内容是什么?文献计量学是以文献信息体系为研究对象,采用数学、统计学等计量方法,研究文献信息的分布状况和变化规律,并进而探索科学技术的发展规律的一门分支学科。
研究对象:信息计量学的研究对象目前主要是各种事务信息的数量方面。
其内容包括信息、数据、事件、事务、文本和文献等。
其中,文献信息指特征信息如作者、主题、分类号。
文献体系指一次、二次、三次文献。
基本内容包括三大部分,(1)理论部分:a.文献信息体系的结构研究b.文献信息流的规律研究:“六大规律三大定律”c.文献信息流的数量关系研究d.文献信息工作系统的研究(2)方法部分:三个特征:a.定量分析;b.移植性;c.综合性(3)应用部分:a.应用原理:为什么?b.应用途径:理论、方法c.应用领域:相关领域:科学学、管理、预测;本体领域:图书情报研究和工作2、什么叫科学计量学、信息计量学?文献计量学与科学计量学、信息计量学的关系怎么样?科学计量学:采用定量方法研究科学本身发展规律的科学学的新型分支学科。
信息计量学:采用数学、统计学等定量方法研究信息现象、过程和规律的一门分支学科。
文献计量学与科学计量学的关系:(1)从研究目的来看:两者相同(2)从研究途径来看:文献计量学是从文献入手(3)从研究方法来看:相似——都用定量法文献计量学与信息计量学的关系:相同:交叉的内容;二者关系密切、相辅相成;不同:(1)范围不同;(2)信息计量学任务更加艰巨3、什么叫网络计量学?其产生的背景和基本内容是什么?网络计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示其数量特征和内在规律的一门新兴分支学科。
网络计量学的产生背景:(1)信息资源的电子化、网络化,及网上数据信息数量的激增,既是网络计量学产生的基础和条件,也是要求其产生迫切的需求;(2)电子文献信息资源统计分析的研究成果为网络计量学产生奠定了基础、积累了经验;(3)是学科发展的需要;(4)是网络管理的需要。
科学计量学的几个基本定律1.描述文献增长定律——普赖斯指数文献增长定律是描述文献数量随时间而有规律地增长。
令F表示文献数量,t表示时间,则文献增长定律的数学表达形式为:F=f)(t式中)(t f的总趋势满足t增大时,F也应相应增大。
描述文献增长规律的主要函数是:线性函数、指数函数、逻辑曲线函数等。
其中以D.J.普赖斯(Price)建立的指数增长定律最为著名bt)(F=aet式中,)(tF为某年)(t的文献累积数量;t为时间(以年为单位);b为文献持续增长率,即每一年文献的增长率。
(半对数坐标,直线实际上指数曲线经对数转换后的结果)图:《化学文摘》年度文献累积曲线图:1600—1950年代科学发明的指数增长(据赵红洲)指数增长规律只有在没有限制或干扰的情况下才会出现,如果受到智力的、物质的和经济的限制,普赖斯指出文献增长更趋于逻辑曲线。
苏联学者弗勒杜茨和B.纳利莫夫提出了著名的逻辑曲线方程式bt ae KF -+=1式中,F(t)表示t 年的文献累积量,K 为F(t)增长的最大值,a 与b 为参数。
2.描述文献老化规律──半衰期,普赖斯老化指数对于科技文献来说,除物理形态上的破损、载体的变质,随时间流逝,文献所载的科技信息逐渐过时,以致于文献本身不再被使用。
老化的量度主要有:(1)半衰期:所谓半衰期是一个时间概念,意指在该时间内发表了某一学科或领域正在被利用的全部文献一半,或者目前所利用的文献的一半是在该时间内发表的。
进行文献老化研究,可采用引用文献分析法,它是对收集文献后而所附参考文献进行研究。
例如,为了对我国化学期刊文献的老化规律进行研究,首先收集某一年,例如1988年出版的重要化学期刊40种,共得到了2000篇有关论文,然后再统计每篇论文后面所附的参考文献(或称引文),共得25000条参考文献。
再按其出版年代进行统计,其结果可用图形表示。
图中纵坐标代表引文量,可以采用绝对数量亦可采用相对数量来表示;横坐标为引文出版年龄,所谓出版年龄是指被引文献出版年代与其被引用年代之差。
信息计量学一、信息计量学概述1。
信息计量学的由来和发展1.1 信息计量学的由来※信息计量学来自于德文Informetrie,由德国学者昂托.纳克(Otto Nache)在1979年最早提出,其后很快出现了与之对应的英文术语informetrics;※由于1987年以来的有关学术会议论文集上都有informetrics标题,因此,很多情报学家都将1987年看成是informetrics被国际情报学界正式承认的一年;※我国将informetrics译为情报计量学,将其作为对应于“情报学”的三级分支学科,1992年,我国有关部门将information从情报改译为信息,informetrics也改译为信息计量学.1。
2 信息计量学的产生背景(1)信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的;(文献计量学主要服务于图书馆学,情报数量>文献数量,情报计量方法>文献计量方法,情报学需要开辟与情报学对应的定量化研究领域);(2)信息计量学是情报学发展的需要和必然产物。
布鲁克斯提到:情报学如果不实现定量化,它将是一堆支离破碎的技艺,而不会成为科学。
情报学定量化研究不可或缺.(3)一批杰出的学科带头人和骨干力量推动了信息计量学发展.1.3 信息计量学的形成与发展(1)信息量化研究的前期实践(2)信息计量规律的探索和发现(3)信息计量学的形成Statistical bibliography(1923)—-Bibliometrics(1969)——Scientometrics(1969)—-Informetrics(1979)(4)信息计量学的发展1988年,英国布鲁克斯提出informetrics代替bibliometrics;1990年,比利时埃格赫和鲁索在Introduction to informetrics:quantitative metiods in library,documentation and in formation science中提出学科演进:统计书目学—文献计量学—科学计量学-信息计量学1980年,国际文献联合会(FID)设“信息计量学委员会”(Committee on Informatrics,FID/IM),得到国际信息学界的承认研究内容逐步从文献研究到内容研究从传统的小样本抽样统计到信息计量工具的改进国内情况2.信息计量学的概念和内容体系2。
文献老化规律《文献老化规律》文献老化规律,简单来说就是随着时间的推移,文献的使用价值或被引用的频率逐渐降低的一种规律。
想象一下文献就像一个个明星。
新出道的明星总是备受瞩目,大家都抢着去看他的表演、听他的歌,各种媒体都在报道他,这就好比新发表的文献,刚出来的时候大家都急于引用,关注度非常高。
但是随着时间的流逝,就像明星逐渐过气一样,文献也会慢慢变得不那么引人注目了。
我们可以把文献看成是水果。
刚摘下来的新鲜水果,色泽鲜艳、口感鲜美,大家都争着购买品尝,这就如同新的文献有着新鲜的观点、数据和研究成果,在学术界就像“香饽饽”一样被人们追捧。
然而,随着时间的推移,水果会慢慢腐烂变质,失去它原本的吸引力,文献也会因为学科的发展、新研究的不断涌现而失去它在前沿领域的“新鲜度”,被引用的次数越来越少。
在现实生活中,这样的例子屡见不鲜。
以计算机科学领域为例,在20世纪80年代关于计算机基础编程的文献,在当时是非常热门的,因为那时候计算机编程刚刚兴起,很多学者和程序员都需要参考这些文献来进行学习和开发。
但是随着技术的飞速发展,到了现在,那些文献已经很少被引用了。
现在的研究更多地集中在人工智能、大数据等新兴领域,新的文献不断涌现,旧的文献就像被时间遗忘在角落里的古董,虽然还有一定的历史价值,但在日常的科研引用中已经逐渐边缘化了。
从数据上来看,根据对某些学科核心期刊文献引用情况的统计,在发表后的前5年,大部分文献会达到引用高峰,之后引用数量就开始逐年递减。
比如在医学领域的一些研究论文,有关新型疾病诊断方法的文献在刚发表后的几年内,被世界各地的医学研究者频繁引用,用来验证、改进或者进一步研究。
可是10年之后,除非是具有非常经典的、开创性的研究成果,否则很少会被再次引用。
文献老化规律在学术界有着非常重要的意义。
对于科研工作者来说,了解这个规律有助于他们及时把握学科前沿动态,知道哪些研究是新的热点,哪些已经是过时的研究方向。