信息分析第九讲 科学计量方法
- 格式:ppt
- 大小:2.38 MB
- 文档页数:79
1. 文献计量学:是采用数学统计方法,对各类文献的诸计量特征进行统计分析,进而揭示、研究文献情报规律,文献情报科学管理以及科学发展趋势的一门学科。
2. 质量牵制原则:出版物的增长数量与其质量有关,不同质量的出版物有不同的出版速度;质量高的文献增长速度慢。
3. 文献老化:科学文献随着其年龄的增长,逐渐失去了作为科学情报源的价值,越来越少的被用户利用的过程。
4. 半衰期:某学科现在尚在被使用的全部文献中,较新的一半是在多长时间内发表的。
5. 普赖斯指数:指在某一领域内,出版年龄不超过5 年的被引证文献与被引证文献总数之比。
6. 文献耦合:是指引用文献通过参考文献建立起来的耦合,如果 A 、B 两篇文献共同引用了一篇或多篇相同的论文,则 A 、B 两篇论文的关系即为耦合关系,也叫文献合配。
7 文献信息流:文献所含情报的汇流称文献信息流。
8 文献老化:科技文献随着其"年龄"的增长,其内容日益变得陈旧过时,失去了作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利用的过程。
9 科学生产率:个体科研人员在一定时期内所撰写的论文数量。
10 引文分析:利用各种方法对科学期刊、论文、著者等分析对象的引证和被引证现象进行分析,以揭示其特征和内在规律。
11 影响因子:即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
12 信息计量学:是以信息作为对象进行计量研究的学问,采用数学、统计学等定量方法,对信息基本循环图式所描述的社会化的信息交流过程中的信息组织,存储,分布,传递,相互引用和开发利用等进行定量描述和统计分析,以便揭示社会信息交流过程的数量特征和内在规律。
13 网络信息计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示七数量特征和内资规律的一门新兴学科。
文献信息老化的主要度量指标有哪两个?两者有何异同?文献信息老化的主要度量指标是半衰期和普赖斯指数。
信息计量学方法的应用一、信息计量学方法的应用(一)测定核心期刊期刊是最基本、最常用的一种信息存贮类型。
在期刊论文的实际分布中,存在着一种普遍现象,即对于某一特定学科或专业来说,少数几种期刊所含的相关信息量很大,多数期刊的信息量却很小。
我们将含有某专业、学科相关信息量很大的少数几种期刊,称为该专业、学科的核心期刊。
确定核心期刊,不仅可以满足信息单位科学管理的需要,缓解信息经费、馆藏等方面的问题,而且可以提高信息服务的效率和准确性、针对性。
因此,测定核心期刊是信息工作的一项重要任务。
信息计量学方法为测定某一专业、学科的核心期刊,提供了一套科学的方法,如布拉德福定律法及百分比补偿、累积百分比法、文摘法、流通率法与综合评价法。
加拿大学者A.波普曾用布拉德福图像分析法测定了信息学的核心期刊。
近年来,信息计量学方法已被广泛应用于化学、医学、农业、生物、海洋等多种学科的核心期刊的确定。
(二)指导信息收藏管理应用信息计量学方法指导信息收藏与管理,表现在以下几个方面:①制定信息采集策略,比如优先订购核心期刊,确定某一主题、专业的信息采集的适当比例等;②选择各类信息的最佳搜集方式,如根据用户要求的特点和经济、合理等因素,确定对某一类信息是采取订购、交换、复制或其他什么形式;③确定期刊收藏的最佳方案,即根据布氏定律与信息老化指数规律,从有关某一学科100%的期刊中选出P泥作为一个适当的比例加以收藏;④指导信息文献剔旧工作,即依据文献的载文量、引文量、流通数据、用户反馈数据、馆藏大小等因素,确定信息文献剔旧的合理方案,维护动态的最佳馆藏;⑤评价信息收藏工作,即根据信息用户占有率、信息利用率数据评价一个信息机构的信息收藏是否充分、合理、经济,是否能基本满足用户对信息的需求。
(三)测定检索工具的完整性检索工具的质量直接关系到检索效果,利用布氏定律,可以测定文摘、索引等书目类检索工具的完整性。
其具体作法是:①统计要校验的文摘或索引的实际款目数量和摘引的期刊数量;②根据从实际统计中得到的某学科期刊n和R(n)的一组数据,利用R(n)= Klogn,求出期刊总数(N= K);再根据公式R(N)= KlogN求出该学科的论文总数;③通过实际值与理论计算值的比较,便能测定其完整性。
信息计量学重点总结信息计量学概念:是应用数学和统计学方法对科学活动中的信息过程、信息现象和信息规律进行描述和研究的一门学科。
信息计量学主要内容:三个应用范围(核心期刊的测定、信息资源的管理、科学评价),四个方法(引文分析法、信息统计分析法、数学模型分析方法、计算机辅助分析方法),五个定律(增长规律、老化规律、集中与分散规律、著者分布规律、词频分布规律)第一章绪论“信息计量学”(原称“情报计量学”)名称最早是由德国学者布莱克特和西格尔以及昂托·纳克教授在1979年最先提出来的。
1923年,英国学者休姆首次使用了“统计书目学”术语,标志着信息计量这一学科的最早开始。
信息计量学与文献计量学和科学计量学之间的关系:相同之处表现在:研究对象方面,研究内容方面,研究方法方面差异:研究目的方面,研究对象方面,研究内容方面,研究方法方面信息计量学的发展趋势:(1)理论研究(2)规律研究(3)研究方法和手段(4)分支学科网络信息计量学(5)拓宽信息计量学的应用领域第二章信息计量学的理论基础掌握马太效应马太效应的结果——成功产生成功第三章科学信息的增长规律人物:普赖斯科学知识增长与科学文献增长的关系:(1)科学文献是科学知识的载体,是科学知识内容的客观记录;(2)科学知识的增长是科学信息增长的直接原因;(3)科学文献的数量增长情况直接反应科学知识增长的变化,所以科学文献的数量是衡量科学知识量的重要尺度之一;(4)科学文献作为科学知识主要的载体形式,它的变化情况可以作为直接反应科学发展的重要标志;(5)科学知识增长和科学文献增长具有同步性,其增长规律也具有很大的相似性。
科学信息增长模型:线性增长模型,指数增长模型,逻辑增长模型指数增长的数学模型:F(t)=ae bt(a>0,b>0) ,a为时间常数,统计的初始时刻(t=0)文献量;b为时间常数,即持续增长率。
指数增长模型中文献量的计算:文献量翻番时间(k=2)设t1,t2的信息总量为F(t1)、F(t2),且F(t2)=2 F(t1),则有ae bt2 =ae bt1△T= t2- t1=ln2/b=0.6931 文献年增加量△F(t)=F(t)(eb-1) =(eb -1)aebt第四章科学信息的老化规律科学文献老化的测度指标:半衰期与普赖斯指数,两者的异同(概念、功能、数值、使用范围)巴尔顿—凯普勒老化方程(巴-凯方程)的标准公式:科学文献增长与科学文献老化的关系:(1)科学文献的增长和老化从不同方面阐释科学的进步(2)科学文献的增长是促成科学文献老化的重要因素(3)在学科的不同发展阶段科学文献增长和老化速度不同第五章 科学信息的集中与分散规律创始人:布拉德福区域划分:如果将一定时间内的按某种学科载文量等级排列的期刊划分为三个区,使每个区所包含的相关论文数量相等,即恰好等于全部期刊发表的该学科文章总数的1/3,则可发现,第一区(核心区)所涉及的文章来自数量不多但效率最高的n 1种期刊;第二区(相关区)包括数量较大、效率中等的n 2种期刊;第三区(外围区)包括数量最大而效率最低的n 3种期刊。
一、为什么区分“信息计量学”与“科学计量学和文献计量学”文献计量学、科学计量学和信息计量学这三个计量学科术语在国际上第一次正式并列是在1989年。
信息计量学在这之前是作为一个笼统的研究领域被包括在文献计量学和科学计量学之中。
真正被承认的时间是1987年在比利时召开的“文献计量学和信息检索的理论问题国际会议”上,其主要由英国著名的信息科学家布鲁尔斯提出来的。
在信息计量学正式提出以前,“文献计量学”和“科学计量学”术语时,一般作为同义语使用,二者界限相当模糊。
“信息计量学”术语在得到信息科学家及图书馆学家、科学学家承认以后,是否还能继续把文献计量学、科学计量学和信息计量学这三个术语当成同义语来使用呢。
对于这三门计量学科的界限是否还能继续模糊下去呢?对于这些疑问,信息计量学研究者比文献计量学和科学计量学的研究者更关心。
信息科学家布鲁克斯觉得,如果不能对这三门计量学科的联系和区别给予一个明确的回答,信息计量学术语就只能是感情上的而不能是科学上的。
对这三门计量学科的联系和区别的回答,有助于澄清过去对文献计量学和科学计量学的模糊解释事进一步明确这三门计量学科的联系和区别,也有助于它们各自的健康发展,充分发挥各自的研究特长。
二、“信息计量学”和“科学计量学”“文献计量学”的起源(一)文献计量学文献计量学历史可追溯到本世纪初欧洲和俄国学者对书目引文的统计分析,但其正式形成是以“文献计量学”术语的提出为标志。
1969年,美国目录学家阿伦·普里查德在一篇专门辨析“统计目录学”与文献计量学的文章中,明确提出用“文献计量学”取代含义模糊不清的传统“统计目录学”。
新创的术语立即受到图书馆学家和刚刚拥有“信息科学”称呼的信息科学家的普遍欢迎。
从此以后,两者在引文分析、文献失效或老化、布拉德福定律等共同关心的领域都进行了大量卓有成效的研究。
虽然西方图书馆学家和信息科学家在对文献计量学的研究中也产生了分歧,但在共同研究的10多年里都能保持求同存异、共同发展。