信息分析第九讲 科学计量方法
- 格式:ppt
- 大小:2.38 MB
- 文档页数:79
1. 文献计量学:是采用数学统计方法,对各类文献的诸计量特征进行统计分析,进而揭示、研究文献情报规律,文献情报科学管理以及科学发展趋势的一门学科。
2. 质量牵制原则:出版物的增长数量与其质量有关,不同质量的出版物有不同的出版速度;质量高的文献增长速度慢。
3. 文献老化:科学文献随着其年龄的增长,逐渐失去了作为科学情报源的价值,越来越少的被用户利用的过程。
4. 半衰期:某学科现在尚在被使用的全部文献中,较新的一半是在多长时间内发表的。
5. 普赖斯指数:指在某一领域内,出版年龄不超过5 年的被引证文献与被引证文献总数之比。
6. 文献耦合:是指引用文献通过参考文献建立起来的耦合,如果 A 、B 两篇文献共同引用了一篇或多篇相同的论文,则 A 、B 两篇论文的关系即为耦合关系,也叫文献合配。
7 文献信息流:文献所含情报的汇流称文献信息流。
8 文献老化:科技文献随着其"年龄"的增长,其内容日益变得陈旧过时,失去了作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利用的过程。
9 科学生产率:个体科研人员在一定时期内所撰写的论文数量。
10 引文分析:利用各种方法对科学期刊、论文、著者等分析对象的引证和被引证现象进行分析,以揭示其特征和内在规律。
11 影响因子:即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
12 信息计量学:是以信息作为对象进行计量研究的学问,采用数学、统计学等定量方法,对信息基本循环图式所描述的社会化的信息交流过程中的信息组织,存储,分布,传递,相互引用和开发利用等进行定量描述和统计分析,以便揭示社会信息交流过程的数量特征和内在规律。
13 网络信息计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示七数量特征和内资规律的一门新兴学科。
文献信息老化的主要度量指标有哪两个?两者有何异同?文献信息老化的主要度量指标是半衰期和普赖斯指数。
信息计量学方法的应用一、信息计量学方法的应用(一)测定核心期刊期刊是最基本、最常用的一种信息存贮类型。
在期刊论文的实际分布中,存在着一种普遍现象,即对于某一特定学科或专业来说,少数几种期刊所含的相关信息量很大,多数期刊的信息量却很小。
我们将含有某专业、学科相关信息量很大的少数几种期刊,称为该专业、学科的核心期刊。
确定核心期刊,不仅可以满足信息单位科学管理的需要,缓解信息经费、馆藏等方面的问题,而且可以提高信息服务的效率和准确性、针对性。
因此,测定核心期刊是信息工作的一项重要任务。
信息计量学方法为测定某一专业、学科的核心期刊,提供了一套科学的方法,如布拉德福定律法及百分比补偿、累积百分比法、文摘法、流通率法与综合评价法。
加拿大学者A.波普曾用布拉德福图像分析法测定了信息学的核心期刊。
近年来,信息计量学方法已被广泛应用于化学、医学、农业、生物、海洋等多种学科的核心期刊的确定。
(二)指导信息收藏管理应用信息计量学方法指导信息收藏与管理,表现在以下几个方面:①制定信息采集策略,比如优先订购核心期刊,确定某一主题、专业的信息采集的适当比例等;②选择各类信息的最佳搜集方式,如根据用户要求的特点和经济、合理等因素,确定对某一类信息是采取订购、交换、复制或其他什么形式;③确定期刊收藏的最佳方案,即根据布氏定律与信息老化指数规律,从有关某一学科100%的期刊中选出P泥作为一个适当的比例加以收藏;④指导信息文献剔旧工作,即依据文献的载文量、引文量、流通数据、用户反馈数据、馆藏大小等因素,确定信息文献剔旧的合理方案,维护动态的最佳馆藏;⑤评价信息收藏工作,即根据信息用户占有率、信息利用率数据评价一个信息机构的信息收藏是否充分、合理、经济,是否能基本满足用户对信息的需求。
(三)测定检索工具的完整性检索工具的质量直接关系到检索效果,利用布氏定律,可以测定文摘、索引等书目类检索工具的完整性。
其具体作法是:①统计要校验的文摘或索引的实际款目数量和摘引的期刊数量;②根据从实际统计中得到的某学科期刊n和R(n)的一组数据,利用R(n)= Klogn,求出期刊总数(N= K);再根据公式R(N)= KlogN求出该学科的论文总数;③通过实际值与理论计算值的比较,便能测定其完整性。
信息计量学重点总结信息计量学概念:是应用数学和统计学方法对科学活动中的信息过程、信息现象和信息规律进行描述和研究的一门学科。
信息计量学主要内容:三个应用范围(核心期刊的测定、信息资源的管理、科学评价),四个方法(引文分析法、信息统计分析法、数学模型分析方法、计算机辅助分析方法),五个定律(增长规律、老化规律、集中与分散规律、著者分布规律、词频分布规律)第一章绪论“信息计量学”(原称“情报计量学”)名称最早是由德国学者布莱克特和西格尔以及昂托·纳克教授在1979年最先提出来的。
1923年,英国学者休姆首次使用了“统计书目学”术语,标志着信息计量这一学科的最早开始。
信息计量学与文献计量学和科学计量学之间的关系:相同之处表现在:研究对象方面,研究内容方面,研究方法方面差异:研究目的方面,研究对象方面,研究内容方面,研究方法方面信息计量学的发展趋势:(1)理论研究(2)规律研究(3)研究方法和手段(4)分支学科网络信息计量学(5)拓宽信息计量学的应用领域第二章信息计量学的理论基础掌握马太效应马太效应的结果——成功产生成功第三章科学信息的增长规律人物:普赖斯科学知识增长与科学文献增长的关系:(1)科学文献是科学知识的载体,是科学知识内容的客观记录;(2)科学知识的增长是科学信息增长的直接原因;(3)科学文献的数量增长情况直接反应科学知识增长的变化,所以科学文献的数量是衡量科学知识量的重要尺度之一;(4)科学文献作为科学知识主要的载体形式,它的变化情况可以作为直接反应科学发展的重要标志;(5)科学知识增长和科学文献增长具有同步性,其增长规律也具有很大的相似性。
科学信息增长模型:线性增长模型,指数增长模型,逻辑增长模型指数增长的数学模型:F(t)=ae bt(a>0,b>0) ,a为时间常数,统计的初始时刻(t=0)文献量;b为时间常数,即持续增长率。
指数增长模型中文献量的计算:文献量翻番时间(k=2)设t1,t2的信息总量为F(t1)、F(t2),且F(t2)=2 F(t1),则有ae bt2 =ae bt1△T= t2- t1=ln2/b=0.6931 文献年增加量△F(t)=F(t)(eb-1) =(eb -1)aebt第四章科学信息的老化规律科学文献老化的测度指标:半衰期与普赖斯指数,两者的异同(概念、功能、数值、使用范围)巴尔顿—凯普勒老化方程(巴-凯方程)的标准公式:科学文献增长与科学文献老化的关系:(1)科学文献的增长和老化从不同方面阐释科学的进步(2)科学文献的增长是促成科学文献老化的重要因素(3)在学科的不同发展阶段科学文献增长和老化速度不同第五章 科学信息的集中与分散规律创始人:布拉德福区域划分:如果将一定时间内的按某种学科载文量等级排列的期刊划分为三个区,使每个区所包含的相关论文数量相等,即恰好等于全部期刊发表的该学科文章总数的1/3,则可发现,第一区(核心区)所涉及的文章来自数量不多但效率最高的n 1种期刊;第二区(相关区)包括数量较大、效率中等的n 2种期刊;第三区(外围区)包括数量最大而效率最低的n 3种期刊。
一、为什么区分“信息计量学”与“科学计量学和文献计量学”文献计量学、科学计量学和信息计量学这三个计量学科术语在国际上第一次正式并列是在1989年。
信息计量学在这之前是作为一个笼统的研究领域被包括在文献计量学和科学计量学之中。
真正被承认的时间是1987年在比利时召开的“文献计量学和信息检索的理论问题国际会议”上,其主要由英国著名的信息科学家布鲁尔斯提出来的。
在信息计量学正式提出以前,“文献计量学”和“科学计量学”术语时,一般作为同义语使用,二者界限相当模糊。
“信息计量学”术语在得到信息科学家及图书馆学家、科学学家承认以后,是否还能继续把文献计量学、科学计量学和信息计量学这三个术语当成同义语来使用呢。
对于这三门计量学科的界限是否还能继续模糊下去呢?对于这些疑问,信息计量学研究者比文献计量学和科学计量学的研究者更关心。
信息科学家布鲁克斯觉得,如果不能对这三门计量学科的联系和区别给予一个明确的回答,信息计量学术语就只能是感情上的而不能是科学上的。
对这三门计量学科的联系和区别的回答,有助于澄清过去对文献计量学和科学计量学的模糊解释事进一步明确这三门计量学科的联系和区别,也有助于它们各自的健康发展,充分发挥各自的研究特长。
二、“信息计量学”和“科学计量学”“文献计量学”的起源(一)文献计量学文献计量学历史可追溯到本世纪初欧洲和俄国学者对书目引文的统计分析,但其正式形成是以“文献计量学”术语的提出为标志。
1969年,美国目录学家阿伦·普里查德在一篇专门辨析“统计目录学”与文献计量学的文章中,明确提出用“文献计量学”取代含义模糊不清的传统“统计目录学”。
新创的术语立即受到图书馆学家和刚刚拥有“信息科学”称呼的信息科学家的普遍欢迎。
从此以后,两者在引文分析、文献失效或老化、布拉德福定律等共同关心的领域都进行了大量卓有成效的研究。
虽然西方图书馆学家和信息科学家在对文献计量学的研究中也产生了分歧,但在共同研究的10多年里都能保持求同存异、共同发展。
一、科学计量的定义科学计量是一种科学研究成果的评价和分析方法,它使用定量分析来衡量科学研究的质量、影响力和价值。
科学计量可以帮助科学家们评估并比较不同研究成果的质量,帮助决策者制定科学政策,帮助科研机构和学术期刊管理和评价研究成果,以及为科学研究提供数据支持。
科学计量的研究对象包括科学研究文献、科学研究人员、科研机构、学术期刊等。
二、科学计量的历史科学计量的历史可以追溯到20世纪初,当时美国科学家Eugene Gailey首次引入了科学计量的概念,他在1902年发表了《Science and the New Humanism》,并提出了一系列科学计量的指标和方法。
20世纪50年代后,随着信息技术和统计方法的发展,科学计量得到了进一步的发展和应用。
1960年,美国科学家Eugene Garfield创办了国际知名的科学计量学期刊《科学引文索引》,并提出了著名的“引文分析”方法,将引文作为科学研究成果的评价指标。
1983年,Garfield创办了科学计量学研究机构——信息资源公司(Information Research Corporation),并创办了著名的科学计量学数据库《科学引文索引》(SCI)。
目前,科学计量学已成为一个跨学科的研究领域,涉及统计学、信息科学、计算机科学、图书情报学等学科领域。
三、科学计量的指标科学计量的指标是衡量科学研究成果的重要标准,主要包括以下几种指标:1. 引文指标:引文是指一篇科学研究文献被其他文献引用的次数。
引文指标包括文献的总引用次数、引文频次、引文半衰期等指标,是衡量文献影响力的重要指标。
2. 影响因子:影响因子是指学术期刊的平均被引用次数,是衡量学术期刊影响力的重要指标。
影响因子由科技引文索引(SCI)数据库每年发布一次,能够反映期刊的学术水平和影响力。
3. H指数:H指数是衡量科学家学术影响力的指标,它的定义是一个学者的h指数是大于等于h的数量n 的最大正整数h。
《科技政策研究之科学计量学方法》读书随笔目录一、内容描述 (2)1.1 科技政策研究的背景与意义 (3)1.2 科学计量学方法的引入及其重要性 (4)二、科学计量学方法概述 (5)2.1 科学计量学的定义与发展历程 (6)2.2 科学计量学的主要研究内容与方法论 (8)三、科技政策研究中的科学计量学应用 (9)3.1 科技政策的研究对象与数据来源 (10)3.2 科学计量学在科技政策制定中的应用 (11)3.2.1 文献计量分析 (13)3.2.2 指标体系构建 (15)3.2.3 政策文本挖掘 (16)3.3 科学计量学在科技政策评估中的应用 (17)3.3.1 政策效果评估 (19)3.3.2 政策影响预测 (20)四、科学计量学方法的局限性及挑战 (21)4.1 数据获取与处理的困难 (23)4.2 方法论的局限性 (24)4.3 政策制定的复杂性 (25)五、结论与展望 (26)5.1 科学计量学在科技政策研究中的价值与贡献 (28)5.2 对未来科技政策研究方法的展望 (29)一、内容描述科学计量学方法的概述:简要介绍了科学计量学的概念、发展历程及其在科技政策研究中的应用。
科技政策的背景分析:阐述了科技政策的重要性、特点和背景,为读者理解本书内容提供了宏观背景。
科学计量学方法在科技政策研究中的应用案例:通过具体案例,详细介绍了科学计量学方法在科技政策研究中的实际应用,包括科技政策的制定、实施和评估等各个环节。
方法论探讨:深入探讨了科学计量学方法的理论基础、技术路线和实践经验,分析了该方法在科技政策研究中的优势与不足。
对当前科技政策的启示和建议:基于科学计量学方法的研究结果,对当前科技政策提出了有针对性的建议,旨在提高科技政策的科学性和有效性。
本书内容结构清晰,既适合从事科技政策研究的学者和专家阅读,也适合对科技政策感兴趣的普通读者阅读。
通过本书的阅读,读者可以更好地了解科学计量学方法在科技政策研究中的应用,为相关领域的研究和实践提供有益的参考。
一、统计推断中的假设检验常见的随机变量有标准正态变量Z 以及演变而成的t -Statistics 、CHI-Squares 、F-Statistics ;关于这四种随机变量的概率分布我们具备完全信息。
分析问题时把研究的具体问题转化为这四种随机变量的任何一种即可进行显著性假设检验。
假定已知μ和σ²的估计量S²,则可以用样本标准差(S )代替总体标准差(σ),得到一个新的变量t 。
一种检验方法可以采用各假设检验统计量的判别准则判断检验统计量数值落在假设检验的接受区域还是拒绝区域,从而作出是否接受原假设的结论;另一种方法可以比较检验统计量的伴随概率P值是小于还是大于等于显著性水平(α=0.05),若P值小于α,则认为小概率事件发生了,拒绝原假设,反之若P值大于α,则认为无充分证据拒绝原假设,接受原假设。
两种方法是等价的。
二、模型统计检验中拟合优度检验、方程的显著性检验(F 检验) 、变量的显著性检验(t检验)的逻辑关系?参数的置信区间预测目的何在?1. 拟合优度表明被解释变量的平均变动有多大比例可以由模型包含的解释变量来解释。
R2大说明样本回归直线的线性拟合程度较高;若R2较小时,我们无从判断回归直线的线性解释能力是否显著,或者说不能判断解释变量的联合体即各变量的线性组合与被解释变量的总体线性关系是否显著,需要将R2转化为F统计量进行显著性检验。
2. 方程的显著性检验等价于拟合优度检验,优点是可以进行显著性检验。
该检验旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。
H0:β0=β1=β2= ⋯ =βk=0H1:βj不全为0可通过该比值的大小对总体线性关系进行推断。
3. 方程的总体线性关系显著并不意味着每个解释变量对被解释变量的影响都是显著的。
因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。
这一检验是由对变量的 t 检验完成的。