当前位置:文档之家› 信息计量学复习

信息计量学复习

信息计量学复习
信息计量学复习

第一章绪论

1.信息计量学

(1)定义:采用定量的方法来描述和研究情报(信息)的现象、过程和规律的一门学科。它是数学和统计学与情报学广发结合而形成的情报学的一个新兴的定量性分支学科。广义信息计量学主要探讨以广义信息论为基础的广义信息的计量问题。狭义信息计量学主要研究情报信息(或文献情报)的计量问题。

(2)产生

信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的。情报的数量

远远大于文献的数量,其计量方法也远远大于文献的计量方法。(文献激增——产生矛盾——促使对文献的管理和使用;缓解矛盾——产生情报学——产生情报(信息)计量学)

信息计量学是情报学发展的需要和必然产物。定量化研究是情报学发展的重要方向和必

然趋势之一。这是因为情报学必然要从定性阶段向定量阶段发展;只有加强情报学的定量化研究,才能不断提高其科学性和精确性,从而有助于确立和提高它在整个科学体系中的学科地位。

一批接触的学科带头人和骨干力量推动了信息计量学的发展。

(3)发展

萌芽时期(1917~1933)文献计量研究比较分散,规模不大;

发展时期(1934~1978)

全面发展时期(1978至今)

发展趋势:从文献向信息计量发展;向自动化方向发展;向网络计量学方向发展

2.信息计量学与文献计量学

(1)文献计量学是以文献信息体系为研究对象,采用数学、统计学定量方法来研究文献信息的分布结构、数量关系和变化规律,并进而探讨科学技术的发展规律的一门新兴的分支学科。

(2)从信息计量学的概念和内容体系来看,信息计量学与文献计量学彼此交叉渗透,既有着许多共同的研究内容,又有着不尽相同的地方。

信息计量学着眼于信息本身的计量问题,文献计量学主要以作为情报载体的文献为计量

对象。

信息计量学较之文献计量学来说,其研究范围更广泛一些。除文献信息之外,还存在着

其他形式的信息。但是,文献信息是整个科学情报的主题。

再次,从任务和方法上来看,信息计量学研究的任务更为艰巨,更难找到恰当的定量方

法及途径。

3.信息计量学与科学计量学

(1)科学计量学是用定量方法研究科学学的一门学科,用以用户研究科学发展过程的各种定量方法的总和。

(2)信息计量学与科学计量学有联系也有区别。联系表现为:

从研究目的来看,两者都是要探讨学科活动之间的内在联系,都把科学发展的特性和规

律作为自己研究的基本任务之一。(科学计量学主要是从定量的角度来探讨学科发展的内在规律,最终促进科学技术的进步。而信息计量学的研究目的也在于探明科学文献本身的规律提高信息管理的科学性,通过信息规律的探讨进而解释科学技术的规律性。)从研究对象和方法来看,两者极为类似。科学计量学研究的科学文献及其数量,也是信

息计量学的研究对象之一。在方法上,两者都要用数学和统计学的定量方法,对科学文献等信息进行定量的分析研究。在研究内容上,二者在很大范围内都是彼此交叉的。

(3)但是应该指出信息计量学和科学计量学有很大的区别

信息计量学的范围比科学计量学的范围广得多。科学计量学仍然局限在科学文献及其数

量和非正式科学交流的消息、事件、实物等,而“狭义信息计量学”除了科学计量学的内容外还包括正式交流的事物信息。

研究目的不同。信息计量学研究目的是“服务信息科学的研究需求”,而科学计量学研

究的目的是“研究并验证科学的产生、传播、利用的量的规律性”。前者目的广泛,后者目的比较单一。

应用领域不同。信息计量学在文献、人才、学科、单位、数据评价方面发挥了很大的作

用、可以涉及的面非常广泛;而科学计量学在科学机制和科技政策的制定方面发挥了非常重要和独特的作用。

(4)由上面可知科学计量学必然向信息计量学方向发展,这和它研究内容和目的比较单一有关。信息计量学的研究目的和内容包含了科学计量学的研究目的和内容。

4.网络信息计量学

Webometrics和cybermetrics可以直译为“网络计量学”和“赛博计量学”。由于计量的

对象是网上的信息或计算机控制的信息,而非“网络”或“电脑”本身,因此直译为网络信息计量学或者网上信息计量学。

网络信息计量学是采用数学、统计学等各种定量方法,对网上信息的组织、存储、分布、

传递、相互引证和开发利用等进行定量描述和统计分析,以便揭示其数量特征和内在规律的一门新兴分支学科。主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科,也是信息计量学的一个新的发展方向和重要的研究领域,具有广阔的应用前景。

5.我国信息计量学的进展(7条)

(1)每年发表的文献量增长较快,并逐步形成了本学科的核心情报源;

(2)确立并提高学科的地位;

(3)主要分支领域的研究取得了重要成果;

(4)文献计量工具和手段的现代化取得了重要进展;

(5)专业教育起步快,发展迅速;

(6)形成了一支骨干队伍(核心研究队伍已经基本形成);

(7)国际交流与合作发展势头良好。

6.信息计量学的研究内容和研究方法(论述题)

(1)信息计量学的内容体系

信息计量学若干基本问题的探讨

信息的基本测度

几个基本定律的研究

信息流模型的研究

信息及量化方法的探讨

信息计量方法和工具的自动化实现方面的研究

在图书情报工作、信息资源管理、信息检索、信息分析与预测、科学学与科学评价

等领域的应用

(2)信息计量的方法体系

信息计量的方法体系主要有统计分析法、数学模型分析法、引文分析发、词频分析法、共现分析法、聚类分析法、计算机辅助信息计量分析法。

统计分析法:主要包括两个部分,一是信息计量的一些专业统计术语,二是数理

统计。数理统计的研究主要是两个方面:一是研究如何从总体中抽取样本,抽多

少,怎样抽的问题,即抽样方法的问题。二是研究如何对抽样的结果(样本数据)

进行合理的分析,做出科学的推断,即统计推断问题。

数学模型分析法:用某种数学语言描述系统的结构和行为而构造出来的,除了从

宏观的角度模拟出系统的结构和运动规律外,主要是从微观上、定量的方向描述

出系统的结构、联系以及运动规律。

引文分析法:引文分析就是用各种数学及统计学的方法和比较、归纳、抽象、概

括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进

行分析,以揭示其数量特征和内在规律的一种计量分析方法。

计算机辅助信息计量分析法:研究在理论分析的基础上,着重进行了计算机辅助

信息计量软件的设计与开发工作,实现了套录资料重组建库以及多种资料统计分

析的功能。该方法的建立标志着我国信息计量研究的方法体系已基本形成并日趋

完善。

第二章文献信息增长规律

1.文献信息流

在信息计量学中,通常把文献所含信息的汇流成为文献信息流。由于文献是信息的最基本的载体形式,文献信息流是一系列主题特征的科学文献的集合,所以有时将文献信息流简称为文献流。

2.文献信息流的特性(动态特性和静态特性)

主要有两个方面:文献信息流的静态特性和动态特性

(1)静态特性——在一定时间内科学文献在空间的分布性质,如集中----离散分布、文献按著者分布、词汇在文献中的分布、引文分布、主题相关分布等的规律性。

(2)动态特性——指科学文献随时间的延续而增长和老化的性质。科学文献既增长又老化,在增长中不断老化,在老化之中又不断增长;增长是文献信息流的主要趋势。

第三章文献信息老化规律

1.文献信息老化

一般而言,“老化”问题包括文献老化和情报(信息)老化。情报的老化是相对于情报对象而言,而文献的老化则是相对于情报用户而言的。

科学文献老化——指科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报源的价值不断减小,甚至完全丧失其利用价值。既是一种客观的社会现象,又是一个复杂的动态过程。

2.文献信息老化的度量指标

(1)半衰期——指某学科(专业)现实尚在利用的全部文献中较新的一半是在多长一段时间内发表的(共时半衰期)。这与该学科一半文献时效所经历的时间(历时半衰期)大体相当。

半衰期适用性:共时半衰期通常是评价某一学科领域或专业文献的老化趋势,而不是指个别文献;而历时半衰期,可以是某一学科文献老化的半衰期,也可以是一种期刊,甚至一篇文献老化的半衰期。

半衰期的计算:

①作图法将统计数据制成引文分布表,以引文累积量或引文百分累积量为纵坐标,以被引文出版的年龄为横坐标作图,在图中找出与纵坐标上引文累积量或百分累积量一半处的对应点的横坐标,即为所求结果。

②定量模型计算法对统计数据建立文献老化模型,再根据定义找出半衰期的计算公式,将相应数据代入求得结果。

(2)普赖斯指数——在几个知识领域内,把对年限不超过5年的文献的引文数量与引

文总量之比当作指数,用以量度文献的老化速度和程度。计算公式为:

出版年限不超过5年的被引文献数量

普赖斯指数= *100%

被引文献总量

普赖斯指数和半衰期比较:

一般说来,某一学科或领域文献的“普赖斯指数”越大,半衰期就越短,说明文献的老化速度就越快。

它们都是从文献被利用的角度出发,但是以不同的方式来反映文献老化的情况。

文献的半衰期只能笼统地衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既可用于某一学科领域的全部文献,也可用于评价某种期刊、某一机构,甚至某一作者或某篇文章的老化特点。半衰期概念可以适用于一般的情报老化,而普赖斯指数只适用于文献情报。

(3)剩余有益性指标

期刊有益性——某一年份某一期刊被用户所利用的文献数。

剩余有益性——经过若干年后,期刊还保留的有益性。

只是对与满足一定类型和内容的情报需求的几种期刊来说,才是有用的。

(4)中值引文年龄

第四章文献信息集中与离散分布规律——布拉德夫定律

1.布拉德夫定律的基本内容(图像、文字描述)

一般认为,布拉德福定律的基本原理是由其区域描述和图像描述两个部分组成的。

(1)区域描述

如果将一定时间内(通常一年)的按某学科载文量等级排列的期刊划分为三个区,使每一个区所包含的相关论文数量相等,即恰好等于全部期刊发表的该学科文章总数的三分之一,便可发现:第一区(核心区)所涉及的文章来自数量不多但效率很高的n1中期刊;第二区(相关区)包括数量较大、效率中等的n2中期刊;第三区(外围区)包括数量最大而效率很低的n3中期刊。

那么这三个区中的期刊数量成下列关系:n1:n2:n3 = 1:a:a2(a>0)(1)式中:a即布拉德福常数,或称比例系数。就布拉德福所分析过的数据而言,a值大约为5.0。上式即为布拉德福定量的区域表述形式,经过维克利的研究,可以把三个区讨论的文献离散规律推广到任意多个区的情况。

各区的期刊的载文量是逐区下降,而各区期刊数量则是逐区上升的。核心区情报密度最高,相关区次之,外围区情报密度最低。

(2)图像描述(书107 和111)

如果取上述等级排列的期刊数量的对数(lgn)为横坐标,以相应的论文累计数R(n)为纵坐标进行图像描述,便可得到一条曲线——布拉德福分散曲线。

分散曲线AB由两部分组成:对应核心区的上升的一段曲线AC和对于相继各区的直线CB,后来研究表明,拐点C点为核心区的分界点。

布拉德福在研究时发现,从图像出发还可以得到另一个结论,即:

n1:(n1+n2):(n1+n2+n3)=1:b:b2

记n1-2=n1+n2,n1-3=n1+n2+n3,则可将上式改为:

n1:n1-2:n1-3=1:b:b2 (2)其中,n1——核心区的期刊数量n1-2——核心区和第二区的期刊累积数n1-3——全部三个区中的期刊累积数,即期刊总数N b——分散系数(3)区域描述和图像描述的关系

区域描述方法是根据实际统计的具体数据,取近似值而概略地归纳出的,是一种近似的经验方法。从许多统计数据中都可以发现,几乎每一组统计数据都近似地满足(1)式,而

且每一组数据也只能近似地满足(1)式。

图像描述方法所依据的是与区域描述完全相同的统计数据,只是图像描述将统计的期刊数取对数,并利用了三个区中相关论文量相等这一近似条件而得到(2)式的结论的。因此,从数学观点来看,图像描述的可行的,从实际应用看来,图像描述也非常接近于反映文献的实际分布情况,甚至其近似程度比(1)式更为精确。

按布拉德福区域描述公式所产生的理论曲线与图像描述的经验曲线基本上是一致的,两种表现形式之间没有歧异性,而具有一致性。

2.布氏分布理论的组成和模型

(1)布拉德福分布理论的基本内容是研究科学论文在期刊中的分布规律及其应用,目前主要包括:一个定律,十来个经验公式和四个数学模型。

(2)布拉德福文献分散定律是布氏分布理论的核心内容。有两个基本点:一是等级排列,形成主体来源(期刊)的有序目录;二是确定相关论文在主体来源中的分布规律。具体研究方法包括区域分析法和图像分析法。布氏定律是布氏分布理论的最基本定律,是这一理论赖以存在的必要基础。

(3)布氏分布经验公式:布鲁克斯的直线分布公式、肯德尔的“布拉德福—齐普夫定律”的一般公式、莱姆库勒的所谓规范化公式、斯马利科夫的统一方程

(4)分布模型:布鲁克斯的混合泊松分布模型、纳兰南的序性流模型、阿拉麦斯库的科学扩散模型

3.布氏分布理论的发展趋势

(1)从目前情况来看,工作主要集中在两个方面。一是进行具体统计,验证布氏定律,并试图应用于实践。二是寻求普遍而精确的经验分布公式的理论解释,并取得了较大进展。(2)科学论文的分布受到很多因素的影响和客观条件的限制,带有主观性和模糊性。如果取得了数学表现上的突破后,就会更加完备、更具有普遍的指导意义。因此,今后发展的趋势将是更多的运用概率论、随机过程理论和模糊数学等工具,同时考虑多种因素的综合影响,结合文献工作实际,寻求更为精确、更为普遍适用的分布公式和数学模型。当前研究主要方向和要解决的问题是:

运用大量的统计数据,以严密的数学方法,对布氏定律进行严格的检验,比较各公

式的优劣,以尽快确立或寻求更为精确的规范化的数学模型。

深入研究布氏分布的机理,以寻求科学的统一的理论解释。

分析和研究其适用条件及局限性,并努力结合实际,大力开展应用研究;真正将理

论用于指导文献情报工作,以节约经费,节省时间,切实提高文献情报服务的效率。第五章文献词频分布规律——齐普夫定律

1.齐普夫定律的理论基础——最省力法则

每一个人的运动都是在一定的道路上进行的,而且受一个简单的基本法则的制约,千方百计的选择一条最省力的途径,这样一个法则称为最省力法则。

2.齐普夫定律

齐普夫定律的文字表述

在任何一篇文章中,词的出现频率都服从如下规律:如果把一篇较长文章(约5000字)中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D(或L)、若用F r表示频次,r表示等级序号,则有:F r*r = C(3)称为齐普夫定律的绝对频数表示法或频次表示法。式中C为常数。但这里的常数并不是绝对不变的恒量,而是围绕一个中心数值上下波动。

齐普夫定律不仅可以用词的绝对频数(频次)表示,而且也可以用此的相对频数(频率)

表示:令N为文章所包含的词汇总数(词容量),f r为第r级词的相对频率,则有f r = cr-1(4)称为齐普夫定律的相对频数表示法或频率表示法。其中,c仍为常量,且c=C/N,而f r=F r/N 齐普夫运用其“最省力法则”解释了这个定律。认为,在任何语言中,凡是使用频率高的词,功能总是不会太大。因为词义本身在这个场合中价值小,因而传递它们所需要的“力”就不大,所以,此的出现频率与等级序号的乘积基本上稳定于一个常数。

齐普夫定律的图像描述——齐普夫分布曲线(书141)

根据文献中出现的词频与等级序号的统计数据,建立F r与r的直角坐标系,用横坐标表示词的等级序号r,纵坐标表示相应的频次F r,就可以得到一条双曲线,即齐普夫分布曲线(a)。如果等级序号r与频次F r都取对数坐标,则图像就变成一条直线了,即齐普夫分布对数曲线(b)。

齐普夫定律的一般数学形式

(2)中的曲线若用等价的数学式表示,则为:lgr+lgFr=lgC

一般的,由解析几何知,斜率为b的任一直线可表示为:blgr+lgFr=lgC

如果将这一方程改写成类似(1)式的形式,则得:Fr*rb=C (5)

若b=1,则(3)式和(5)式相同,这与后来朱斯提出的齐普夫定律的修正式的一致的。第六章文献信息作者分布规律——洛特卡定律

1.洛特卡定律

文字表述(P167)

检验发现,生产2篇文章的作者大约是生产1篇文章作者数的1/4,生产3篇文章的作者数是生产1篇文章作者的1/9……,写n篇文章的作者数是生产1篇文章作者数的1/n2;且生产1篇文章的作者数的全体作者的60%左右。可表述为:

y(x) = y(1)/x2 (6)

y(1)为写1篇文章的作者数,y(x)为写x篇文章的作者数。

图像描述(书168)

洛特卡定律的特点

洛特卡定律实际上是科学论文在作者上集中与分散的分布现象,具有两个特点:

(1)洛特卡采用频次排序的方法,即按某类作者出现的频次大小排位,而非按照作者所写的论文多少来对作者进行等级排序;

(2)论文在作者上的集中与分散程度只限于平方反比关系,即只给出了这种集中与分散程度的单一描述。

2.科学生产力

第八章文献信息统计分析法

1.文献信息统计的原则和指标

指标:说明同类社会现象的某种数量特征的量。例如期刊量、相关论文量、流通量。指

标体系是指一系列相互联系的统计指标的集合。统计指标的设置原则:确定性原则、可获取性原则、简便性原则、单位要明确

文献信息统计的原则要求(P259)

(1)针对性:对不同的具体统计项目不同的要求,如统计的内容、指标的设置、数据处理的方法等,都要有针对性,不能千篇一律。

(2)准确性:数据和结果的准确性是文献信息统计的核心要求。只有文献数据准确,才能得出可靠的分析结论。统计中,很多工作都是为了这个目标服务的,如明确规定统计界限、指标含义、统计工具要有代表性、数据来源要广泛等,都是保证数据准确,使之更接近于实际。

(3)代表性:抽样统计的代表性较强的样本,要能代表总体,提高统计结果的可靠性

和分析结论的可信度。

(4)可比性:文献信息统计数据是分析判断的基础,设置文献指标和统计数据时,必须注意数据的可比性。这样才便于比较分析,得出有说服力的结论。

(5)累积性:累积数据可以是绝对数也可以使相对数。在文献信息统计研究中,常利用文献的累积数来说明问题。文献数据的累计时间越长,累积量越大,则越有理由提高文献统计的准确性。

2.文献信息统计的类型和基本步骤

(1)类型

出版物统计:出版物包括图书、期刊、期刊报告、专利文献等各种类型的文献。它

是文献统计的主要对象,对其数量进行统计分析是文献计量学的重要内容和途径。

包括按国别、学科、语种对书刊等文献量的统计,对科学期刊中登载某学科的文献

量的统计、对各出版社的书刊发行量的统计、对某学术团体或可研机构发表的专著、论文、专利等文献量的统计。

著者统计:统计著者的论文数有利于掌握科技发展的水平;同时也为人才学、科学

学研究提供数据。主要有:杰出著者量的统计;分别统计各学科或专业的文献的著

者数比例,以便分析它们的研究峰期及发展趋势,为科学学和未来学的研究提供依

据。

科技用语统计:专业术语的组成和数量变化在一定程度上反映者科学技术的交叉渗

透、兴衰起伏。

引文统计:对科学论文或著作所附的被引文献数量进行统计,或者利用引文索引工

具来统计有关引文量。以引文数据为基础的引文分析是很重要的常用的一种计量研

究方法。

其他有关文献信息利用的统计:主要指图书情报单位的业务统计,包括藏书统计、

沟通统计、读者统计以及其他文献情报项目的数量统计等。

(2)基本步骤

统计调查,确定具体方法、选准统计工具、明确指标项目、统计原始数据

统计整理,即对原始数据资料进行分门别类的加工整理,工作内容包括:计算、排

序、表示

统计分析,它是整个文献统计分析的关键步骤,包括统计数据的结论分析和误差分

析,分析方法有:理论指导下的分析、数值分析、图像分析。

第十章引文分析法

1.引文分析法:就是利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。

2.引文分析法的基本步骤

(1)选取研究对象:根据所要研究的学科的具体情况,选择该学科中有代表性的较为权威的杂志,确定若干期及若干篇相关论文作为统计的对象。

(2)统计引文数据:在选取的若干篇论文中,分项统计每篇论文后面的引文数量,引文的出版年代、语种、类型、论文作者的自引量等。根据研究的目的和要求,灵活掌握,自行确定。

(3)引文分析:在获取的引文的数据的基础上,根据研究目的,从引文的各种指标或其他不同的角度进行分析。

(4)作出结论。根据引文分析原理和其他一般原则进行判断和预测,从而做出相应的分析结论。

3.引文分析法的主要工具结构功能和特点(SCI-E 和ESI)

(1)SCI-E结构简介

①简易检索提供三种检索途径——主题、人名和地名,通过一系列简单的提示符或者提问式引导检索。

②全面检索——可以根据需要设定不同的限制条件,使用户可以查到最新、最全、最准确的信息,是比较专业的检索方法。

a.一般检索主题、著者、来源期刊名、著者地址四个检索途径

b.被引文献检索被引著者、被引著作、引文年代检索

c.结构检索用于检索化学反应和化合物的化学结构

d.高级检索允许使用检索项标记进行更复杂的检索,并能进行检索系列组合

(2)SCI-E特点

和其他版本一样,SCI网络版主要也是用以检索论文被收录和被引证的情况。

①特色链接

内部链接——被引次数、参考文献和相关记录的链接

外部链接——与ISI Chemistry Server(SM)、Derwent Innovations Index、Web of Science Proceedings、BIOSIS Previews的链接

②充分利用WWW网罗天下的强大威力,SCI网络版彻底改变了传统的文献检索方式:通用的浏览器界面,无需安装任何其他软件;全新的超文本格式,所有的信息都相互关联。

③SCI网络版每周更新,并且每次更新即更新整个系统中的所有链接,包括被引次数、参考文献、相关文献的链接。

④SCI网络版允许检索整个数据库或指定检索年份,目前数据可回溯到1945年,并且可检索所有被引证的著者,而非仅仅是第一著者。

⑤SCI网络版可以直接收录纯电子期刊,便于及时反映相关研究成果。

(3)ESI(美国《基本科学指标》)结构

ESI的主要内容包括引文排位、高被引论文以及引文分析三大主要模块。

引文排位,包括科学家、机构、国家和期刊排名表

高被引论文,包括高被引论文和热门论文排名

引文分析,包括基线和研究前沿列表

对各种表格和数据进行评论的内容,包括In-Cites、特殊话题、科学观察。引文排

位页面和高被引论文页面还提供了与顶尖论文页面、时间序列图的链接。

(4)美国ESI特点

①基本的分析工具

②服务对象的广泛深入

③综合全面的数据、论文和课题

④与其他信息资源的链接和整合

(5)美国ESI的评价功能:分析某个公司、研究机构、国家以及期刊的科学研究绩效;跟踪自然科学和社会科学领域内的研究发展趋势;分析评价员工、合作者、评论家以及竞争对手的能力;测定某一专业研究领域内科学研究成果的产量和影响力;进行学科结构、学科关系以及学科发展史的研究;为科学评价提供重要的数据源。

4. 评价期刊的主要测度指标:期刊载文量、期刊引证率、期刊被引率、平均引文率(包括平均引证率和平均被引率)、影响因子、即年指标、期刊自引率、期刊自被引率。

(1)影响因子:评价和比较一种期刊相对于同学科中其他期刊的影响力和重要性的指标。计算公式:影响因子=某刊前两年发表论文在该年的被引证次数/该刊前两年发表论文总数。(2)即年指标(ImmediacyIndex,也称当年被引指数):评价期刊中的论文被引证的速度,或者在同一年内期刊中的论文被引证的频率。即年指标=该刊某年发表的论文在当年的被引次数/当年发表论文的篇数。

5.引文耦合与同被引的异同

(1)引文耦合:指引证文献通过其参考文献(被引证文献)建立的耦合关系。

具体来说,如果A和B两篇文献共同引证了一篇或多篇参考文献,或者说它们共同具有某一篇或多篇同样的参考文献,则称A和B两篇文献具有引文上的耦合关系。

(2)同被引:同被引——指两篇(或多篇)论文同时被后来的一篇或多篇论文所引证,则称这两篇论文(被引证论文)具有“同被引“关系。

(3)异同

相同

①都是指两篇论文通过另外一篇或多篇论文建立起来的关系,所以都可以反映出文献之间的联系程度和结构关系,在引文分析中属于同一种类型:即以文献之间的联系程度作为计量单位的网络结构分析,从引文角度揭示论文的主题相似性,以及相互之间作用和联系。

②这两种分析方法都可用于研究文献关系,进行文献检索和揭示学科结构等。

区别

①引文耦合反映的是两篇引证文献之间的关系,同被引反映的是两篇被引证文献之间的关系。前者由两篇文献的作者共同建立的,后者是由引证它们的作者各自建立的。

②引文耦合强度是固定不变的(因为对于任意两篇已发表的论文来说,其后的参考文献是固定不变的),同被引强度则随时有可能发生变化(处于被动地位,等着其它文献来建立)。

③引文耦合反映的文献间的关系是一种固定的长久的关系,而同被引反映的则是变化的或暂时的关系。因此,引文耦合形成的模型的静态结构模型,而同被引则是动态结构模型。

④引文耦合是回溯的,属于“回向引证”,而同被引则是展望性的,属于“前向引证”。

⑤对于研究和解释科学文献的内在联系与规律,描绘科学发展的动态结构来说,同被引比引文耦合更具有优越性,更适合当代情报科学研究的对象是不断变化和发展的特点。

6.引文的聚类分析:文献聚类分析是聚类分析技术在引文分析领域的具体利用。文献聚类分析根据引文的不同特征,进行引文的分群聚类和分析研究。是指分析对象根据彼此之间的相关程度分成类群,使群内尽量相似,群间尽量相关,然后进行分析研究的过程。

7.引文分析法的局限性

著者引证文献是一个人为控制的思维和判断过程,而作为其表现形式的引证文献,仅仅是宏观的、表面的测度。

(1)文献被引证并不完全等于重要

(2)著者选用引文受到可获得性的影响

文献地理分布、著者语言能力、文献本身年龄和流通状况等影响

(3)引文关系上假联系的影响

引证文献的原因多种多样,两篇论文可能出于完全不同的原因或从不同的角度引证同一篇早期文献,一篇可能是引证其方法,另一篇可能是引证其结果,这样这两篇文献在内容上的联系就可能是虚假的;引文有些是发生在前言和篇名中,有些是在正文中,有些发生在结论或讨论中。

(4)马太效应的影响人们往往以“名著”、“权威”作为选择引文的标注,有的确是出于需要,有的则是为了装饰门面、太高自己论文的身价,从而掩盖和影响着文献引证的真实性。

第十二章信息计量学在信息资源管理与研究中的应用(论述)

1.核心期刊的定义及形成机理

指针对某一学科或专业领域来说,刊载大量专业论文和利用率较高的少数重要期刊,就

成为该学科(专业)的核心期刊。各种期刊的情报价值有大有小,在情报信息交流中所发挥的作用各不相同。这种情报价值交流作用的大小往往取决于相关论文在期刊中的分

布状况。对于某一特定期刊而言,少数期刊的相关学科或专业来说,少数期刊所含的相关情报量很大,而多数期刊的相关情报量却很少。

从文献分布的集中与离散规律出发,对核心期刊的形成机理至少和作两个方面的理论解

释:(1)受科学发展观客观规律的制约。因为科学期刊的产生和发展是由学科发展客观需要所决定的,而且每一种期刊都有自己的学科和专业性质,使得该学科论文高度集中于少数期刊上,形成文献分布的“堆加效应”。(2)某些人为控制的主观因素也会影响文献的分布和核心期刊的产生及发展。例如“马太效应”的影响,使大量的文献“堆加”在少数期刊上,形成文献分布的集中现象,同时在文献生产和交流过程中,许多现象要受到人为选择因素的影响,而人的选择要受“最省力法则”的支配。

2.核心期刊的测定概念

核心期刊的测定是文献信息计量学实际应用中的一项重要内容。研究和评价期刊质量,科学地确定核心期刊的范围,对于获得高密度的情报源,对于图书情报单位建立基本的核心馆藏,对广大科学工作者重点阅读本专业期刊内容等具有重要意义。

3.核心期刊测定的重要意义

(1)图书情报管理单位科学管理上的需要

期刊发行量很大而任何一个单位把这些期刊定全,没有必要也没有可能,只能有选择地订购少数核心期刊,就能满足读者的大部分的信息要求。因此,研究和评价期刊的质量、科学地确定核心期刊,不断提高订刊的合理性和准确性,是图情领域的重要研究课题,也是提高图情单位科学管理水平的一个重要环节。

(2)科技工作者重点阅读的需要

据不完全统计,目前科技期刊6万种,每年发表的论文400万篇以上,一个科学家或工程技术人员,面对数量如此庞大的文献,想要将本学科范围内的文献全部浏览或是阅读一遍几乎不可能,毫无疑问,科研人员只能有选择性的重点阅读本专业的核心文献。

(3)提高信息检索和文献信息服务效率的需要

只有了解各种期刊的特点和优缺点,掌握重要论文的出现规律与搜集途径,把握一批高质量的核心期刊,才能有针对性的做好信息检索和文献情报服务公司。在解决咨询和定题服务时,也必须充分利用各专业的核心期刊,提高文献情报服务的工作效率。

4.核心期刊的测定方法

(1)利用信息计量学工具和指标直接选定各学科的核心期刊,如SCI及其副产品《期刊引证报告》JCR提供的期刊被引量、影响因子等;

(2)利用文献计量学方法,按一定基本步骤测定。如果从测定的标准来划分,包括:以载文量为标准的方法,包括布氏定律法及百分比补偿和累积百分比法

以摘引率为标准的方法,包括文摘法和引文法

以流通量为标准的方法

综合评价法,主要是将几种方法同时运用,综合判断

第十三章信息计量学在科技管理与预测中的应用(论述)

考点:科学学研究、科学学和科学管理中的应用(基本原理、基本内容)、信息计量学与人才评价(原理和方法)、信息计量学与科技预测(是什么、有哪几方面内容(科学预测、技术预测、产品预测、科技事业预测、科技对经济社会影响))

1、信息计量学与科学学研究的基本原理与基本内容(P502)

科学学是门研究科学本身发展规律和组织结构的学科。

科学学的发展规律,在很大程度上是有人才、经费、成果的消长演变、增长速度、学科

构成及其比例关系来体现,而这方面的变化又反映在科学文献的各种变化上。这是因为科学文献是科技知识和成果的客观记录,是科学存在的表现形式。科学文献的数量和质

量是对科学技术水平的一种度量。根据科学文献的内容构成和数量的变化规律,可以归纳总结、分析或评价科学技术的历史和现状,以及预测整个科学系统发展趋势和发展规律。

基本内容:

(1)科学发展特点①科学发展速度加快②具有继承性③阶段性④交叉渗透性⑤科学发展重点的转移⑥科学劳动的集中性

(2)科学结构

①利用书目分析法 a.书目结构反映学科结构 b.书目数量变化反映学科发展的动态特性②利用引文分析法a.静态研究,如引文聚类形成的网络图b.动态比较研究 c.超结构的微观研究,利用二维空间来描绘跨学科的宏观聚类③利用词频分析法研究学科发展结构

(3)科技史

(4)科技政策

2、信息计量学评价人才的原理与方法(P513)

原理

(1)科技人员的成就与学术造诣与其发表的文献数量有关。一般而言,科学人员的发明越多,成就越大,他的文献,特别是专利文献以及在重要刊物上发表的文献就越多。

(2)科技人员的成就和学术造诣与其发表文献的被引次数有关。文献的被引次数的多少,在一定程度上反映了文献的质量和价值,从总体上反映了该文作者在学术界的影响和地位以及对社会的贡献,从客观和使用的角度证明发表论文的价值和作用。

方法:

(1)书目分析法。即统计某一时期各位科技人员在公开出版物发表的文章的篇数,并作为篇目,然后将各篇目比较,发表文章多的一般被认为成果较多。简单但不充分。

(2)引文分析法。一般采用4个指标:论文总数,被引证总数,每篇论文的被引次数,高被引论文数。具体方法是直接统计或者利用《科学引文索引》数据库统计出在一定时期内科学家所写论文的总被引次数,谁的被引次数高,谁就中选,比较客观可靠,因而在评选人才中得到了广泛应用。

3、科技预测的概念和内容(P538)

科技预测是根据预测学的基本原理以及科技发展的历史和现状,对科技的发展前景及其

对社会进步的影响程度进行分析和预测,从而得出预见性的结论。

五方面的内容:

(1)科学预测——关于科学发展前景的预测。预测整个科学体系的发展趋势,分析各学科的分化、交叉、渗透、综合的演变方向;预测现有学科的发展前景、可能出现的新学科特别是边缘学科和综合学科;预测某些科学理论的实用价值、科学技术化的发展趋势和周期演变规律。

(2)技术预测——关于技术的发展前景的预测。预测某些重大技术领域的发展前景、可能出现的技术发明、新材料、新工艺、新设备和新方法,预测新技术的应用领域。

(3)产品预测——利用信息计量方法可以预测产品开发和应用前景。

(4)科技事业预测——关于科学技术事业未来前景的预测。预测科研体制、科技队伍、科技图书、情报资料、科技交流、技术引进、技术转移等的发展前景。

(5)科技对经济、社会影响的预测预测科学技术对社会、经济发展等各方面的影响。第十四章信息计量学的新发展——网络信息计量学

1.网络计量学:网络计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存

储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示其数量特征和内在规律的一门新兴分支学科。

2. 网络计量学的研究内容和方法和特点

网络信息计量学的主要研究内容(P564)

(1)网络信息计量学的基本问题研究网络信息的类型和特点;网络信息计量的基本原理、基本方式、意义和作用以及发展趋势等。

(2)网络信息计量学的理论问题研究网络信息分布、增长、老化、关联和离散等规律研究

(3)网络信息计量学的方法问题研究基本测度指标,网络信息内容、结构的测度,网页的链接、影响因子分析,网络信息使用规律的测度,统计分析方法,数据挖掘方法等(4)网络信息计量的技术问题研究网络信息计量系统的机理与设计,文本、多媒体、多语言信息计量技术,智能代理计量技术,网络信息的计量评价系统,XML等环境下的计量问题等

(5)网络信息计量的应用问题研究网上电子期刊、电子图书馆等信息的计量分析,网络站点的增长、分布、联系等计量分析等

(6)网络信息资源计量管理对策问题研究资源配置计量问题,价值的定量评价,过滤的定量分析,共享效率的计量等

主要特征(P571)

①计量方便②统计全面③结果准确④学科新颖⑤方法精致⑥应用广泛⑦更新较快

主要研究方法(P580)

(1)网络链接分析法(2)相关分析法(3)内容分析法(4)统计分析法(5)可视化方法(6)数据挖掘法

3.网络信息计量学的研究意义

计量经济学复习要点1

计量经济学复习要点 第1章 绪论 数据类型:截面、时间序列、面板 用数据度量因果效应,其他条件不变的概念 习题:C1、C2 第2章 简单线性回归 回归分析的基本概念,常用术语 现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质是由固定的解释变量去估计被解释变量的平均值。 简单线性回归模型是只有一个解释变量的线性回归模型。 回归中的四个重要概念 1. 总体回归模型(Population Regression Model ,PRM) t t t u x y ++=10ββ--代表了总体变量间的真实关系。 2. 总体回归函数(Population Regression Function ,PRF ) t t x y E 10)(ββ+=--代表了总体变量间的依存规律。 3. 样本回归函数(Sample Regression Function ,SRF ) t t t e x y ++=10??ββ--代表了样本显示的变量关系。 4. 样本回归模型(Sample Regression Model ,SRM ) t t x y 10???ββ+=---代表了样本显示的变量依存规律。 总体回归模型与样本回归模型的主要区别是:①描述的对象不同。总体回归模型描述总体 中变量y 与x 的相互关系,而样本回归模型描述所关的样本中变量y 与x 的相互关系。②建立模型的依据不同。总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的。③模型性质不同。总体回归模型不是随机模型,而样本回归模型是一个随机模型,它随样本的改变而改变。 总体回归模型与样本回归模型的联系是:样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型。 线性回归的含义 线性:被解释变量是关于参数的线性函数(可以不是解释变量的线性函数) 线性回归模型的基本假设 简单线性回归的基本假定:对模型和变量的假定、对随机扰动项u 的假定(零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定) 普通最小二乘法(原理、推导) 最小二乘法估计参数的原则是以“残差平方和最小”。

金融计量学复习重点及答案

金融计量学复习重点及 答案 集团标准化办公室:[VV986T-J682P28-JP266L8-68PNN]

《金融计量学》复习重点 考试题型: 一、名词解释题(每小题4分,共20分) 计量经济学:一门由经济学、统计学和数学结合而成的交叉学科. 经济学提供理论基础,统计学提供资料依据,数学提供研究方法 总体回归函数:是指在给定X i 下Y 分布的总体均值与X i 所形成的函数关系(或者说将总 体被解释变量的条件期望表示为解释变量的某种函数) 样本回归函数、 OLS 估计量 :普通最小二乘法估计量 OLS 估计量可以由观测值计算 OLS 估计量是点估计量 一旦从样本数据取得OLS 估计值,就可以画出样本回归线 BLUE 估计量、BLUE :最优线性无偏估计量, 在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量 拟合优度、拟合优度R 2(被解释部分在总平方和(SST)中所占的比例) 虚拟变量陷阱、 自变量中包含了过多的虚拟变量造成的错误;当模型中既有整体截距又对每一组都设有一个虚拟变量时,该陷阱就产生了。 或者说,由于引入虚拟变量带来的完全共线性现象就是虚拟变量陷阱 ((如果有m 种互斥的属性类型,在模型中引入(m-1)个虚拟变量,否则会导致多重共线性。称作虚拟变量陷阱。)) ??)X |E(Y ?) )X |E(Y ( ??? :SRF 2 211i 21i 21的估计量。是的估计量; 是的估计量;是其中相对于ββββββββi i i i Y X X Y +=+=

方差分析模型、方差分析模型是检验多组样本均值间的差异是否具有统计意义的而建立的一种模型。 协方差分析模型、一般进行方差分析时,要求除研究的因素外应该保证其他条件的一致。作动物实验往往采用同一胎动物分组给予不同的处理,研究不同处理对研究对象的影响就是这个道理。 多重共线性 多重共线性是指解释变量之间存在完全的线性关系或近似的线性关系. 分为完全多重共线性和不完全多重共线性 自相关:在古典线性回归模型中,我们假定随机扰动项序列的各项之间,如果这一假定不 满足,则称之为自相关。即用符号表示为: 自相关常见于时间序列数据。 异方差、 异方差性是为了保证回归参数估计量具有良好的统计性质BLUE ,线性回归模型的一个重要假定是:总体回归函数中的随机误差项满足同方差性,即服从相同的方差。如果这一假定不满足,则称线性回归模型存在异方差性。 随机误差项: 模型中没有包含的所有因素的代表 例: Y — 消费支出 X —收入 、 — —参数 u —随机误差项 cov(,)()0i j i j E i j μμμμ=≠≠存在u X Y ++=βααβ

计量经济学 模拟考试题(第1套)

第一套 一、单项选择题 1、双对数模型 μββ++=X Y ln ln ln 10中,参数1β的含义是 ( ) A. Y 关于X 的增长率 B .Y 关于X 的发展速度 C. Y 关于X 的边际变化 D. Y 关于X 的弹性 2、设k 为回归模型中的参数个数,n 为样本容量。则对多元线性回归方 程进行显著性检验时,所用的F 统计量可表示为( ) A. )1() (--k RSS k n ESS B .) ()1()1(2 2k n R k R --- C .) 1()1()(2 2---k R k n R D .)()1/(k n TSS k ESS -- 3、回归分析中使用的距离是点到直线的垂直坐标距离。最小二乘准则 是指( ) A. 使() ∑=-n t t t Y Y 1 ?达到最小值 B. 使() 2 1 ?∑=-n t t t Y Y 达到最小值 C. 使t t Y Y ?max -达到最小值 D. 使?min i i Y Y -达到最小值 4、 对于一个含有截距项的计量经济模型,若某定性因素有m 个互斥的类型, 为将其引入模型中,则需要引入虚拟变量个数为( ) A. m B. m+1 C. m-1 D. m-k 5、 回归模型中具有异方差性时,仍用OLS 估计模型,则以下说法正确的是( ) A. 参数估计值是无偏非有效的 B. 参数估计量仍具有最小方差性 C. 常用F 检验失效 D. 参数估计量是有偏的 6、 在一元线性回归模型中,样本回归方程可表示为( ) A. t t t u X Y ++=10ββ B. i t t X Y E Y μ+=)/( C. t t X Y 10???ββ+= D. ()t t t X X Y E 10/ββ+= 7、 在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。 例如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出Y 对实际可支配收入X 的回归关系明显不同。现以1991年为转折时期,设虚拟变 量?? ?=年以前 , 年以后 , 1991019911t D ,数据散点图显示消费函数发生了结构性变化:基本 消费部分下降了,边际消费倾向变大了。则城镇居民线性消费函数的理论方程可

《计量经济学》复习重点及答案

各位同学:请大家按照这个复习重点进行认真复习,考试时请大家带上计算器,平时成绩占30%,期末占70%。 考试题型: 一、名词解释题(每小题4分,共20分) 计量经济学:一门由经济学、统计学和数学结合而成的交叉学科. 经济学提供理论基础,统计学提供资料依据,数学提供研究方法 总体回归函数:被解释变量的均值同一个或者多个解释变量之间的关系 样本回归函数:是总体回归函数的近似 OLS 估计量 :以残差平方和最小的原则对回归模型中的系数进行估计的方法。普通最小二乘法估计量 OLS 估计量可以由观测值计算 OLS 估计量是点估计量 一旦从样本数据取得OLS 估计值,就可以画出样本回归线 BLUE 估计量、BLUE :最优线性无偏估计量, 其估计量是无偏估计量,且在所有的无偏估计量中其方差最小。 拟合优度、衡量了解释变量能解释的离差占被解释变量的百分比。 拟合优度R 2(被解释部分在总平方和(SST)中所占的比例) 虚拟变量陷阱、 带有截距项的回归模型,如果有m 个定性变量,只能引入m-1个虚拟变量。如果引入了m 个,就将陷入虚拟变量陷阱。既模型中存在完全共线性,使得模型无法估计 方差分析模型、解释变量仅包含定性变量或虚拟变量的模型。 协方差分析模型、回归模型中的解释变量有些是定性的有些是定量的。 多重共线性 多重共线性是指解释变量之间存在完全的线性关系或近似的线性关系. 分为完全多重共线性和不完全多重共线性 ??)X |E(Y ?) )X |E(Y ( ??? :SRF 2211i 21i 21的估计量。是的估计量;是的估计量;是其中相对于ββββββββi i i i Y X X Y +=+=∑∑==2 22?i i y y TSS ESS R

金融计量学 习题3答案

金融计量学习题三 一、填空题: 1.平稳性检验的方法有___时间路径图法_______、__自相关系数法________和__单位根检验法________。 2.单位根检验的方法有:__DF检验________和___ADF检验_______。 3.当随机误差项不存在自相关时,用_____DF检验_____进行单位根检验;当随机误差项存在自相关时,用__ADF检验__进行单位根检验。 4.EG检验拒绝零假设说明___被检验变量之间存在协整关系_______。 5.DF检验的零假设是说被检验时间序列__非平稳________。 6.协整性检验的方法有EG检验和 JJ检验。 7.在用一个时间序列对另一个时间序列做回归时,虽然两者之间并无任何有意义的关系,但经常会得到一个很高的2R的值,这种情况说明存在__伪回归_问题。 8.建立误差校正模型的步骤为一般采用两步:第一步,____建立长期关系模型________________;第二步,___建立短期动态关系即误差校正方程___。 二、单项选择题: 1. 某一时间序列经一次差分变换成平稳时间序列,此时间序列称为(A)。 A.1阶单整 B.2阶单整 C.K阶单整D.以上答案均不正确 2.如果两个变量都是一阶单整的,则(D)。 A.这两个变量一定存在协整关系 B.这两个变量一定不存在协整关系 C.相应的误差修正模型一定成立 D.还需对误差项进行检验 3.当随机误差项存在自相关时,进行单位根检验是由(B)来实现。 A DF检验 B.ADF检验 C.EG检验 D.DW检验 4.有关EG检验的说法正确的是(A)。

A .拒绝零假设说明被检验变量之间存在协整关系 B .接受零假设说明被检验变量之间存在协整关系 C .拒绝零假设说明被检验变量之间不存在协整关系 D .接受零假设说明被检验变量之间不存在协整关系( 与A 重复) 三、多项选择题: 1. 平稳性检验的方法有(ABCD )。 A.散点图 B.自相关函数检验 C.单位根检验 D. ADF 检验 2.当时间序列是非平稳的时候(ABCD )。 A .均值函数不再是常数 B .方差函数不再是常数 C .自协方差函数不再是常数 D .时间序列的统计规律随时间的位移而发生变化 3.随机游走序列是(BD )序列。 A .平稳序列 B .非平稳序列 C .统计规律不随时间的位移而发生变化的序列 D .统计规律随时间的位移而发生变化的序列 4.下面可以做协整性检验的有(CD )。 A DF 检验 B .ADF 检验 C .EG 检验 D .Johansen 检验 5. 有关DF 检验的说法正确的是(BC )。 A . DF 检验的零假设是“被检验时间序列平稳” B . DF 检验的零假设是“被检验时间序列非平稳” C . DF 检验是单侧检验 D . DF 检验是双侧检验 三、计算题 1、下列为一完备的联立方程计量经济学模型: 011210132t t t t t t t t t Y M C I M Y P ββγγμααγμ=++++=+++

信息计量学复习题

第一章 1.信息计量学的发展逻辑过程:统计书目学—文献计量学—科学计量学—信息计量学 2.(了解)与文献计量学和信息计量学相类似,网络计量学的内容体系是由它的理论、方法 和应用三部分组成的,理论是基础,方法是手段,应用是目的。 3.信息计量学(名词解释):主要内容是应用数学、统计学等定量方法来分析和处理信息过 程中的种种矛盾;从定量的角度分析和研究信息的动态特性, 并找出其中的内在规律 4.信息计量学的三大定律:布拉德福定律、齐普夫定律、洛特卡定律 5.引文分析(名词解释):就是利用各种数学和统计学的方法和比较、归纳、抽象、概括 等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证 和被引证现象进行分析,以揭示其数量特征和内在规律的一种 文献计量分析方法 6.信息计量学与文献计量学的关系:从信息计量学的概念和内容体系来看,信息计量学与文 献计量学彼此交叉渗透,既有许多共同的研究内容,又 有着不尽相同的地方: 1)信息计量学着眼于“信息”本身的计量问题,文献计 量学主要以作为情报载体的“文献”为计量对象 2)信息计量学较之文献计量学来说,其研究范围更广泛 一些 3)从任务和方法上来看,信息计量学研究的任务更为艰 巨,更难找到恰当的定量方法及途径 第二章 1.文献信息流的特性:文献信息流的静态特性和动态特性。(静态特性是指在一定时间内科 学文献在空间的分布性质,如集中-离散分布、文献按著者分布、词 汇在文献中分布、引文分布、主题相关分布等规律性;动态特性是指: 科学文献随时间的延续而增长和老化的性质) 2.科学知识量的急剧增长的科学文献激增的主要原因 3.普赖斯是最早提出“文献信息指数增长规律” 4.文献信息增长规律的应用(论述):1)在科学学和科技史研究中的应用:通过文献数量的 增长变化规律来判断和预测科学知识的增长状况, 继而探索整个科学的发展规律,是科学史和科学学 研究中常用的方法。 2)在情报研究中的应用:从科学情报学的角度出发, 科学文献增长规律的研究是科技人员和情报工作人 员开展情报分析研究,掌握科技发展动态,进行科 学预测的可靠手段。科学文献数量的增长可以反映 一个国家某项技术发展的最敏感指标 3)在文献信息管理中的应用:一个图书馆或情报机构 确定经费的合理分配、资料搜集的原则、馆藏增加 的策略、存储空间扩大的措施、情报加工处理和传 递交流新技术的应用,等等,都要以科学文献的数 量及未来的增长趋势作为重要的决策依据 第三章 1.半衰期(名词解释):指某学科现时尚在利用的全部文献中较新的一半是在多长一段时间内

计量经济学模拟考试题第1套(含答案)培训课件

计量经济学模拟题 一、单项选择题 1、双对数模型 μββ++=X Y ln ln ln 10中,参数1β的含义是 ( C ) A. Y 关于X 的增长率 B .Y 关于X 的发展速度 C. Y 关于X 的弹性 D. Y 关于X 的边际变化 2、设k 为回归模型中的参数个数,n 为样本容量。则对多元线性回归方 程进行显著性检验时,所用的F 统计量可表示为( B ) A. )1() (--k RSS k n ESS B .) ()1()1(2 2k n R k R --- C .) 1()1()(2 2---k R k n R D .)()1/(k n TSS k ESS -- 3、回归分析中使用的距离是点到直线的垂直坐标距离。最小二乘准则 是指( D ) A. 使() ∑=-n t t t Y Y 1?达到最小值 B. 使?min i i Y Y -达到最小值 C. 使t t Y Y ?max -达到最小值 D. 使() 2 1 ?∑=-n t t t Y Y 达到最小值 4、 对于一个含有截距项的计量经济模型,若某定性因素有m 个互斥的类型, 为将其引入模型中,则需要引入虚拟变量个数为( B ) A. m B. m-1 C. m+1 D. m-k 5、 回归模型中具有异方差性时,仍用OLS 估计模型,则以下说法正确的是( A ) A. 参数估计值是无偏非有效的 B. 参数估计量仍具有最小方差性 C. 常用F 检验失效 D. 参数估计量是有偏的 6、 在一元线性回归模型中,样本回归方程可表示为( C ) A. t t t u X Y ++=10ββ B. i t t X Y E Y μ+=)/( C. t t X Y 10???ββ+= D. ()t t t X X Y E 10/ββ+= 7、 在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。 例如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出Y 对实际可支配收入X 的回归关系明显不同。现以1991年为转折时期,设虚拟变 量?? ?=年以前 , 年以后 , 1991019911t D ,数据散点图显示消费函数发生了结构性变化:基本

计量经济学复习要点

计量经济学复习要点-西北大学 一.单项选择 1.下列说法中那一项不属于应用计量学的研究目的的C经济政策评价 2.构造行为方程式的最重要依据为D变量间的技术 3.总体回归线是指D解释变量X取定值时,被解释变量Y的条件均值或期望值的轨迹 4.在一元线性回归模型Y=β1+β2x+μ中,若回归系数β2通过了t检验,则表达式B.β2≠0 5.在回归模型Y=β1+β2x2+β3X3+μ中,如果X2与X3高度线性相关,则与经典模型相比β2的方差C变大 6.经济计量模型是指C包含随机方程的经济数学模型 7.回归分析中定义的B解释变量为非随机变量,被解释变量为随机变量 8.若一元线性回归模型Y=β1+β2X+μ满足经典假定,那么参数β1、β2的普通最小二乘估计了β1、β2是所有线性估计量中B无偏且方差最小的 9 .D-W检验,即杜宾-瓦尔森检验,用于检验时间序列回归模型的误差项中的一阶序列相关的统计量,DW统计量以OLS残差为基础,如果DW值越接近于2 C则表明无自相关 10.容易产生异方差的数据为C横截面数据 二、名词解释 1.时间序列数据:指某一经济变量在各个时期的数值按时间先后顺序排列所形成的数列。 2.样本回归函数:指由样本的得到的回归函数,其表现形式为Yt=β1+β2Xt+et 样本回归函数是用来估计总体回归函数的。 3.统计关系:指两个变量X与Y之间存在的一种不确定关系。也就是说,即使变量X是变量Y的原因,给定变量X的值也不能具体确定变量Y的值,而只能确定定变量Y的统计特征。 4.几何分布滞后模型:对于无线分布滞后模型Y=α+β0Xt+β1Xt-1+∧+μt,库伊克提出了两个假设:①模型中所有参数符号都是相同的②模型中的参数是按几何数列衰减的,即βt =β0入j,j=0,1,2…式中0﹤入﹤1,入称为分布滞后的衰减率,入越小,衰减速度越快。X滞后的远期值对当期Y的影响就越小,带入后得到模型Yt=α+β0Xt+β0Xt-1+β0入Xt-1+β0入2Xt-2+∧+β0入jXt-j+∧+μt此模型称为几何分布滞后模型。 5.恰好识别:指在可识别的模型中,结构式参数具有唯一数值的方程。 6.计量经济学:是融合数学、统计学及经济理论,结合研究经济行为和现象的理论和实务。 7.两阶段最小二乘法:两个阶段分别应用最小二乘法,故叫做两阶段最小二乘法。 8.外生变量:指不是由模型系统范围决定的量。 9.虚拟变量:又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。引入哑变量可使线性回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且更接近现实。例如:反映文化程度的虚拟变量可取为1本科学历、0非本科学历,一般地,在虚拟变量的设置中,基础类型、肯定类型取值为1,比较类型、否定类型取值为0。

『金融计量学』 『金融计量学基础』

『金融计量学』 『金融计量学基础』 『The Fundamentals of Financial Econometrics』 『Analysis of Financial Time Series』 教学纲要 张明恒 上海财经大学经济学院 一、课程信息 题目:金融计量学基础或金融时间序列分析) 年级:07数量经济(中外) 代码:100098 时间: 共计13周,2011年2月21日~6月3日 周一10:05至11:45am (1207 教室) 周三15:25至17:05am (1207 教室) 二、课程目的 1)研究和掌握基本的金融时间序列的计量模型和分析方法2)描述金融市场的统计特征(非高斯、非平稳、非线性)3)理解金融时间序列的统计特征和计量局限性 4)训练发现问题、收集数据和量化模型的实证分析 三、课程背景 1)概率论和数理统计 2)计量经济基础

四、教材及读物 1)教材: ①Analysis of Financial Time Series by Ruey S. Tsay (John Wiley, 2005), 2nd Ed., ISBN 0471690740(Textbook). See, the website of Prof.Tsay https://www.doczj.com/doc/a69150439.html,/ruey.tsay/teaching/bs41202/sp200 7 或 ②金融时间序列分析(in Chinese) Translated by Prof. Pan, Pressed by 机械工业出版社, ISBN711118386X, 2006-4-1(Textbook). 2)读物: ①Essentials of Stochastic Finance - Facts, Models Theory by Albert N. Shiryaev, 2003, World Scientific. ②The Econometrics of Financial Markets by Campbell, Lo, and MacKinlay, 1997, Princeton University Press. ③Options, Futures, and Other Derivatives, 6th Ed. by J.C. Hull, 2005, Prentice-Hall. ④Modern Applied Statistics with S-Plus by W.N.Venales and B.D.Ripley, 1997, Springer. ⑤Modeling Financial Time Series with S-plus by E. Zivot and J. Wang, 2005, 2nd Ed., Springer. ⑥SAS系统与股票市场分析by 高惠璇etal, 1998, 北京大学. ⑦A.J. McNeil, R.Frey, and P.Embrechts, Quantitative Risk Management: Concepts, Techniques, and Tools, Princeton Press, 2005

计量经济学1—2

第二章课后习题 2.1(1)分别分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系。解:各国人均寿命(Y)与人均GDP(X1)之间的数量关系: Y=56.64794+0.12836X1 各国人均寿命(Y)与成人识字率(X2)之间的数量关系: Y=38.79424+0.331971X2 各国人均寿命(Y)与一岁儿童疫苗接种率(X3)之间的数量关系:

Y=31.79956+0.387276X3 (2)对所建立的回归模型近性检验(假设显著性水平α为0.05)。 解:各国人均寿命(Y)与人均GDP(X1)之间的回归模型检验: 1﹥经济意义检验:所估计的参数β1=56.64794,β2=0.12836,说明亚洲各国人均GDP每增加1美元,人均寿命将增加0.12836年,这与预期的经济意义相符。 2﹥拟合有度检验:可决系数R2=0.526082,说明所建模型整体上对样本数据拟合较好,即解释变量“人均GDP”对被解释变量“人均寿命”的一半多作出了解释。 3﹥统计检验:H0:β2=0,H1:β2≠0,因为P=0.0001<α=0.05,所以拒绝原假设,因此亚洲各国人均GDP对人均寿命具有显著影响。 各国人均寿命(Y)与成人识字率(X2)之间的回归模型检验: 1﹥经济意义检验:所估计的参数β1=38.79424,β2=0.331971,说明亚洲各国成人识字率每增加1%,人均寿命将增加0.331971年,这与预期的经济意义相符。 2﹥拟合优度检验:可决系数R2=0.716825,说明所建模型整体上对样本数据拟合较好,即解释变量“成人识字率”对被解释变量“人均寿命”的大部分作出了解释。 3﹥统计检验:H0:β2=0,H1:β2≠0,因为P=0.0000<α=0.05,所以拒绝原假设,因此亚洲各国成人识字率对人均寿命具有显著影响。 各国人均寿命(Y)与一岁儿童疫苗接种率(X3)之间的回归模型检验: 1﹥经济意义检验:所估计的参数β1=31.79956,β2=0.387276,说明亚洲各国一岁儿童疫苗接种率每增加1%,人均寿命将增加0.387276年,这与预期的经济意义相符。 2﹥拟合优度检验:可决系数R2=0.537929,说明所建模型整体上对样本数据拟合较好,即解释变量“一岁儿童疫苗接种率”对被解释变量“人均寿命”的一半多作出了解释。 3﹥统计检验:H0:β2=0,H1:β2≠0,因为P=0.0001<α=0.05,所以拒绝原假设,因此亚洲各国一岁儿童疫苗接种率对人均寿命具有显著影响。 2.2(1)建立浙江省财政预算收入与全省生产总值的计量经济模型,估计模型的参数,检验模型的显著性,用规范的形式写出估计检验结果,并解释所估计参数的经济意义(假设显著性水平为0.05)。

计量经济学复习材料

计量经济学复习材料 一、名词解释 1、时间序列数据(time series data):一批按照时间先后排列的统计数据。 2、截面数据(cross-section data):一批发生在同一时间截面上的调查数据。 3、虚变量数据():是认为设定的虚拟变量的取值,也称二进制数据,一般取0或1。 4、总离差平方和(total sum of squares):用TSS表示,用以度量被解释变量的 总变动。 5、残差平方和(residual sum of squares):用RSS 表示,用以度量由解释变量 引起的被解释变量变化的部分。 6、回归平方和(explained sum of squares):用ESS表示,用以度量实际值与拟 合值之间的差异,是由除解释变量以外的其他因素引起的被解释变量变化的部分。 7、可决系数(coefficient of determination):度量回归方程拟合优度的指标,为 由解释变量引起的被解释变量的变化占被解释变量总变化的比重。 8、随机干扰项(stochastic disturbance):也称随机误差项,指总体观测值与回 归方程理论值之间的偏差。 9、普通最小二乘法(OLS):用估计的剩余平方和最小的原则确定样本回归函数 的方法。 10、广义最小二乘法(GLS):是最具普遍意义的二乘法,可用来处理模型存在 异方差或序列相关的估计问题。 11、加权最小二乘法(WLS):是对原模型加权,使之变成一个新的不存在异方 差性的模型,然后采用OLS法估计其参数。 12、异方差性(heteroskedastictity):指对于不同样本值,随机干扰项的方差不 再是常数,而是互不相同的。 13、序列相关性(serial correlation):指对于不同样本值,随机干扰项之间不再 是完全相互独立,而是存在某种相关性。 14、多重共线性(multicollinearity):指两个或两个以上解释变量之间存在某种 线性相关关系。 15、间接最小二乘法(ILS):先对关于内生解释变量的简化式方程采用普通最 小二乘法估计简化式参数,得到简化式参数估计量,然后通过参数关系体系,计算得到结构式参数的估计量。这种方法称为间接最小二乘法。 16、二阶段最小二乘法(2ILS):估计联立方程计量经济学模型中的某个结构式 方程时,先用OLS对其中内生解释变量的简化式进行估计,得到它的估计值,用此估计值代替原结构式方程,用OLS进行估计。这种方法称为二阶段最小二乘法。 17、内生变量(endogenous variables):是具有某种概率分布的随机变量,它的 参数是联立方程系统估计的元素,由模型系统决定,同时也对模型系统产生影响。内生变量一般都是经济变量。 18、外生变量(exogenous variables):一般是确定性变量。具有临界概率分布的 随机变量。其参数不是模型系统研究的元素,会影响系统,但不受系统影响。 19、先决变量(predetermined variables):外生变量与滞后内生变量被统称为先 决变量。滞后内生变量是联立方程计量经济学模型中重要的不可缺少的一部

计量经济学选择题1

第一章绪论复习题 二、选择题 2、在同一时间不同统计单位的相同统计指标组成的数据组合,是(D ) A、原始数据 B、时点数据 C、时间序列数据 D、截面数据 3、计量经济模型的被解释变量一定是(C ) A、控制变量 B、政策变量 C、内生变量 D、外生变量 4、在一个计量经济模型中可作为结实变量的有( D ) A、政策变量 B、控制变量 C、内生变量 D、外生变量 E、滞后变量 5、下列模型中属于线性模型的有( B ) 6、同一统计指标按时间顺序记录的数据称为( B )。 A、横截面数据 B、时间序列数据 C、修匀数据 D、原始数据 7、模型中其数值由模型本身决定的变量是( B ) A、外生变量 B、内生变量 C、前定变量 D、滞后变量 11、在回归分析中,下列有关解释变量和被解释变量的说法正确的有( C ) A.被解释变量和解释变量均为随机变量 B.被解释变量和解释变量均为非随机变量C.被解释变量为随机变量,解释变量为非随机变量 D.被解释变量为非随机变量,解释变量为随机变量 一、单项选择题 1、将内生变量的前期值作解释变量,这样的变量称为( D )。 A.虚拟变量 B. 控制变量 C.政策变量 D. 滞后变量 2、把反映某一总体特征的同一指标的数据,按一定的时间顺序和时间间隔排列起来,这样的数据称为( B )。 A.横截面数据 B. 时间序列数据 C.修匀数据 D. 原始数据 3、在简单线性回归模型中,认为具有一定概率分布的随机数量是( A )。 A.内生变量 B. 外生变量 C.虚拟变量 D. 前定变量 9、同一时间,不同单位相同指标组成的观测数据称为( B )。 A.原始数据 B. 横截面数据 C.时间序列数据 D. 修匀数据 A.解释变量X1t对Yt的影响是显著的 B.解释变量X2t对Yt的影响是显著的 C.解释变量X1t和X2t对Yt的联合影响是显著的 D.解释变量X1t和X2t对Yt的影响是均

计量经济学复习大纲

计量经济学复习大纲 第一章绪论 1. 建立计量经济学模型的步骤及其要点? (1)如何正确选择解释变量? (2)如何确定模型的基本形式? (3)区分时间序列数据、横截面数据和虚变量数据。(4)何谓经济意义检验?检验的方法? (5)计量经济学模型成功的三要素及其关系。 2. 结合实际例子理解结构分析方法(弹性、乘数的运用及其模型参数解释)。 第二章一元线性回归模型理论与方法 1. 回归分析与相关分析的联系与区别? 2. 回归分析的主要目的和内容? 3. 总体回归函数PRF的内涵和形式(确定和随机)。 4. 随机干扰项的定义及其内涵? 5. 样本回归函数的形式及其与PRF的关系? 6. 线性回归模型的基本假设(结合现实经济例子给予解释说明)。 7. OLS法的原理及其参数估计量的估计方法(推导过程)、正规方程组的导出。 8. OLS估计量的计算公式(离差形式)及其参数经济意义解释(要求掌握回归函数的求解计算过程)。

9. OLS估计量的性质(要求掌握线性性、无偏性、有效性的涵义及其证明过程,基本推论要牢记且理解) 10. BLUE估计量与高斯-马尔可夫定理? 11. 一元参数估计量的概率分布形式、总体方差的无偏估计公式以及样本参数的标准差计算公式(要求牢记公式并熟练运用于计算)。 12. 拟合优度检验的原理(TSS、ESS和RSS的内涵及其关系)? 13. 变量显著性检验的方法原理(t检验) (1)小概率事件原理(零假设必须是一小概率事件)?(2)t统计量的构造? 14.. 缩小置信区间的方法:同等显著性水平下尽可能减小t检验临界值和样本参数的标准差。 一是增大样本容量;二是提高模型的拟合优度。 15. 本章练习题第2、3、7、8、9(样本参数估计量的性质)、11题要求熟练掌握。 第三章多元线性回归模型理论与方法 1. 理解偏回归系数的概念及其应用解释。 2. 多元线性回归模型的基本假定(标量和矩阵形式)。 3. 理解普通最小二乘估计的正规方程组及其参数估计量计算公式。 4. 理解最小样本容量的概念及其原理。 5. 熟练掌握和应用调整可决系数的计算公式及其与R2的关系

金融计量学习题及习题答案-上海财经大学

诚实考试吾心不虚 ,公平竞争方显实力, 考试失败尚有机会 ,考试舞弊前功尽弃。 上海财经大学《 Financial Econometrics 》课程考试卷一 课程代码 课程序号 姓名 学号 班级 Part 1 Term Explanation (20 marks ) 1.White Noise 2.RandomWalk 3.Akaike Information Criterion 4.Jarque-Bera Statistic 5.Chow Test Important Point : 1.White Noise :White Noise is the special case of stationary stochastic process. We call a stochastic process purely random or white noise if it has zero mean, constant variance and is serially uncorrelated. 2.RandomWalk: Random walk means that the stochastic process is nonstationary and value of this period is highly related to the past values. For example, the stock price today may equal the yesterday ’s price plus a random shock. Random walk without drift can be expressed as t t t u y y +=-1 3.Akaike Information Criterion: AIC provide a way to select the better regression model among several models by comparing their forecast performance. The lower the AIC, the better the forecast performance will be. AIC will also be used to determine the lag length in ARDL approach. 4.Jarque-Bera Statistic: The Jarque-Bera test is the test of normality. We first calculate the skewness and the kurtosis, and it is also based on the residual of the regression. The Jarque-Bera Statistic=)24 )3(6(2 2-+K S n , where S is the skewness and K is the kurtosis,

中国医科大学2018年7月考试《卫生信息管理学》考查课试题

(单选题) 1: 以作者本人取得的成果为依据而创作的论文、报告等,并经公开发表或出版的各种文献,属于( )。A: 零次文献 B: 一次文献 C: 二次文献 D: 三次文献 正确答案: (单选题) 2: 卫生信息化工作起源于( )。 A: 日本 B: 美国 C: 欧洲联盟 D: 中国 正确答案: (单选题) 3: 下列信息类型中属于按信息存在形式划分的是( ) A: 内部信息 B: 外部信息 C: 非记录信息 D: 语法信息 正确答案: (单选题) 4: 信息管理各理论学派中强调多学科、多领域团队工作与合作研究的是:( ) A: 信息系统学派 B: 信息管理学派 C: 信息用户学派 D: 信息交流学派 正确答案: (单选题) 5: "信息管理者即信息经纪人。"是哪种卫生信息管理者角色观的观点?( ) A: 资源管理观 B: 特性控制观 C: 作业辅助观 D: 信息经济观 正确答案: (单选题) 6: 卫生信息管理的应用学科中,研究卫生主管部门的信息化和办公自动化属于( ) A: 卫生行政信息管理 B: 卫生服务信息管理 C: 卫生信息生产管理 D: 卫生信息系统管理 正确答案: (单选题) 7: 下列关于信息标准化“四原理”中的简化原理的描述,正确的是:( ) A: 简化的原则是功能等效,从一组对象中选择确定简化的范围,应能包括被取代对象所具备的必要功能 B: 简化对象是系统内相关因素的关系以及系统与外部相关因素的关系 C: 简化的目的是为了经济、使之更有效地满足需要 D: 简化是相对的,确定的简化规范,只适用于一定时期和一定条件 正确答案: (单选题) 8: 作为实验室检验项目和临床观测指标的通用标识符可以解决实验室或诊断服务部门系统与临床医疗护理系统代码不一致无法转换的难题的是:( ) A: DICOM B: LOINC C: HL7 D: Snomed CT 正确答案: (单选题) 9: ( )用来区别和描述对象,是对象类的特征。 A: 数据元 B: 数据元概念 C: 表示

计量经济学期末复习习题

计量经济学期末复习习题 Ch1: 1、相关关系是指【】 A 变量间的严格的依存关系 B 变量间的因果关系 C 变量间的函数关系 D 变量间表现出来的随机数学关系 2、横截面数据是指【】 A 同一时点上不同统计单位相同统计指标组成的数据 B 同一时点上相同统计单位相同统计指标组成的数据 C 同一时点上相同统计单位不同统计指标组成的数据 D 同一时点上不同统计单位不同统计指标组成的数据 3、下面属于截面数据的是【】 A 1991-2003年各年某地区20个乡镇的平均工业产值 B 1991-2003年各年某地区20个乡镇的各镇工业产值 C 某年某地区20个乡镇工业产值的合计数 D 某年某地区20个乡镇各镇工业产值 4、同一统计指标按时间顺序记录的数据列称为【】 A 横截面数据 B 时间序列数据 C 修匀数据D原始数据 5、计量经济模型是指【】 A 投入产出模型 B 数学规划模型 C 包含随机方程的经济数学模型 D 模糊数学模型 6、设C为消费;Y为收入水平;消费函数为:C=a+bY+u;根据经济理论;有【】 A a应为正值;b应为负值 B a应为正值;b应为正值且小于1 C a应为负值;b应为负值 D a应为正值;b应为正值且大于1 7、回归分析中定义【】 A 解释变量和被解释变量都是随机变量 B 解释变量为非随机变量;被解释变量为随机变量 C 解释变量和被解释变量都是非随机变量 D 解释变量为随机变量;被解释变量为非随机变量 8、在模型的经济意义检验中;不包括检验下面的哪一项【】 A 参数估计量的符号 B 参数估计量的大小 C 参数估计量的相互关系 D 参数估计量的显著性 Ch2: 9、参数β的估计量具备有效性是指【】

信息计量学期末复习资料

1、 信息计量学有代表性的各种定义,其有共同之处,构成的基本要素为: a 是一门学科; b 采用数学、统计学等方法; c 以各类文献为基础; d 对文献及其各种特征进行定量统计分析 2、 信息计量学研究的内容是由研究的对象与任务决定的,形成三大模块:时间序列、信息 分布、引证研究。是以文献计量学为基础,向网络计量学发展 3、 信息计量学研究的方法体系:统计分析法,数学模型分析法,引文分析法,计算机辅助信 息计量分析法 4、 信息计量学形成的三个基本条件:文献可计量;大数量;有规律 5、 文献计量学的特点(现象):人为的计量、近似的统计、精确的计算 6、 信息计量学研究对象:消息、数据、事件、实物、文本和文献 7、 信息计量学研究的基本规律有哪些?文献增长/分散/老化/引用/著者/词频/利用…… P19 8、 图书馆有那些可量度的单位? 枚举图书馆常用的文献计量学单位(量度)或衡量一个图 书馆的基础指标是哪些?馆藏量/馆舍/TDB/用户数。藏书,建筑面积,年经费,工作人员…… 成为衡量一个馆大小的量度 9、 文献计量学特征变量:文献量/类型/读者/馆空间容量/文献信息检索点。如:期刊,学位 论文,专利,DB 10、 图书馆工作中的计量单位:利用率,满意度,文献购置结构,差错率,借阅率,拒 借率。藏书利用率=全年出借册数/全馆藏书总册数x100% 11、 从图书馆OPAC 查书,(小于100),可借状态下,在架的拒借率是与什么因素有关? 12、 信息计量工具:SCI (WOS ), SSCI A&HCI, ESI, JCR CSCD, CSSCI, CNKI SPSS 13、 文献计量学研究的是情报的“载体”表象—形式特征。 信息计量学研究的是情报 的“信息”知识—内容特征 14、 文献信息统计分析法类型有:出版物、著者、科技用语、引文分析、信息利用等统 计 15、 统计一般过程:收集 (聚集)\整理 (分类 / 整序)\分析(找规律)\推断(预测) 16、 统计特征值有:中位数,极差,众数,平均值,加权,环比 17、 情报吸收系数 I=N/M 统计时内发文总数/被利用的文献总数P262 18、 文献信息统计原则: 针对性,准确性,代表性,可比性,累积性 19、 文献增长规律研究的模型:与质量有关,指数;逻辑;滑动;直线 20、 增长模型。按指数曲线增长,其翻番如何计算,年增长量又如何计算 21、 普赖斯曲线的主要性质,特点时的文献累积量当年的文献累积量∞→---->+=-t t t F b ae k t F kbt κ)()0(1)( 22、 文献老化机理(现象) 内容:知识的时效性, 载体:物理的破损性, 理论:用户兴趣与 数模相对稳定性 (成本信价比提高) 23、 文献老化: 定义。。。。利用的减少论 内容的过时论 使用价值的衰减论 24、 方向: 文献老化理论—文献传播动态规律 /定量描述文献数模方法与老化规律 /文 献老化应用研究,指导馆藏建设等 25、 半衰期:在被使用的学科文献中,近期文献增长并占全部文献一半所花去的时间 26、 普赖斯指数 bt Ae t F A bt F =+=)(ln %100*)5(被引文献总引 量年被引文献P r ≤=λ λλ)(Ae t F ,bt ==)(0 ,4/1,2/1,4/31

相关主题
文本预览
相关文档 最新文档