基于引用的科学数据评价研究
- 格式:doc
- 大小:27.50 KB
- 文档页数:7
-"沿与热点•基于引文内容分析的图书学术影响研究——以《小科学,大科学》为例雷天骄1孙浩东1王鲁燕"(1.西北农林科技大学图书馆陕西咸阳712100)(2.中国农业大学图书馆北京100083)摘要:图书是学术产出的重要组成,对图书学术影响的评价意义重大。
普赖斯的著作《小科学,大科学》是科学计量学的奠基之作,具有研究意义°文章构建了引文内容属性标引体系,采取引文内容分析法,对SSCI、CSSCI数据库中《小科学,大科学》的被引情况进行统计、分析,揭示《小科学,大科学》影响的研究领域、研究主题,并对比分析了中外文文献引文内容分析结果,对《小科学,大科学》的进一步研究工作和图书的学术影响评价提出了建议。
关键词:科学计量;引文内容分析;学术影响;《小科学,大科学》中图分类号:G256.1文献标识码:A D0I:10.11968/tsyqb.1003-6938.2021030Research on the Academic Influence of Book under the Content Citation Analysis Method------Taking the Little Science,Big Science as an ExampleAbstract Books are important components of academic output,and it is of great significance to the evaluation of the academic influence of books.Price's book Little Science,Big Science is the foundation of Scientific Metrology and has research significance.A citation content attribute indexing system is constructed in this paper,and then it is applied to count and analyze the citations of Little Science,Big Science in SSCI and CSSCI database so as to explore the research fields and topics influenced by Little Science,Big Science,and then Chinese and foreign literature citation content are comparatively analyzed.Pertinence suggestions for further studies of Little Science,Big Science and the evaluation of the books v academic influence are put forward.Key words citation content analysis;academic influence;Little Science,Big Science在跨学科研究飞速发展的今天,学科间的联系越发紧密"而图书、论文作为科学知识记录和传播的载体也是紧密联系的,研究者在开展论文创作时经常参考前人的经典著作,为自己研究的开展奠定基础,提供依据。
成果主要研究内容、科学发现点、科学价值、同行引用及评价1. 引言1.1 概述本篇文章旨在介绍和分析我的研究成果的主要内容、科学发现点、科学价值以及同行引用和评价情况。
这项研究是基于特定主题展开的,通过实验设计与方法的应用,得出了一系列重要结论。
本文将详细描述这些科学发现点,并对其进行全面分析,同时评估其创新性贡献、实际应用前景以及未来可持续性和发展趋势。
1.2 研究内容在本次研究中,我着眼于某一具体领域或主题,并深入探索了相关问题。
经过系统的研究方法和实验设计,在多个方面开展了一系列实验,并获取了大量数据和结果。
我将详细讨论这些实验设置和方法,并对结果进行准确的分析与解释。
1.3 目的通过本次研究,我们旨在揭示以前未知或未被充分理解的事物,并提供新的见解、观点或策略。
具体而言,我们通过详细描述我们的科学发现点,希望为该领域增加新知识,并提供对不同利益相关方有益的信息。
我们还将探讨这些发现的科学价值,包括其创新性贡献、实用性以及对未来研究方向的启示。
以上是“1. 引言”部分的详细内容,简要概述了本文的目标、主题和范围,介绍了研究成果的主要内容和科学发现点,并提及了对科学价值与同行引用评价进行深入分析的计划。
2. 正文:2.1 科学发现点本研究的科学发现点主要包括以下几个方面。
首先,我们通过对大量数据的分析和实验验证,发现了某种特定基因与某种疾病之间存在明显的相关性。
进一步的实验表明,这种基因在疾病的发生和进展过程中扮演着重要角色。
其次,我们还发现了一种新型药物对该基因具有显著抑制作用,并能够有效地治疗相关疾病。
此外,我们还观察到该药物能够降低患者的血压、改善心血管功能等多种积极效应。
这些科学发现点为深入理解该基因及其在相关疾病中的作用提供了重要线索。
2.2 实验设计与方法为了探究上述科学发现点,我们设计了一系列实验并采取了多种方法进行验证。
首先,我们采集了来自不同人群的大量样本,并进行了DNA测序分析,以确定目标基因突变情况及其与相关疾病之间的关联性。
引文检索的评价功能的概念引文检索的评价功能是指对于科学研究领域的文献进行定量或定性评价的一种功能。
这个功能可以帮助研究人员快速了解和评估特定领域的现有文献,从而为其研究提供重要的背景知识和参考。
引文检索的评价功能基于引文分析的方法,通过对文献中引用的其他文献进行计数和分析来判断一篇研究的学术影响力和知名度。
在引文检索过程中,有以下几个主要的评价指标:1. 引用频次:通过统计一篇文献被其他文献引用的次数来衡量其影响力。
一般来说,被引频次越高,说明这篇文献对其他研究的影响力越大。
2. 引用网络:引用网络是由一篇文献与其引用的其他文献之间形成的关系网络。
通过分析引用网络的结构,可以了解一个领域内不同文献之间的连接情况,评估其在学术界中的重要性和地位。
3. 学科影响力:利用引文检索工具可以对文献进行学科分类和分析,从而评估一篇文献对特定学科领域的影响力。
这可以帮助研究人员了解一个领域内的重要研究成果和学术潮流。
4. 引用时效性:通过分析一篇文献被引用的时间分布,可以判断该文献的时效性和更新速度。
研究人员可以根据引用时效性的评估结果来确定其是否需要阅读最新的研究成果。
引文检索的评价功能对于科学研究具有重要的意义。
首先,它可以帮助研究人员快速了解一个领域内已有的研究成果,避免重复研究。
其次,通过引文分析和评估,研究人员可以对自己的研究进行定位和定位,确定研究问题和研究方法。
此外,它还可以帮助评估当前研究领域的研究热点和趋势,为科学研究提供参考和指导。
值得注意的是,引文检索的评价功能也存在一定的限制和挑战。
首先,引文分析仅仅基于已有文献之间的引用关系,可能会忽略一些独立贡献或新颖的研究成果。
其次,由于引文检索主要依赖于文献数据库,不同数据库之间可能存在差异,这可能导致结果的不一致性。
此外,一些因素(如自引用、作者影响力等)也可能影响引文分析的准确性和可靠性。
总之,引文检索的评价功能是科学研究中非常重要的一个环节。
循证药学名词解释循证药学是一种重视实验证据、综合各种形式资料,以科学方法来评价医疗措施和药物疗效的药学学科。
它是引用广泛、良好的科学证据,在分析应用药物的疗效、安全性和合理性,以及研究药物使用的策略、结果分析的药理学分支。
循证药学的宗旨是在确定最佳药物使用策略的基础上,研究药物治疗的疗效、安全性和效果,以及对患者优劣影响的不良反应。
循证药学名词解释:1.实验证据:在循证药学中,实验证据是药学研究的基础,也是医疗措施和药物疗效的评估的重要依据,通常由临床试验来体现。
2.科学证据:科学证据是用来说明特定医学问题,如药物治疗的有效性和安全性的,基于多种类型的科学数据的结果。
它包括临床证据、实验室研究数据,以及其他病例研究资料等。
3.临床证据:临床证据是一种通过在人群中进行试验研究,以有效和安全地评估药物疗效以及其他医疗措施是否有效的证据。
临床证据通常包括病例研究、对照试验、实验室研究和荟萃分析等,以确定药物的有效性和安全性。
4.实验室研究数据:实验室研究数据是药物研究中最常用的证据,可以确定药物本身的活性以及它与他物发生相互作用的机理,或者检测药物的质量和有效性。
它是在比较短的时间内测量一种药物的疗效,对于药物的有效性和实验室检测结果有重要的参考价值。
5.病例研究:病例研究是指以某一个或者一组病例作为研究对象,通过收集、分析和比较,以有效和安全地评估药物临床应用疗效的研究过程。
由于受研究者数量有限,病例研究有较强的主观性,只能作为药物有效性的一般参考。
6.综合各种形式资料:循证药学研究中会综合多种形式的资料的证据,以确定药物疗效和安全性的最佳结果,这些资料可以形成强有力的科学证据,从而更好地评估药物的疗效。
7.良好的科学证据:良好的科学证据是指严格按照科学方法分析、综合多种形式的资料,确定治疗疾病的最佳策略的科学证据,它可以为众多治疗决策提供充分依据。
8.评价医疗措施:评价医疗措施是指根据药物疗效、安全性和合理性,以及研究药物使用的策略、结果分析和不良反应等,来评价药物疗效和安全性,以便确定最佳使用策略的过程。
SCI、EI、ISTP、SSCI、CSSCI和CSCD介绍美国《科学引文索引》的英文简称,其全称为:Science Citation Index,,创刊于1961年,它是根据现代情报学家加菲尔德(Engene Garfield) 1953年提出的引文思想而创立的,由美国科学信息研究所(ISI)1961年创办出版的引文数据库,其覆盖生命科学、临床医学、物理化学、农业、生物、兽医学、工程技术等方面的综合性检索刊物,尤其能反映自然科学研究的学术水平,是目前国际上三大检索系统中最著名的一种,其中以生命科学及医学、化学、物理所占比例最大,收录范围是当年国际上的重要期刊,尤其是它的引文索引表现出独特的科学参考价值,在学术界占有重要地位。
时至今日加菲尔德仍是SCI主编之一。
SCI是由ISI(Institute for Scientific Information Inc.)美国科学情报所出版。
现为双月刊。
ISI除了出版SCI外,还有联机型据SCISEARCH。
ISTP (Index to Scientific &Technical Proceeding)也由其出版。
SCI是一部国际性的检索刊物,包括有:自然科学、生物、医学、农业、技术和行为科学等,主要侧重基础科学。
所选用的刊物来源于94个类、40多个国家、SO多种文字,这些国家主要有美国、英国、荷兰、德国、俄罗斯、法国、日本、加拿大等,也收录一定数量的中国刊物。
从SCI的严格的选刊原则及严格的专家评审制度来看,它具有一定的客观性,较真实地反映了论文的水平和质量。
根据SCI收录及被引证情况,可以从一个侧面反映学术水平的发展情况。
特别是每年一次的SCI论文排名成了判断一个学校科研水平的一个十分重要的标准。
SCI 以《期刊目次》(Current Content)作为数据源,目前自然科学数据库有五千多种期刊,其中生命科学辑收录1350种;工程与计算机技术辑收录1030种;临床医学辑收990种;农业、生物环境科学辑收录950种;物理、化学和地球科学辑收录900种期刊。
基于ESI与InCites的高校学科发展分析研究1. 引言1.1 研究背景高校学科发展一直是教育界和科研界关注的焦点之一,对于提高高校整体实力和提升国际竞争力具有重要意义。
近年来,随着科学研究的发展和信息技术的进步,基于ESI与InCites的高校学科发展分析研究成为了一种新的趋势。
ESI是一种基于Web of Science平台的评估工具,可以对学术领域的科研成果进行综合评估和排名。
而InCites则是一种基于ESI数据的分析工具,可以帮助用户对学术研究进行深入的分析和评估。
通过这两种工具,可以更好地了解高校在各个学科领域的表现,帮助学校更好地制定发展战略和目标。
在这样的背景下,本研究旨在探讨ESI与InCites在高校学科发展中的应用情况,分析数据来源与研究方法,以及通过案例分析和学科发展趋势分析来揭示高校学科发展的规律和趋势。
通过这项研究,可以为高校提供更科学的决策参考,促进高校学科的持续发展和提升。
【研究背景】至此结束。
1.2 研究目的本研究的目的是通过对ESI与InCites在高校学科发展分析中的应用进行深入研究,探讨其在评估学科影响力、发展方向和趋势方面的作用,进一步探讨如何优化高校学科发展策略,提升学科竞争力。
通过分析数据来源与研究方法,揭示ESI与InCites在高校学科发展分析中的数据来源及研究方法,为高校提供科学决策支持。
通过案例分析和学科发展趋势分析,总结高校学科发展的经验教训,为其他高校学科建设提供借鉴。
通过本研究的提出,旨在为高校提供更为科学的学科发展指导,促进高校学科的跨学科合作、学科交叉和学科创新,为高校提升学科质量和国际影响力打下良好基础。
1.3 研究意义高校学科的发展是整个学术领域的核心,对于提升学校的学术影响力和竞争力具有重要意义。
ESI与InCites作为评价学术水平的重要工具,其在高校学科发展分析中的应用已经逐渐成为一个研究热点。
本研究旨在深入探讨ESI与InCites在高校学科发展分析中的作用,以期为高校优化学科布局、提升学术水平提供科学依据。
文献计量的优秀文章文献计量是一种评估学术研究影响力和引用情况的方法。
通过分析文献的引用次数和被引频率,可以量化衡量一个学术研究的影响力和质量。
以下是一些关于文献计量的优秀文章及其相关参考内容。
1. 文献计量的发展历程:这篇文章回顾了文献计量的发展历程,从最早的引文索引和引文分析方法,到现代的基于Web的文献计量方法。
文章还介绍了文献计量在评价学术研究、科研政策制定和科研经费分配中的作用。
参考文献:- Garfield, E. (2006). The history and meaning of the journal impact factor. Jama, 295(1), 90-93.2. 文献计量的指标评价:这篇文章讨论了常用的文献计量指标,如影响因子、H指数和引用频率分析,并提出了评价这些指标的优缺点。
文章还探讨了文献计量指标的误用和滥用问题,以及如何正确解读和使用这些指标。
参考文献:- Hicks, D., & Wouters, P. (2015). The Leiden Manifesto for research metrics. Nature News, 520(7548), 429.3. 文献计量在学科评价中的应用:这篇文章介绍了文献计量在学科评价和排名中的应用。
作者通过分析不同领域的文献计量数据,提出了一种基于引用和被引频率的学科评价方法,并讨论了该方法的优缺点以及如何应对一些潜在的问题。
参考文献:- Van Raan, A. F. (1996). Advanced bibliometric methods as quantitative core of peer review based evaluation and foresight exercises. Scientometrics, 36(3), 397-420.4. 文献计量的社交媒体数据应用:这篇文章探讨了将社交媒体数据应用于文献计量的方法和问题。
基于ESI与InCites的高校学科发展分析研究近年来,高校学科发展分析研究备受重视,成为教育界和学术界关注的热点话题。
在这个背景下,基于ESI(Essential Science Indicators)与InCites的高校学科发展分析研究成为一种重要的方法和手段。
本文将结合ESI与InCites两大数据库,对高校学科发展进行深入分析,探讨其在学术界和实际应用中的意义和价值。
一、ESI与InCites的概念及特点ESI是由美国汤森路透(Clarivate Analytics)公司开发的一个基于Web of Science (科学引文索引)数据库的评价工具,用来评估全球科学研究的学术表现。
ESI将研究论文根据引用频次和影响因子等指标进行排名,为学术界提供了一个科学评价和比较的工具,成为评估高校学科发展的重要参考依据。
InCites是基于Web of Science数据库的一种科研评估和分析工具,能够提供科学研究的综合信息、引文分析、合作网络、性能评价等方面的数据,用于评估和分析高校学科的研究表现和学术影响力。
ESI与InCites的数据和分析结果为高校学科发展提供了丰富的信息和依据,有助于高校进行科学评估和决策,促进学科建设和发展。
具体来说,ESI与InCites在以下几个方面发挥了重要作用。
1. 学科发展趋势分析ESI与InCites提供了学科发展的趋势分析功能,能够通过长期数据对比,发现学科的发展方向和趋势,为高校学科发展规划提供科学依据。
2. 学科影响力评估ESI与InCites能够通过引文分析等方法,评估学科在全球范围内的学术影响力,帮助高校了解自身学科在国际学术舞台上的地位和影响程度。
3. 学术合作网络建设ESI与InCites能够分析学术合作网络,包括学校内部和国际间的学术合作情况,为高校建设科研团队、开展国际合作提供数据支持和决策依据。
4. 学科重点培育ESI与InCites还能对学科的具体研究方向、热点问题等进行分析,帮助高校确定学科重点培育方向和策略。
晋图学刊 2023(3):1-11ShanxiLibraryJournal 收稿日期:2022-08-28 定稿日期:2022-12-29作者简介:杨毓丽(1975-),女,硕士,副研究馆员,研究方向为情报分析。
E mail:2458901513@qq.com引文格式:杨毓丽.基于引文出版年光谱和波束图的学者学术评价与生涯分析:以JuditBar-Ilan为例[J].晋图学刊,2023(3):1-11.·青年论坛·基于引文出版年光谱和波束图的学者学术评价与生涯分析———以JuditBar-Ilan为例杨毓丽(大连理工大学图书馆,辽宁大连116024)摘 要:为科学评价某一学者学术生涯特征,了解其学术研究传承脉络,并客观评价其学术影响,运用引文出版年光谱分析和波束图(Beamplot)方法,以WOS和Scopus数据库为数据基础,构建了学者个人学术发展和影响力评价体系。
同时选择普赖斯奖获得者JuditBar-Ilan作为案例研究对象进行定量分析。
结果显示:与其他获奖者相比,Judit的学术生涯初创期和发展期较长;Judit是10位获奖者中唯一一位学术影响力达到顶峰时的学术年龄小于学术生产力的学者,Judit的学术创新是一个积微成著、量变催发质变的过程;其多年潜心磨砺而厚积薄发,但其获得专业认可的时间偏长;在其职业生涯中后期,一直呈现高产状态,并且存在不止一个产出高峰,发表了多篇引用率较高的经典论文,影响深远。
关键词:引文出版年光谱分析;波束图;JuditBar-Ilan中图分类号:G251.2 文献标识码:A 文章编号:1004-1680(2023)03-0001-110 引言科学家是人类科学事业的开拓者,分析他们的学术成就不但可以了解科学家学术生涯历程及分期,而且还能揭示出其学术兴趣变化规律。
目前定量评价的指标非常多,叶鹰[1]基于国际学术评价指标研究现状,将多个学者提到的指标归为如下三类。
SCI名词解释SCI,全称为Science Citation Index,是一种统计科学文献被引用次数的指标。
它基于学术论文的引文信息,包括一篇文章的引用被引文献的统计分析,是一种有力的研究评价指标。
SCI的历史可以追溯到1960年,这是美国和加拿大的传统文献数据库。
它包括了各个研究领域的权威期刊,也就是所谓的“SCI期刊”,一般来说,这些期刊的研究质量都比较高,被广泛认可,SCI期刊也是学术论文发表的重要平台。
SCI分为SCI-Expanded、SCI-Current Contents、SCI-Web of Science等三个子版本,其中,SCI-Expanded是最为基础的一个版本,收录最全面,SCI-Current Contents为了跟踪当前科学界的最新发表论文,收录最好但期刊数量最少,SCI-Web of Science则是基于两个版本的综合性版本,它们收集到的论文数量比较全面,可以更好地反映当前各个学科的研究水平。
在科学文献的引文分析中,SCI是一种重要的分析指标,可以帮助评估学术论文的贡献和影响,优秀学者和机构也把SCI当作衡量研究质量和学者影响力的重要指数。
SCI的指数加权系统可以根据引文文献的学术影响力进行分级,同时也用于评价一位学者的研究能力和学术地位,在学术社会中,SCI的引文指数也是很多学术机构和企业用于评价和评选学者的重要依据。
SCI的应用包括许多方面,可以帮助研究者评估论文的影响力,并在研究领域中取得更成功的结果。
它还可以帮助研究者了解论文的研究方向及其发展趋势,进而促进学术研究领域的发展。
同时,它也可以帮助组织评估团队或学者的研究能力,以及相关组织对论文的重视程度,以便对研究绩效和研究人员进行评估。
总而言之,SCI是一个宝贵的科学文献被引用次数统计指标,它可以有效地测量学术论文的影响力,为学者及有关组织提供研究成果的重要参照物。
它可以帮助评估研究的质量和进步,更好地指导研究者的学术发展方向,为学术机构和企业提供更可靠的评价标准。
基于引用的科学数据评价研究作者:丁楠黎娇李文雨泽白晋铭潘有能来源:《图书与情报》2014年第05期摘要:科学研究离不开数据的支持,科学数据评价是对科学数据实施有效管理、促进数据共享与重用的基础。
文章借鉴引文分析方法,选取数据发布量、数据被引量、数据平均被引频次及h指数等指标,构建了基于引用的数据评价体系,并以DCI中的人口调查数据为例进行了实证研究。
研究发现通过数据引用可以有效地对科学数据的发布及存储机构的影响力进行评估,而DCI虽然由于建立时间较短而不够成熟,但仍可为科学数据的定量评价提供强有力支持。
关键词:数据共享数据引用数据评价引文分析中图分类号: G250.25 ;文献标识码: A ; 文章编号: 1003-6938(2014)05-0095-05Scientific Data Evaluation based on Data CitationAbstract Data is the footstone of science research. The evaluation of scientific data can promote the management of scientific data, then facilitate the sharing and reuse of data. Based on the method of citation analysis, the authors propose a scientific data evaluation system which includes indices such as data publication, data citation, citation per data and h-index. An experiment is implemented with the data of population survey in DCI. The result shows this system is useful for the evaluation of institutions which published and stored scientific data. The result also shows DCI can provide strong support to the quantitative evaluation of scientific data.Key words data sharing; data citation; data evaluation; citation analysis1 引言现代科学经过数百年的发展,产生了数量庞大而又结构复杂的科学数据,在这些已有数据的基础上开展进一步研究是科学研究的一种重要模式。
从某种程度上来说,基础数据的质量直接决定了研究的质量,因此科学数据的评价具有重要意义。
然而目前国内外学界尚缺乏统一的数据引用规范[1-3],也没有完整的科学数据评价标准,这为科学数据的评价带来了很大的困难,也影响到了作者和机构共享数据的积极性。
本项研究试图借鉴传统的引文分析,探讨基于引用的科学数据评价方法,选择合理的评价指标,从而达到对科学数据及相应的机构和数据仓储进行客观、有效地评价的目的,促进数据的共享与利用。
图书情报学领域的专家学者在引文分析研究中已经积累了宝贵的经验并形成了一些较为成熟的方法,这些经验与方法可为数据引用分析提供借鉴。
但数据引用分析与引文分析仍有明显区别,引文分析的对象主要是文献,而数据引用分析的对象是原始数据或派生数据,在科研素材体系中处于更底层的位置,其粒度也相对更细。
对数据引用进行分析可以从更原始、更基础的层面上了解科研产出情况,从而提供一个新的对科研机构或学者进行评价的视角。
2 数据评价概述目前专门针对科学数据评价的研究尚不多见,绝大部分的相关研究都是直接针对“数据”这一概念,大致可以分为两种类型:一种是如何评价一般开放数据,即对数据本身的评价;另外一种则是如何评价特定数据环境中的数据,即将数据置身于数据库或信息系统中进行评价。
(1)对数据本身的评价。
对数据本身的评价方法可分为单维度准确性评估和基于多维度指标的评价等。
在单维度准确性评估中,针对总量数据,可采用逻辑规则检验、经验参数比对、相关指标变动趋势对比、基于模型的异常数值识别与参数稳定性分析等方法,针对个体数据,则可采用统计分布检验与基于统计分布的异常数值识别、基于事后重复调查的偏差估计、误差效应的测量及其模型建构等方法[4]。
基于多维度指标的评价方法通常在给出精确性(给定数据集合与相应正确实际的相符程度)、可达性(数据可以得到的程度)、一致性(数据能以相同格式表达的程度)、完整性(数据无缺失的程度)、时效性(数据的时间特性对应用的满足程度)等指标的定义和计算方法的基础上,对计算结果进行再加工[5-6]。
(2)对特定数据环境中的数据的评价。
根据所处数据环境的不同,该类评价方法又可细分为基于数据库的评价和基于信息系统的评价。
在基于数据库的评价中,依照用户的不同可将评价指标分为数据使用质量和数据质量两方面。
数据使用质量包括数据查询率、安全性、敏捷性、可响应性、可使用性(可采集到的数据是否在数据超市中得到应用)、有效性(数据的更新频率);对数据质量的评价存在于数据仓库其他模块对数据的操作当中,是反映数据仓库物理层数据的固有属性,包括完整度(非法空值记录的条数)、可信度、正确度(缺省值的记录条数)、一致性、唯一性等[7]。
在基于信息系统的评价中,数据被视为有生命周期的产品,从数据表示质量、数据值质量、数据模型质量和数据体系结构质量4个维度,对数据质量进行评价[8]。
以上两种方法在进行数据评价时,尽管针对层面和开展角度有所不同,但都需要建立一个评价体系并设立各种指标,此外还需确定指标的权重,从而不可避免地具有较大的主观性。
更为重要的是,该类评价方法的适应性在复杂的数据环境中将遭受极大的考验,正如很难有一套指标体系直接对各个学科中的论文质量进行评价一样。
因此,本项研究将摒弃直接对数据质量进行评价的思路,而试图通过科学数据被引用的情况来评价其影响力,并从侧面反映数据的质量及重要程度,从而保证了该评价方法的客观、有效及广泛的适用性。
3 基于引用的科学数据评价数据引用类似于文献引用,是指作者在论文中以参考文献、脚注或文中注等方式,对其所引用的数据提供来源出处的做法。
与文献引用类似,数据被引用意味着数据进入了交流领域被获取和使用,并产生影响。
数据引用不但意味着使用者对被引用数据及其所有者的认可,还可在数据管理与共享中起到重要作用。
首先,科研工作者可通过数据引用信息定位并获取数据,从而促进数据的共享与重用;其次,科研人员或管理者可通过数据引用获取科学研究的原始数据,重现研究过程,从而对其结果进行验证;最后,数据引用可以增强数据生产者的被认同感,激励研究人员进行科研创造和共享。
目前,基于文献引用的引文分析方法在长期发展中已趋于完善和成熟,并被广泛应用于各个层面的测度评价研究,包括微观层面(作者个人、研究小组)、中观层面(机构、期刊)和宏观层面(国家、跨国区域)。
常用的引文分析指标则有发文量、被引量、篇均被引次数、影响因子、h指数等,其中发文量和被引量是两个基本的测度,篇均被引次数和影响因子主要用于衡量机构或期刊论文的平均影响力。
由于影响因子可以消除由于载文量不同和论文质量参差不齐所造成的对期刊被引率的影响,从而能够在不同期刊间进行比较,目前已在引文分析和期刊评价中得到广泛应用。
h指数是近年新出现的一种评价指标,综合考虑到了论文发表的数量和质量,在各个层面的测度评价中具有较强的适应性。
因为数据引用与文献引用之间的相似性,这些指标也可以被数据引用分析所借鉴。
参照引文分析方法,并综合考虑数据评价的特点与可行性,本项研究拟选取微观层面的团体作者和中观层面的数据仓储作为研究对象,统计其数据发布量、数据被引量、数据平均被引频次及h指数。
其中,数据发布量即一定时间段内某研究团体或数据仓储发布的总数据量,发布数据是被引用的前提,所以该指标是基于引用的数据质量评价的基本指标;数据被引量即发布的所有数据被引用的总次数,用于衡量某研究团体或数据仓储所发布数据的总体影响;数据平均被引频次即数据被引量除以数据发布量,该指标用于衡量某研究团体或数据仓储所发布数据的平均影响;h指数则综合考虑数据的质和量,某个研究团体或数据仓储的h指数为n是指其发布的数据中至少有n条数据每条被引了至少n次。
2012年10月,全球领先的信息供应商汤森路透旗下的知识产权与科技事业部宣布推出数据引用索引(Data Citation Index,DCI),并将其作为Web of Knowledge平台上一个新的研究资源,旨在推动对数据的检索、引用与评价,并把这些数据与Web of Knowledge中的文献连接起来。
借鉴SCI、SSCI等引文索引系统的成功经验,数据引用索引试图为数据的管理、共享、评价提供强有力支持。
使用者只需在数据引用索引中进行检索,便可获得所需要数据的元数据信息,包括数据的创建者、机构、标题、创建日期等,还可链接到所在数据仓储(Data Repository)中。
数据仓储是数据的实际存储地,其中包含数据研究(Data Study)和数据集(Data Set)。
一个数据研究中往往包含了若干个数据集,例如某数据仓储中存有大量人口普查数据,所有这些数据可作为一个数据研究,而这些数据又可分为20世纪70年代的人口数据、20世纪80年代的人口数据等,这些不同年代的人口数据即是多个数据集。
对数据仓储来说,数据引用索引的出现不但能提高其数据的被引率,还完善了其元数据,提供了引用信息,让数据生产者知道有哪些作者或机构利用了其数据,也让数据使用者了解到哪些数据属于高被引数据[9]。
数据引用索引的出现有利于建立有效的数据评价机制,激发数据生产者和拥有者共享数据的积极性。
4 应用实例4.1 方法与数据考虑到数据的相对全面性和完整性,本项研究选择Web of Science的DCI数据库作为数据来源。
因为DCI目前所收录的数据量还较为有限,其中图书情报学领域的数据尤为少见,本项研究选取了和图书情报学同属于社会科学大类的人口调查领域进行研究,即在主题检索中输入Population Survey进行查询,时间范围为1900~2014年,共获得13796条数据,然后将数据以txt形式下载并导入Excel中进行处理及统计分析。
需要注意的是,不同于Web of Science核心合集,DCI目前的功能尚不完善,平均被引频次及h指数等均需下载数据后自行计算,而作者及机构信息也需进一步精炼。