关键词标引常见问题探讨
- 格式:doc
- 大小:29.00 KB
- 文档页数:10
论文写作中的关键词选择和使用技巧在撰写论文时,选择和使用恰当的关键词是非常重要的,因为关键词能够准确地反映文章的主题和内容,有助于提高论文的可被检索性、引用率和引起读者的兴趣。
本文将探讨论文写作中的关键词选择和使用技巧,帮助读者提升论文的质量和可读性。
一、关键词的选择1. 主题相关性:在选择关键词时,首先要确保关键词与论文主题密切相关。
关键词应能准确地概括论文的研究内容,能够被他人理解并与该领域的相关研究联系起来。
2. 学科导向:关键词应该与所属学科领域一致。
例如,若论文属于心理学领域,适当的关键词可能包括“心理学”、“认知”、“情绪”等,而不应使用与心理学无关的关键词。
3. 关键词的广度:关键词应选择具有一定广度的词语,能够涵盖论文的各个主要方面。
通过选择广度适当的关键词,可以使论文涵盖面更全面,提高文章的可读性,同时也使得作者在学术交流中更容易被其他研究者发现和引用。
4. 学术权威性:在选择关键词时,优先选择具有学术权威性的词语。
这些关键词通常是特定领域的核心概念或热点问题,能够反映出作者在学术研究中的深度和广度。
二、关键词的使用技巧1. 关键词的位置:在论文中,关键词通常出现在摘要部分后面。
关键词一般以粗体形式出现在论文摘要的下方,使其在文献检索时容易被注意到。
2. 关键词的数量:根据学术期刊或论文要求,通常需要提供3-5个关键词。
过多的关键词可能会导致关注点不够集中,而过少的关键词则可能导致搜索引擎无法准确识别文章所属领域。
3. 术语使用:在关键词的选择中,应该避免使用过于专业化的术语。
理想情况下,关键词应该使得读者无需具备过多专业知识就能够理解文章的主题和内容。
4. 同义词和近义词:在关键词的选择中,可以考虑加入同义词和近义词。
这样做能够提高文献检索的覆盖面,增加文章被引用的机会。
5. 更新关键词:随着研究的深入,某些关键词可能会过时或不再准确地概括文章的主题。
因此,在修订和更新论文时,需要重新评估并更新关键词,以确保它们能够最好地反映文章的研究内容。
阅读理解中的关键词辨析技巧在阅读理解中,正确理解和辨析关键词对于准确把握文章主旨、思路和细节非常重要。
本文将介绍一些关键词辨析的技巧,帮助你提高阅读理解的能力。
一、同义词与近义词辨析在阅读理解中,有些文章会使用同义词或近义词来表达相同的意思。
例如,文章可能使用"buy"一词来描述购买行为,而另一篇文章则使用"purchase"这个词。
因此,我们在阅读的过程中要注意寻找并理解这些同义词或近义词的含义。
例如,当我们阅读一篇有关创业的文章时,文章中可能会出现"start a business"和"establish a company"这两个短语。
虽然这两个短语看起来不完全相同,但它们实际上表达了相似的意思。
我们需要通过对上下文的理解,确定它们的含义是相同的。
二、正反对比词的判断有些文章中会使用正反对比的词汇,以表达不同的观点、观点变化或者转折关系。
正确辨析这些词汇对于理解作者的意图至关重要。
例如,文章可能使用"although"来引出一个转折关系,表明作者将在之后介绍一个相反的观点。
而使用"however"则意味着作者要提出一个与之前观点相对立的观点。
通过正确理解这些正反对比词的含义,我们能更好地理解作者的论述。
三、因果关系词的判定在阅读理解中,我们经常会遇到因果关系的表达。
正确辨析因果关系对于理解文章的逻辑和推理过程至关重要。
例如,文章可能使用"because"来说明一个原因,指出某个事情发生的原因。
而使用"therefore"则表明某个观点是基于之前的论证而得出的结论。
通过正确理解这些因果关系词的含义,我们能更好地把握作者的论证逻辑。
四、数量词与程度词的辨析在阅读理解中,数量词和程度词的使用可以帮助我们理解作者所表达的具体度量或者程度。
例如,文章中可能使用"many"来表示某个事物的数量众多,而使用"few"则表示数量很少。
龙源期刊网
论文中关键词标引原则
作者:
来源:《中国中医药信息》2012年第07期
关键词是指论文中最能反映主题信息的特征词汇、词组或者短语。
关键词包括主题词和自由词。
主题词是规范化的关键词,如美国国立医学图书馆编印的“Medical Subject Headings”(MeSH),中国医学科学院信息所编译的《医学名词与主题词(MeSH)对应表》,中国中
医科学院信息所编印的《中医药学主题词表》;而关键词是自然标识词,即非限定词,选择比较灵活。
标引关键词原则上是以主题词为主,若主题词无相应的词,通常选择上位词、同义词,或者采用组配等方法,自由词尽量少用。
具体要求如下。
①关键词一般选择3~8个。
②从文章题目、摘要或正文中选取能表达文献主题的、
有实质意义的词,能恰当反映文章的关键内容,及对读者有实际意义的主题概念,切忌仅就论文的题名选词,更不能望题生意地构词;选取关键词时还应顾及名词在文中的逻辑关系,不可随意罗列,应体现一定的层次性。
反映论文研究目的、对象、范围、方法和过程等内容的关键词在前,揭示研究结果、意义和价值的关键词在后。
③应尽量选用已经被上述词表收录的、已经规范化的词语;未被词表收录的新技术、新学科等重要术语以及文章题名中的人名、地名也可作为关键词标出;必要时可以选用自由词。
④主题词中的缩写词应按MeSH还原成全称,如“HBsAg”应标引为“乙型肝炎表面抗原”。
⑤不能以非共知共用的外文缩写作为关键词。
⑥凡有英文摘要的文章,应标注与中文对应的英文关键词。
(本刊编辑部)。
护理论文写作中关键词标引常见问题讨论编译关键词是科技论文的文献检索标识,是对全文主题的概括。
在科技论文中正确地标引关键词,是快速、准确地检索到论文的重要保证。
关键词的标引是科技论文撰写的一下基本要素。
本刊编辑部针对目前已出版的护理论文中关键词标引的常见问题进行总结,供读者参考。
11关键词不能反映文章重要主题关键词是反映论文主题的重要内容,部分护理论文在关键词的标引中忽视这一重点,例如“心脏外科ICU护士术前访视在冠状动脉旁路移植术患者中的应用和效果研究”一文关键词为“心脏外科、冠状动脉旁路移植术、ICU护士”,这样就遗漏了本文最重要的关键词“术前视访”。
读者如果仅从“冠状动脉旁路移植术”、“心脏外科”去检索文章,可能会造成漏检。
22关键词标引随意性太大护理科技论文中关键词标引过于随意是最为常见的问题。
如“显微手术治疗颅底大型脑膜瘤的临床分析及护理”一文关键词标引为“大型脑膜瘤、显微手术、疗效、护理”。
其中“疗效”一词为泛意词缺乏专指性。
此外,这类的词还包括“方法、研究、质量、对策、问题、服务”等,这类词作为关键词标引出来缺乏对论文主题的专指性,即失去了对论文的标引和检索作用。
33关键词标引深度不当关键词的标引深度是指一篇论文的主题概念被确认转换为检索标识的数量。
一般情况下,关键词越多,揭示的主题就越深越详细,可供检索的范围就越少。
适当的标引适当的既能将文献定位于某一特定类别,又能充分揭示主题。
一般科技论文要求每篇文章关键词3~8个,标引视具体情况而定。
4逻辑关系混乱关键词各条目间应有一定逻辑的排序规律,能够通过关键词的逻辑组合,提示论文主题内容。
护理科技论文中普遍存在关键词逻辑组合不能有效表达论文主题的问题,造成信息遗漏,给检索造成障碍。
例如“儿童皮肤科护士皮疹分诊识别状况调查”一文为“儿童、皮疹、导诊”,正确应标引为“护士、儿童皮疹、分诊识别”。
55相关建议(1)5.1确定论文主题。
对篇名、摘要、引言、结论、正文都要进行正确的理解和判断,抓住有创新观点和价值的词,紧扣主题。
第34卷总第89期2013年3月西北民族大学学报(自然科学版)J ournal of N or t hw es t U ni ver s i t y f or N at i onali t i es(N at ur al Sci enc e)V01.34.N o.1M ar ch,2013科技期刊论文关键词标引中的常见错误及其规范要求朱兴红(西北民族大学学报编辑部,甘肃兰州730030)护姆癌、护诤席培摩龟声k,舞妒译蒋、护孽霖-虑婶虑培虑、护啻虑妇柱恒席妒译摩q声、s—5[摘要]关键词是学术期刊论文的有机组成部分.准确规范的关键词标引能将论文中起关键作用的,最能说明问题的,代表论文内容特征的信息在摘要的配合下准确、迅速、科学地反映出来.关键词的规范标引可以方便使用者高效率地查找需要的信息,也便于信息的管理.如何规范标引关键词是作者和编辑应该学习和掌握的知识,要规范标引还需遵循一定的规则.[关键词】关键词;错误例析;标引规则[中图分类号]G232[文献标识码]A[文章编号]1009—2102(2013)01—0092—04O引言在我国,高校学报早在1988年就规定发表论文应从形式上达到规范化要求.数字、量和单位的规范达标高校学报曾进行过严格检查,各学报基本上做到了规范化、标准化的要求,而对关键词的标引规范到目前多数入包括作者甚至是稿件的把关人——编辑往往忽视了,认为随意抽取几个词作为关键词即可,期刊评比和质量监管部门也没有出台便于操作的细则和衡量的指标,这样编辑人员就从观念上产生不重视关键词规范标引的偏差.作者或编辑在标引关键词前如果缺少必要的论文主题分析,就不能标引出准确的、能反映论文主题的语词.既然科技期刊论文标引来自图书情报的文献标引,那么就应按文献标引的规则进行,特别是在进行论文主题分析和选取关键词上,应遵循标引的基本规则、方法和步骤.对论文的主题进行分析,是关键词选取之前必不可少的重要环节,而这一点又是编辑人员最容易忽视的.下面就关键词标引过程中出现的不规范现象谈谈其规范要求.1关键词标引的要求与作用《中国学术期刊(光盘版)检索与评价数据规范》规定:“凡期刊文章的文献标识码为A、B、C三类者均应标注中文关键词……由期刊编辑在作者配合下,按G B/T3860的原则和方法,参照各种词表和工具书选取;未被词表收录的新学科、新技术中的重要术语,以及文章题名中的人名、地名也可用关键词标出.”…这一规定实际上是对学术期刊论文提出关键词标引的要求.标引是指在文献的处理过程中,对文献的内容特征和外部特征用检索标识加以标识的过程.文献标引是文献检索的前提和基础,其目的在于使文献管理者能够有效地组织文献,文献利用者能够迅速地查找到所需要的信息.在G B7713—1987中提出,关键词是为了文献标引工作从论文中选取出来用以表示全文主题内容信息,款目的单词或术语.每篇报告、论文选择3~8个词作为关键词,以显著的字符另起一行,排在摘要的左下方.如有可能,尽量用《汉语主题词表》等词表提供的规范词.[收稿日期]2013一01—16[作者简介]朱兴红(1966一),女(藏族),甘肃天祝人,编辑,主要从事编辑学面的研究一92—关键词包括2类词:①叙词(正式主题词),指收入《汉语主题词表》(叙词表)中可用于标引文献主题概念的即经过规范化的词或词组;②自由词是直接从文章题名、摘要、层次标题或文章其他内容中抽出来的,能反映该文主题概念的自然语言(词或词组).叙词又称主题词,是从自然语言中精选出来的,经过规范化处理以后,能与概念一一对应的受控词汇,它的最大好处是能够排除自然语言中一词多义、多词一义以及词义含糊的现象.叙词标引是按叙词语言的规范要求,严格遵循要领组配的原则进行的,具有较高的检索效率.要充分发挥叙词语言的优异性能,必须进行严格的词汇控制,以高质量的词表为工具,所以叙词标引有相当的难度心J.由于叙词表的词汇有限,更新较慢,词汇滞后问题突出;另外,叙词标引需要标引人员具有较高的专业水平,难度较大,因此,现今大多数期刊并未完全采用叙词标引【3J,而采用自由词.自由词是指词表以外的未经规范化处理的自然语言词汇.自由词标引又称非控标引,它是直接用未经规范化处理的自然语言词汇,作为描述和表达文献内容主题的一种标引方式.使用自由词标引要符合下面4个条件:①具有独立的检索意义;②促进新的学科或技术的发展;③被国内外科技文献的检索工作接纳和兼容;④与国际上著名科技刊物特别是著名检索刊物关键词的选用接轨.在网络时代,广大网络终端用户已经可以直接使用检索语言查找资料.网络环境下的文献检索就是一个控制和组织信息并迅速获取和利用信息的过程.这个过程离不开文献检索语言,它在很大程度上影响着检索的效率.一篇科技论文提炼出来若干个科学准确的检索词就显得非常重要.所以,不管是作者还是编辑都应树立与时俱进的观念,尤其是编辑,作为文化产品的把关人,更应树立良好的工作作风,更新观念上的偏差,在思想上要认识到检索语言的重要性,如此才能在具体的工作过程中规范标引关键词.如果关键词标引不规范就会造成计算机检索的“噪声”,降低检索效率.《科技查新规范》中指出,检索词是指用于描述信息系统中的内容特征、外表特征和表达用户信息提问的专门语言的基本成分,是构成检索提问式的最基本的单位.在实际检索过程中,经常会遇到检索结果为“零”或检出文献过多或与查新内容相关性不大的问题,这些问题的出现都是由于选词不当造成的.另外,有作者提出,在海量信息时代,信息环境发生了深刻的变化,检索语言种类繁多,仅使用“关键词”不能准确表达文章的主题,提出应将关键词改为检索项【4J,更符合海量信息时代的发展,而检索项中就包括检索词.关键词与检索词有着密切的关联但也有区别.没有经过规范处理的关键词是一种非标准化的自然语言,是对信息内容的描述,它不受词表的限制,是用户根据文章的内容,自定义的词.检索词是在用户提供的关键词的基础上,必须要借助相关工具、主题词表等,根据词的同类、隶属、相关等关系进行确定,是用以检索的关键词.规范的检索词不仅可以保证检索质量,还能够提高查找文献的速度.面对海量的信息资源,如没有确定好规范的检索词,检索结果将是差之毫厘,失之千里,多次反复查找,将更加延长检索时间.因此,要在海量的信息资源中提高检索工作的效果,确定规范检索词将会起到事半功倍的作用.检索词是专业性较高的检索语言,因此,规范的检索词不是凭借想象就可以确定的,而是以情报专业知识为基础,通过相关工具、主题词表、阅读相关综述文献以及自身的专业知识和经验,才能进行确定.2关键词标引常见错误例析关键词标引中常见的不规范现象主要有:2.1关键词不能准确反映主题、遗漏关键词关键词究竟出自题名、摘要还是正文并不重要,重要的是所选择的关键词必须能反映文章的核心概念,能够涵盖全文,使读者一看关键词,就能知道论文的主旨和行文目的.如文章《应重视“总目次”和“索引”的规范编排》,所标引的关键词:学报;总目次;索引[5|.该文主要论述的是学报末期总目次和索引的“编排规范”问题,但仅有“学报、总目次、索引”是难以揭示该文主题的,漏标了“编排规范”这样的带关键性的语词…6.一93—2.2关键词排列的逻辑顺序不当关键词标引要考虑其标引的逻辑顺序,即概念外延由大到小,能够清晰明了地反映文献的主题层次.如文章{SCI收录的高影响因子期刊探析》所标引的关键词为“影响因子,运作模式,科技期刊,JcR'吐71.排列顺序应改为“科技期刊,影响因子,运作模式,JC R”就能更清楚地表达论文所要阐述的内容【8】.《高光谱海洋遥感影像处理系统集成与应用研究》一文,原标关键词顺序为:高光谱,海洋遥感影像,光谱角,目标识别.该文研究的目的是能有效地识别海水、赤潮等海洋现象,而光谱角分类方法是一种光谱的匹配技术,应将关键词的排列顺序改为:海洋遥感影像;高光谱;目标识别,光谱角[9】.2.3用词泛化、专指性不强如《简议浪漫主义时期的音乐》所标引的关键词:浪漫主义时期,浪漫主义音乐,早期,中期,晚期.其中后三个词“早期、中期、晚期”既可以表示一种音乐发展的时期,也可以指一种社会发展的历史时期,还可以表明某种特殊疾病的发病程度等一系列的意义,专指度低,检索意义不大.若把早期、中期、晚期改为具备独立检索意义的词“浪漫主义早期(中期、晚期)”,这样标引的关键词就增强了专指性.2.4关键词中加了标点符号或关键词写成了短语《论科技期刊编辑的“学术公平”意识及其引发的思考》所标引的关键词为:科技期刊,编辑,“学术公平”.其中“学术公平”加了引号,对以机读为主要识别手段的信息来说是种干扰.“高校学报特征,高校学报事业发展”把关键词写成了短语,这属于组配标引不合理的现象.3正确标引关键词的步骤和方法标引是检索的前提,没有正确的标引,也就不可能有正确的检索.标引还需遵循规则.3.1对文献进行主题分析,提炼主题概念从论文的题名、摘要、标题、结束语中查找那些能反映文献主题,具有实质意义的词语,必要是要通读全文,要了解和判别文献所论述与研究的对象或问题.在进行文献主题分析时要注意以下3点[10]:1)全面性:把符合检索要求的所有主题都提炼出来,注意不要遗漏隐含的主题概念.2)专指性:每一个关键词只表达一个概念,不允许存在一词多义或词义不清.提炼出来的主题概念的外延和内涵应与文献中所论述的主题概念的处延和内涵一致.3)实用性:充分考虑检索系统目标和用户的需求,选定文献中有检索意义的关键词.正确理解和判断文中的主要内容和要点,抓住创新观点和最有价值的方法和结果,经分析、判断形成主题“概念”,然后将主题概念转换成关键词这一检索标志,向传播者输出包含充分能量的信息,使文献利用者能从关键词就能准确判断出文章的价值.3.2将主题概念转换为正式的标引词主题概念转换的实质就是将文献中提炼出来的主题要素(自由语言)转换为主题词表中的正式主题词,即将选出来的自由词做规范化处理,变成符合检索要求的关键词[11|.关键词标引的优先顺序为:1)直接标引:将所选的主题概念逐一在《汉语主题词表》等工具表中查找,与文献主题概念直接相对应的专指的主题词作为直接标引词.2)组配标引:如果汉语主题词表没有与之对应的主题概念时,应选2个或2个以上的叙词进行组配标引.组配标引有2种类型:①交叉组配.系指2个或2个以上具有概念交叉关系的叙词所进行的组配,其结果表达一个专指概念.例如“喷气式垂直起落飞机”,可用“喷气式飞机”和“垂直起落飞机”这2个泛指概念的词确切地表达叙词表中没有的专指概念.②方面组配.系指一个表示事物的叙词和另一个表示事物某个属性或某个方面的叙词所进行的组配,其结果表达一个专指概念.例如“信号模拟器稳定性”可用“信号模拟器”与“稳定性”组配,即用事物及其性质来表达专指概念;“彩色显像管荧光屏涂覆”可用“彩色显像管”、“荧光屏”“涂覆”3个词组配,即用事物及其状态、工艺过程3个面的叙词表达一个专概念.一94—在组配标引时,优先考虑交叉组配,然后考虑方面组配.参与组配的叙词必须是与文献主题概念关系最密切、最邻近的叙词,以避免越级组配.如果无法用组配方法表达主题概念时,可选用最直接的上位词或相关词标引.3)自由词标引.一些表达新学科、新论点、新材料、新技术等出现的概念以及词表中未收录的产品、地区、人物等的名词可采用自由词标引,要求概念明确、词形简练、实用性强.4结语关键词与摘要一样,是科技论文的有机组成部分.关键词是将论文中起关键作用的、最能说明问题的、代表论文内容特征的、可以在摘要的配合下更准确、迅速、科学地反映与获取科研信息.科技论文中进行关键词的标引,对科技期刊内容被引纳入各种文献检索系统,进行有序的情报贮存和检索,提高论文的被引用率,促进学术交流和科技成果转化,都起到了积极作用【12|.关键词的选择与标引有其自身的特点和规律,只有循着其特点和规律按照一定规则、一定顺序进行标引,才能反映和揭示文章的主题,也才能真正实现关键词的检索功能.目前,科技期刊编辑出版界普遍存在不重视关键词标引的情况,相当数量的期刊完全由作者自己标引,编辑把关不严,有时甚至作者标什么就是什么,编辑只按着3~8个的要求少的随便补一个,忽视了关键词专指性强不强,标引是否合理,往往造成错标、漏标的现象.造成关键词标引不规范的原因主要是在期刊评比和质量管理中没有将关键词提出像文字、词语、语法、标点符合、数字、量和单位、版面格式等一样的便于操作的认定细则和衡量指标,造成编辑人员不重视关键词的正确标引.另外,关键词标引本身是一项比较复杂、难度较大的工作,需要一定的专业知识、标引方法和工作经验.有关部门应该重视这方面的工作,加大投资,添置有关工具书,方便工作人员查找;还需加强工作人员对这方面的学习与培训,提高编辑人员的业务素质.标引的实质就是对文献主题内容的提炼与升华,只有认真、深入、细致地了解文献的中心思想、主题内容,熟悉所用词表,掌握标引的规则和方法,提高编辑人员业务素质,才能保证标引的规范化,进一步提高文献检索的效率.参考文献:[1]C A J—C D13/T1—1998中国学术期刊(光盘版)检索与评价数据规范[S].[2][6][8]王昌度,熊云,徐金龙,等.科技期刊论文关键词标引的问题与对策[J].编辑学报,2003,15(5):349—351[3]姚密红.科技论文中“关键词”的标引方法[J].太原师范学院学报(自然科学版),2003,2(1):89—91.[4]魏振枢,蔡红燕.科技论文中“关键词”改为检索项”更科学[J].科技与出版,2009,4:39—40.[5]朱德培.应重视“总日次”和“索引”的规范编排[J].编辑学报,2002,14(1):9—11.[7]莫京,任胜利.SC I收录的高影响因子期刊探析[J].中国科技期刊研究,2010,21(2):138—141.[9]张哲,王克平,翟国君,蒋红燕.对科技论文关键词规范标引的浅析[J].编辑学报,2009,12.[10][11]向飒,郑素侠.科技论文关键词的正确标引[J].郑州工业大学学报(社会科学版),1999,17(1).[12]陆艾五.科技论文中的关键词[J].安徽农学院学报,1986,(2):44—45.一95—。
文章标题中关键词的运用和搭配技巧标题是一篇文章的门面,它承载着文章的核心思想和主题。
关键词的运用和搭配技巧在标题中起到了至关重要的作用。
本文将探讨关键词在标题中的运用和搭配技巧,并通过实例来说明。
一、关键词的选择选择合适的关键词是标题的基础。
关键词应该准确地概括文章的主题,能够引起读者的兴趣和好奇心。
例如,如果文章主题是关于健康饮食,合适的关键词可以是“营养”,“健康”,“饮食”。
这些关键词能够直接表达文章的核心内容,吸引读者的注意力。
二、关键词的运用关键词应该巧妙地运用在标题中,使标题更加生动有趣。
可以通过修辞手法、悬念等方式来增加标题的吸引力。
例如,“营养的魔力:健康饮食的秘密揭秘”这样的标题,通过使用修辞手法“魔力”和“秘密揭秘”,使标题更加引人入胜。
三、关键词的搭配关键词的搭配也是标题中的一项重要技巧。
搭配合适的关键词能够增强标题的表达力和吸引力。
例如,“绿色环保:可持续发展的关键”这样的标题,通过搭配“绿色环保”和“可持续发展”,突出了环保与可持续发展的关系,使标题更加有深度和内涵。
四、关键词的位置关键词的位置也对标题的效果有着重要的影响。
通常情况下,关键词应该尽量放在标题的前面,以便读者能够迅速抓住文章的主题。
例如,“科技改变生活:智能手机的革命性影响”这样的标题,关键词“科技改变生活”放在了标题的开头,引起了读者的兴趣。
五、关键词的变体为了增加标题的多样性和吸引力,可以使用关键词的变体。
例如,“健康饮食,你所不知道的秘密”这样的标题,使用了关键词“健康饮食”的变体“你所不知道的秘密”,使标题更加新颖和引人注目。
六、关键词的数量关键词的数量也需要注意,过多或过少都会影响标题的效果。
通常情况下,标题中的关键词应该控制在2-4个之间。
过多的关键词会使标题显得冗长和复杂,过少的关键词则会使标题缺乏表达力。
因此,在选择关键词时,应该注意控制数量,使之既能够准确概括文章的主题,又能够吸引读者的注意力。
关键词标引常见问题探讨通过对关键词标引现状及其常见问题的分析,提出优化词表,重视关键词检索、加强人员培训和制定关键词标引的质控体系。
以提高关键词标引质量。
关键词标引已成为现代文献数据加工的重要环节,其原因在于关键词在统一同类文献、涵盖不同专业文献,有利于文献查找方面发挥着不可替代的作用。
正因为如此,如何改进和提高关键词标引的质量,吸引了大量研究人员进行探讨并深入挖掘关键词在文献数据库构建中的巨大潜力。
本文对关键词标引的现状、常见问题进行分析,并对如何提高关键词标引的质量提出一些建议,供研究者参考。
关键词标引的现状关键词标引是构建文献数据库的基础。
关键词标引的好坏,直接影响文献数据库的质量。
正确理解关键词的概念以及关键词标引的要求、作用和意义,对于把握关键词标引有着至关重要的作用。
1、关键词的概念《科学技术报告,学位论文和学术论文的编写格式》(GB7713-87)对关键词的定义如下:“关键词是为了文献标引工作从报告、论文中选取出来用以表示全文主题内容信息款目的单词或术语。
”学术界对关键词的定义更为具体,如有的学者认为“所谓关键词,是指那些出现在文献的标题(篇名、章节名)、摘要和正文中,对表征文献主题内容具有实质意义的词语,亦即对揭示和描述主题内容来说是重要的、带有关键性的、可作为检索入口的词或短语,是一种近似于自由词的自然语言。
”(《医学论文关键词的标引》,陈晶等著)但是,我国尚无国家标准直接将关键词定性为“近似于自由词的自然语言”,为非受控词汇。
在实际应用中,关键词标引时受较少控制,可以比较自由地标引,但也不是绝对的自由,其遵循的原则应选择表述文献主题的具有实质意义的词或短语。
由于关键词标引是依据被标引文献原文选取关键词,选取的关键词具有一定的专指性,具备及时反映新学科、新理论、新技术、新材料等概念的优点,但不足之处在于查全率不高。
2、关键词标引的要求、作用及意义一般情况下,标引的关键词必须是表达某个主题概念的具有专业用语性质的词或词组。
这个词或词组应该是名词或以名词为中心组成的名词性词组。
毋庸置疑,关键词标引在文献数据加工中具有重要的作用和意义。
首先,关键词能表达文献主题,往往通过查看关键词就可以了解该篇文献的主题,进而判断是否需要阅读全文;其次,采用关键词标引可以较低的成本、较快的速度将海量文献构建成书目数据库,通过关键词串联相同主题的文献,为读者快速、准确地查阅和了解文献内容提供方便,避免全文检索中词汇相同而主题不同的文献的干扰,确保用户检索到需要的文献。
3、关键词标引的发展趋势关键词标引的发展趋势取决于两个方面。
一方面取决于关键词标引的难易度。
由于叙词标引有较高的难度,这个难度体现在文献主题的表达方面和标引人员与检索人员如何保持一致性方面。
在学术期刊中,使用关键词标引仍占大多数。
相对叙词标引而言,关键词标引虽然难度小一些,但其查全率亟待提高。
因此,有学者通过对期刊文献中关键词标引质量的比较,从标引词来源、标引深度、标引一致性、通用词使用情况等方面做了抽样统计分析,提出编制综合性的后控词表,该词表可以把“自由散漫”的自然语言组织起来,形成一个语义网络以方便检索,克服不同刊物、不同标引人员存在标引不一致的问题。
另一方面取决于计算机技术的发展。
当前关键词标引仍存在不小的难度,准确性不高,一致性难以保证,需要耗费巨大的人力和物力。
而计算机技术的发展可以给关键词标引带来一些新变化。
基于已标注关键词的大规模分类语料库,依据领域专家知识,统计得到词语表达文献主题概念的主题度,以此为基础,构建一个关键词自动标引系统,取得了很好的标引结果。
另外,研究人员对于马尔可夫统计模型和最大熵模型在关键词自动标引任务中的应用也做了有益分析和深入探讨。
虽然与实际应用还有相当的距离,但这些研究工作展现了关键词标引的新方向。
关键词标引的常见问题分析当前的关键词标引主要存在标引词不足、标引词过度、标引词错误和标引词无检索意义等几种类型。
现结合实例对上述常见问题进行分析,探讨如何正确选取和标引关键词。
1、标引不足所谓“标引不足”是指标引的关键词不能全面、准确体现文献主题或技术信息,遗漏了主题信息或其他对检索有用的信息。
包括以下几种形式。
(1)标引的关键词文献重要的主题信息例如,某文献介绍了一种由高效减水剂、普通减水剂、高活性组分、载体以及钠盐组成的混凝土施工用复合防冻剂,“减水剂”显然是该文献的重要技术信息,而标引的关键词中遗漏了该信息。
又如,某文献主题为“电介质陶瓷组合物及使用该组合物的叠层陶瓷电容器等电子部件”,而关键词中没有“电子部件”、“多层陶瓷电容器”的信息。
(2)标引的关键词缺少对检索有用的信息例如,某文献介绍了一种乳液聚合法制备偏氯乙烯共聚物胶乳的方法,“脱氯化氢”和“颜色稳定性”属于技术信息产生的直接技术效果,是该方法区别于其他方法的显著优点,具有一定的检索意义,应增加标引词“脱氯化氢”和“颜色稳定性”。
2、标引过度所谓“标引过度”是指主题提炼过程中,将检索意义不大或与主题概念不太吻合的词作为标引对象,引起过多标引或一定程度上的重复标引。
例如,某文献介绍了一种合成烃催化剂,所用催化剂为金属氧化物,但标引人员由于对主题理解不当,标引了很多金属的名称,对文献论述的各种金属氧化物却未提取作为标引词。
又如,标引人员将某文献中的“碳酸钡”和“毒重石”同时标引为关键词,事实上两者为同一物质,只需标引其中之一即可。
再如,某文献介绍了一种可络出高质量纱筒的筒子机成形控制机构,标引人员对“弹簧”和“压力弹簧”进行了标引,二者是上下位概念,但在该文献中是同一个部件,应删除“弹簧”。
3、标引词错误所谓“标引错误”,是指由于标引人员对主题理解错误、用词不当等原因导致标引的关键词无法正确地体现文献主题。
包括以下几种形式。
(1)对文献主题理解错误导致的标引错误例如,某文献介绍了一种具有螺旋隔板的翅片列管式冷却器,其冷却筒内设置有环绕翅片管束的螺旋隔板,标引人员将“翅片;列管式换热器”作为关键词,误解了原文献的技术概念和主题,应标引为“翅片管:冷却器”。
又如,某文献介绍了一种烟火电流发生器,其可缩短从启动到达到最大电流强度的时间,即缩短燃料反应时间,标引人员将“启动时间”作为关键词,误解了原文献的主题,应标引为“反应时间”。
(2)选取的标引词不当导致的标引错误。
例如,某文献介绍了一种在磁场中制造高转变温度超导陶瓷薄膜的方法及设备,标引人员将“超导陶瓷薄膜”标引为“超导;陶瓷:薄膜”,失去了原文献所要描述的主题,应标引为“超导陶瓷:陶瓷薄膜”。
又如,某文献介绍了一种带有自身保护功能的铅酸蓄电池,其在输出电极之间连接具有单向导电功能的硅隔板,标引人员将“输出电极”标引为“输出:电极”,破坏了“输出电极”这一整体概念,应标引为“输出电极”。
4、标引词无检索意义所谓“标引词无检索意义”,是指选取了对检索来讲毫无意义的词语,导致检索噪声增大,影响文献检索的查准率。
这些词包括人名,地名、社会类、经济类用语等不能表达技术意义的名词和含义过于宽泛,未明确表达技术概念或工艺过程或步骤的词汇,以及形容词,数词、量词,连词,介词、感叹词等。
例如,某文献介绍了一种收集网址形成网址数据库的导航网站,标引人员将“收集”作为关键词,“收集”的概念过于宽泛且未明确表达技术概念,应标引为“网址收集”。
又如,某文献主题为“泵体底部具有小面积导油管的小四级高真空玻璃油扩散泵”,解决了底部反油问题,标引人员将数量词“四级”作为关键词,基本无检索意义,应予删除。
提高关键词标引质量的对策关键词已成为检索平台的一个重要检索入口,关键词检索业已成为信息检索用户常用的一种信息检索方法,其检索的结果直接受标引质量的影响。
鉴于上述关键词标引的现状和问题,本文就如何提高关键词标引的质量提出以下建议。
1、构建专业词表,优化词表内容构建专业词表,为实现关键词标引的规范化、标准化和统一化奠定基础。
根据不同领域关键词的特点,由专业人员依据书目数据库的标引记录建立若干专业词表,并不断加以优化,完善和改进,保证词表的专业性和一致性。
例如,化学物质是化学医药领域非常重要的技术信息,其在文献信息分析,文献研究等方面的应用尤为明显。
一物多名或一名多物是该领域关键词的特点,也是标引的难点,若能采用国际标准的化学物质命名法命名,并针对该名称和化学物质同义词的特点制定相应标引规则,就可以解决这一难题。
2、重视关键词标引的检索意义由于关键词检索方便,快捷,无论是专业检索人员还是普通检索人员,最常用的检索方式就是从关键词人手查找所需文献,因此,关键词标引的质量直接影响检索效果,继而影响文献的分析和利用。
因此,必须高度重视关键词标引对检索效果的影响。
目前,国外一些商业性质的信息服务行业已对关键词检索给予了高度重视,如汤姆森科技的INSPEC,STN国际联机检索系统(the Scientific and TechnicalInfor-mation Network International)等都建立了专业性关键词词表,检索人员在进行关键词检索前,可以依据词表对自己的检索式进行优化,保证查全率和查准率。
3、加强标引人员的素质培训关键词标引的最终目的是为文献检索服务,有效地传播和高效地利用文献中的技术信息,从而推动科技创新和科学进步,标引人员有责任保证关键词标引的质量。
关键词标引是一项专业性较强的工作。
首先,要求标引人员具备一定的专业知识和合理的知识结构,熟悉所标引的技术领域,了解相关学科知识。
其次,标引人员必须正确理解和熟练掌握标引规则和标引方法。
标引规则和标引方法是标引结果一致性的基础,只有统一认识,才能保证同领域文献关键词标引结果的一致性,从而保证查全率和查准率。
要做到以上两点,应该经常为新参加标引工作的人员举办培训班,不定期地举办小型研讨,交流标引经验,分析标引实例等等。
4、制定科学,合理的质量评价体系提高关键词标引的质量,必须建立科学,合理,易于操作的质量评价体系,实行有效的质量监控。
在建立和应用关键词标引质量评价体系的过程中,要及时对标引中出现的问题进行分析和研究,进一步促进词表的完善、标引规则的修订以及标引方法的改进。