分类语言与主题语言比较
- 格式:doc
- 大小:17.50 KB
- 文档页数:2
关于主题词标引一、什么叫主题词、主题词表和检索语言(一)主题词。
主题词也称叙词,是一些以概念为基础的,规范化的,具有组配性能,并可显示词间语义关系的词和词组。
主题词分正式主题词和非正式主题词。
正式主题词用来标引和检索文献,非正式主题词是查找正式主题词的引导词。
(二)主题词表。
主题词表也称叙词表,是指由自然语言中优选出来的语义相关、族性相关的名词术语按字顺排列所组成的一种规范化的动态词典。
(三)《公文主题词表》。
《公文主题词表》是用于公文主题标引与检索的主题词表。
它是适应机关办公自动化,尤其是计算机数据处理的需要,为党政机关公文主题标引与检索而编制的一部术语控制工具。
(四)检索语言。
检索语言是根据人们检索工作的需要而创造的一种人工语言,它是存储、查找文献的共同依据,也叫标引语言。
检索语言又分为分类语言和主题语言。
分类语言是指以阿拉伯数字或以拉丁字母和数字混合作为类目标识符号,以基本类目作为词汇,以类目的从属关系表达复杂概念的一类检索语言。
主题语言是以直接论述的事物、对象为依据,以自然语言为基本词汇,以概念之间的逻辑关系作为构词法的一类检索语言。
二、为什么要标引公文主题词(一)标引公文主题词有利于建立先进的公文检索体系,辅助领导同志决策。
信息量的增加,数据量的增大,单纯的分类检索方法难以满足人们对多主题文件查找的要求。
主题检索方法弥补了分类检索方法的不足,检索更自由,查找跨度更大。
(二)标引公文主题词是建立机关办公自动化检索系统的前提条件。
办公自动化系统通过文件上标注的主题词将文件纳入检索系统。
办文人员在办公自动化系统上通过主题词来查找有关主题的文件。
(三)标引主题词是实现公文管理现代化的基础。
档案工作人员可以根据公文主题词编制档案、文件主题索引或主题目录、专题目录等手工检索工具。
办文人员可直接利用根据公文主题词而建立的档案编目计算机检索系统查找文件。
(四)对提高秘书工作人员业务素质有重要作用。
三、《公文主题词表》的体系结构《公文主题词表》由范畴表、字顺表、附表三大部分组成。
信息检索基础知识(一)一、信息检索的定义信息检索是指将信息按一定的方式组织起来,并根据信息用户的需要找出有关信息的过程。
由于有信息的组织存储做保障,这样的信息检索可以做到迅速、准确而又没有重大遗漏。
为了正确地选择检索工具,我们需要认识检索对象的特点。
按检索对象划分,信息检索可以分为文献检索、数据检索和事实检索。
其中文献检索是以文献为检索对象的线索。
例如,为撰写论文查找参考文献,为承担某项研究和工作查找可做参考的资料。
数据检索是以数据为检索对象的检索(主要指数值方面的一些信息)。
例如查找某人的电话号码,某年的人均国民生产总值,某种金属的熔点等。
事实检索是以事实为检索对象的检索。
例如要了解某个事件的过程,某人的生平,某个高校的专业设置等。
二、常用检索途径用于文献检索的途径很多,基于内部特征检索途径有分类检索和主题检索;基于外表特征检索途径有作者、团体作者、题名、代码、信息类型和语种等。
1.主题检索2.分类途径3.作者途径4.号码途径5.题名途径6.引文途径7.其他途径三、检索语言检索语言是用于描述信息系统中信息特征和表达用户信息提问的一种专门语言,是信息存储与检索共同遵循的规则。
只有检索提问标志和信息特征标志一致时,相关的文献才能被检索出来。
检索语言包括分类语言和主题语言,主题语言又可分为关键词语言、单元词语言、标题词语言和叙词语言。
(一)分类法语言1.中图分类法2.国际十进制分类法四、检索技术检索技术是指利用光盘数据库、联机数据库、网络数据库、搜索引擎等进行信息检索时采用的相关技术,主要包括布尔检索、截词检索、字段检索、词位置检索、加权检索等。
(一)布尔逻辑检索(二)截词检索(三)字段检索(四)词位置检索(五)加权检索五、信息检索的方法对于一般的信息用户,在信息检索中需要特别注意的问题有两个,这就是信息源的选择与检索词到的选择。
(一)选择信息源(二)检索词的确定。
一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。
( B ) A.文摘、索引等 B.图书 C.百科全书 D.手册3. 以下属于特种文献的是( B )。
A.图书B.科技报告C.报纸 D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权~6. 利用分类途径进行检索,其检索标识为( C ) A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C )A. Journal B. Report C. Conference D. Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么( D )A.测试你当天的手气 B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接D.直接跳转到系统认为是最相关的页面…11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况( D )A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程( C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。
A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统…15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好( C )A.关键词摘要 intitle: 知识管理B.论文知识管理 PDFC.学术论文知识管理D.学术论文 intitle:知识管理16. 在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。
哈尔滨工业大学远程教育学院 2009年秋季学期文献检索一、概念题(10分)信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
会议论文就是在会议等正式场合宣读首次发表的论文。
分类法就是在产品品种、规格繁多,但可以按照一定标准分类的情况下,为了简化计算工作而采用的一种成本计算方法。
索引将文献中具有检索意义的事项(可以是人名、地名、词语、概念、或其他事项)按照一定方式有序编排起来,以供检索的工具书。
信息检索的基本原理是:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。
二、填空题(20分)1、三大检索是以下三种:SCI(科学引文索引)、EI(工程索引)、ISTP(科技会议录索引)2、发明专利、实用新型专利、外观设计专利;专有性、地域性、时间性3、零次文献、一次文献、二次文献、三次文献4、目录型检索工具、题录型检索工具、文摘型检索工具5、顺查法、倒查法、抽查法三、简答题(30分)1、答:A、为优选期刊、节省经费和馆藏评价提供参考依据B、为图书馆指导读者阅读提供依据C、为科研管理和科研机构扩大影响、提高水平服务D、为期刊扩大影响,提高学术水平服务E、为期刊论文质量评价提供依据F、为我国社科、科技论文统计分析提供依据G为数据库建设提供支持。
2、答:前沿性、学术性、论文结构严谨、观点明确、数量大,难以系统地收集、管理和交流3、答:分类法的优势是比主题法有更大的容量,内容更有针对性、更具学术性、符合研究人员的要求。
在进行文献检索时可以很方便地检索到某一学科的相关文献。
4、答:检索语言即情报检索语言,是根据信息检索的需要创造出来的一种人工语言。
检索语言是一种受控语言,它依据一定的规则对自然语言进行规范,将其编制成表,供信息标引以及检索时使用。
分类语言优点:具有学科的系统性缺点:不易反映学科交叉性、渗透的情况,也不易准确标引主题复杂的文献主题语言优点: a 来源于自然语言中,标识比较直观,适合人们的辨识习惯,主题词表易于利用容易掌握;b 表达概念惟一,具有专指性;c 可以按照检索需要,自由组配检索概念,具有很大的灵活性; d 一个主题词表达一个泛指的事物概念,若干个主题词合乎逻辑的组配,可以形成高度专指的概念,具有高度的概念网罗度。
第一章信息检索基础知识一.概述1.信息与文献信息知识的分类:已掌握的知识和需查询的知识。
信息的定义:信息是事物运动的状态与方式,是物质的一种属性,并且借助于一定的物质载体传输和储存。
这里有几个词组需说明:事物:泛指一切可能研究的对象(包括物质的和精神的)。
运动:泛指一切意义上的变化(机械运动、化学运动、思维运动和社会运动)运动方式:在时间上所呈现的过程和规律:运动状态:在空间上所展示的形状和态势。
信息已成为与物质、能量同样重要的三大资源之一。
信息是一种原料,人类接受外界大量信息后,经过实践活动和大脑的思维机制加工提炼后变成有用的知识(知识的认识程度)。
文献:将知识记录并保持在一定的载体上,就形成了文献。
文献信息是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经过人们筛选、归纳和整理后记录下来的信息。
科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科学信息的主要来源。
2.信息的特点(1)普遍性;信息是无处不在,无时不在的,c从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体;(2)时效性:信息的获得和传送需要时间,信息反映的总是特定时刻事物的运动状态和方式,当人们获得信息后,它反映的是某段时间的事物,是一种历史纪录,如果传递很慢,信息就会失去应有的价值;(3)传递性:指信息的空间和时间效应,信息可以从一个地方传到另一个地方,从一个时期传到另一个时期;信息的传递决定了信息的可扩散性,信息是通过各种渠道、媒介传播和扩散;(4)共享性:信息在传播和使用的过程中,载体本身的信息并不因此而减少,信息资源的共享将极大地推进人类文明的发展;(5)可转换性:信息的物质载体形态是可以相互转移变换的;信息在一定条件下可以转化为物质、能量、时间、金钱、效益、质量等;(6)可伪性:在人们得到信息后,必须进行分析判断和筛选,以便正确享用信息。
信息检索文字题复习提纲(名词解释、举例、简答、论述)信息检索复习题1、信息检索的原理是什么?(1)广义信息检索原理:在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中,收集有用的信息,对有用的信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用的信息组织成可供件所用的数据库,并存储在一定的介质上。
(2)狭义信息检索原理:狭义信息检索的原理就是广义信息检索中信息检索过程的那部分原理。
信息检索基本原理中的核心部分就是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关系之间的比较和匹配机理。
两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。
*2、信息检索有哪些工具?按处理信息手段分:手工检索工具、计算机检索工具。
按著录方式分:目录型(国家书目、馆藏书目、联合书目、专题书目)、题录型、文摘型(指示性、报道性、评论性)、索引型(主题索引、分类索引、著者索引)。
3、信息检索的途径和方法有哪些?(1)信息检索途径分类途径:按学科分类体系来检索文献信息。
从分类途径检索文献信息,主要是利用分类目录和分类索引。
它以知识体系为中心,比较能体现学科系统性,反映学科与事物的隶属、派生与平行关系,便于从学科所属的范围来查找文献资料,并可起到“触类旁通”的作用。
题名途径:是根据文献名称包括书名、刊名、篇名等来检索文献的途径。
一些检索系统中提供题名字顺检索途径,如书名目录、刊名目录、篇名索引等。
(2)信息检索方法追溯法:也称引文法,是利用综述或已经掌握文献所附的引文注释和参考文献目录作为线索逐一追查原文,再利用这些原文所附的参考文献目录逐一扩检,产生滚雪球效果。
直接法:又称常用法,是直接利用检索工具检索文献的方法。
它又分为顺查法(由远及近)、倒查法(由近及远)和抽查法(重点时间段进行)。
分类语言与主题语言比较
摘要:分类法和主题法既有相同性,又有各异的特征,本文通过探讨它们特征的差异突
出它们各自的特点,显示出二者互有长短,各有千秋,阐明它们的功能作用,以便于我们更
好地开拓文献利用渠道, 最大限度地发挥分类法和主体法的效能。
关键词:分类法,主题法,差异
1.1 表达文献主题概念的方法不同
[3]
分类检索语言是用分类号来表达文献主题概念,并按学科性质分门别类地将
文献系统组织起来的语言。分类检索语言又称等级体系分类语言。如中国图书馆
图书资料分类法(中图法)、中国科学院图书馆图书分类法(科图法)。
主题检索语言是用语词来表达文献主题概念,它不管各语词之间相互关系如
何,一律按字顺排列成主题词表,故称主题检索语言。按选词原则,语词型检索
语言又分为标题词语言、单元词语言、关键词语言和叙词型语言四种。
1.2 主题概念的组织方式不同[1]
分类法按学科体系或逻辑体系组织,系统性强,反映事物的派生、隶属与平
行关系。能够直接地满足以学科或专业出发、范围较广泛的检索课题要求,但读
者难以掌握新、细小、复杂主题在体系中的准确位置。
主题法是按照词的顺序来组织主题概念,依名检索,解决了分类法中难于归
类的主题。
1.3 标识符号不同[4]
分类法采用纯数字、纯字母或字母数字混合形式的标式符号代表其所属学科
门类。直观性差,在标引与检索过程中均需经过“概念、标识符号”的转换过程。
主题法采用自然语言中的名词术语。经规范化处理后,作为检索标识,简明
直观,易于掌握使用。
1.4 标引的方法不同
[2]
分类法注重于学科属性,标引采用标记系统表达,对文献资料分类基本是对
号人座。
主题法则侧重于主题因素之间的关系,标引过程难度较大,它必须从文献的
标题与内容中分析出主题,然后根据主题词表收词情况对主题概念进行分析转
还,找到较确切表达主题概念的词。
1.5 结构体系不同
[1]
分类法结构体系的主体是按学科性质划分的等级层累结构的逻辑分类系统,
它遵循从总到分、从一般到特殊、从低级到高级、从简单到复杂、从上位到下位,
层层展开、上下隶属的逻辑序列,便于读者从学科门类进行族性检索。
主题法结构体系的主体是字顺系统,满足了读者对图书进行特性检索的需
要。
1.6 主要功能不同[5]
分类法的主要功能是组织分类目录和分类排列图书,这是管理图书的一种科
学方法。
主题法不具有组织藏书和排架的功能,它的主要功能是组织主题目录,这一
目录直接用语言文字表达出来,按字顺排列。
1.7 对科技发展的适应性不同[2]
分类法是一种先组的列举式语言,受学科体系和符号的束缚,不能随学科的
发展而增删某些类目。
主题法按字顺排列,相邻之间无必然联系,增删主题词不会影响整个系统的
结构,比较灵活,有着广泛的适应性,能及时反应新技术,不需考虑在整体中的
位置。
结论:分类法的优点可以概括为“三性”,即:系统性、间接性和严密性,
其中系统性为其主要特征;主题法的优点也可以概括为“三性”,即:特指性、
直接性和灵活性,其中特指性为其主要特征。主题法的长处正是分类法的短处,
分类法的优点正是主题法的不足,所以,分类法与主题法要取长补短,相辅相成。
参考文献:
1. 马日新,梁育芝.试谈分类法与主题法的异同.右江民族医学院学报,1998,3(1):20
2. 孙静,贾素平.浅谈主题法与分类法.北京医科大学图书馆,1994,(4)
3. 田质兵,王志坚,谈春梅.科技情报检索.北京:清华大学出版社,2004,(8)
4. 张帆.分类语言与主题语言.武汉:华中师范大学出版社,1991:12
5. 田素梅.评《中国图书分类主题词表》相关参照.图书与情报工作,1996,(3):29