2.主要体系分类检索语言
- 格式:pdf
- 大小:663.57 KB
- 文档页数:48
第一章信息检索概论思考题:1.什么是信息?简述信息的特点和分类?我们认为,信息是事物或事物之间不确定性的量度,即负熵。
掌握的信息越多,所需认识的事情的确定性就会越少。
信息由信源,信宿和信道(载体)构成。
信息的特点:(1)客观真实性:客观、真实是信息的最重要的本质特性(2)普遍性:信息是物质的普遍属性,物质是具有普遍性,所以信息也拥有该特性(3)针对性:信息的作用和价值可以随着接受者的不同而不同(4)传递性:过程:信息源(信息的发出者)——>编码—>信道(载体)—>译码—>信宿(信息的接收者)信息源:是信息的发出者信宿:是信息的接收者信息的传播是双向的,多维的。
信息源和信宿是相对的,也是可以相互转换的。
信道:就是在传播过程中,编码经过的物理通道(5)时效性:指信息发出、接收到利用的时间间隔及效率,也包括信息的本身更新速度。
客观物质不断的变化,反映事务的运动状态和运动方式的信息也会发展变化一般而言,随着时间的推移,信息的价值会逐渐减少也有反例:如考古信息(恐龙、古钱币),年代越久,使用价值越大衡量信息的时效性参数不只是时间参数,还有地理环境(6)可转换性:信息可以从一种形态转换成另一种形态(7)可处理性(可识别性):可以通过人们的感觉器官所感知,也可以通过仪表、器械来检测进而予以识别。
(8)可共享性:指同一内容的信息可以在同一时间里被若干个用户使用,此时信息载体本身的信息量不会被磨损、消失信息的类型:(1)按信息表现形式划分,可分为文字信息,图象信息,数值数据信息,语音信息。
▪文字信息:文字是人们为了实现信息交流、通信联系所创造的一种约定的形象符号。
▪图象信息:图象(形)是一种视角信息,它比文本信息直接,易于理解。
如,一幅画、一部电影。
▪数值数据信息:数值数据是“信息的数字形式”或“数字化的信息形式”。
▪语音信息:人讲话实际是大脑的某种编码形式的信息转换成的语言信息的输出,是一种最普遍的信息表现形式。
一、填空题:1. 文献按其加工深度不同可以划分为一次文献、二次文献和三次文献。
2. 信息素质的内涵包括信息需求、信息意识、信息知识、信息道德和信息能力。
3. 构成文献的三要素是内核、物质载体和符号系统。
4. CNKI的中文全称是中国知识基础设施工程。
5. 标准文献的主体是技术标准。
6. 期刊论文的文献出处包括期刊名称、年卷期和起止页码。
7. 在计算机信息检索中,用于组配检索词和限定检索范围的布尔逻辑运算符包括and 、or和not三种。
8. 文件ABC.001.TXT的后缀名是TXT,文件类型是文本文档。
9. 多数网页采用HTML编写,这里的HTML指的是超文本标识语言。
10. 在使用搜索引擎检索时,URL:ustc可以查到网址中带有ustc的网页。
11. 根据索引编制方式的不同,可以将搜索引擎分为索引型搜索引擎和网络目录型搜索引擎。
12. 按文献的相关度来划分,可以把文献分为核心文献、相关文献、边缘文献。
13. 检索工具具有两个方面的职能:存储职能、检索职能。
14. 利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法,又称为引文法。
15. 已知一篇参考文献的著录为"Levitan, K. B. Information resource management. New Brunswick: Rutgers UP, 1986",该作者的姓是Levitan。
16. 检索语言可分为两大类:分类语言、主题词语言。
17. 在大多数情况下,检索的目的是为了找到相关文献,而不是"答案"。
18. 二八定律在期刊文献检索中的体现是:20%的期刊登载了80%的重要文献,体现这种特性的期刊是核心期刊。
19. 当计算机访问范围受到限制时,可以通过代理服务器访问外部网络。
20. PDF、VIP文件对应的打开程序分别为Adobe Reader,VipBrowser 。
三、名词解释题1. 按物质载体和记录形式划分,信息可分为印刷型、缩微型、声像型、机读型和手写型。
2. 文献是指“记录有知识的一切载体”,情报是“作为交流对象的有用知识”3. 内容、符号系统、物质载体、记录方式是构成文献的四个基本要素。
4. 按出版形式和内容的不同,信息可分为图书、期刊、报纸和特种信息。
特种信息也叫做灰色信息,包括:专利信息、学位论文、标准信息、会议信息、科技报告、政府出版物、产品样本资料和档案。
5. ISBN号是国际标准书号,由13位数字组成,分成五段:图书代号;国家、区域、语种代号;出版社代号;书名代号;计算机校验码。
ISSN号是国际标准出版物号,由8位数字组成,分两段:序号、校验码。
6. 图书按用途可分为3种类型:阅读用书,参考工具书,检索用书7. 按检索方法划分,检索工具可分为手工检索工具、计算机和网络检索工具。
8. 知识产权范围主要包括专利权、著作权和商标权9. 知识产权具有两大功能:保持功能和公开功能10. 广义的检索包括信息的存储和检索两个过程。
11. 检索方法分为常规法、引文法(追溯法和检索引文法)和交替法三种12. 检索途径可以分为主题途径、分类途径、责任者/著者途径、号码及其它途径13. 手工检索工具中的著录项目在数据库中称为字段,字段的集合称为记录。
14. 文献数据库内英文段码Abstract对应的中文段码名称是文摘。
Keyword对应的中文段码名称是关键词。
15. 按国际上通用的分类法,数据库分为参考数据库、源数据库和混合型数据库。
16. 中国现行主要的图书分类方法是《中国图书馆分类法》,它属于体系分类语言。
17. 《中图法》第四版将图书分为5部,22大类,L.M.W.Y没有,计算机属于TP类, 属于二级类目。
18. 索书号主要由分类号和著者号组成。
19. 在因特网中,政府机构和商业组织的二级域名分别是GOV、COM。
域名.hk所指的国家或地区是香港;.org的含义是非营利组织.20. 公告号为8510961的专利是发明专利,专利号为200420011414.6的专利是实用新型专利;申请号为99322746.5的专利是外观设计专利。
第2章检索语言【本章要点】●介绍检索语言的概念、功能及类型●总结检索语言的主要理论基础●阐述分类检索语言的结构与性能●分析主题检索语言的原理与性能●论述分类主题语言一体化检索语言的原理、性能及类型●探讨网络环境下检索语言的发展2. 1 检索语言概述2.1.1检索语言的概念(04北师)retrieval language,是为沟通文献标引与文献检索而编制的人工语言。
广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。
狭义的检索语言指根据信息检索的需要,按照一定的规则对自然语言进行规范,并专门用于信息标引和用户检索的人工语言。
2.1.2检索语言的功能(06华南师范简答)1.标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性2.对内容相同及相关的文献信息加以集中或揭示其相关性3.使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行有序化检索4.便于将标引用语和检索用语进行相符性比较2.1.3检索语言的分类1.按描述文献的特征:描述文献外表特征(题名、组织、文献编号、引文等)的检索语言和描述文献内容(分类语言、主题语言、代码语言)特征的检索语言2.按结构或原理:分类语言、主题语言、代码语言和引文语言3.按信息标识的组合使用方法:先组式语言、后组式语言和散组式语言4.按语言的规范化程度:人工语言和自然语言2. 2 检索语言的理论基础检索语言以概念逻辑为基础,知识分类是概念逻辑的基础,检索语言的创制以术语学的研究成果为基础。
2.2.1概念逻辑1.概念逻辑的含义:是一种科学思维方法,通过明确各自概念及其相互关系而揭示事物的本质属性及各种事物之间的联系与区别。
2.概念是反映对象本质属性的思维形式,是对事物本质属性的概括。
①概念的内涵是概念所反映的对象的本质属性的总和。
②概念的外延是概念所反映对象的范围。
2.21.1概念间的关系1.相容关系:指两个概念的外延至少一部分是重合的。
检索语言检索语言(Retrieval Language)就是组织文献与检索文献时所使用的语言。
也就是说,文献存储时,文献的内容特征(如分类、主题)和外表特征(如书名、刊名、篇名、号码、著者等)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达。
这种在文献的存储和检索过程中,共同使用、共同遵循的语言就是检索语言。
实质上它是标引和检索之间的约定语言,是人与检索系统对话的基础,检索的匹配就是通过检索语言的匹配来实现的。
使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。
检索语言的基本成分是检索词。
按检索词的规范化程度和组配程序,检索语言可分为自然语言(Natural Language)和人工语言(Artificial)两种。
自然语言采用的检索词是未加工整理和规范过的,即平常采用的关键词,这种语言又称作关键词语言(Keyword Language)。
人工语言采用经过规范化的词,规定一个词表示一种事物,例如规定“aircraft”表示飞机,而不用“air plane”、“plane”和“aeroplane”,以做到文献存储和检索的一致性。
信息检索语言是根据检索需要而创制的人工语言,也称检索标识系统,专门用于各种手工和计算机信息检索系统。
从不同角度检索文献,就有不同种类的检索语言,常用的有主题语言和分类语言,下面分别加以论述。
(一)分类语言分类语言是用分类号和相应分类款目来表达各种概念的,它以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序。
分类语言能反映事物的从属派生关系。
便于按学科门类迸行族性检索。
分类语言中最常见的是体系分类语言,它按照学科体系从综合到一般、从复杂到简单、从高级到低级的逻辑次序逐级展开,世界著名的分类法有:《国际专利分类表》(IPC)、《杜威十进分类法》(DDC)、《美国国会图书馆图书分类法》(LC)、《中国图书馆图书分类法》(中图法)和《中国科学院图书馆图书分类法》(科图法)。
《大学生信息检索概论》模拟试题一、填空题1、文献的级次分为零次文献、一次文献、二次文献、三次文献2、《中图法》有五个基本部类,分别是马克思主义、列宁主义、毛泽东思哲学;社会科学;自然科学和综合性图书,在此基础上又划分为_22_个大类。
3、按内容可将计算机检索系统的数据库类型分为:文献书目型数据库、事实型数据库、数值型数据库和全文型数据库。
4、我国标准可分为国家标准、部标准和企业标准三大类。
5、在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法和综合法。
6、国际标准化组织简称:ISO 、本标准每 5 年修订一次二、选择题1、如果需要检索某位作者的文献被引用的情况,应该使用( C )检索。
A.分类索引B.作者索引C.引文索引 D.主题索引2、利用图书馆的数据库检索期刊论文时,可供选择的中文数据库是( D )。
A.超星数字图书馆 B.万方学位论文 C.国研网 D.维普科技期刊 E.高校财经库3、如果检索有关多媒体网络传播方面的文献,检索式为(A D)。
A.多媒体and 网络传播 B.多媒体+网络传播 C.多媒体or 网络传播 D.多媒体*网络传播4、如果对某个课题进行主题检索时,可选择的检索字段有( A D E )。
A.关键词 B.作者 C.刊名 D.题名 E.文摘5、二次文献又称检索工具,包括:( A C D )。
A.书目B.百科C.索引D.文摘E.统计数据三、名词解释题1、文献:用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。
也可以理解为古今一切社会史料的总称。
2、体系分类语言:是以科学分类为基础,运用概念的划分与概括的逻辑方法,形成一个概念等级体系,按知识门类的逻辑次序,按照从总到分,从一般到具体,从低级到高级,从简单到复杂的原则进行概念的综分,层层划分,累累隶属,逐步展开而形成的一个等级体系。
3、引文语言:是根据文献所附参考或引用文献的特征进行检索的语言。
简述分类检索语言的结构.说明类目之间的关系及表
现形式
1、分类语言。
分类语言以号码为基本字符,用分类号作为主题概念标识,将各种概念按学科性质进行分类和系统排列的检索语言。
分类语言是以学科体系为基础的语言。
国内外比较重要的分类语言表有《国际专利表》、《杜威十进分类法》、《中国图书馆图书分类法》、《中国科学院图书分类法》等。
分类语言可分为体系分类语言、组配分类语言和混合分类语言。
2、主题语言。
主题语言是以词语作为概念标识,即用自然语言中的名词、名词性词组、或句子作为主题词,来表达各种概念,将各种概念不管其相互关系,完全按字续排列的检索语言。
主题语言包括标题词语言、单元词语言、叙词语言和关键词语言。
3、代码语言。
是人们为了提高检索语言的语义能力,而研究提出的一种代码系统。
这种代码系统,一般只就事物的某一方面特征加以标引和排列。
4、引文语言。
是利用文献之间的相互引证关系而建立的一种自然语言。
这种语言提供了从被引论文来检索引用它的全部论文的途径,从而能顺着一种科学思想发展过程找到有关的文献。
5、先组式检索语言。
是指描述信息主题概念的标识在检索之前就已经事先固定好的标识系统,如体系分类语言、标题语言等。
6、后组式检索语言。
是指描述信息主题概念的标识在检索之前未固定组配,而是在检索时根据检索的实际需要,按照组配规则临时进行组配的标识系统。
如叙词语言等。