信息存储与检索复习资料
- 格式:doc
- 大小:68.50 KB
- 文档页数:6
信息资源:经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据索引:是存取信息资源“地址”或“出处”的标识系统,是信息存储与检索的基本形式检索词:用户或检索者在检索活动开始前提出的字词或字符(叙词、标题词、自由标引词、关键词、全文检索自由词等),是检索式的基本单元提问检索式:检索提问表达式,简单为一个检索词和一个字段名,复杂为多个检索词及字段名由关系算符连接组成关系符:用于表示检索项在记录中出现的逻辑关系或位置关系的符号或位置算符(W)或():在检索结果中(W)算符两侧的检索词必须按此前后邻接的顺序排列,顺序不可颠倒,同时两个检索词之间不允许有其他词或字母,但可留空格或连字符(nW):算符两侧的检索词之间允许n个实词或虚词,两个检索词的词序不允许颠倒(N):由(N)连接的检索词的记录中出现的顺序可以调换,但必须彼此相邻(nN)::算符的检索词之间可以插入n个词,且两个检索项的位置可以调换(F):算符两侧的检索词必须同时出现在文献记录的同一字段中(S):算符两侧的检索词必须同时出现在文献记录的相同子字段内,其检索词的顺序不限,夹在期间的词汇数量限(L):算符两侧的检索词是从属关系(C):算符两则的检索词须同时出现在一篇文献记录中,为and 关系(X):两个相邻且词形相同的检索词作为词组出现,其间只能用“-”不得有其他字母或词gas(X)gas 即gas-gas(nX):两个户型相同的检索词,其间夹有n-1个其他词时,可作为词组进行检索word by word可用word(2X)word表示截词检索:在检索词的某个局部截断,利用检索词的词干或不完整的词形加上截词符号所进行的检索前截断(后方一致检索):将截词符号放在检索词词干的左边,以允许词干左边有若干个字符变化):?magnetic后截断(前方一致检索):将截词符号置于检索词词干的右方,以允许其右方有多个字符的变化):geolog?中截断(前后方一致检索):将截词符作为通用字符旋转在检索词的中间,以有有限个字符变化,符号的个数所字符变化的个数相同):wom?n前后截断(:中间一致检索):在检索词词干的左右两侧同时旋转截词符号,用以表示词干两侧允许有有限或无限个字符的变化):?wave? 有限截断(在检索词干的左、中、右加上?和*,截词符的个数与允许变化的字符数相等)与无限截断(在检索词的后面加上?,允许在词干后出现的字符个数不限):检索computer, comput?Comput??记录:是书目数据库文档的基本组成单位,也是描述某一信息实体牲数据的集合,由逻辑上相关的若干字段组成。
1.请说明一次文献、二次文献和三次文献的特点和功用。
(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。
如期刊论文、科技报告、会议论文、专利说明书(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。
二次文献的重要性在于可以帮助人们查找一次文献。
如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。
包括综述研究和参考工具两类。
如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目2.请说明题录目录文摘的特点以及区别(1)题录是揭示和报导单篇文献外表特征的工具。
特点:以单篇文献为著录对象(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。
特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。
特点:带摘要的题录3. 布拉德伏特文献文献分散定律和期刊影响因子的概念(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。
如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。
(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。
4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。
一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。
( B ) A.文摘、索引等 B.图书 C.百科全书 D.手册3. 以下属于特种文献的是( B )。
A.图书B.科技报告C.报纸 D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权~6. 利用分类途径进行检索,其检索标识为( C ) A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C )A. Journal B. Report C. Conference D. Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么( D )A.测试你当天的手气 B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接D.直接跳转到系统认为是最相关的页面…11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况( D )A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程( C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。
A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统…15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好( C )A.关键词摘要 intitle: 知识管理B.论文知识管理 PDFC.学术论文知识管理D.学术论文 intitle:知识管理16. 在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。
1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。
这种附着在各种载体上的记录统称为文献。
2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。
3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。
信息是物质存在的方式、形式和运动规律的表征。
人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。
如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。
由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。
4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。
5、信息资源的构成可从不同的层次和角度来划分:一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。
二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次文献。
(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。
例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。
按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。
二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。
1、信息素质:个体在现实需求的驱动下,能有效地发现、获取、评价和利用信息。
包含四个层面的含义:第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。
第二,掌握了主要的信息源和信息工具的知识及技能。
第三,能够分析评价选择相关信息。
第四,利用信息的目的是为了有效地解决具体问题。
信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力和信息道德等内容。
1)信息意识(前提)信息意识是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。
信息意识的强烈与否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。
2)信息知识(基础)信息知识是关于信息的特点、性质、运动规律、信息方法与技术、信息系统的有关知识。
3)信息能力(核心)信息能力是人们获取、分析、加工、传递、创造信息等能力的综合。
包括:信息查询与获取能力、信息交流与传播能力、信息组织与整合能力、信息利用能力、信息评价能力等.信息能力是提高信息素质的关键所在。
4)信息道德(准则)信息道德是指在信息活动中调节和控制信息生产者、信息服务者、信息利用者及其相互关系、伦理道德和行为规范的总和。
具体:遵守国家有关信息的法律法规、不制作不传播不利用违反国家政策的信息和不健康信息、不制作不传播虚假信息、不侵犯知识产权、不利用信息技术谋取不正当利益和从事违法活动等。
2、文献信息链文献作为人类文化信息的承载物,从其产生、替代、反复被利用、再创造,直至产生新知识,是一个不断演进的运动过程。
有人把这一过程比喻为文化信息从低级到高级不断螺旋上升的信息链接。
美国《图书馆与情报科学百科丛书》第26卷把知识的产生及其有序化进程描述为动态的文献链。
对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。
补充材料:从人类整个知识体系的行程来看,现存文献中的知识来自于研究组织通过观察、实验而获得的发现与数据,它们被记录在实验室笔记或日记里,是具有第一手意义的文献信息。
信息存储与检索一. 填空题:1.信息存储与检索的对象是:(P1)(信息资源)。
2. 信息资源基本特征:(P4)( 1.共享性,2.时效性,3.智能型,4.无限性与有限性并存,5. 增值性)。
3. 信息资源按信息资源产生的先后和加工深度可划分为:一次信息资源,二次信息资源,三次信息资源。
4. 纸质文献资源的存储与组织的4个基本要素( P18):( 信息内容,载体材料,记录符号和记录方式)。
5. 信息存储与检索类型,按检索系统的工作方式划分(P45):脱机存取、联机存取、光盘存取、因特网存取。
6. 按文献的加工深度划分:(P23) ((1)一次文献,(2)二次文献,(3)三次文献,(4)零次文献)。
7. 索引款目的组成(P50):(索引标题词,说明语,和地址参照项)。
8. 多媒体存取技术的核心是:媒体数据库技术。
9. 从网络存取技术查询内容和功能来看,网络信息检索工具可分为3种类型(P73)(按查询内容和功能划分):( 字典型查询工具,索引型查询工具,交互式检索工具 )。
10. 计算机信息存取系统类型按系统存取的信息特征划分。
(P117)(文献存取系统,事实存取系统,数值存取系统,图像存取系统)。
11.存取系统的检索效果指标(P131):检全率、检准率、检新率。
12. 按检索机制划分检索工具(P196):( 关键词检索工具,分类目录,混合型检索工具)。
13. 文献存取系统包括(P117):书目(目录,题录,文摘)、全文和超文本。
14. 中文搜索引擎(P211):谷歌、百度、雅虎、中国搜索、搜狗搜索,爱问搜索引擎等。
(三个可)15. 多元性检索工具分类(P217):并行处理引擎,串行处理引擎和ALL_IN_ONE方式。
16.多媒体信息存取系统的特征(P304):信息载体的多样性、交互性、实时性、集成性。
17. 信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字,声音,图像,数据。
二. 名称解释:1. 电子信息资源(P7):是以数字化形式(即二进制代码0,1)把文字、图像、声音、动画等多种形式的信息存储在光、磁等非印刷型介质上,并以光信号、电信号的形式传输,通过相应的计算机和其他外部设备再现出来的信息资源。
第1章信息资源概论1、信息资源的涵义信息的涵义:信息是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。
资源的涵义:资源是一切可被人类开发和利用的客观存在。
我们的观点:信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。
2、信息资源的类型及各自的特点我们将信息资源区分为纸质文献型信息资源和电子型信息资源(包括电子出版物、网络信息资源)两大类型。
纸质文献资源的特点:✧携带、书写、保存方便✧直观性✧以纸质为载体的艺术作品的不可替代性✧纸质文献作为收藏品的不可替代性电子信息资源的特点:✧存储形式多样化✧资源数字化✧可交流程度高✧方便利用✧内容丰富✧载体容量大第2章信息存储与检索基础1、信息存储与检索的基本原理信息检索的基本原理:为了促进信息资源的充分交流和有效利用,使用户在信息集合中快速、精确、全面地获得特定需要的信息资源,必须要对广泛、大量、分散、无序的信息进行搜集、记录、组织、存储,以建成各种信息存取系统。
用户则根据检索需要,将需求转变为系统所能识别的检索式,再与存取系统中表征信息资源特征的标识进行逐一的相符性匹配与比较,两者完全一致或部分一致时,即为命中信息,可按用户要求从存取系统中输出。
2、信息存储与检索的历程信息存储与检索走过了文献检索、情报检索的历程,并且正在向着知识检索的领域迈进:文献检索就是一个从文献集合中查找出特定文献的活动、方法与程序,并指明“文献集合”即为经过加工的“众多文献”。
情报检索是一种时间性通信形式,是“发生在当代人之间或当代人与前人和后人之间思想、文化和科学信息的交流,它是实现情报传递的重要环节,它本身就意味着人类的通信。
信息是人类社会和自然界所有物质的一种普遍属性,其概念外延十分宽广。
知识是通过大脑思维重新组合和系统化的信息。
一般认为,“情报”是传递中的知识,文献则是指记录在一定物质载体上的知识。
一、名词解释1.信息检索(广义)信息检索是指将信息按一定的方式组织、存储起来,并针对用户的需要查找所需信息的过程。
因此,信息检索包含了信息的存储和检索两个不可分的部分。
2. 著录著录是把文献信息的各种内部、外部特征记录下来的过程,其结果就是形成一条目录信息。
文献信息被著录后能有利于被识别、交流和传播;通过著录的目录信息能方便地指向原始信息。
3. 二次文献二次文献是为了控制文献,便于人们查找,将分散无序的一次文献经过筛选、分析、整理、按其内容特征和外部特征进行提炼、浓缩,编制而成的有检索功能的文献。
4.参考数据库参考数据库指存放某一学科领域原始文献的来源和属性的一类数据库;为用户指出获取原始信息的线索。
数据库中的记录是通过对原始文献的来源和属性的再加工和过滤(如编目、索引、文摘等),记录内容包括文献的题目、著者、主题词、文摘、出处等。
5.元搜索引擎元搜索引擎是对搜索引擎进行搜索的搜索引擎,是对多个独立搜索引擎的整合、调用、控制和优化利用,也被称为“搜索引擎之母”。
6. 检索语言检索语言是信息检索系统存储和检索时使用的共同语言,即:文献存储时,文献的内容特征和外部特征按照检索语言来描述;检索文献时的提问也按照检索语言来加以表达。
7. 搜索引擎搜索引擎是根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。
8. 源数据库源数据库是能够直接为用户提供原始资料或具体数据的一类数据库。
源数据库可以提供的数据信息包括数值、事实和原文,能够直接满足用户的信息需求,而不必转查其他的信息源。
9. 追溯法追溯法是利用已有文献后面的参考文献作为检索入口,依据文献之间的引证和被引证关系进行检索的方法。
10. RSSRSS:Really Simple Syndication,真正简易聚合,是站点之间共享内容的一种简易方式,通常在时效性比较强的内容上使用RSS订阅能更快速获取信息,例如Blog、新闻。
1 信息检索的一致性匹配作用机理包括5个机理:(1)提取机理;(2)表示机理;(3)比较机理;(4)判断机理(5)选择机理。
2 任何检索策略都包含3个部分:文档表示、查询表示和匹配函数。
3 经典模型包含:布尔模型、向量模型、概率模型。
4 布尔模型:是基于集合论和布尔代数的一种简单检索模型,它假定标引词在文档中要么出现,要么不出现。
5 多媒体数据中存在的数据冗余类型主要有以下几种:(1)空间冗余;(2)时间冗余;(3)结构冗余;(4)视觉冗余;(5)听觉冗余;(6)知识冗余。
6 多媒体技术的关键特征:多样性;集成性;交互性;实时性;互补性。
7 图像的数据模型。
(1)语义表现层是用于描述图像所表明的高级领域的概念,通常包含图像的主题、作者的创作意图、个人的印象等,具有很大的不确定性;(2)逻辑表现层包括图像逻辑属性和图像对象逻辑属性。
①最小边界矩形②空间关系扫描线表示③空间有向图④OR-串⑤2D-串;(3)物理表现层.物理表现层提供原始图像数据,即图像的物理表示及物理特性。
包括:①原色特征:原色直方图、原色对特征、主色调特征;②纹理特征:纹理特征分析、纹理特征描述③轮廓特征。
8 视频的数据模型。
视频数据是连续的图像序列。
(1)帧(2)镜头(3)场景(4)故事单元。
9 基于内容的多媒体信息检索流程和指标:(1)用户查询需求说明,(2)相似性匹配,(3)返回初步检索结果,(4)特征修正、逐步求精:用户对检索结果进行浏览,判断是否已经达到检索要求,经过不断地筛选、求精,直到用户得到满意的结果为止。
10 Web信息资源的检测方法主要有3种基本形式:基于超文本/超媒体的信息浏览、基于目录的信息查询和基于搜索引擎的信息检索。
11 元数据的种类非常多。
可以分为一般性元数据、专业性元数据、Web元数据和多媒体元数据4种类型。
12 DC元数据集:DC元数据( Metadata)是描述、提供某种资源的有关信息的结构化数据,就是关于其他数据的数据。
1.信息资源基本特征:(P4)(1)共享性:这是信息资源区别于物质资源的根本属性之一,信息资源可以为众多使用者享有(2)时效性:过时的信息可能分文不值(3)智能型:是人类脑力劳动的产物,传播的是人的知识与智慧(4)无限性与有限性并存:信息资源呈现又不枯竭的特点,但在一定条件下,相对于特定需求来说是有限的(5)增值性:对信息资源的投入和使用,不但可以使自然资源、人力资源、资本资源增值,同时信息资源可以一次投入、多次开发利用,并不断产生新的信息使其自身增值2.信息资源划分为纸质文献型信息资源和电子型信息资源两大类(P6)3.按照网络信息资源的表现形式将网络信息资源分为:电子图书、电子期刊、电子报纸(P10)4.根据存储介质及存储技术,现代信息存储可以划分为以下类型:(1)信息印刷存储(2)信息微缩存储(3)信息磁存储(4)半导体存储(5)光盘存储(P34)5.信息检索模型和信息浏览模型:(P41)信息检索模型信息浏览模型基于文档内容的检索模型基于文档结构的检索模型平面浏览模型目录导航模型网状结构模型布尔逻辑模型概率统计模型向量空间模型并列链表模型层次邻接模型6.信息存储与检索类型按查询信息的特征划分:(P44)(1)书目存取:利用文献存取系统,从一个特定的书目集合中查找热定用户所需的特定主题、特定区域、特定时间文献的程序与方法(2)数据存取:以查询各类物质与材料的特性、参数、常数、价格、统计数据等数值信息为主要对象的信息存取(3)事实存取:以客观事实为对象的信息存取活动(4)全文存取:利用计算机化的全文数据库,以机器可读的字符代码形式或文献页面扫描图像形式存储文献正文内容,以便于用户从任意字、词、句、段落等为存取点查询的全文信息的活动(5)图像存取:在基于文本式的检索基础上增加了基于内容的图像存取(6)多媒体信息存取:分为基于文本方式的多媒体信息存取和基于内容特征的多媒体信息存取7.索引款目一般由索引标题词、说明语和地址参照项组成,而简单的索引款目只有索引标题词和地址参照项组成(P50)索引标题词:亦称款目、索引键、索引标题等,一般处于索引款目中最醒目的位置,是索引款目的核心,也是信息资源外部特征与内容的标志说明语:亦称上下文或修饰语,用来说明、解释、限定索引标题词含义的辅助项目,说明语可用来区别同一索引标题词的不同含义地址参照项:位于索引标题词和说明语之后,索引地址所指明的是索引标题词的出处8.全文检索系统的开发包括选择数据、建立全文数据库和实现文本检索等功能(P70)9.全面智能信息检索系统包括知识库、数据库、文本处理部分和检索推理机及人机接口(P75)10.构造提问检索式的基本要素是检索词、布尔逻辑算符、位置逻辑算符和截词算符(P78)布尔逻辑算符:现代计算机信息检索系统多采用这种方式,用户利用逻辑算法构造检索式可以将一些具有简单概念的检索词组配成为一个具有复杂概念的检索式,用以表达用户的检索需求位置逻辑算符:为了弥补逻辑算符的不足,规定了一些位置算符,主要用于全文数据库查询截词算符:只在检索词的某个局部截断,利用检索词的词干或不完整的词形加上截词符号所进行的检索11.(简答题)信息检索步骤:(P 90)(1)分析检索课题,明确检索需求。
一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。
(B)A.文摘、索引等B.图书C.百科全书D.手册3. 以下属于特种文献的是( B)。
A.图书 B.科技报告 C.报纸D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权6. 利用分类途径进行检索,其检索标识为( C )A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献(C )A.Journal B.Report C.Conference D.Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么?(D)A.测试你当天的手气B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接 D.直接跳转到系统认为是最相关的页面11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况(D)A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程(C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。
A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找?( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?(C)A.关键词摘要intitle:知识管理B.论文知识管理PDFC.学术论文知识管理D.学术论文intitle:知识管理16.在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。
信息存储与检索复习资料一、名词解释1. 主题标引:是在主题分析的基础上,依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程。
2. INTERNET(因特网):泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。
3. 顺查法:就是以课题研究的起始年限为出发点,利用选定的检索工具如书目、索引、文摘又远及近的逐年查找。
4. 三次文献: 是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为“情报研究”的成果5. 文献信息资源:文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。
6. 倒查法:一种逆时间顺序由近而远地查找信息的方法.7. 一次文献:即原始文献。
它是作者以生产或科研为依据而创作的原始文献。
如专著、期刊论文、学位论文等。
8. 检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。
它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。
9. 手工检索:是由检索者通过卡片式或书本式的目录、题录、文摘、索引等检索工具查找文献线索的过程。
10. 信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。
11. 特种文献:特种文献是指出版发行和获取途径都比较特殊的科技文献。
特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等。
12. 间接检索法:利用一定检索工具进行文献检索13. 专利:有三层含义:一指受专利法保护的发明,二是指专利权,三指专利说明书等专利文献。
这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体体现。
14. 搜索引擎:是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。
一、什么是信息(Information)?在西方英文中 information一词有情报、资料、消息、报道之意,我国大陆曾译为情报或信息,后经国家有关部门核准,统一译成“信息”。
在我国台湾、香港地区,该词被译为“资讯"。
信息是被反映物的属性再现,信息的属性在于表现它物。
也就是说,信息不是事物的本身,而是由事物发出的消息、情报、指令、数据、信号中所包含的内容,是对客观世界中各种事物发出的特征、变化及其相互联系的最新反映。
一切事物包括自然界和人类社会都会产生信息。
一个完整的信息过程,包括信息的传递、接收、贮存、加工和利用.2、信息具有以下特征:1)普遍性(2)时效性:信息在一定的时间内是有效的信息,在此时间之外就是无效信息。
而且任何信息从信源传播到信宿都需要经过一定的时间,都有其时滞性。
(3)传递性(4)可转换性:信息是可以由一种形态转换成另一种形态。
信息一般有4种形态:数据、文本、声音、图像。
这4种形态可以相互转化,例如,照片被传送到计算机,就把v图像转化成了数字.(5)可再生性(6)共享性:同一信源可以供给多个信宿,因此信息是可以共享的,且不因共享而减少(7)可识别性:信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。
不同的信息源有不同的识别方法。
(8)可存储性:信息是可以通过各种方法存储的。
二、信息检索广义:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。
其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。
取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程.狭义:仅仅指信息查找的过程。
即取的环节。
三、信息检索的发展1、第一阶段:完全手工检索阶段2、第二阶段:半机械检索系统-机电、光电检索系统的发展阶段3、第三阶段:计算机检索系统的发展阶段4、第四阶段:基于Internet 的网络化检索系统阶段信息资源的分类:1、信息源可分为自然信息源和社会信息源。
一:单项选择题(共20小题,每小题2 分,共40分)二:填空题(共12个空,每空1分,共12分)三:简答题。
(共4小题,每小题6分,共24分。
)四:应用题。
(共3小题,4选3,每小题8分,共24分。
)(应用)例1 检索课题:查找中国2003年国内人口出生率和自然增长率。
1.手工检索检索工具:《中国统计年鉴—2004》通过分类途径在类目“人口”下进行查找。
2.计算机检索(1)CNKI中国统计年鉴全文数据库(2)国家统计局网站进入国家统计局网站主页——点击“数据库查询”——进入“国家统计数据库”——输入检索关键字:人口,点击“搜索”,在结果页面单击“(整表/年度资料)--1978-2006年历年人口出生率、死亡率和自然增长率”链接,得到的检索结果如下:指标名称人口出生率人口死亡率人口自然增长率(单位:‰)2003年12.41 6.40 6.01(3)搜索引擎检索式:“2003年中国人口出生率自然增长率”例2.检索课题:查找2004年上海市国民经济生产总值GDP及其增长率。
1.手工检索检索工具:《上海市统计年鉴—2005》通过分类途径在类目“国民经济核算”下进行查找。
2.计算机检索(1)国研网”主页,进入“国研网”主页,。
点击“区域经济”栏目,在“区域列表”中点击“上海”。
在检索框里输入关键词“2004年上海”,检索条件限制在“标题”,并经关键词“GDP”二次检索,得到上海市2004年的GDP相关数据。
结果如下:2004年上海市按经济普查口径核算的GDP为8072.8亿元,比年快报核算的总量增多了622.5亿元,增加8.4%。
(2)中国经济信息网地区数据>> 年度数据(3)国家统计局网站统计数据>> 年度数据_>> 国民经济核算(4)CNKI中国统计年鉴全文数据库(5)上海统计网上海统计信息网——统计数据——上海统计年鉴——国民经济核算(6)搜索引擎检索式:“2004年上海市GDP”一、纸质文献资源的存储与组织的4个基本要素信息内容、载体材料、记录符号和记录方式二、按文献加工深度划分:零次文献、一次文献、二次文献、三次文献的区分零次文献——尚未经过系统整理形成正式文献的零散资料,包括草稿、记录和谈话等。
-A-A- ^*7*-弟一早:1、信息检索就是对信息项进行表示、存储、组织与存取的全过程。
信息存储是指将有用信息按照一定方式组织和存放起来,信息检索是指当用户需要这些信息时,再把它们从存放的地方查找和提取出来。
2、信息检索的原理:参见书上图1-1理解3、信息检索的一致性匹配机理:提取机理、表示机理、比较机理、判断机理、选择机理。
4、信息检索的类型:(1)按照检索对象的性质分为文献检索、数值检索、事实检索;(2)按照计算机检索技术分为脱机检索、联机检索、光盘检索、网络检索。
5、在手工检索阶段,人们常用的概念是检索工具,在计算机检索阶段,人们使用数据库,在网络检索阶段。
人们使用搜索引擎。
6、信息检索系统物理结构组成,逻辑结构的组成和原理。
7、信息检索产生于美国,其发展经历了起步期(以单词检索为特征)、成长期(以脱机检索为特征)、发展期(以联机检索为主)、成熟期(检索转向个人终端)、开放期(以网络检索为主)。
8、信息检索的趋势:跨语言检索、多媒体检索、信息检索可视化、信息检索智能化、信息检索个性化、信息检索多样化。
-A-A- --------- --- ^*7*一弟一早:1、检索策略一般都包含文档集的逻辑表示、查询的表示、相似性匹配及其排序三个要素。
2、经典的检索模型:布尔模型、向量空间模型、概率模型。
要求了解三种模型的思想和原理,重点掌握矢量模型的计算过程。
3、TF-IDF加权策略:对特征项计算权重的方法,该策略由簇内相似性和簇间不相似性两种效果来衡量。
4、将文本内容中的信息与文档结构信息结合起来进行检索的模型叫做结构化检索模型。
包括费重叠链表模型、邻近节点模型、平坦模型(扁平浏览模型)、结构导向模型、超文本模型。
弟二早:1、记录是作为一个单位来处理的有关数据的集合,它是对某一实体的属性进行描述的结果。
常见的书目记录是MARC记录结构,不同的国家有不同的记录格式,但为了进行不同机构间的目录交换,机读目录必须在物理结构、内容标识符、内容数据方面做到统一。
一、名词解释1. 主题标引:是在主题分析的基础上,依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程。
2. INTERNET(因特网):泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。
3.顺查法:就是以课题研究的起始年限为出发点,利用选定的检索工具如书目、索引、文摘又远及近的逐年查找。
4.三次文献: 是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为“情报研究”的成果5.文献信息资源:文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。
6. 倒查法:一种逆时间顺序由近而远地查找信息的方法.7. 一次文献:即原始文献。
它是作者以生产或科研为依据而创作的原始文献。
如专著、期刊论文、学位论文等。
8. 检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。
它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。
9. 手工检索:是由检索者通过卡片式或书本式的目录、题录、文摘、索引等检索工具查找文献线索的过程。
10. 信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。
11. 特种文献:特种文献是指出版发行和获取途径都比较特殊的科技文献。
特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等。
12.间接检索法:利用一定检索工具进行文献检索13. 专利:有三层含义:一指受专利法保护的发明,二是指专利权,三指专利说明书等专利文献。
这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体体现。
14.搜索引擎:是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。
用户可以通过主题浏览和关键词检索的方式搜索所需信息。
15. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。
16. 索引:根据标题法的原理,将类目及其注释改成标题形式,按字顺排列,并注明相应的分类号。
这样不仅可方便查表,而且还可将分类表中因为按学科分类而被分散的同一事物不同方面的类目集中,使分类法在某种程度上兼有主题法的性能。
17.抽查法:针对研究课题发展的特点,选择有关的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。
18. 回溯检索:又叫追溯法,是以某一篇文献末尾所附的参考文献为依据,由近及远进行逐一追踪的查找方法.19. 循环检索:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找.20. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。
21. 分类标引:对档案给予分类号标识的过程。
22. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。
它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。
1.信息——是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过一定的传递和处理,来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。
2.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。
3.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。
1.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
2.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。
3.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化。
1.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识的原始来源和属性的数据库。
1.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。
2.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。
3.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。
1.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。
2.电子报纸——多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。
1.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
2.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
3.手册——是汇集某一方面经常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。
4.名录——是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。
1.搜索引擎——就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。
二、填空题1.信号只是信息的(载体),信息是信号所载荷的(内容)。
2.现实的信息资源依据传递信息的载体和表述方式的不同,可以划分为(口语信息资源),(体语信息资源),(文献信息资源),(实物信息资源),(网络信息资源)。
3.口语信息资源、体语信息资源和实物信息资源,通过计算机技术的转化,成为(网络信息资源),如果有长期开发的价值,往往会转化成(文献信息资源)。
4.(文献)是记录有信息和知识的一切有形载体,是将知识用文字、符号、图像、音频、视频等方式记录在一定的固态物质载体的结合体。
5.期刊按内容和性质划分,可以分为(学术性期刊),(检索性期刊),(其他类型期刊)。
6.(零次文献)是指未经出版发行的或未以公开形式进入社会交流的最原始的文献。
1.信息检索根据检索的目的和对象的不同,可分为(数据检索)、(事实检索)、(文献检索)三种。
2.信息检索工具按存储内容划分有(目录型)、(题录型)、(文摘型)和(全文型)检索工具。
3.信息检索工具按载体划分有(印刷型)、(缩微型)和(电子型)检索工具。
4.主要的布尔逻辑关系符有三种:(逻辑与)、(逻辑或)、(逻辑非)。
5.截词检索的截词符一般用(?)或(* )表示。
1.参考数据库主要包括(书目数据库)、(文摘数据库)和(索引数据库)。
2.SCI是(科学引文索引)的缩写,文献主要来源于(期刊),还有少量的专著、会议录、书评、科技报告和专利文献。
3.EI是(工程索引)的缩写, 90%的文献语种是(英语)。
4.EI收录期刊的三个档次为(全选期刊)、(选收期刊)、(扩充期刊)。
1.(专利文献)是专利制度的产物,反过来说又是专利制度的重要基础。
2.中国专利说明书包括以下几种类型:(发明专利申请公开说明书),(发明专利说明书),(实用新型专利说明书),(外观设计专利说明书)。
3.(国际专利分类法)(IPC)是目前惟一国际通用的专利文献分类和检索工具,为世界各国所必备。
4.会议文献是指通过召开学术会议而产生的文献,包括(会前文献)、(会中文献)和(会后文献)等三种。
5.会议文献的出版形式有很多,通常有以下几种:(图书)、(期刊)、(科技报告)、(在线会议)。
6.按照多数国家的学位制度,学位论文包括(学士学位论文)、(硕士学位论文)和(博士学位论文)三种类型。
7.(标准)是对工农业产品和工程建设的质量、规格、检验方法、包装方法及贮运方法等方面所制定的技术规格。
1.电子图书是(多媒体技术)和(超文本技术)发展的产物。
3.目前,我国多家专门从事制作电子图书的商业机构,如(超星图书公司)、(北大方正)、(书生之家)等以及一些专门出版网络电子图书的出版商如博库公司等都算得上是我国电子图书事业的先驱。
4.按制作与出版形式分类,电子图书可分(数据库式)电子图书和(原生)电子图书两类。
5.目前,电子报纸主要有(网络版电子报纸)、(光盘版电子报纸(数据库))、(手机版电子报纸)和(便携式电子报纸)等4种类型。
1.事实和数据的检索是一种能提供具体答案的(确定性检索)。
2.在数据库兴起之前,人们要解决事实与数据的查找问题主要是依靠(参考工具书),而随着计算机技术以及互联网的蓬勃发展,(事实与数值型数据库)以及(网络资源)已经成为人们解决该类问题的首选途径。
3.(词典)是汇集语言里的词语,主要解释词语的概念、意义及其用法,并按照一定的方法编排,以便查阅的工具书。
4.荟萃人类一切知识门类或某一学科知识的完备的工具书称为(百科全书)。
1.(网络信息资源)是通过计算机网络可以利用的各种信息资源的总和。
2.根据信息来源的不同,人们将Internet信息资源分为(政府)、(公众)、(商用)三类信息资源。
3.根据信息资源利用的性质,人们将Internet信息资源分为(开放式信息)、(注册信息)、(交流式信息)三类信息资源。
4.(数据库方式)与(超媒体方式)是网络环境下文献资源组织方式的主流。
5.一般地,人们从(检索策略)和(检索工具)两个方面对Internet信息检索方式进行分类。
6.从广义上讲,搜索引擎应包括两部分:一是(对信息的采集、存储和组织),二是(信息检索)7.搜索引擎按其工作方式和原理的不同,主要可分为三种,分别是(全文搜索引擎)、(目录索引类搜索引擎)和(元搜索引擎)。
1.信息资源搜集的主要方法有(系统检索法)、(科学实验法)、(访问考察法)和(调研法)四种。
2.根据内容的不同,文摘可分为以下三大类:(报道性文摘)、(指示性文摘)和(报道指示性文摘)。
3.学位论文的开题一般包括(选题)、(资料搜集)、(撰写开题报告)和(文献综述)几部分内容。
三、简答题1. 光盘检索与手工检索相比有哪些优势?使用光盘检索系统,,节省了电讯费和联机系统使用费,还可免除由通信线路传输过程中所造成的失误光盘系统向用户随盘提供相当于联机信息检索系统功能的软件,并提供菜单驱动与命令驱动两种方式光盘存贮容量大,耐用,复制费用低需要大量光盘数据库,受到经费限制在信息需求的适时性上,光盘检索不如联机检索系统,因为光盘只能定期提供数据库费用大手工检索的优势(1)便于检索者根据文献标引规则查阅相关文献。