国内重要的综合性信息检索系统-精选
- 格式:ppt
- 大小:1.23 MB
- 文档页数:44
国内重要的全文检索系统功能比较摘要:随着信息技术的快速发展,尤其是近年来internet的日益普及和网上信息的激增,大大扩展了人们可利用的信息空间。
与此同时,信息检索系统无论从技术上还是服务方式上也都向网络化、可视化、便捷化等方向发展,信息检索的功能也更加丰富。
中国知识基础设施工程(cnki)和万方数据资源系统是目前国内主要的两大全文检索系统,通过深入的分析和比较这两大信息检索系统,对于研究全文检索系统的应用和发展具有一定的参考。
关键词:全文检索系统;功能比较中图分类号:g633 文献标识码:a 文章编号:1003-2851(2012)-12-0189-01一、cnki数据资源系统的概述cnki是中国知识基础设施(china national knowledge infrastructure)工程,由清华大学中国学术期刊(光盘版)电子杂志社,光盘国家工程研究中心和清华同方光盘股份有限公司联合建立,从1999年3月正式开始实施。
该系统为国内的各级政府职能部门、高等院校、科研院所、学术机构等出版的重要会议论文集,内容覆盖理工、农业、医药卫生、文史哲、经济政治法律、教育与社会科学综合等各方面。
ki全文数据库的种类目前,中国的网络版数据库每日更新。
其主要的数据库包括以下几种:(1)中国期刊全文数据库。
(2)中国优秀博硕士论文全文数据库。
(3)中国重要报纸全文数据库。
(4)中国重要会议论文全文数据库。
(5)中国科学文献计量评价数据库。
ki全文检索系统的收录状况cnki数字图书馆具有翔实的文献资源基础。
它囊括的资源总量达到全国同类资源总量的80%以上。
在此基础上,cnki组织各学科专家对文献中的知识进行提炼,并通过知识元链接、引文链接等技术,将文献间的知识关联起来,使收录的知识资源形成了具有内在联系的知识网络整体。
ki全文检索系统的范围经过多年的努力,cnki数字图书馆已经建成了世界上全文传息量规模最大的“cnki数字图书馆”,内容涵盖我国自然科学、工程技术、人文与社会科学期刊、博硕士论文报纸、图书、会议论文等公共知识信息资源,用户遍及全国和世界多个国家和地区,基本实现了中国知识信息资源在互联网条件下的社会人共享与国际化传播。
第一部分1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有(C特征。
A、差异性B、传递性C、时效性D、共享性2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(B:A、信息意识B、信息心理C、信息能力D、信息道德3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是(。
A、获取知识的捷径B、科学研究的向导C、终身教育的基础D、创新知识的源泉4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面(是一次信息的别称。
A、灰色信息B、原始信息C、检索性信息D、参考性信息5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的(信息载体类型的特点。
A、印刷型B、电子型C、声像型D、微缩型6、谈谈你对“信息”的理解。
特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。
7、下列文献哪个是二次文献?(AA.文摘B.会议文献C.辞典D.百科全书8、“文章草稿”、“私人笔记”及“会议记录”属于(A。
A.零次文献B.一次文献C.二次文献D.三次文献9、下列选项中哪一项属于“国内统一刊号”(C。
A.ISBN7-04-014623-1B.ISSN0254-416411-2127/TPD.0254-4164/TP10、根据国标GB/T7714-2005规定,下面的横线上的信息是对(C参考文献的著录条目描述。
萧钰.出版业信息化迈入快车道[EB/OL].(2001-12-19[2002-04-15].http:∥www.….htm.A、标准文献B、期刊(杂志C、电子文献D、会议文献11、根据国标GB/T7714-2005规定,下面的横线上的信息是对(B参考文献的著录条目描述。
昂温G,昂温P S.外国出版史[M].陈生铮,译.北京:中国书籍出版社,2001:15-20A、期刊(JB、图书C、科技报告(RD、会议文献(Z12、下面哪些资料属于三次信息?(ACFLOPA、《2009年山东省统计年鉴》B、美国《工程索引》C、《新华字典》D、《新华文摘》E、《机械工业出版社2012年图书征订目录》F、《计算机科学技术百科全书》G、《计算机工程与应用》H、《网络营销》I、《NASA报告》。
第一次作业一、填空题1、1984、信息意识、获取文献信息2、形成全民学习、终身学习的学习型社会3、自然、社会、客观性、普遍性、无限性、扩充性、转换性4、知识性、传递性、针对性5、知识内容、信息符号、载体材料、记录方式6、印刷型、缩微型、视听型、电子型、零次、一次、二次、三次7、ISBN、10、-、组号、出版社号、书序号、检验位二、名词解释1、P4情报:就是指为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。
2、P4知识:是人类通过信息对自然界、人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合和系统化了的信息,是信息中最有价值的部分。
3、P5文献:信息本身是看不见的,要使存在于客观世界的信息保留下来并加以传播和利用,就必须使信息依附在某种载体上,文献就是这种载体的主要表现形式。
4、P1信息意识:即人的信息敏感程度,是人们对自然界和社会的各种现象、行为、现论观点等从信息的角度理解、感受和评价。
5、P2信息能力:是指人获取信息、加工处理信息和利用信息的能力。
6、P6一次文献:依据作者本人的研究或研制成果创作的文献,即通常所说的“原始文献”、“第一手资料”。
7、P7教科书:系统归纳和阐述某学科现有知识和成果的教学用书。
8、P7工具书:供查找和检索信息和知识用的图书。
9、P9期刊:指采用统一名称,定期或不定期出版的汇集许多个某著者论文的连续出版物。
三、简答题1、P1信息意识的评价内容:(1)对信息科学的认识;(2)对信息的社会作用、经济价值的认识(3)对特定信息需求的自我识别;(4)能充分、准确地表达出对特定信息的需求。
P3信息道德的评价内容:(1)了解国家在信息及信息技术方面制定的相关政策、法律、道德规范;(2)在获取、使用信息资源时能遵守法规以及约定俗成的一些规则;(3)了解知识产权中的“合理使用”的规定,尊重原作;(4)了解影响信息资源的社会和政治问题。
2、P4从信息、知识和情报的定义可以看出,信息无处不在,信息的范围最大,信息中被人们认识的部分成为知识,而知识中被人们用来解决问题的部分成为情报。
第一章信息检索概述信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
信息素养:人们在解答问题时利用信息的技术和技能。
信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。
信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索 2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。
信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。
存储是检索的基础,检索是存储的目的。
信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。
信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。
其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。
信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。
信息检索的历史:最早的信息检索主要依靠信息分类。
1手工检索 2机械信息检索。
3脱机批处理检索是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型1浏览型模型:扁平式模型、结构导向模型、超文本模型 2检索型模型:结构化模型、基于内容的检索型模型。
信息检索模型是信息检索的核心。
信息检索系统:是具有信息存储和信息查询功能的一类服务设施。
信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS.信息检索物理结构1计算机硬件2软件3数据库信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。
注意:1、通读教材,根据页码提示完成下列题目。
2、最后一次上机课在线测试,范围不超出如下题目。
第一章一、单选1、报道范围主要为能源方面的科技报告为(D)。
A、AD B、PB C、NASA D、DOE{第7页}2、(C)是出版周期最短的定期连续出版物。
A、图书B、期刊C、报纸D、学位论文{第6页}3、(A )是高校或科研机构的毕业生为获取学位而撰写的。
A、学位论文B、科技报告C、会议文献D、档案文献{第6页}4、了解各个国家政治、经济、科技发展政策的重要信息源是(C)A、科技报告B、政府出版物C、标准文献D、档案文献{第8页}5、年鉴属于下列哪一类别(D)A、零次信息B、一次信息C、二次信息D、三次信息{第5页}6、下列哪种文献属于一次文献(A )。
A、图书B、百科全书C、综述D、文摘{第4页}7、下列文献中属于一次信息的是(A )A、专利说明书B、百科全书C、目录D、综述{第4页}8、以下各项属于二次信息的是(A )A、索引B、期刊C、学位论文D、百科全书{第4页}二、多选9、二次信息主要包括(CD)等。
A、手册B、年鉴C、目录D、题录{第4页}10、信息的属性包括(ABCD)A、客观性B、时效性C、传递性D、共享性{第3页}11、信息素质的内涵主要包括(ABC)。
A、信息意识素质B、信息能力素质C、信息道德素质D、信息职业素质{第9页}12、以下类型的信息属于三次信息的是(BC)。
A、目录B、词典C、百科全书D、科技报告{第4页}三、判断13、档案文献具有原始性特点,客观真实地反映了历史。
(∨){第8页}14、年鉴和百科全书属于二次信息。
(×){第4页}15、图书一般不能反映最新的信息,时效性差,相比之下,期刊出版发行速度快,内容新颖。
(∨){第6页}16、文献信息源是各种信息源中检索与利用的主体。
(∨){第3页}17、一次信息也称为第一手资料,如书目和索引。
(×){第4页}18、语言信息源,即零次信息,也就是指非正式的、口头交换的信息。
⽂献检索概论实习题⽬1)进⼊CALIS(中国⾼校⽂献保障系统)⽹站,简述CALIS的基本内容,并写出⽹站提供哪些服务?基本内容:中国⾼等教育⽂献保障体系(CALIS)是⼀个以CERNET为依托的⽂献资源服务⽹.该组织负责组织中国的重点院校,收集整理有关重点学科的全球⽹络资源,并在⽹上做⽹络资源⽬录导航服务.服务:公共⽬录检索系统、联机编⽬、集团采购、⽂献传递服务⽹、数字图书馆解决⽅案、中⽂资源导航、西⽂数据库导航2)图书、期刊内容特点和主要功⽤,写出⽹上查找图书的1-2个免费⽹站。
图书内容特点:内容⽐较系统,全⾯,成熟,可靠;出版周期较长,传递信息速度较慢。
图书主要功⽤:传播知识,是⼈类社会实践的产物,是⼀种特定的不断发展着的知识传播⼯具。
期刊内容特点:出版周期短,反映最新的发现:揭⽰知识体系不全⾯。
期刊主要功⽤:是⼤众传播的重要载体,具有反映和引导社会舆论的功能。
免费⽹站:南京图书馆、⼴东省省⽴中⼭图书馆3)⽂献检索效果可以⽤哪2个指标来描述,写出其表达式。
查全率=检索到的⽂献/数据库中所有⽂献查准率=相关的⽂献/所有检索到的⽂献4)简述截词检索技术的类型及优缺点前截断,中截断和后截断;优点:⽤⼀个简单的词代替了需要⽤逻辑或连接的许多个词;缺点:当词⼲少时,检索结果会有很多,难以挑选。
5)请说明⼀次⽂献、⼆次⽂献和三次⽂献的特点,分别举例。
⼀次⽂献:新颖性、创造性,量⼤⽽⼴,内容具体详尽分散。
⼆次⽂献:报导性和检索性。
三次⽂献有:系统性、综合性、知识性、概括性。
功⽤:⼀次⽂献是信息检索的主要对象和最终⽬标。
⼆次⽂献:是查找⼀次⽂献的⼯具。
三次⽂献:能提供学科系统知识和进展及释疑解难。
6)常⽤的检索策略有⼏种?分别写出其名称。
常规法、⼯具法、引⽂法、检索技术法、⼆次检索法7)什么是联合⽬录?进⼊中科院联合⽬录(/doc/aec1d406cf84b9d529ea7a23.html /),查询是否收藏期刊“The Journal of Navigation ”, 如收藏,列出收藏馆3-5个,并写出馆藏号。
国际六大著名检索系统美国《科学引文索引》SCI (见下文)。
美国《工程索引》Ei (见下文)。
美国《化学文摘》(Chemical Abstracts, CA。
CA报道的化学化工文献量占全世界化学化工文献总量的98% 左右,是当今世界上最负盛名、收录最全、应用最为广泛的查找化学化工文献大型检索工具。
英国《科学文摘》(Science Abstracts, SA;或INSPEC)——《物理文摘》(Section A- Physics Abstracts, PA);——《电子与电气文摘》(Section B- Electrical Engineering & Electronics Abstracts, EEA);——《计算机与控制文摘》(Section C- Computers and Control Abstracts, CCA);——《信息技术》(Information Technology, IT )。
俄罗斯《文摘杂志》(Abstract Journals, AJ) 或РЖ(共220余卷),被称为世界三大综合检索统。
日本《科学技术文献速报》(Corrent Bulletin on Science Technology, CBST;为印刷本,共12分册)。
现扩充为大型数据库"日本科学技术情报中心"(Japan Information Center Science and Technology, JICST)。
被称为世界三大综合检索系统。
美国《科学引文索引》(SCI)美国《科学引文索引》(Science Citation Index, 简称SCI)于1957年由美国科学信息研究所(Institute for Scientific Information, 简称ISI)在美国费城创办。
40多年来,SCI(或称ISI)数据库不断发展,已经成为当代世界最为重要的大型数据库,被列在国际六大著名检索系统之首。
一、名词解释1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。
2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。
3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。
5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。
6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。
7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。
8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。
9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。
10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。
11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。
12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
信息检索考题(总36页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--单选题(每题1分,共45题,45分)1.下列哪种属于一次文献(未作答)正确答案:AA.期刊论文B.百科全书C.综述D.文摘2.下列哪种属于二次文献(未作答)正确答案:DA.专利文献B.学位论文C.会议文献D.目录2.学位论文是(未作答)正确答案:BA.零次文献B.一次文献C.二次文献D.三次文献3.题录是(未作答)正确答案:CA.零次文献B.一次文献C.二次文献D.三次文献2.百科全书是( D )。
正确A.零次文献B.一次文献C.二次文献D.三次文献4.下列哪种属于三次文献(未作答)正确答案:CA.标准文献B.学位论文C.综述D.目录5.科研利用率最高的是(未作答)正确答案:DA.图书B.学位论文C.会议文献D.期刊17.用主题词进行检索,一般可检索出对应的(未作答)篇文献。
正确答案:DD.多1.计算机中使用的"0"与"1"的二进制代码是(未作答)正确答案:CA.自然信息B.生物信息C.机器信息D.人类信息6.以下数据库中收录期刊最全的是(未作答)。
正确答案:AA.维普C.万方7.影响因子是评价(未作答)的重要指标。
正确答案:DA.图书B.报纸C.论文D.期刊12.等级体系分类法以文献的(未作答)为对象。
正确答案:BA.出版时间B.学科性质C.主题概念D.题名29.对工具书进行检索,最好选择(未作答)正确答案:AA.中国知网B.中国高等教育文献保障系统C.中刊库D.万方学位论文数据库20.利用分类途径进行检索,其检索标识是(未作答)正确答案:CA.主题词B.关键词C.分类号D.分子式6.主题法用(未作答)做描述文献主题的标识和检索标识。
正确答案:BA.分类号B.词语C.阿拉伯数字D.英文字母电子图书指的是( D )正确答案:BA.扫描书B.光学字符识别书C.直接录入的电子图书D.格式转换电子书1.以下(未作答)不是信息的基本要素。
计算机信息检索02139自考资料第一章信息检索概述1.信息检索:指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
2.根据检索手段的不同,信息检索能够分为手工检索、光盘检索、联机检索和网络检索。
3.信息检索的基本原理经过对大量的、分散无序的文献信息是进行搜集、加工、组织、存储,建立各种各样的检索系统,并经过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。
4.信息检索语言信息检索语言是人们在加工、存储和检索信息时用来描述信息内容和信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。
5.五个信息检索阶段:手工检索、机械信息检索、脱机批处理检索、联机检索、网络信息检索,后三者统称为计算机信息检索。
6.与手工检索相比,计算机信息检索的特点表现在:(1)速度快、效率高,仅几分钟就能够从成千上万条记录中找到所需信息;(2)检索范围广,能够迅速而方便地浏览相关学科或主题的所有数据库中的记录,在网络中,几乎每一台个人计算机都能够成为信息源;(3)检索不受时空的限制,只要拥有相应的软件和硬件设备,就能够在任何地方借助光盘和通信网络查询所需信息。
7.信息检索的模型:就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和抽象,表述为某种数学公式,再经过演绎、推断、解释和实际校验,反过来指导信息检索实践。
信息检索的三个经典模型是:布尔模型、向量空间模型和概率模型。
8.信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。
9.信息检索系统是信息检索所用的硬件资源、系统软件以及信息资源集合的总和。
10.数据库由字段、记录和文档构成。
11.根据载体的不同,数据库可分为:联机数据库、光盘数据库和网络数据库三种。
12.信息检索系统评价的核心是检索性能评价。
13.检索性能评价:根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进一步完善检索工作的过程。