信息检索复习整理
- 格式:doc
- 大小:58.50 KB
- 文档页数:10
信息检索知识点 Revised by Liu Jing on January 12, 2021信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
第一部分:基本常识1.文献按照出版形式可分为哪几种类型?举例。
图书、期刊、报纸、特种文献。
图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI 期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。
报纸:人民日报特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA报告4、能源部的DOE报告。
2现代科技文献具有的特点哪些?答:(1)数量多、增长快, (2)出版形式多、文种多,(3)文献异常分散, (4)文献失效加快, (5)报道内容重复交叉, (6)文献总体质量下降3什么是核心文献、相关文献和边缘文献?答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。
如核心期刊等。
相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。
相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。
4 什么是文献?构成文献的有哪四个要素?答:文献的定义是记录有知识的一切载体称为文献。
构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。
5 电子文献的主要类型和文件格式是什么?答:(1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分;(2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的 gif文件、jpg文件以及标记文件格式的 html文件和xml文件之分;(3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分;(4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分;(5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类;(6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。
信息检索复习要点复习要点:1.如何查找纸本原⽂,必备信息是什么,刊名等同于什么刊名等同于ISSN号,必备的信息是,⽂章题⽬、期刊名称或是ISSN号,年/卷/期。
先查找有⽆电⼦全⽂。
⾕歌搜索、SFX全⽂搜索系统、先查本馆纸本期刊⽬录,获取论⽂全⽂中的查询本馆纸本期刊⽬录,联合⽬录。
2.哪些数据库有⾃动截词功能?EI3.中⽂科技期刊数据库、SCI和EI数据库的精确检索是如何实现的中⽂:可选择限定检索学科领域可选择逻辑算符可选择跨库检索的其他检索⽅式可选择匹配度⼆次检索其他限制条件EI:精炼检索结果位置:检索结果显⽰页左侧Refine Search的⼯具栏添加⼀个检索词的⼆次检索(Add a term )优化和调整检索结果(限定(Limit to)按钮或排除(Exclude)按钮:作者、作者机构、规范词、分类类名、国家、⽂献类型、语种、出版年、刊名、出版者等限定字段4.数据库检索结果的排序⽅式CNKI:主题发表时间被引下载EI:相关度和时间系统提供5种排序⽅式(按相关度、出版年代、作者字顺、刊名字顺和出版者字顺)5.主要的全⽂数据库CNKI、维普、万⽅:中⽂期刊全⽂数据库。
EBSCO、ScinceDirect、SpringerLinker:外⽂全⽂数据库。
6.Web ofScience数据库中包含有哪些数据库?SCIE/SSCI/A&HCL/CPCI-S(ISTP)/ CPCI-SSH7.查全查准率如何实现?提⾼查全率(扩⼤检索结果)的⽅法选择较⼤字段:如摘要、主题、全⽂、任意字段等尽量多⽤同义词、近义词、反义词、缩写词、上下位类词(增加逻辑或关系)减少逻辑与关系(限制条件)采⽤模糊匹配功能扩⼤检索年限使⽤截词符(*?$)提⾼查准率(缩⼩检索结果)的⽅法选择较⼩字段:如篇名(题名)、题名或关键词字段尽量增加核⼼检索词:从内容中挖掘核⼼词使⽤词位检索采⽤精确匹配/精确短语功能采⽤“AND”或“NOT”算符连接检索词或进⾏⼆次检索。
信息检索文字题复习提纲(名词解释、举例、简答、论述)信息检索复习题1、信息检索的原理是什么?(1)广义信息检索原理:在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中,收集有用的信息,对有用的信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用的信息组织成可供件所用的数据库,并存储在一定的介质上。
(2)狭义信息检索原理:狭义信息检索的原理就是广义信息检索中信息检索过程的那部分原理。
信息检索基本原理中的核心部分就是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关系之间的比较和匹配机理。
两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。
*2、信息检索有哪些工具?按处理信息手段分:手工检索工具、计算机检索工具。
按著录方式分:目录型(国家书目、馆藏书目、联合书目、专题书目)、题录型、文摘型(指示性、报道性、评论性)、索引型(主题索引、分类索引、著者索引)。
3、信息检索的途径和方法有哪些?(1)信息检索途径分类途径:按学科分类体系来检索文献信息。
从分类途径检索文献信息,主要是利用分类目录和分类索引。
它以知识体系为中心,比较能体现学科系统性,反映学科与事物的隶属、派生与平行关系,便于从学科所属的范围来查找文献资料,并可起到“触类旁通”的作用。
题名途径:是根据文献名称包括书名、刊名、篇名等来检索文献的途径。
一些检索系统中提供题名字顺检索途径,如书名目录、刊名目录、篇名索引等。
(2)信息检索方法追溯法:也称引文法,是利用综述或已经掌握文献所附的引文注释和参考文献目录作为线索逐一追查原文,再利用这些原文所附的参考文献目录逐一扩检,产生滚雪球效果。
直接法:又称常用法,是直接利用检索工具检索文献的方法。
它又分为顺查法(由远及近)、倒查法(由近及远)和抽查法(重点时间段进行)。
超星:拥有海量图书、全球最大的中文在线图书库;在线阅读,无地域时间限制。
CNKI、维普、万方:中文期刊全文数据库。
EBSCO、ScinceDirect、SpringerLinker:外文全文数据库。
ACS:自然科学、工程技术类学科专题数据库。
OVID:生物医学类学科专题数据库。
SCI:引文索引数据库。
EI:工程索引数据库。
2. 读秀学术搜索收入中文图书全文200多万种,元数据1.9亿条(其中中文期刊5000多万条,中文报纸近3000万条)。
3. Apabi电子图书方正Apabi数字图书馆提供73,000余种中国出版的电子新书;常用外文期刊数据库(全文类)1. Elsevier SDOL(ScienceDirect Online)该数据库提供访问的电子期刊都是举世公认的高品质的学术期刊,其中SCI收录1410种,EI收录515种,很多期刊的影响因子都达到了2.0以上,在学术界有很大的影响力。
2. ACS PublicationsACS一直致力于为全球化学研究机构、企业及个人提供高品质、高影响力的文献资讯及服务。
目前,ACS包括38种期刊,每一种期刊都回溯到其创刊卷,最早的到1879年。
3. SpringerLink SpringerLink是Springer于1996年推出的一个电子出版物在线服务平台。
SpringerLink除包含2100多种全文学术期刊外,还包含丛书、图书、参考工具书以及回溯文档,全文文献超过440万篇。
4. IEEE/IET Electronic Library美国电子电气工程师协会(Institute of Electrical and Electronics Engineers,IEEE)创立于1963年,是航空系统、计算机科学、通信、生物医学工程、电力等领域最权威的学会。
5. Wiley Interscience 在化学、生命科学、医学以及工程技术等领域学术文献的出版方面颇具权威性。
一、逻辑算符、检索式l布尔逻辑算符:and 、or、 not(含义)1.逻辑“与”(AND 或 *) 用于表达两个或两个以上检索词(关键词、主题词)之间的相交关系或限定关系运算。
逻辑与检索能增强检索的专指性,使检索范围缩小。
2.逻辑“或”(OR或 + )用于表达两个或两个以上检索词(关键词、主题词)之间的并列关系。
运算逻辑或检索扩大了检索范围,提高检索信息的查全率。
此算符适于连接有同义关系或相关关系的词。
3.逻辑“非”(NOT或-)用于表达两个或两个以上检索词(关键词、主题词)之间中排除不需要的检索词(关键词、主题词)运算,可以缩小检索范围,增强检索的准确性。
此运算适于排除那些含有某个指定检索词(关键词、主题词)的记录。
但如果使用不当,将会排除有用文献,从而导致漏检。
检索式举例:题目:第三方物流信息管理系统检索式:第三方*物流*信息*管理*系统(and)检索入口:题目或关键词l截词检索:是一种常用的检索技术,尤其是在西文文献的检索中,使用更为广泛。
截词检索方式可分为三种,即:后截断、前截断、中间截断。
按截断的字符的数量上看,又可分有限截断与无限截断两种。
通常用* 表示无限截词。
用?表示有限截词。
后截断:是最常用的一种检索技术,将截词放在一个字符串之后,以表示其后有限或无限个字符不影响之前的检索字符串的检索结果。
如biolog*,可检索biologcal biologist biology等词, physic ??,可检索 physical、physicst等词。
、前截词将截词符号置于一个字符串的前方以表示其之前有限或无限个字符不影响之后的检索字符串的检索结果如*physics,可检索 physics、astrophysics、biophysics、chemiphysics、geophysics 等词。
中截词又称“ 内嵌字符截断” 。
将检索字符置于一个检索词中间,而不影响前后字符串的检索结果。
如:organi?ation可检索 organization、organisation。
信息检索复习资料1、信息是客观事物经过感知或认识后的再现2、知识是人们通过实践对客观事物及其运动过程和规律的认识3、知识、载体和记录是构成文献的三个基本要素4、信息资源是经过人类筛选、组织、加工,并可以存取和能够满足人类需求的各种媒介信息的集合。
5、连续出版物是一种具有统一名称、固定板式、统一开本、连续编号,汇集多位著者的多篇著述,定期不定期编辑发行的出版物6、学位论文是大学生或研究生为取得学位资格而提交的学术论文7、会议文献主要是指在国内外各类会议上宣读或交流的论文、报告或其他有关资料8、专利文献是实行专制制度的国家和地区以及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。
主要有专利申请、专利说明、专利公报等9、标准文献是为了一定范围内获得最佳秩序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件10.信息素质是利用大量的信息工具及主要信息源使问题得到解答的技术和技能:信息能力指人们有效利用技术和信息工具获取信息加工处理信息以及创造和交流新信息的能力信息需求分析和表达能力、信息获取能力、信息分析和处理能力、信息利用能力12、Internet应用:①信息获取:搜索引擎网络新闻②交流沟通:即时通信博客社交网站电子邮件论坛③网络娱乐:网络游戏网络文学网络视频网络音乐④商务交易:网络购物旅游预订网上支付网上炒股13、信息检索的广义含义:是将信息按一定的方式组织和存储起来,并根据信息用户的需要要找出相关的信息过程,全称“信息的存储和检索”14、信息检索过程:①分析检索需求②确定检索标识③选择检索系统和检索工具④实施检索操作⑤索取原始文献15、信息检索按检索对象内容划分:文献检索、数据检索、事实检索、多媒体检索16、手工信息检索直接发明于图书馆的参与咨询和文摘索引工作17、分类语言是一种按学科范畴和体系来划分事物的语言,它是从数字字母符号对类目进行标识的一种语言体系,也称分类法。
《信息检索》期末复习题及答案(仅供参考)一、判断题1.综述和百科全书属于二次文献。
(× )2.从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。
(× )3.题录、目录属于一次文献;期刊论文属于二次文献。
(× )4.主题词规范化的目的是扩大检索范围。
(√)5.在众多的信息源中,期刊是最重要的信息源。
(√ )6.核心期刊是指经常使用的期刊。
(× )7.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后者是未经词表规范的自由词。
(×)8.《中国图书分类法》(简称《中图法》)是由分类号(代码)和类名来揭示信息的主题概念。
(×)9.题录型的检索工具,其著录项目包括题目、作者、文献出处、文摘。
()10.一项发明创造要获得专利权必须具备新颖性、创造性和实用性。
()二、选择题1、广义的信息检索包含两个过程( B )A、检索与利用B、存储与检索C、存储与利用D、检索与报道2、文献是记录有知识的()。
A、载体B、纸张C、光盘D、磁盘3、下列哪种文献属于一次文献( A )。
A、期刊论文B、百科全书C、综述D、文摘4、下列哪种文献属于二次文献( D )。
A、专利文献B、学位论文C、会议文献D、目录5、下列哪种文献属于三次文献( C )。
A、标准文献B、学位论文C、综述D、文摘6、下列选项中属于连续出版物类型的选项有(C )。
A、人民日报B、学位论文C、科技期刊D、会议文献7、下列选项中属于特种文献类型的有( D )。
A、学位论文B、图书C、科技期刊D、标准文献8、纸质信息源的载体是()A、光盘B、缩微平片C、感光材料D、纸张9、《中国图书分类法》(简称《中图法》)将图书分成( A )A、5大部分22个大类B、5大部分26个大类C、6大部分22个大类D、6大部分26个大类10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。
《信息检索》课理论考试复习题一、选择题:A1、从对文献的生产加工与组织层次来看,文献可以分成一次文献、二次文献和三次文献。
一次文献主要有(A)A、专著、报纸、期刊B、书目、索引、文摘C、百科全书、年鉴、手册2、《中图法》共分为五个基本部类,( B )个大类。
A、二十五B、二十二C、二十八3、按照《中图法》的分类原则,文学类和哲学、宗教类分别用汉语拼音字母(C )表示。
A、G、HB、E、DC、I、B4、根据主题词表所规定的以反映文献内容的主题词为标志,从主题的角度检索文献资料的途径是(C)A、著者途径B、文献名途径C、主题途径5、著录一批相关的图书或报刊文献的基本特征,按照一定次序编排而成的揭示和报道文献的工具书是( B )A、文摘B、书目C、索引6、按照文献的知识内容及所属学科性质而分类和检索文献信息的途径是(A)A、分类途径B、主题途径C、著者途径7、信息检索中,以课题起始年代为起点,按时间顺序由远而近逐期查找文献的方法是( C )A、倒查法B、追溯法C、顺查法8、在各种大型电子全文图书系统中,国内影响较大的主要有( B)A、人大复印资料数据库B、超星数字图书馆C、学位论文数据库9、美国《科学引文索引》是最具权威的国际性检索系统之一,简称是(A )A、SCIB、SSCIC、EI10、目前世界上最大的连续动态更新的中国期全文数据库是( B)A、维普中文期刊数据库B、CNKI中国学术期刊数据库C、万方数字化期刊数据库11、集各种类型工具书之大成,被称为“工具书之王”的工具书是( C )A、类书B、年鉴C、百科全书12、汇集某一学科或多学科的文献信息资料,按照特定的体例和排检方法编排,专供人们查阅、征引或解决疑难问题的一种专门文献是( A )A、工具书B、标准文献C、专利文献13、联机检索分为( B )联机检索和检索结果与反馈3个阶段。
A、简单检索B、检索准备C、高级检索14、内容比较成熟、资料比较系统、有完整定型的装帧形式的出版物是( C )A、技术报告B、政府出版物C、图书15、按信息检索的手段划分的信息检索类型是( C )A、数据检索B、计算机信息检索C、事实检索B1、美国《科学引文索引》是最具权威的国际性检索系统之一,简称是:( C )A.SSCI B.CSSCI C.SCI通2、本馆电子图书系统有( B )。
一、电子信息资源特点1.存储形式多样化2.资源数字化3.可交流程度高4.方便利用5.内容丰富6.载体容量大二、信息检索步骤①分析检索课题,明确检索需求:1.检索的目的与意图;2.学科范围与主题概念;3.文献性质、类型与数量②制定检索策略③选择检索系统与数据库④确定检索词和检索途径,编制逻辑检索式⑤检索策略的调整三、我国计算机信息存储的进步经历的过程1.引进开发过外磁带、开展定题服务2.开发国际联机检索终端技术3.自建数据库4.微型计算机和国际联机往信息存取的发展四、计算机信息存取系统评价计算机信息存取系统是利用计算机对一定范围的信息集合进行选择、记录、存储与排序,以便用户采用科学手段与技术从中获取必要和充分信息资料的计算机信息系统。
1.系统研制目标性指标2.数据范围、更新频率与数据来源指标3.系统的技术水平和运行质量指标4.数据组织形式与用户界面指标5.检索方式和检索策略指标6.检索效果与辅助索引指标7.系统响应速度及费用指标8.输出格式指标综上所述:信息存取系统的评价指标由多方面因素构成,实际上影响系统质量与效益的情况也很复杂。
一个科学合理的评价指标体系的构成应该具有整体性、多向性、可测性及动态性等特点。
五、First Search联机存取的主要特色1.提供一体化服务2.强大的检索手段3.灵活多样的辅助索引4.专门配置了Web界面的管理模块5.数据库记录中包含馆藏信息6.信息量大7.面向最终用户8.收费低六、基于内容的多媒体信息检索特点①提供重建查询机制②查询方式的交互性③相似度检验④多媒体同步检索技术⑤多层次检索信息.七、基于内容检索的关键技术①信息模型和表示(超文本模型、文献模型、信息元模型)②检索技术③查询语言④信息压缩和恢复⑤信息存储管理⑥多媒体同步技术八、网络信息检索的策略1.明确检索目标,确定检索项2.选定适合的检索工具3.正确对待检索结果4.提高上网速度,选择最佳上网时间九、网络信息存取的特点1.存取范围覆盖Internet所有资源2.传统检索方法与全新检索技术相结合3.用户界面友好且操作方便4.具备良好的导航和编辑功能5.具有用户透明度十、纸质文献的特点和个性纸质文献类型的特点:1.携带、书写、保存方便;2.直观性;3.以纸质为载体的艺术作品的不可替代性;4.纸质文献作为收藏品的不可替代性个性:1纸质文献是知识信息的存在形式2传递信息是纸质文献的又一特征3纸质文献资源可以多次重复使用,可以进行复制和传递4纸质文献所包含的知识信息是一种相对固化的信息十一、简述中国专利文献特点及检索途径中国专利局发行的专利文献包括专利说明书,专利公报和专利年度索引等1,专利文献手工检索(分类途径,申请人和专利权人途径,专利序号途径)2,国内专利网检索(中国专利信息网,中国知识产权局专利检索系统,中国知识产权网)十二、存储技术发展趋势①纸质印刷存储、缩微存储、磁存储、光盘存储长期并存,互为补充,这是信息存储发展的一个趋势。
一、什么是信息(Information)?在西方英文中information一词有情报、资料、消息、报道之意,我国大陆曾译为情报或信息,后经国家有关部门核准,统一译成“信息”。
在我国台湾、香港地区,该词被译为“资讯”。
信息是被反映物的属性再现,信息的属性在于表现它物。
也就是说,信息不是事物的本身,而是由事物发出的消息、情报、指令、数据、信号中所包含的内容,是对客观世界中各种事物发出的特征、变化及其相互联系的最新反映。
一切事物包括自然界和人类社会都会产生信息。
一个完整的信息过程,包括信息的传递、接收、贮存、加工和利用。
2、信息具有以下特征:1)普遍性(2)时效性:信息在一定的时间内是有效的信息,在此时间之外就是无效信息。
而且任何信息从信源传播到信宿都需要经过一定的时间,都有其时滞性。
(3)传递性(4)可转换性:信息是可以由一种形态转换成另一种形态。
信息一般有4种形态:数据、文本、声音、图像。
这4种形态可以相互转化,例如,照片被传送到计算机,就把v图像转化成了数字。
(5)可再生性(6)共享性:同一信源可以供给多个信宿,因此信息是可以共享的,且不因共享而减少(7)可识别性:信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。
不同的信息源有不同的识别方法。
(8)可存储性:信息是可以通过各种方法存储的。
二、信息检索广义:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。
其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。
取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。
狭义:仅仅指信息查找的过程。
即取的环节。
三、信息检索的发展1、第一阶段:完全手工检索阶段2、第二阶段:半机械检索系统-机电、光电检索系统的发展阶段3、第三阶段:计算机检索系统的发展阶段4、第四阶段:基于Internet 的网络化检索系统阶段信息资源的分类:1、信息源可分为自然信息源和社会信息源。
2、按信息资源所依附的载体划分(不用全背)(1)体裁信息资源:以人体为载体并能为他人识别的信息资源。
按其表述方式又可分为口语信息源和体语信息源。
口语信息源是人类以口头方式表述但未被记录下来的口语信息,如:谈话、讲课、讲演、讨论、唱歌等。
体语信息源是以人的体态为载体表述出来的信息资源,如:表情、手势、姿态等方式表述的体语信息。
(2)实物信息资源:以实物为载体的信息资源。
又分为自然实物信息源与人工实物信息源。
如:化石、产品、样品等。
(3)文献信息资源:以文字、图形、符号、声频、视频等发生记录在各种载体上的知识和信息资源。
(4)网络信息资源:以网络为纽带连接起来的信息资源和以网络为主要交流、传递、存储的手段与形式的信息资源。
3、按信息资源传递的范围划分:(1)公开信息资源:又称共享信息资源或白色信息资源(white information),指公开发行、流通和传递的信息资源,其蕴涵的信息人人可以使用。
一般来说,公开信息资源的数量最大,而且能够作为信息商品进行流通领域。
(2)半公开信息资源:又称灰色信息资源(grey information),指非公开发行、流通和传递,从常规途径难以获取的信息(内部信息)。
这类信息出版量小,发行渠道复杂,流通传递范围有限,不易收集。
例如:内部的刊物、技术报告、会议资料等。
(3)非公开信息资源:又称黑色信息资源(black information),指人们未破译或未被识别的,也指处于保密状态的信息。
例如:考古发现的古老文字、未解密的政府文件、内部档案、个人日记、私人信件等。
自然信息均属于不可检信息。
超文本型(Hypertext):是用超链结的方法,将各种不同空间的文字信息组织在一起的网状文本。
文献信息资源1、按信息资源所依附的载体的物质形态划分(1)刻写型:包括手稿、日记、信件、原始档案、碑刻等。
(2)印刷型:主要是指以纸张为载体,以印刷为记录手段,把信息内容固化在纸张上的形式。
其优点是便于直接阅读、使用方便,其缺点是较笨重、存储密度低、收藏占用空间大、加工保存等花费人力物力大、识别和提取难以实现机械化和自动化。
(3)缩微型:以感光材料为载体,以缩微照相为记录手段而产生的一种载体形式,如缩微胶卷、缩微胶片等。
其优点是存储密度较大、体积小、便于收藏保存和远距离传递。
缺点是不能直接阅读、需借助缩微阅读机或阅读复印机才能使用。
缩微型一般针对于数量大、利用率低但又有较大保存和利用价值的信息资源。
(4)声像型:以磁性和感光材料为载体,借助特殊的机械装置(如复录机、摄像机、录像机等)直接记录声音、图像信号的信息载体,又称视听资料,如唱片、录音带、录像带、幻灯片、电影片、多媒体资料等。
其优点是可以闻其声、观其形,直观而真切,给人以生动鲜明的印象。
其缺点是制造成本较高,且需要借助于一定的设备才能使用。
2、按信息资源的加工深度和结构等级划分(1)零次文献:指未经过任何加工的原始文献。
如:实验记录、手稿、日记、原始录音、原始录像、谈话记录。
(2)一次文献:未经加工或粗略加工的原始信息资源,以本人的研究成果为基本素材而创作的文献,具体、详尽和系统化。
如期刊论文、专利文献、科技报告、会议录、学位论文等等。
(3)二次文献:它是将大量分散、零乱、无序的一次文献进行进行加工、整理、标引、著录、浓缩,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。
如:目录、题录、索引、文摘。
具有报道和检索功能。
(4)三次文献:通过二次信息资源提供的线索,对某一范围内的一次信息资源进行分析、研究、加工而成的信息资源,它包括综述、述评、专题情报研究报告、百科全书、年鉴、指南、手册、词典等。
特点:一次文献是最重要的文献,是全部文献的基础。
数量庞大、内容分散、无系统性,不便于管理和传播。
二次文献作为寻找一次文献的指南与向导,能提供多种检索途径(分类、主题、著者、团体著者、会议名称等)。
三次文献可以充分利用反映某一领域研究动态的综述类文献信息,在短时间内了解其历史、动态、水平等。
一次文献是二次文献和三次文献的基础,是文献检索的主要对象;二次文献具有浓缩性,是一次文献的简略及有序化,是文献检索的工具;三次文献具有综合性,既是检索对象,又可提供一定的检索途径与检索手段。
总之,文献经过加工、压缩,从零次信息到三次信息,使科技信息由分散到集中,由无序到有序,由无组织到系统化,由博而精的对知识信息进行不同层次的加工的过程。
信息的不同出版类型划分为:图书期刊科技报告会议文献[C]论题集中、新颖、丰富、专深、学术性强,是了解各国科技发展水平和动向的重要文献来源。
(5)专利文献[P]:(6)技术标准和规范[S]:7)政府出版物(8)学位论文[D]:(9)产品资料(10)技术档案(11)报纸[N]3)科技报告[R] (理解)scientific and technical report :报道(记录)研究工作和开发调查工作的成果或进展情况的一种文献类型。
又称研究报告、报告文献。
出现于20世纪初,第二次世界大战后迅速发展,成为科技文献中的一大门类。
大多与政府的研究活动、国防及尖端科技领域有关,发表及时,课题专深,内容新颖、成熟,数据完整,且注重报道进行中的科研工作,是一种重要的信息源。
查寻科技报告有专门的检索工具。
特点:①反映新的科研成果迅速。
以科技报告形式反映科研成果比这些成果在期刊上发表,一般要早一年左右,有的则不在期刊上发表。
②内容多样化。
它几乎涉及整个科学、技术领域和社会科学、行为科学以及部分人文科学领域。
③保密性。
大量科技报告都与政府的研究活动、高新技术有关,使用范围控制较严。
④报告质量参差不齐。
大部分科技报告是合同研究计划的产物,由工程技术人员编写,由于撰写受时间限制、因保密需要以工作文件形式出现等因素影响,使报告的质量相差很大。
⑤每份报告自成一册,装订简单,一般都有连续编号,出版发行不规则。
通常载有主持单位、报告撰写者、密级、报告号、研究项目号和合同号等。
附:美国四大科技报告(AD,PB,NASA ,DOE )按检索对象的内容区分:(1)文献检索(document retrieval)(2)数据检索(data retrieval)(3)事实检索(fact retrieval)手工检索:以手工操作的方式,利用检索工具书进行信息检索。
手工信息检索是信息检索的传统方式,已经历经了一个多世纪的发展历程。
检索效率高;直接性灵活性好,浏览功能差附:查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度。
查全率=(检出相关文献量/系统中相关文献总量)*100%查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度。
查准率=(检出相关文献量/检出文献总量)*100%三、按检索对象区分:(1)文本检索:查找含有特定信息的文本文献的检索,其结果是以文本形式反映特信息反映的文献。
这是一种传统的信息检索类型,在信息检索中至今占据主要地位。
(2)多媒体检索:多媒体是指将声音、图像、通信等在内的多种媒体的功能有机结合在一起,并用某种新媒体代替传统媒体的多种媒体。
多媒体检索是指根据用户的需求,对文字、声音、图像、图形等多种媒体信息进行组织、存储从而识别、查找并获取所需信息的过程。
在因特网上存在着大量的多媒体文献,用户常常需要查找特定的声音、图像、动画等。
多媒体文献的信息组织与处理传统文本的处理截然不同,其检索要求和检索途径也别具特色,这是现代信息检索的新课题。
(3)超媒体检索(hyper media retrieval)如果超文本节点中的信息除文本块以外,还有图形、图像、声音、视频等多媒体信息,则称为超媒体(hyper media )。
即存储对象超出了文本范畴,融入了静、动态图像(形)以及声音等多种媒体信息。
(同样具有超文本检索的优点,并且检索内容与形式更为丰富)(1)强相关检索:强调检索的准确性,也称作特性检索。
这种检索注重查准率。
只要检索得到的文献信息能满足用户的需求就行,对于检索结果的数量多少不作要求。
(2)弱相关检索:强调检索的全面性,向用户提供系统完整的信息的检索。
也称族性检索。
这种检索注重查全性,要求检索出一段时间期限内有关特定主题的所有信息。
为了尽可能避免漏检相关信息,对于检索的准确性相对要求较低。
要注意的是,这是两种检索要求比较极端的检索类型。
实际上是介于两者之间,保证一定的查全率和查准率。
按时间跨度(1)定题检索SDI (selective dissemination of information)查找有关特定主题最新信息的检索。