【精品】计算机信息检索重点
- 格式:doc
- 大小:55.50 KB
- 文档页数:24
信息检索1、信息检索概念:P12、信息检索的原理一整节内容要自己理解:P3-P4图1-1要掌握文献替代和文献整序的概念要掌握3、信息检索在历史上的不同表现:联机检索、光盘检索、网络检索的区别和特征:P6-P94、信息检索的模型概念:P95、布尔模型、向量空间模型、经典概率模型要理解并掌握各自的优缺点:P11-P126、信息检索系统的概念:P127、检索效果的评价指标:P15-P164个指标:查全率、查准率、漏检率、误检率掌握它们的含义并懂得计算8、网络检索的表达式:布尔逻辑检索、邻近检索、短语检索、截词检索的特点、区别和联系:P17-P219、信息检索的技巧要理解尤其是要掌握及时调整检索策略:P33-P3610、搜索引擎的概念:P3711、数据库知识,实验内容,特点12、引文的概念13、搜索引擎的分类:P40-41搜索引擎划分的类别以及元搜索引擎的概念要掌握12、CBR概念P11312、多媒体信息检索的原理和方法:P110-P114其中要重点理解基于内容的多媒体信息检索的检索形式(可以结合课件)13、专利的概念:P12514、专利的类型:P126(理解一下各类型的区别)15、专利文献的概念:P12716、专利文献的类型:P127(理解一下各类型的区别)17、灰色文献的概念:P14718、会议文献的概念:P15819、科技报告的概念:P16320、查新的概念:P20021、科技查新的作用:P201(每一个小标题后面要自己展开一段)关于上课讲的那几个数据库大家自己看一下PPT,掌握一下。
以上纯属个人观点题型:名词解释:5*4=20简答题:4*10=40论述题:2*20=40考试时间:1月8日上午:9:00—11:001.信息检索的概念(P1)信息检索有广义和狭义两重含义。
广义上说,信息检索是指将信息按照一定的方式组织和存储起来,并根据信息用户的需求查找相关信息的过程。
它包含信息存储和信息查找两个过程。
信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
信息检索课程重点整理一、信息概念:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。
特征:预先性、实用性、时效性、可传递性、共享性。
传递渠道:1、非正式过程(表现为个人的行为特征。
对话、通信、演讲、授课);2、正式过程(表现为文献流通。
借助文献系统进行正式交流)。
文献概念:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。
也可以称为固化在一定载体上的知识。
必须含有知识、记录方式、载体。
资料概念:固化在一定的实物或载体上的知识。
二、信息的类型:1、按信息的加工层次划分:一次信息(原始文献)、二次信息(检索工具)、三次信息(参考性文献)。
P42、按信息载体的出版编辑特点划分:十二大文献源。
P53、按信息载体的物理类型划分:印刷型、缩微型、电子型、声像型。
P64、按信息的性质划分:一、自然信息(自然界发出的信息,以自然物为载体);二、社会信息(经过人类利用语言、文字、符号、图像等方式加工过的自然信息)。
5、按信息所表征的服务对象划分:经济信息、科技信息、教育信息、军事信息、商业信息、金融信息、综合信息。
三、信息检索的定义及类型p2信息检索,就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。
它包括三个方面:数据检索、事实检索、文献检索。
三者中以文献检索为主。
数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。
四、文献检索的定义及类型p3定义:1、检索系统的建立及检索工具的组织和积累;2、文献的查寻,利用检索工具检出与课题相关的文献。
类型:直接检索:是从通过阅读原始文献直接获取所需信息;快捷、方便;漏查率高。
间接检索:是通过检索工具的指导再查找原始文献而获取所需信息。
系统、全面:滞后。
五、检索工具定义、具备条件及类型检索工具是按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。
信息检索复习知识点1.信息(Information)信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。
* 信息的属性——客观存在性* 信息的作用——消除不确定性* 信息的形式——数据、消息等事实2.各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源3. 信息用户Information User信息的使用者即是信息用户。
使用的情况可以包括需要信息、接受信息和利用信息。
4. 信息需求Information Demand人们在社会实践活动中,为了解决各种实际问题,会产生对信息的需要,这种需要可表现为对信息的必要感和不满足感。
我们把意识到的信息需要定义为信息需求5. 信息检索Information Retrieval对信息用户而言,信息检索就是根据各自的目的和要求,选择恰当的信息资源,采用适当的检索手段、检索技术、检索方法,对所需要的信息进行查找、筛选和索取的过程或活动。
6. 信息素质:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。
* 信息意识* 信息能力* 信息道德7. 信息社会是以知识和信息为基础从而促进社会高速发展的一种社会形态。
8. 经济领域的特征a.劳动力结构出现根本性的变化,从事信息职业的人数与其它部门职业的人数相比已占绝对优势;b.在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势;c.能源消耗少,污染得以控制;d.知识成为社会发展的巨大资源。
9. 社会、文化、生活方面的特征10.社会观念上的特征11当代信息环境特征描述* 信息超载严重信息超载又称信息泛滥或信息爆炸。
它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪音化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。
* 信息失衡明显所谓信息失衡是对由于各国经济水平、科技水平和其它多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的描述。
信息检索考试大一下知识点信息检索是指从大量的信息中快速找到满足特定需求的信息过程。
在大一下学期的信息检索考试中,通常会涉及以下几个知识点:一、信息检索基础概念1. 信息检索的定义和目的信息检索是指通过使用计算机技术,在海量信息中寻找到与用户需求相匹配的信息。
其目的是快速、准确地获取到用户所需的信息。
2. 检索模型和流程信息检索基于检索模型,常见的模型包括布尔模型、向量空间模型和概率模型。
检索流程一般包括问题建模、索引构建、查询处理和结果排序等步骤。
二、关键词检索1. 关键词的选择与组合在进行信息检索时,关键词的选择和组合非常重要。
关键词应该准确描述用户需求,并且能够尽可能覆盖相关领域的信息。
2. 布尔查询与逻辑运算符布尔查询是一种基础的检索方式,通过使用逻辑运算符(AND、OR、NOT)对关键词进行组合,从而获得符合用户需求的信息。
三、索引构建与检索技术1. 逆向索引逆向索引是一种常用的索引结构,它通过将文档中的每个单词与包含该单词的文档进行关联,实现了关键词到文档的快速定位。
2. 向量空间模型向量空间模型将文档和查询都表示为向量,在向量空间中进行计算,通过计算文档与查询之间的相似度来判断文档的相关性。
3. 布尔模型的实现与优化布尔模型的实现与优化涉及到倒排索引的构建与压缩、布尔运算的优化算法等方面的技术。
四、评价与改进1. 检索结果的评价对于检索系统的性能评价,一般使用准确率、召回率、F值等指标来衡量检索的有效性和完整性。
2. 改进方法与技术为了提升检索系统的性能,可以采用词干提取、查询扩展、排名算法优化等方式进行改进。
五、实际应用与发展趋势1. 商业搜索引擎与个性化推荐商业搜索引擎通过不断改进和优化信息检索技术,提供高效准确的搜索服务。
个性化推荐则基于用户的兴趣和行为,向用户推荐符合其需求的信息。
2. 大数据与信息检索随着大数据时代的到来,信息检索面临着处理海量数据的挑战。
如何有效地利用大数据技术来进行信息检索是当前的研究热点之一。
AI 《著者索引》BA/RRM《生物学文摘/报告、评论、会议》BP《英国药典》BNF《英国处方集》BIOSIS美国生物科学情报社CPI 会议论文索引CNKI中国知识基础设施工程中国期刊全文数据库CPI《会议论文索引》CA美国《化学文摘》CS《化学物质索引》CBA《中国生物学文献数据库》CASSI《化学文摘资料来源索引》DIALOG国际联机检索系统EM荷兰《医学文摘》GS《普通主题索引》GB 中国国家标准IPA《国际药学文摘》IM美国《医学索引》IPC《国际专利分类表》ISTP《科技会议录索引》ISO 国际标准化组织ISSN《国际标准连续出版物编号》ISBN《国际标准图书编号》KWI 《关键词索引》MeSH《医学主题词表》NF《美国处方集》NLM美国国立医学图书馆OI 生物体索引OCLC联机计算机图书中心PI 《专利索引》PUBMedNCBI开发制作的医学相关文献数据库免费使用来源premedline medline SCI《科学引文索引》通过引文分析衡量评价论文的学术水平或刊物的影响力高低。
USP《美国药典》WO 世界知识产权组织ScienceDirect (SD):Elsevier数据库Ovid高影响因子核心药学期刊全集美国四大报告:PB;AD;AEC/ERDA/DOE;NASA报告同族专利是指基于同一优先权文件,在不同国家或地区,以及地区间专利组织多次申请、多次公布或批准的内容基本相同或有所修改的一族专利。
其中最先得到批准的专利称为基本专利,也称原始专利。
和基本专利内容基本相同,在不同国家或地区内提出申请而得到批准的专利称为等同专利。
相关专利为与基本专利内容不完全相同,但有关联的专利,在专利种类代码后用Related表示。
1. 信息资源的类型(以加工程度划分):一次信息资源(会议论文、科技报告、学位论文、标准、档案、专利说明书);二次信息资源(书目、文摘、索引);三次信息资源(综述、百科全书、手册、词典,教科书)2.信息检索的类型:文献检索、事实检索、数据检索。
一、信息检索四要素1、信息检索的前题:信息意识2、信息检索的基础:信息源3、信息检索的核心:信息获取能力4、信息检索的关键:信息利用二、信息基本特征:普遍性、客观性、扩散和传递性、增值性(创新)、可存贮性和可压缩性、可知性(信息能力)和共享性知识属性:意识性、信息性、实践性、继承性、渗透性情报属性:针对性、知识性、时间性、传递性、效用性信息、知识、情报的关系:信息经过人脑思维加工,即认识飞跃产生知识,情报属于知识的范畴。
广义的情报是信息的传递,因此,情报具有信息和知识两种性质。
三、按载体不同分为:口头信息源、实物信息源、文献信息源四、文献信息源:1、按出版形式不同可分为十种类型:图书、期刊、科技报告、会议文献、政府出版物、专利文献、标准、产品资料、学位论文、技术档案2、按记录信息的材料可分为三种类型:纸印本文献、缩微型文献、机读型文献3、按加工深度不同可划分为四种:零次文献、一次文献、二次文献、三次文献四者之间的关系:从零次文献到三次文献,是一个从分散的原始文献加工整理系统化的过程。
零次文献是一次文献的素材,一次文献是基础,是检索的对象;二次文献是检索一次文献的工具;三次文献是一次文献的浓缩,是情报信息的重要来源。
五、信息检索系统类型:⑴根据检索目标和检出文献信息形式的不同:文献检索、数据检索、事实检索⑵根据具体检索手段不同:手工检索、机械检索六、检索步骤:分析研究课题确定检索范围和检索标识选定检索工具确定检索途径查找和获取原始文献七、信息检索的方法:⒈常用法:是利用检索工具查找文献的方法.⑴顺查法⑵倒查法⑶抽查法⒉追溯法:从已知的现有文献后所列参考文献入手,逐一追查原文,从这些原文后所列参考文献再逐一追查,不断扩检的查找方法⒊循环法:指追溯法常用法混合使用的方法。
八、信息检索的途径:⒈根据外表特征划分著者途径;书名、篇名、刊名途径;序号途径⒉根据内容特征划分分类途径(SA、Ei);主题途径(SA、Ei);分子式途径(CA)九、文献检索的一般步骤:1、分析研究课题2、确定检索范围与检索标示3、选择检索工具4、确定检索途径5、查找和获取原始文献检索途径与方式:初级检索:默认的检索方式高级检索:两种检索方式组合使用,如“篇名”和“著者”。
信息检索考试重点信息检索考试类型:闭卷考试题型:单选、判断、名词解释、应用(信息检索过程)考试重点:1、文献:文献是记录知识的一切载体。
凡是用文字、图形、符号、声频、视频记录下来,具有存贮和传递知识功能的一切载体都称为文献。
2、文献类型:印刷型缩微型视听型机读型3、知识:是在人们对信息进行分析的基础上提供的解决方案。
知识管理的主要目的是使信息能够服务于人们的行动和决策。
4、信息:是凭借人的认知能力和经验对数据进行选择、评价、组织和分析的结果。
信息管理主要是解决数据的相关性、系统化和规范化的问题。
5、数据:指离散孤立的互不关联的事实、文字、数据和符号,这些资料之间缺乏相关性。
6、文献级次:零次文献(灰色文献):指非正式出版物或非正式渠道交流的文献。
一次文献(原始文献):凡是著者在科学研究,生产实践中根据科研成果,发明创造撰写的文献,称为一次文献。
一次文献是文献的主体,是最基本的情报源,是文献检索的对象。
二次文献:它是将分散、无序的一次文献,按照一定的原则进行加工,整理、提炼、组织,使之成为便于存贮、检索的系统。
如目录等检索工具。
三次文献:它是在利用二次文献的基础上,选用一次文献的内容,进行分析、概括、综合研究和评价而编写出来的文献。
它又可分为综述研究类和参考工具类两种类型。
前者如动态综述、学科总结、专题述评、进展报告等;后者如年鉴、手册、大全等。
三次文献源于一次文献,又高于一次文献,属于一种再创性文献。
三次文献一般来说系统性好,综合性强,内容比较成熟,常常附有大量的参考文献,有时可作为查阅文献的起点。
高级文献:计算机型文献,如:PTF、HTM等。
7、十大文献源1图书(Books) 2期刊(Periodicals)或(Journal,Magazine) 3科技报告(Technical reports) 4政府出版物 5会议文献(Conference papers) 6专利文献:(patents) 7学位论文(Thesis,Dissertation)8技术标准(Technical standards) 9科技档案 (document) 10产品样本8、文献检索:从大量的文献中查找与特定课题有关的文献的过程。
1,、十大信息源:图书、连续出版物、学位论文、科技报告、会议文献、政府出版物、专利信息、标准信息、产品样本、档案文献2、二次信息:是对一次信息进行加工、提炼、压缩和整理后所得到的信息,如目录、题录、文摘、索引和名录等检索工具。
二次信息主要功能是检索通报控制一次信息帮助人们在较少时间内获取较多信息,故又称为检索信息或通报性信息,其具有汇集性工具性综合性系统性等特点。
3信息素质;作为具有信息素质的人必须具有一种能够充分认识到何时需要信息并有能力有效地发现检索评价和利用所需要的信息解决当前存在的问题的能力4信息素质的内容:信息意识、信息能力、信息道德1、信息检索是指依据一定的方法从已经组织好的大量有关信息组合中直接查找并获取特定的相关信息的过程。
2、信息检索的基本原理可以从信息的替代、整序、标识的匹配三方面来讲述。
3、信息检索的类型文献检索、数据检索、多媒体检索4、信息检索的发展趋势表现在智能化、可视化、个性化、专业化5、信息检索的意义:有利于培养人才提高学生自学能力和独立的科研能力;帮助科研人员继承和借鉴前人的成果避免重复研究减少重复劳动;帮助科研人员迅速准确的获取所需的全部资料提高科研效率缩短科研周期;促进信息资源的开发利用推动社会进步和经济发展。
6、检索语言是根据信息检索的需要而创制的人工语言适应文献信息的加工存储和检索的共同需要而编制的语言是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标志系统。
7、检索语言的主要作用标识文献信息内容及其外表特征保证不同标引人员标引文献的一致性;对内容相关的文献信息加以集中或揭示其相关性;使文献信息的存储集中化系统化组织化便于检索着按照一定的排列次序进行有序化检索;便于将标引用语和检索用语进行相符性比较保证不同检索人员表述相同文献内容的一致性;保证检索者按不同需要检索文献时都能获得最高查全率和查准率。
8、信息检索技术布尔逻辑检索、截词检索、位置检索、限制检索9、信息检索的评价指标体系主要包括对信息检索数据库的评价对检索结果的评价对检索功能的评价和对用户负担的评价。
一、信息检索四要素1、信息检索的前题:信息意识2、信息检索的基础:信息源3、信息检索的核心:信息获取能力4、信息检索的关键:信息利用二、信息基本特征:普遍性、客观性、扩散和传递性、增值性(创新)、可存贮性和可压缩性、可知性(信息能力)和共享性知识属性:意识性、信息性、实践性、继承性、渗透性情报属性:针对性、知识性、时间性、传递性、效用性信息、知识、情报的关系:信息经过人脑思维加工,即认识飞跃产生知识,情报属于知识的范畴。
广义的情报是信息的传递,因此,情报具有信息和知识两种性质。
三、按载体不同分为:口头信息源、实物信息源、文献信息源四、文献信息源:1、按出版形式不同可分为十种类型:图书、期刊、科技报告、会议文献、政府出版物、专利文献、标准、产品资料、学位论文、技术档案2、按记录信息的材料可分为三种类型:纸印本文献、缩微型文献、机读型文献3、按加工深度不同可划分为四种:零次文献、一次文献、二次文献、三次文献四者之间的关系:从零次文献到三次文献,是一个从分散的原始文献加工整理系统化的过程。
零次文献是一次文献的素材,一次文献是基础,是检索的对象;二次文献是检索一次文献的工具;三次文献是一次文献的浓缩,是情报信息的重要来源。
五、信息检索系统类型:⑴根据检索目标和检出文献信息形式的不同:文献检索、数据检索、事实检索⑵根据具体检索手段不同:手工检索、机械检索六、检索步骤:分析研究课题确定检索范围和检索标识选定检索工具确定检索途径查找和获取原始文献七、信息检索的方法:⒈常用法:是利用检索工具查找文献的方法.⑴顺查法⑵倒查法⑶抽查法⒉追溯法:从已知的现有文献后所列参考文献入手,逐一追查原文,从这些原文后所列参考文献再逐一追查,不断扩检的查找方法⒊循环法:指追溯法常用法混合使用的方法。
八、信息检索的途径:⒈根据外表特征划分著者途径;书名、篇名、刊名途径;序号途径⒉根据内容特征划分分类途径(SA、Ei);主题途径(SA、Ei);分子式途径(CA)九、文献检索的一般步骤:1、分析研究课题2、确定检索范围与检索标示3、选择检索工具4、确定检索途径5、查找和获取原始文献检索途径与方式:初级检索:默认的检索方式高级检索:两种检索方式组合使用,如“篇名”和“著者”。
信息检索知识点范文信息检索是指从大量的信息中找到与用户需求相关的信息的过程。
以下是信息检索的一些重要知识点:一、信息需求分析:1.了解用户需求:包括明确用户的信息需求,了解用户的背景和需求的具体要求。
2.制定信息策略:确定的关键词、限定范围、排除冗余和无关信息的策略。
二、信息源:1.内部信息源:组织内部的数据库、档案等。
2.外部信息源:包括互联网上的网页、文档、图片等。
三、信息检索模型:1.自动索引:使用关键词或主题对文档进行描述和索引,并建立索引词表,方便用户检索。
2.布尔模型:将检索式表示为逻辑表达式,利用逻辑运算符对检索词进行组合,实现精确的文档检索。
3.向量空间模型:通过计算文档和查询的向量空间相似度,将文档按相关性排序。
4.概率检索模型:通过统计分析文档和查询的概率模型,计算文档的相关性概率。
5.链接分析模型:根据页面之间的链接关系和链接的权重等信息来评估页面的相关性。
四、检索评价:1.检索精度:通过计算检索结果的相关文档和非相关文档的比例,来评估信息检索系统的精确性。
2.检索效率:评估信息检索系统执行查询的速度和资源消耗程度。
3.检索一致性:评估系统在连续多次查询时的稳定性和一致性。
五、信息检索技术:1.关键词:通过输入关键词进行检索,系统会返回与关键词相关的文档。
2.高级:包括利用限定符进行、布尔逻辑、通配符等。
3.相关性反馈:根据用户的反馈信息,调整检索结果的排序,提高检索的准确性。
4.语义分析:通过对查询语句和文档的语义进行分析,找到语义上的相关性。
5.分布式检索:将索引和查询分发到多个节点上进行检索,提高速度和可靠性。
六、信息检索系统的应用:1. 网络引擎:例如Google、百度等,为用户提供互联网上的信息服务。
2. 文献检索系统:用于科研人员查找相关文献,例如PubMed、IEEE Xplore等。
3.图像检索系统:通过图像的内容特征进行检索,例如相似图片、人脸识别等。
4.音乐、视频检索系统:通过音乐或视频的特征进行检索,例如识别歌曲、相似视频等。
信息检索的概念:广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术;狭义的信息检索是指从信息集合中找到所需信息的过程。
信息(information)信息是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。
信息具有共享性、存储性和传递性、价值性、时效性。
情报是指运用一定的形式,传递给用户,并产生效益的知识或信息。
三个属性:知识性、传递性、效用性。
知识是优化、理论化的信息集合。
文献(document)是指记录有知识的一切载体。
也就是说用文字、图形、符号、声频、视频等手段记录下来的人类知识都可以称之为文献。
四个要素:知识载体文字、图形、符号、视频、声频记录简述信息、知识、文献的概念及其三者之间的关系。
信息:是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。
知识:是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。
文献:记录有知识的一切载体三者从概念范畴上看,信息大于知识大于文献,知识是信息的一部分,是理论化系统化的信息,文献是知识中记载下来的那部分。
信息素质(information literacy)是指判断何时、何地需要信息,并有效的定位、获取、评价和利用信息的一系列能力的总和。
包括:计算机素养、因特网素养、媒体素养、图书馆素养、批判性思考的能力。
信息素质主要体现在:——信息意识:是个体对信息重要性认识程度和对信息是否具有特殊的、敏锐的感受力和持久的注意力,即对信息的捕捉、分析、判断和吸收的敏感性。
——信息能力:是对信息的搜集获取能力、分析鉴别能力和综合利用能力。
——信息道德:是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的伦理规范。
零次文献是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等。
一次文献是指作者直接以自己的工作、科研、社会活动等实践经验为依据而撰写,并公开发行进入社会流通的专著、学术论文、专利说明书、科技报告等。
信息检索知识点 Revised by Liu Jing on January 12, 2021信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
信息的基本概述一信息:1.信息的特征(5个普遍性与客观性、依存性与传递性、可知性与共享型、可扩充性与可压缩性、时效性与滞后性)2.数据信息、知识、文献、情报、智慧DIKW模型看截图3.信息检索的概念与本质(匹配过程)本质:是用户的信息需求和信息集合的匹配过程,进而满足用的信息需求的过程二信息资源(定义信息资源是人类在认识世界和改造世界过程中产生、整理、记录的有用信息的集合)1.信息资源的类型按时间的产生顺序先导信息资源、即时信息资源、滞后信息资源按传播形式口头信息资源、文献信息资源、实物信息资源按载体形式书写型、印刷型、缩微型、视听型、数字型按出版形式(十大科技情报源)图书、期刊、会议文献、学位论文、专利文献、科技报告、标准文献、技术档案、产品资料、政府出版物按加工深度(零次一次,二次)一次文献知识的首次固化期刊论文、标准、报告、文献等:是依据作者本人的科研成果而撰写的首次记录科研成果的原始文献二次文献检索工具题录,目录,书录,文摘,索引:是对分散的无组织的一次文献进行加工整理、压缩、提炼、简化、整理的产物三次文献直接提供答案百科全书,词典,手册:对大量一次文献经过综合、分析、提炼撰写而成零次文献实验数据,观察记录,手稿等:是形成一次文献之前的信息、知识、情报、即未公开记录或未公开与社会的最原始的文献,或没有正式的发表的文字材料信息资源的特点能够重复使用、具有整合性、具有流动性、共享性、实效性、动态性、不可分性、支配性信息资源的作用可以减少物质与能量的作用,从而极大提高社会劳动生产率,有利于实现国民经济的可持续发展。
信息资源已经成为了当今社会的核心资源。
信息资源的开发利用,可有效降低社会的运营成本三信息社会(概述与内容包括哪三类资源)信息素养的三个层次:基础性、自我满足性、自我实现性信息素养(IL)(定义美国图书馆协会:具有信息素养的人能够知道什么时候需要信息,能够有效的识别、获取、评价、和利用所需要的信息)信息素养的内涵:信息意识对信息的敏感程度,有效发现信息需求,是人们产生信息需求,形成信息动机和兴趣的动力和源泉信息知识信息的基本知识(相关理论、知识与方法),信息技术和知识(信息技术原理)等信息能力获取、理解、处理、表达、评价、利用、创新等信息法律与道德(又称信息伦理)了解利用信息所涉及的经济、法律和社会问题,合理、合法地获取和利用信息第二章信息检索绪论一信息检索概述信息检索概念广义:存储和查询将信息按一定的方式组织和存储,并根据信息用户需求查找所需信息的过程侠义:查询从信息集合中查询信息用户所需信息的过程(仅指从已经存贮的具有检索功能的信息集合中查询出所需要的信息的过程)信息检索原理信息需求与信息集合:匹配检索者将检索提问式与存储与检索系统的文献标引词进行匹配对比,取得一致性即为最符合要求的结果信息检索类型信息检索内容对象数据、事实、文献信息检索组织方式全文、超文本、超媒体信息检索的手段手工与计算机信息检索步骤6个分析课题明确需求、选择检索工具或数据库、确定检索方法、确定检索途径、查找文献检索、获取原始文献。
计算机信息检索复习计算机信息检索是指通过计算机技术来获取和利用大量信息资源的过程。
在现代社会,数据量爆炸式增长,人们需要从海量的信息中快速准确地找到所需的信息。
计算机信息检索因此成为一门重要的学科,被广泛应用于各个领域。
本文将从计算机信息检索的基本概念、分类方法、技术算法以及发展前景等方面进行复习。
一、基本概念1.1 信息检索与搜索引擎的区别信息检索是指通过用户输入的关键词等信息,在信息资源中查询并返回相关信息的过程,而搜索引擎是指以互联网为载体,通过爬取、索引和检索技术,提供全面、快速、准确的信息查询服务。
1.2 关键词关键词是用户在进行信息检索时使用的重要词汇,它能够准确描述用户的需求。
在信息检索系统中,关键词通常通过布尔逻辑运算符进行联合查询,以便更加准确地匹配用户需求。
1.3 相关性相关性是指检索结果与用户需求的一致程度,是衡量信息检索系统性能的重要指标。
相关性通常通过计算文档与查询之间的相似度来确定。
二、分类方法2.1 根据检索领域根据检索领域的不同,可以将计算机信息检索分为一般文本检索、专业文献检索、多媒体检索等。
2.2 根据检索模式根据检索模式的不同,可以将计算机信息检索分为精确检索和模糊检索。
精确检索要求检索结果与用户需求完全一致,而模糊检索则容许检索结果与用户需求存在一定程度的差异。
2.3 根据检索技术根据检索技术的不同,可以将计算机信息检索分为基于关键词的检索和基于内容的检索。
基于关键词的检索是目前应用最广泛的检索方式,而基于内容的检索则能够更好地满足用户个性化需求。
三、技术算法3.1 倒排索引倒排索引是一种常用的信息检索技术,它将文档集合中的每个词汇与包含该词汇的文档进行关联,快速地定位文档。
倒排索引能够大大提高检索效率和准确性。
3.2 向量空间模型向量空间模型是一种通过计算文档与查询之间的相似度进行检索的方法,它将文档和查询表示为向量,通过计算它们之间的夹角来衡量相似度。
信息检索的概念广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术;狭义的信息检索是指从信息集合中找到所需信息的过程。
第一章计算机信息检索的1.1 学科基础-信息学概述信息概述信息需要和检索1.2 技术基础-信息技术概述信息技术概述信息检索的关键技术-P14★具有广泛影响的定义:信息:是指应用文字、数据或信号等形式通过一定的传输和处理,来表达各种相互联系的客观事物在运动总所具有的特征性内容的总称。
知识(Knowledge)词典解释:知识是人类在改造世界的社会实践中获得的对事物本质认识的成果和结晶。
知识是人类对自然界、人类社会中各种现象、规律进行思维分析、加工提炼形成的系统化、理论化结果。
也就是通过大脑思维重新组合的系统化的信息集合。
因此,系统化、理论化的正确信息就是知识(1)按信息的表达形式划分•文献信息•声像信息•电子信息文献(document)是指记录有知识(或信息)的一切载体。
也就是说用文字、图形、符号、声频、视频等手段记录下来的人类知识都可以称之为文献。
三个要素:ϕ内容-被记录的知识(信息)κ载体λ记录知识信息的手段一个特点:记录(2)按信息加工的层次划分-P5零次信息指尚未以公开形式进入社会流通使用的信息。
如:实验记录、会议记录、内部档案、论文草稿、设计草稿等。
一次信息指以信息编制者的研究成果为依据而创作(撰写)的并公开发表或出版的信息。
如:图书、学术论文、专利说明书、科技报告等,是信息检索的主要对象和最终目标。
二次信息指对一次信息进行加工整理,使之简化(如著录信息特征,摘录信息内容要点等),或分类编辑之后所得的产物,或为了便于检索和利用一次信息而编辑出版的产物。
如目录、索引、文摘、书目型数据库等。
二次文献是对一次文献的浓缩和有序化,主要作用:是存贮和报道一次文献线索、提供查找的途径,是检索的主要学习对象。
三次信息指根据某种需要和目的,利用二次信息作为手段,将某方面的大量一次信息加以全面系统的再度选择、分析和综合,编写成具有专指性内容和使用目的更为明确、效果更为直接的三次信息。
信息检索知识点信息检索考点整理 1 、信息检索的概念广义的信息检索就是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储与检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。
2. 信息检索的原理就就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡就是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就就是初步命中检索所需的信息。
3 、为什么说信息存储与检索就是两个不可分割的有机体?检索的全过程包括存储与检索两个过程,存储与检索就是相辅相成、不可分割的。
存储过程主要就是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要就是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程就是存储过程的逆过程。
因此,检索者只有在全面了解存储者就是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4 、信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法(4)追溯法 (5)循环法 5 、信息检索的途径 (1)内部特征途径a) 分类途径 b) 主题途径 (2)外部特征途径 a) 题名途径 b) 著者途径 c) 文献编号途径 d) 检索途径 e) 机构检索法 f) 引文检索途径 6 、布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2) 可操作性强,应用广泛;(3) 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4) 能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7 、概率排序原则: 如果一个检索系统对用户的每个检索提问的反应就是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果就是最好的。
信息检索数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号.一般指原始,未处理过的数据。
信息(Information):1。
物质存在的一种方式。
一般指数据、消息中所包含的意义.可以使消息中所描述的事件的不定性减少。
2.是事物运动的状态与方式的反映。
知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。
B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。
提供某种经过思考的判断和某种实验的结果.(信息是知识的原材料,知识是信息加工的抽象化产物.)情报(Information):钱学森:“情报是活化了的、激活了的知识”。
可以理解为是指传递着的有特定效用的知识或信息。
三要素:知识性、传递性、效用性文献(Literature):记录有知识的一切载体.三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。
)、知识(反映了文献的信息内容.)、记录(信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。
)文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-—--—手工检索,缩微时期-—--—缩微检索,20世纪90年代后期,光盘时期-—--—单机检索,网络初期-——--联机检索21世纪,网络兴盛—--——网络检索第一章信息检索原理一、信息检索的含义(掌握)广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。
二、信息检索的类型(一、)以检索内容划分(重点)1.文献信息检索凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。
其检索的结果是文献信息2。
数据信息检索(DataRetrieval)凡是利用参考工具书、数据库等检索工具检索包含在文献中的某一数据、参数、公式或化学分子式等,统称为数据信息检索。
其检索结果为数据信息.3.事实信息检索(FactRetrieval)凡是利用百科全书等检索工具从存储事实的信息系统中查找出特定事实的过程称为事实信息检索。
其检索结果是基本事实。
文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。
一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。
(二、)以信息存储和检索的方式和技术划分(掌握)1。
手工检索(ManualRetrieval)手工检索简称“手检",是指人们通过手工的方式来存储和检索信息。
其使用的检索工具主要是书本型、卡片式的信息系统,即目录、索引、文摘和各类工具书.检索过程是由人工以手工的方式完成的.2。
计算机检索(Computer—basedRetrieval)计算机检索简称“机检”,是指人们利用数据库、计算机软件技术、计算机网络以及通信系统进行的信息存储和检索,其检索过程是在人机的协同作用下完成的.三、信息检索的意义(重点)(会用自己的语言表达)1。
避免重复研究或走弯路—科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。
2.节省研究人员的时间3。
是获取新知识的捷径一、检索工具的定义(了解)1.用来揭示、存储和查找信息的工具,主要指手工检索工具。
2。
检索系统则是由一定的检索设备(如计算机)和经过加工整理并存储在相应载体(如磁带、磁盘等)上的信息集合及其他设备共同构成的一种具有存储和检索功能的信息服务系统。
二、检索工具的类型(了解)目录目录款目索引索引款目文摘1、目录综合性目录:是以各个学科门类的图书或者报刊文献为揭示对象的目录。
如《全国总书目》、《中国国家书目》、《中国报纸名录》、《中国期刊名录》等。
(1)专题目录(2)馆藏目录(3)联合目录2、索引(Index)(1)索引是指将信息中所包含的主题词、分类号、著者姓名、论文题名等内容摘录出来,并注明它们所在图书、期刊或检索工具中的位置,然后按照一定的规则编排组织起来所形成的检索工具。
如《工程索引》(Ei)的“主题索引"、“著者索引"等。
(2)索引条目至少有两个著录项目:标目(标识Heading)和存储地址,有时候可能还会有说明语.主题索引、著者索引是最常用的索引。
3、文摘(Abstract)(1)文摘就是对一份文献的内容所进行的简略而准确的描述。
通俗地讲,文摘就是原始文献的内容摘要。
它是将论文或书籍的主要论点、数据和结论等信息简明扼要地摘录出来,注明出处,并按一定方式编排的一种文献检索和阅读工具。
它是检索工具的主体,二次信息的核心。
美国的《工程索引》(Ei)和英国的《科学文摘》(SA)等均属此类检索工具。
(2)文摘通常以一个内容上独立的文献单元(如期刊中的一篇论文、会议录中的一篇会议论文或一种图书)为基本著录单位(见第五章《工程索引》文摘款目的样页)。
它和目录的主要区别在于:目录以单位出版物为著录对象,而文摘的著录对象可以是一个单位出版物,也可以是单位出版物的个别内容;目录反映的是文献的外部特征,而文摘既反映文献的外部特征,又反映文献的内容特征.三、信息检索的方法(掌握):1、常规法2、追溯法3、交替法(一)常规法:常规法就是利用检索工具查找信息的方法,因在信息检索中经常使用而得名。
它又分为顺查法、倒查法及抽查法三种。
顺查法--顺查法即是利用检索工具、根据课题研究的起始年代由远及近逐年查找信息的方法。
顺查法比较费时间,但由于是逐年查找,因而有较高的查全率。
倒查法——倒查法与顺查法相反,它是利用选定的检索工具由近及远、逐年逐卷地进行查找信息的方法。
当检索者的要求是获取近期文献时,最好采用倒查法。
倒查法的查准率较高,查全率比顺查法低。
抽查法—-抽查法是针对课题研究所处的发展高峰阶段进行的信息检索,它往往用来解决要求快速检索的课题.抽查法有较高的检索效率,但使用该方法的前提是必须事先了解该研究课题的历史背景。
(二)追溯法:追溯法又称引文法,主要有以下两类。
1.传统追溯法——它是利用一次信息所附的参考文献进行追溯查找的方法。
检索时可以先查找出几篇与课题有关的专著或述评(这类文献往往附有大量的参考文献,多时可达上百篇),以此作为起点进行检索。
2.引文追溯法——它是一种由远及近的检索方法,即找到一篇与课题有关的论文后进一步查找该论文被哪些文献引用过、是否有人对该领域做过进一步研究、实践结果如何、最新的进展怎样等。
由远及近地追寻,信息愈来愈新,研究也就越深入。
这种方法主要依靠专门的引文索引,如《科学引文索引》(SCI)、《社会科学引文索引》(SSCI)等。
(三)交替法1、交替法就是以追溯法和常规法交替使用来查找信息的方法,又称分段法或综合法。
2、即先利用检索工具查出一批相关信息,然后利用这些信息所附的参考文献进行追溯,扩大线索,由此获得更多信息。
交替法比前两种方法的检索效果好,是一种立体型的检索法。
3、当检索工具缺期或缺卷时,使用该方法也能连续获得所需年限以内的信息四、信息检索的程序(重点)(会用自己的语言表达)1、分析检索课题2、选择检索工具3、选择检索途径,确定检索标识4、选择检索方法5、获取原始文献(一)分析检索课题课题分析是信息检索过程中最重要的环节.每一项检索课题都有明确的目的和具体的要求。
课题分析应从以下几方面进行。
1.分析主题内容确定文献的学科范围,其次找出课题研究需要解决的关键问题,选择恰当的主题词或关键词,这是成功检索的第一步。
2。
分析时间范围分析查找年代,确定检索的时间范围,可避免浪费时间和精力.根据课题的历史背景和检索要求,推算出所需信息最为适当的时间段.例如,为了了解某个领域的最新研究进展,只查询近一两年的文献就可以了。
如果是专利的查新检索,回溯年限则相对要长些。
3.分析信息类型在进行信息检索时,还要进一步确定待查信息的类型。
因为不同的检索工具对不同信息的收集量不同.如研究基础理论课题,则应侧重于检索期刊论文、专著和会议论文;如果是技术应用和开发的课题,则侧重于检索专利文献、标准文献及科技报告等。
明确信息类型,可为选择检索工具和检索手段提供依据,提高检索的针对性,否则将会降低检索效率,甚至一无所获。
(二)、选择检索工具选择检索工具的依据有以下两方面。
1.根据课题涉及的学科范围进行选择如果课题复杂,涉及的学科多,应选择综合性和专业性检索工具相结合的方法进行检索:如果课题涉及学科单一,可以以专业性检索工具为主、综合性检索工具作为补充。
如要查找关于“计算机软件"的信息,可以先利用专业性较强的《科学文摘》(SA)的C辑“计算机与控制文摘(CCA)”查找,然后再用综合性的工具《工程索引》(Ei)作为补充.如果检索课题涉及某种特定的信息类型,则应选用收录特定信息类型的检索工具。
比如要检索专利文献,应选用<〈中国专利公报》、《世界专利索引》(WPl),或者专利信息数据库等检索工具。
2.根据检索工具收录范围和编制体系进行选择不同的检索工具在收录范围、报道形式、编排体系、著录格式和索引系统等方面不尽相同,使用时可根据具体检索要求加以选择。
这里需要强调的是,对于类型相似的检索工具,应该根据收录的信息量、文摘和题录的质量、标引的质量、使用的方便程度及出版的周期等加以选择。
(三)选择检索途径,确定检索标识检索途径是检索的入口。
主要有两类:一是反映信息内容特征(主题、分类)的检索途径,二是反映信息外部特征(著者、题名、代码等)的途径。
1.选择检索途径(1)分类途径-—它是按学科分类体系查找信息的途径,主要有分类目录和分类索引.它以学科概念的上、下、左、右关系来反映事物的派生、隶属、平行、交叉的关系,能够较好地满足族性检索的要求.(2)主题途径(3)题名途径(4)著者途径如著者索引、著者目录、全国报刊索引。
缺点:无系统性和完整性.(5)信息代码途径通过已知信息的专用代码查找信息的途径。
ISBN、ISSN、专利号、合同号、标准号、入藏号等。
2.确定检索标识每个检索途径对应一种检索标识。
采用主题词做检索标识时,应考虑该词的同义词、近义词,以免漏检。
上位类(放大)、下位类(缩小)(四)选择检索方法(五)获取原始文献1.判断信息的发表类型2。
缩写语和非拉丁语系文字的音译问题3。
通过其他方式获得4馆际互借、代购、向著者索取、向出版发行机构购买、联机订购、数据库全文.信息检索是一种逻辑思维与推理过程.第二章信息检索语言信息检索的意义和作用(掌握)信息检索的意义:检索语言就是为沟通信息标引与信息检索两个过程而编制的人工语言,是连接标引人员与检索人员双方思路的桥梁信息检索的作用:(1)帮助信息工作人员完整、准确、快速地标引信息的内容特征和外表特征,完成信息的存储过程,也就是利用检索语言编制检索工具或建立检索系统.各种图书资料分类表、主题词表都是利用检索语言编制而成的.(2)帮助检索者系统、全面、准确地查找所需的文献资料,完成文献的检索过程。