信息检索重点
- 格式:doc
- 大小:52.50 KB
- 文档页数:26
计算机检索1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息。
2.信息检索广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。
包括存储和检索两个过程.狭义:从信息集合中找出所需信息的过程。
信息查找(Information Search,Information Seeking)2。
1信息现状分析1)信息爆炸导致文献量急剧增加,内容相互渗透,语种增多;文献分布异常分散;文献寿命愈来愈段;2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高。
3.检索的作用1)促进智力资源的开发;2)协助管理者做出正确的决策;3)帮助科研人员借鉴前人的研究成果,避免重复劳动;4)信息检索是知识更新的手段.4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。
自建数据库:馆藏目录(OPAC),本校学位论文数据库。
商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。
免费数据库:开放获取资源、机构典藏和其他免费的网络资源。
5.数据库类型(2)从收录文献的内容分,有综合性数据库和专业性数据库之分;从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA)综合性数据库:读秀、Scopus、EI、SCI特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:Web of Science、CSSCI(中文社会科学引文索引)6.Science Citation Index Expanded(SCI—E)是个什么样的数据库?它是ISI检索平台中Web of Science核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科范围包括科学、技术的各学科7.查文献应该如何选择数据库?学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要。
信息检索数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号.一般指原始,未处理过的数据。
信息(Information):1。
物质存在的一种方式。
一般指数据、消息中所包含的意义.可以使消息中所描述的事件的不定性减少。
2.是事物运动的状态与方式的反映。
知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。
B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。
提供某种经过思考的判断和某种实验的结果.(信息是知识的原材料,知识是信息加工的抽象化产物.)情报(Information):钱学森:“情报是活化了的、激活了的知识”。
可以理解为是指传递着的有特定效用的知识或信息。
三要素:知识性、传递性、效用性文献(Literature):记录有知识的一切载体.三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。
)、知识(反映了文献的信息内容.)、记录(信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。
)文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-—--—手工检索,缩微时期-—--—缩微检索,20世纪90年代后期,光盘时期-—--—单机检索,网络初期-——--联机检索21世纪,网络兴盛—--——网络检索第一章信息检索原理一、信息检索的含义(掌握)广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。
二、信息检索的类型(一、)以检索内容划分(重点)1.文献信息检索凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。
1. 按物质载体和记录形式划分,信息可分为印刷型、缩微型、声像型、机读型和手写型。
2. 文献是指“记录有知识的一切载体”,情报是“作为交流对象的有用知识”3. 内容、符号系统、物质载体、记录方式是构成文献的四个基本要素。
4. 按出版形式和内容的不同,信息可分为图书、期刊、报纸和特种信息。
特种信息也叫做灰色信息,包括:专利信息、学位论文、标准信息、会议信息、科技报告、政府出版物、产品样本资料和档案。
5. ISBN是国际标准书号,由13位数字组成,分成四段:组号(国家、区域、语言的代号);出版者号;书序号;检验码。
ISSN号是国际标准出版物号,由8位数字组成,分两段:分序号、校验码。
6. 图书按用途可分为3种类型:阅读用书,参考工具书,检索用书7. 按检索方法划分,检索工具可分为手工检索工具、计算机和网络检索工具。
8. 知识产权范围主要包括专利权、著作权和商标权9. 知识产权具有两大功能:保持功能和公开功能10. 广义的检索包括信息的存储和检索两个过程。
11. 检索方法分为常规法、引文法(追溯法和检索引文法)和交替法三种12. 检索途径可以分为主题途径、分类途径、责任者/著者途径、号码及其它途径13. 手工检索工具中的著录项目在数据库中称为字段,字段的集合称为记录。
14. 文献数据库内英文段码Abstract对应的中文段码名称是文摘。
Keyword对应的中文段码名称是关键词。
15. 按国际上通用的分类法,数据库分为参考数据库、源数据库和混合型数据库。
16. 中国现行主要的图书分类方法是《中国图书馆分类法》,它属于体系分类语言。
17. 《中图法》第四版将图书分为5部,22大类,L.M.W.Y没有,计算机属于TP类, 属于二级类目。
18. 索书号主要由分类号和著者号组成。
19. 在因特网中,政府机构和商业组织的二级域名分别是GOV、COM。
域名.hk所指的国家或地区是香港;.org的含义是非营利组织.20. 公告号为8510961的专利是发明专利,专利号为200420011414.6的专利是实用新型专利;申请号为99322746.5的专利是外观设计专利。
信息检索课程重点整理一、信息概念:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。
特征:预先性、实用性、时效性、可传递性、共享性。
传递渠道:1、非正式过程(表现为个人的行为特征。
对话、通信、演讲、授课);2、正式过程(表现为文献流通。
借助文献系统进行正式交流)。
文献概念:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。
也可以称为固化在一定载体上的知识。
必须含有知识、记录方式、载体。
资料概念:固化在一定的实物或载体上的知识。
二、信息的类型:1、按信息的加工层次划分:一次信息(原始文献)、二次信息(检索工具)、三次信息(参考性文献)。
P42、按信息载体的出版编辑特点划分:十二大文献源。
P53、按信息载体的物理类型划分:印刷型、缩微型、电子型、声像型。
P64、按信息的性质划分:一、自然信息(自然界发出的信息,以自然物为载体);二、社会信息(经过人类利用语言、文字、符号、图像等方式加工过的自然信息)。
5、按信息所表征的服务对象划分:经济信息、科技信息、教育信息、军事信息、商业信息、金融信息、综合信息。
三、信息检索的定义及类型p2信息检索,就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。
它包括三个方面:数据检索、事实检索、文献检索。
三者中以文献检索为主。
数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。
四、文献检索的定义及类型p3定义:1、检索系统的建立及检索工具的组织和积累;2、文献的查寻,利用检索工具检出与课题相关的文献。
类型:直接检索:是从通过阅读原始文献直接获取所需信息;快捷、方便;漏查率高。
间接检索:是通过检索工具的指导再查找原始文献而获取所需信息。
系统、全面:滞后。
五、检索工具定义、具备条件及类型检索工具是按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。
1.信息检索(information retrieval) 定义(1)广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关的信息的过程和技术。
所以它的全称又叫信息存储与检索(information storage and retrieval).(2)狭义的信息检索:指广义的信息检索的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们的所说的信息查寻。
(information search)2.检索工具定义:检索工具是人们用来存储、报道和查找文献的工具。
因此,它具有存储和检索的功能。
存储是把分散、无序的文献,采用一定的检索语言使其集中,组织起来,成为有规律的检索系统,变成检索工具。
检索是人们按照有关检索语言,采用一定的方法和途径,检出自己所需的文献。
3.检索策略的定义陈光祚:所谓检索策略就是在弄清用户情报需求实质的前提下,选择检索途径、检索用词以及明确各词之间逻辑关系和查找步骤的科学安排。
赖茂生:所谓检索策赂,是指为实现检索目的而制定的全盘计划和方案,是对整个检索过程的谋划和指导。
4.信息资源:是人类存储与载体(包括人脑)上的已知或未知的可利用的信息。
信息中的载体信息和主体信息是使信息资源的最基本的组成部分。
填空一.检索工具的功能(1)报道功能。
(2)标识功能。
(3)辅助检索功能。
二.检索工具的类型1 按检索方法划分检索工具可以划分为手工检索和机械检索工具两大类型,机械检索工具主要是指计算机检索。
2 按收录范围划分检索工具可分为综合性检索工具、专业性检索工具、单一性检索工具3种。
综合性检索工具收录范围广,涉及多门学科。
专业性检索工具收录的范围仅限于某一学科领域。
单一性检索工具只收录某一特种类型的文献,但学科范围可广可窄。
3 按出版形式划分检索工具又可分为书本式、卡片式、磁带式和缩微制品等形式,书本式又包括书刊式、单卷式和附录式3种。
4 按收录文献的对象和揭示方式来划分⑴目录目录是一批图书或其他单独出版的资料的系统化记载及内容的揭示。
信息检索初步知识点总结信息检索是指利用计算机系统来检索和获取文档或者信息资源的技术和方法。
在当今信息爆炸的时代,信息检索具有非常重要的意义。
信息检索系统可以帮助人们快速准确地获取所需要的信息资源,不仅可以提高工作和学习效率,还可以帮助人们更好地利用信息资源。
在信息检索中,有一些基本的知识点是非常重要的,下面我将对这些知识点进行总结。
1. 信息检索的概念和发展历史信息检索是指从信息库中按照一定的要求来搜索、检索信息的过程。
它主要是利用计算机技术来实现信息的存储、检索和利用。
信息检索的发展可以追溯到20世纪50年代,随着计算机技术的发展,信息检索技术也得到了很大的发展。
现代信息检索系统不仅能够实现文档的存储和检索,还可以实现自然语言处理、信息抽取、信息过滤等功能。
2. 信息检索的基本过程信息检索的基本过程包括信息需求分析、文档表示和查询处理、检索模型和算法、评价和反馈等几个方面。
其中,信息需求分析是整个信息检索过程的第一步,它包括对用户的信息需求进行分析和建模,确定用户的检索目标和检索词,为后续的检索准备工作做好准备。
文档表示和查询处理是指对文档和查询进行适当的表示和处理,以便计算机系统能够理解和利用。
检索模型和算法是指根据文档和查询的表示,计算出相关度得分,以确定文档的相关性。
最后,评价和反馈是指对检索结果进行评价和反馈,以优化检索系统的性能。
3. 信息检索的技术手段信息检索的技术手段主要包括文本索引技术、全文搜索技术、信息抽取技术、信息推荐技术等几个方面。
其中,文本索引技术是指将文档中的关键词进行索引,以便计算机系统能够快速地定位到相关的文档。
全文搜索技术是指利用全文索引进行搜索,可以实现对文档中所有内容的搜索。
信息抽取技术是指从文档中抽取出有用的信息,以便为用户提供更精确的搜索结果。
信息推荐技术是指根据用户的行为和偏好,为用户推荐相关的信息资源。
4. 信息检索的评价指标信息检索的评价指标主要包括召回率、准确率、F值、MAP值等几个方面。
信息检索考试大一下知识点信息检索是指从大量的信息中快速找到满足特定需求的信息过程。
在大一下学期的信息检索考试中,通常会涉及以下几个知识点:一、信息检索基础概念1. 信息检索的定义和目的信息检索是指通过使用计算机技术,在海量信息中寻找到与用户需求相匹配的信息。
其目的是快速、准确地获取到用户所需的信息。
2. 检索模型和流程信息检索基于检索模型,常见的模型包括布尔模型、向量空间模型和概率模型。
检索流程一般包括问题建模、索引构建、查询处理和结果排序等步骤。
二、关键词检索1. 关键词的选择与组合在进行信息检索时,关键词的选择和组合非常重要。
关键词应该准确描述用户需求,并且能够尽可能覆盖相关领域的信息。
2. 布尔查询与逻辑运算符布尔查询是一种基础的检索方式,通过使用逻辑运算符(AND、OR、NOT)对关键词进行组合,从而获得符合用户需求的信息。
三、索引构建与检索技术1. 逆向索引逆向索引是一种常用的索引结构,它通过将文档中的每个单词与包含该单词的文档进行关联,实现了关键词到文档的快速定位。
2. 向量空间模型向量空间模型将文档和查询都表示为向量,在向量空间中进行计算,通过计算文档与查询之间的相似度来判断文档的相关性。
3. 布尔模型的实现与优化布尔模型的实现与优化涉及到倒排索引的构建与压缩、布尔运算的优化算法等方面的技术。
四、评价与改进1. 检索结果的评价对于检索系统的性能评价,一般使用准确率、召回率、F值等指标来衡量检索的有效性和完整性。
2. 改进方法与技术为了提升检索系统的性能,可以采用词干提取、查询扩展、排名算法优化等方式进行改进。
五、实际应用与发展趋势1. 商业搜索引擎与个性化推荐商业搜索引擎通过不断改进和优化信息检索技术,提供高效准确的搜索服务。
个性化推荐则基于用户的兴趣和行为,向用户推荐符合其需求的信息。
2. 大数据与信息检索随着大数据时代的到来,信息检索面临着处理海量数据的挑战。
如何有效地利用大数据技术来进行信息检索是当前的研究热点之一。
信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进展相符性比较,但凡信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,那么具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体.检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进展标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进展标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进展比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法〔1〕顺查法〔2〕倒查法〔3〕抽查法〔4〕追溯法〔5〕循环法5.信息检索的途径〔1〕部特征途径a)分类途径b)主题途径〔2〕外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:〔1〕简单,形式简洁,易于理解;〔2〕可操作性强,应用广泛;〔3〕构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常准确的语义概念;〔4〕能处理构造化提问。
缺点:〔1〕表达用户复杂需求效果欠佳〔2〕准确匹配无法提供定量比较〔3〕匹配标准不尽合理〔4〕检索结果不易控制7.概率排序原那么:如果一个检索系统对用户的每个检索提问的反响是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索.所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那局部信息的过程。
一、信息检索四要素1、信息检索的前题:信息意识2、信息检索的基础:信息源3、信息检索的核心:信息获取能力4、信息检索的关键:信息利用二、信息基本特征:普遍性、客观性、扩散和传递性、增值性(创新)、可存贮性和可压缩性、可知性(信息能力)和共享性知识属性:意识性、信息性、实践性、继承性、渗透性情报属性:针对性、知识性、时间性、传递性、效用性信息、知识、情报的关系:信息经过人脑思维加工,即认识飞跃产生知识,情报属于知识的范畴。
广义的情报是信息的传递,因此,情报具有信息和知识两种性质。
三、按载体不同分为:口头信息源、实物信息源、文献信息源四、文献信息源:1、按出版形式不同可分为十种类型:图书、期刊、科技报告、会议文献、政府出版物、专利文献、标准、产品资料、学位论文、技术档案2、按记录信息的材料可分为三种类型:纸印本文献、缩微型文献、机读型文献3、按加工深度不同可划分为四种:零次文献、一次文献、二次文献、三次文献四者之间的关系:从零次文献到三次文献,是一个从分散的原始文献加工整理系统化的过程。
零次文献是一次文献的素材,一次文献是基础,是检索的对象;二次文献是检索一次文献的工具;三次文献是一次文献的浓缩,是情报信息的重要来源。
五、信息检索系统类型:⑴根据检索目标和检出文献信息形式的不同:文献检索、数据检索、事实检索⑵根据具体检索手段不同:手工检索、机械检索六、检索步骤:分析研究课题确定检索范围和检索标识选定检索工具确定检索途径查找和获取原始文献七、信息检索的方法:⒈常用法:是利用检索工具查找文献的方法.⑴顺查法⑵倒查法⑶抽查法⒉追溯法:从已知的现有文献后所列参考文献入手,逐一追查原文,从这些原文后所列参考文献再逐一追查,不断扩检的查找方法⒊循环法:指追溯法常用法混合使用的方法。
八、信息检索的途径:⒈根据外表特征划分著者途径;书名、篇名、刊名途径;序号途径⒉根据内容特征划分分类途径(SA、Ei);主题途径(SA、Ei);分子式途径(CA)九、文献检索的一般步骤:1、分析研究课题2、确定检索范围与检索标示3、选择检索工具4、确定检索途径5、查找和获取原始文献检索途径与方式:初级检索:默认的检索方式高级检索:两种检索方式组合使用,如“篇名”和“著者”。
专业检索:输入命令行。
更直接、快速、准确初级检索检索步骤:1、登录全文检索系统CJFD2、选取检索范围——确定课题所在的专辑:双击专题查看下一级目录3、选择检索字段:题名、关键词、摘要、作者、单位、来源、全文、参考文献、主题、第一作者、基金4、选择年份:从1994年到今5、选择排序排序(无、时间、相关度)6、匹配(精确查询、模糊查询)7、输入检索词,点击[检索]按钮高级检索检索步骤:1、登录全文检索系统2、点击[高级]切换到高级检索系统界面3、选取检索范围4、字段限定5、有三个逻辑运算符连接两组检索词输入框(确定各检索词之间的关系AND或OR或NOT)6、点击[检索]检索工具类型:⑴按检索手段分手工检索工具、机械检索工具⑵按出版形式分书本式(期刊式检索工具( SA、Ei) 、单卷式检索工具、附录式检索工具)卡片式胶卷式磁带式(3)按用途检索性(目录、题录、文摘、索引)参考性(手册、年鉴、百科全书)语言性(字典、词典)⑷按收录范围分综合性检索工具(SA、Ei)专业性检索工具(MA、CA)单一性检索工具(WPA)⑸按著录方式分目录、题录、文摘、索引检索工具的结构说明:包括检索方法、内容范围、使用方法等著录:检索工具的正文(如题录文摘)索引:针对著录款目编排系统设立的检索途径附录:检索工具后的相关参考资料(如摘用期刊一览表、编写术语的解释等)检索工具中文献信息来源的识别:文献类型的识别(图书、期刊、会议文献、专利文献、科技报告、学位论文)刊名缩写的识别音译的识别检索工具体系1 、印刷型检索工具☆检索图书的检索工具;全国总书目、全国新书目(月刊)、中国国家书目、全国科技图书总览、全国图书书目总汇☆检索中文期刊的检索工具:中国当代期刊总览、中文核心期刊要目总览、全国中文期刊联合目录、中文科技期刊联合目录☆检索外文期刊的检索工具:国外科技核心期刊投稿指南、全国西文期刊联合目录☆检索报刊的检索工具—全国报刊索引☆检索技术成果的检索工具:中国技术成果大全(工、农、医)☆检索会议文献的检索工具:全国学术会议文献通报☆检索学位论文的检索工具:中国学位论文通报☆检索专利的检索工具:中国专利索引(分类年度索引、申请人、专利权人年度索引)2 、电子数据库☆检索图书的工具:书生之家、超星数字图书馆等☆检索中文期刊的工具:中国学术期刊数据库、维普数据库、万方数据库☆检索特种文献的工具:专利、标准等数据库检索途径和方法:1.分类途径(1)分析课题,确定类目和类号。
(2)浏览与选择文献。
(3)索取原始文献。
2. 作者途径根据作者索引得到文摘号,然后向前翻到正文部分,根据文摘号找到相应的文摘,如果需要原文,可根据来源出处到相应的馆藏单位或情报收藏单位索取原文。
3.题中人名途径“题中人名索引”,所列人名不是作者,而是论文中被论述的对象。
它是查找与某人有关资料的最好途径。
科学文摘的检索途径主要有三种:分类途径、主题途径和著者途径,还可以借助于附加索引,从书目途径、图书途径、会议途径、团体著者途径进行检索科学文摘的检索途径主要有三种:分类途径、主题途径和著者途径,还可以借助于附加索引,从书目途径、图书途径、会议途径、团体著者途径进行检索1.分类途径第1步:分析课题,确定类目第2步:阅读文摘,确定取舍第3步:索取原始文献2.主题途径第1步:分析课题,确定主题词第2步:查主题索引,初选文献线索第3步:阅读文摘,确定取舍第4步:索取原始文献检索途径的比较从分类途径和主题途径可以查到相同的文献。
但分类途径适用于现期检索,只能逐月逐本检索,比较麻烦,而从主题途径可以一次查到半年或多年的文献线索,适用于回溯检索。
若已知著者姓名,可从著者途径检索,由著者索引得到文摘号,再去查找文献。
参考工具书主要作用(1)为读者解决疑难问题、提供事实与数据(2)为学习或研究提供资料或线索(3)为读者治学指示门径(4)是传播知识和文化的工具参考工具书的特点(1)查考性(2)易检性(3)概括性(4)权威性(5)完备性(6)资料性(7)稳定性参考工具书的类型1、按文种:中文参考工具书和外文参考工具书2、按学科:社会科学参考工具书和科技参考工具书3、按编排目的、收录内容和功用:百科全书、年鉴、辞典、名录、手册、图表册与手工检索相比其特点:1.查找速度快,反馈及时2.检索范围广、涉及主题全面3.内容新颖,反映实时信息4.功能完善,操作简洁方便5.组配灵活,检索多元化6.检索费用(硬件、信息费、网络费)7.检索的适应性有时较差(用户需求不同)8.检索回溯的年限不够长(资源收录年限、加工难易度)计算机检索的种类目前广泛使用的计算机检索包括联机检索、光盘检索和国际互联网检索三种形式。
计算机信息检索系统的构成计算机检索系统由计算机硬件、软件、数据库和通讯网络构成。
计算机检索系统类型一、按存储的信息内容划分1、文献检索系统2、事实型检索系统3、数值型检索系统4、图像检索系统5、多媒体信息检索二、按检索的工作方式划分1、脱机信息检索系统2、联机信息检索系统3、光盘信息检索系统4、网络信息检索系统检索技术一、布尔逻辑检索二、截词检索三、原文检索四、加权检索和聚类检索五、限制检索六、区分大小写检索七、短语检索(精确检索)九、模糊检索十、概念检索十、相关检索检索策略的编制:1 分析检索课题2 选择检索工具,确定检索途径3 选取检索词,构造检索式4 检索式的反馈调整,输出结果5 检索效率分析和检索策略的调整网络信息资源的特点1、信息量大、传播广泛2、信息类型多样、内容丰富3、信息时效性强、变化频繁4、信息分散无序、但关联程度高5、信息缺乏管理、良莠不齐(三)、网络信息资源的类型1、按采用的网络传输协议划分(1)WWW信息资源(2)Telnet信息资源(3)FTP信息资源(4)用户服务组信息资源2、按信息资源组织形式划分(1)文件方式(2)超文本/超媒体方式(3)数据库方式(4)网站3、按网络信息资源的内容划分(1)网络数据库(联机、光盘数据库)(2)网络出版物(电子图书、电子期刊等)(3)社会信息(政策、新闻、娱乐信息等)(4)软件资源(各种应用程序)(5)其他类型的信息(论坛、电子公告、网络日志)网络信息检索的特点1、检索范围涵盖整个Internet2、传统检索方法与全新网络检索技术相结合3、用户界面友好且操作方便4、用户透明度高5、信息检索效率不高网络信息检索的一般方法1、浏览方式(1)随意浏览(2)分类体系浏览2、查询方式:通过输入检索条件,从大量的信息集合中检索信息的方式。
网络信息检索技术1、全文检索技术2、多媒体信息检索技术(1)基于内容的图像检索技术(2)基于内容的视频检索技术(3)基于内容的音频检索技术3、智能检索技术(采用人工智能计算机技术进行信息检索的技术)(1)机器学习技术(2)知识发现技术(3)自然语言理解技术(4)智能代理技术4、数据挖掘技术(1)Web内容挖掘(从文档内容或其描述中抽取知识)(2)Web结构挖掘(从组织结构和连接关系中推导知识)(3)Web使用记录挖掘(从Web访问记录中挖掘)5、自动标引和分类技术网络信息检索工具的类型1、WWW信息资源检索工具(1)网络资源指南(2)搜索引擎(3)信息门户(4)搜索软件2、非WWW信息资源的检索工具(1)FTP信息资源的检索工具(2)Telnet信息资源的检索工具(3)用户服务组信息资源的检索工具(一)、网络信息检索策略1、分析检索课题(1)明确检索目的(2)明确课题的检索范围(3)确定检索项2、选择检索工具(1)明确不同类型网络信息检索工具的适用范围(2)了解主要检索工具的特点和功能(3)重视检索工具的分类浏览功能在学术信息检索中的应用(4)注意多种网络检索工具的组合使用3、实施检索(1)了解检索工具的检索规则(2)确定检索词(3)构造检索式(4)选择和处理检索结果(二)、网络信息检索技巧1、提高检索效率的措施(1)提高查全率少用逻辑“与”、多用逻辑“或”、降低检索词的专指度等(2)提高查准率2、提高检索速度的措施(1)建立收藏夹分类体系(2)采用缓存措施(3)设置启动页面(4)减少信息媒体的装载网络信息检索的发展趋势1、网络信息检索的智能化2、网络信息检索的个性化(1)收录内容特色化(2)个性化检索设置(3)个性化检索界面(4)个性化信息推送3、网络信息检索的可视化4、网络信息检索的多样化(1)网上检索信息的多样化(2)网络检索工具的多样化(3)检索功能的多样化(4)系统维护的动态化搜索引擎的种类一、目录索引搜索引擎二、全文检索搜索引擎原文下载:1、在检索结果摘要区点击“原文下载”图标,弹出“文件下载”对话框2、如果要将文件下载到本地磁盘,请点“保存”,并指定路径3、如果要浏览原文,请点“打开”,检索系统会调用原文阅读器打开全文全文浏览器:在全文浏览器中可以实现:打开、打印、发送邮件、目录树、全屏、手形工具、放大、缩小、栏选、图像选择、复制、文字识别、首页、上一页、下一页、末页、上一视图、下一视图、实际大小、适合窗口、适合宽度、查找、下一个、这是什么、关于功能。