信息检索复习重要知识
- 格式:pdf
- 大小:217.26 KB
- 文档页数:11
计算机复习信息检索信息检索是指通过计算机技术,根据用户的需求,在大规模的信息资源中准确、快速地找到相关的信息。
在当今信息爆炸的时代,信息检索的重要性不言而喻。
本文将介绍信息检索的基本概念、技术和应用,并附带答案和解析。
一、信息检索概述信息检索是指通过计算机对大规模信息资源进行全文检索、关键词检索等方式,根据用户需求提供相关信息的过程。
其目标是提高检索准确性和检索效率,帮助用户快速获取所需信息。
信息检索系统由信息资源、检索模型、检索方法和用户界面等组成。
其中,信息资源包括数据库、文档集合等;检索模型包括向量空间模型、布尔模型等;检索方法包括倒排索引、词频统计等;用户界面提供检索接口供用户输入查询词,并显示检索结果。
信息检索的基本流程包括:用户输入查询词->检索系统进行查询处理->检索系统返回相关文档。
二、信息检索技术1. 关键词检索关键词检索是最常见的信息检索方式,用户通过输入关键词,检索系统根据关键词在信息资源中进行匹配,并返回相关文档。
关键词检索常用的算法有向量空间模型、TF-IDF算法等。
全文检索是指对文档集合中的全部文本进行检索,而不仅仅是关键词。
全文检索主要通过分词、建立倒排索引等技术来实现。
用户输入的查询词可以是一个短语或一句话。
3. 自然语言查询自然语言查询是指用户使用自然语言进行查询,而不是像关键词查询那样只输入几个词。
自然语言查询需要将用户的自然语言转化为计算机可处理的查询语言,如SQL语句。
4. 语义检索语义检索是一种基于语义理解的检索方法,通过对查询词的语义进行分析,实现更精准、准确的检索。
语义检索常用的技术有词义消歧、词向量模型等。
三、信息检索应用1. 搜索引擎搜索引擎是信息检索的最常见应用之一,在互联网上广泛使用。
搜索引擎通过爬虫程序对互联网进行爬取,建立庞大的索引库,并通过用户输入的查询词返回相关页面。
2. 文献检索在学术界和科研领域,文献检索是非常重要的工作。
信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
1.请说明一次文献、二次文献和三次文献的特点和功用。
(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。
如期刊论文、科技报告、会议论文、专利说明书(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。
二次文献的重要性在于可以帮助人们查找一次文献。
如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。
包括综述研究和参考工具两类。
如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目2.请说明题录目录文摘的特点以及区别(1)题录是揭示和报导单篇文献外表特征的工具。
特点:以单篇文献为著录对象(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。
特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。
特点:带摘要的题录3. 布拉德伏特文献文献分散定律和期刊影响因子的概念(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。
如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。
(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。
4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。
信息检索知识点信息检索考点整理 1 、信息检索的概念广义的信息检索就是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储与检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。
2. 信息检索的原理就就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡就是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就就是初步命中检索所需的信息。
3 、为什么说信息存储与检索就是两个不可分割的有机体?检索的全过程包括存储与检索两个过程,存储与检索就是相辅相成、不可分割的。
存储过程主要就是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要就是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程就是存储过程的逆过程。
因此,检索者只有在全面了解存储者就是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4 、信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法(4)追溯法 (5)循环法 5 、信息检索的途径 (1)内部特征途径a) 分类途径 b) 主题途径 (2)外部特征途径 a) 题名途径 b) 著者途径 c) 文献编号途径 d) 检索途径 e) 机构检索法 f) 引文检索途径 6 、布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2) 可操作性强,应用广泛;(3) 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4) 能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7 、概率排序原则: 如果一个检索系统对用户的每个检索提问的反应就是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果就是最好的。
信息检索初步知识点总结信息检索是指利用计算机系统来检索和获取文档或者信息资源的技术和方法。
在当今信息爆炸的时代,信息检索具有非常重要的意义。
信息检索系统可以帮助人们快速准确地获取所需要的信息资源,不仅可以提高工作和学习效率,还可以帮助人们更好地利用信息资源。
在信息检索中,有一些基本的知识点是非常重要的,下面我将对这些知识点进行总结。
1. 信息检索的概念和发展历史信息检索是指从信息库中按照一定的要求来搜索、检索信息的过程。
它主要是利用计算机技术来实现信息的存储、检索和利用。
信息检索的发展可以追溯到20世纪50年代,随着计算机技术的发展,信息检索技术也得到了很大的发展。
现代信息检索系统不仅能够实现文档的存储和检索,还可以实现自然语言处理、信息抽取、信息过滤等功能。
2. 信息检索的基本过程信息检索的基本过程包括信息需求分析、文档表示和查询处理、检索模型和算法、评价和反馈等几个方面。
其中,信息需求分析是整个信息检索过程的第一步,它包括对用户的信息需求进行分析和建模,确定用户的检索目标和检索词,为后续的检索准备工作做好准备。
文档表示和查询处理是指对文档和查询进行适当的表示和处理,以便计算机系统能够理解和利用。
检索模型和算法是指根据文档和查询的表示,计算出相关度得分,以确定文档的相关性。
最后,评价和反馈是指对检索结果进行评价和反馈,以优化检索系统的性能。
3. 信息检索的技术手段信息检索的技术手段主要包括文本索引技术、全文搜索技术、信息抽取技术、信息推荐技术等几个方面。
其中,文本索引技术是指将文档中的关键词进行索引,以便计算机系统能够快速地定位到相关的文档。
全文搜索技术是指利用全文索引进行搜索,可以实现对文档中所有内容的搜索。
信息抽取技术是指从文档中抽取出有用的信息,以便为用户提供更精确的搜索结果。
信息推荐技术是指根据用户的行为和偏好,为用户推荐相关的信息资源。
4. 信息检索的评价指标信息检索的评价指标主要包括召回率、准确率、F值、MAP值等几个方面。
信息检索考试大一下知识点信息检索是指从大量的信息中快速找到满足特定需求的信息过程。
在大一下学期的信息检索考试中,通常会涉及以下几个知识点:一、信息检索基础概念1. 信息检索的定义和目的信息检索是指通过使用计算机技术,在海量信息中寻找到与用户需求相匹配的信息。
其目的是快速、准确地获取到用户所需的信息。
2. 检索模型和流程信息检索基于检索模型,常见的模型包括布尔模型、向量空间模型和概率模型。
检索流程一般包括问题建模、索引构建、查询处理和结果排序等步骤。
二、关键词检索1. 关键词的选择与组合在进行信息检索时,关键词的选择和组合非常重要。
关键词应该准确描述用户需求,并且能够尽可能覆盖相关领域的信息。
2. 布尔查询与逻辑运算符布尔查询是一种基础的检索方式,通过使用逻辑运算符(AND、OR、NOT)对关键词进行组合,从而获得符合用户需求的信息。
三、索引构建与检索技术1. 逆向索引逆向索引是一种常用的索引结构,它通过将文档中的每个单词与包含该单词的文档进行关联,实现了关键词到文档的快速定位。
2. 向量空间模型向量空间模型将文档和查询都表示为向量,在向量空间中进行计算,通过计算文档与查询之间的相似度来判断文档的相关性。
3. 布尔模型的实现与优化布尔模型的实现与优化涉及到倒排索引的构建与压缩、布尔运算的优化算法等方面的技术。
四、评价与改进1. 检索结果的评价对于检索系统的性能评价,一般使用准确率、召回率、F值等指标来衡量检索的有效性和完整性。
2. 改进方法与技术为了提升检索系统的性能,可以采用词干提取、查询扩展、排名算法优化等方式进行改进。
五、实际应用与发展趋势1. 商业搜索引擎与个性化推荐商业搜索引擎通过不断改进和优化信息检索技术,提供高效准确的搜索服务。
个性化推荐则基于用户的兴趣和行为,向用户推荐符合其需求的信息。
2. 大数据与信息检索随着大数据时代的到来,信息检索面临着处理海量数据的挑战。
如何有效地利用大数据技术来进行信息检索是当前的研究热点之一。
信息检索复习题1、信息检索的步骤包括:界定问题、选择信息源、制定检索策略并实施检索、评价信息、分析利用信息五个步骤。
2、文献中ISBN、ISSN分别是指:国际标准书号、国际标准刊号。
3、文献按出版形式划分为哪几种?简述之。
答:按出版类型划分:图书、期刊、特种文献:(科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案)4、给出“基于云计算的煤矿安全监测预警系统研究”一文的关键词。
煤矿监测预警云计算数据挖掘5、给出3种常用搜索引擎名称,什么情况下应该使用百度快照?答:百度、Google、360、搜狗搜索到的结果无法打开或打开速度很慢的情况下,可以使用百度快照。
6、利用百度搜索一份技术开发合同,应该在搜索框输入(技术开发合同 filetype:doc 或技术开发合同 filetype:ppt )。
(提示:技术开发合同的格式:doc或pdf)。
百度以“filetype:”来限制,后面是文档格式。
文档可以是pdf、doc、xls、ppt等。
首选gov(政府)、edu(教育)、org(非盈利性机构)、ac(学术类)网站;次选com(商业) net(网络)等7、CNKI中国知网主要收录哪些类型的全文学术文献?期刊文献,报纸,会议文献,国外学术文献,工具书,年鉴,专利,成果,标准文献,博士学位论文,硕士学位论文8、查找中文全文图书和期刊文献分别有哪几个数据库?中文全文数据库:CNKI中国知网.维普期刊资源整合服务平台.万方数据知识服务平台,读秀学术搜索9、学位论文有哪些特点?简述之。
4)学位论文(dissertation,thesis)指高等院校和科研机构的毕业生在获取相应学位时,必须提交的论文。
外部特征:著者、论文题名、颁发学位的机构名称、学位等级、授予年份等。
其主要辨识特征是学位名称,特征词:Ph,D,MS等。
从内容上看,学位论文具有以下四个特点:学术性,科学性,创造性,规范性10、依据GB/T7714-2005,分别给出图书、期刊和学位论文的著录格式,并各举一例。
大一信息检索与利用考试知识点信息检索与利用是信息科学与技术专业的一门重要课程,旨在培养学生对信息资源进行系统化检索和有效利用的能力。
本文将介绍大一信息检索与利用考试的相关知识点,帮助同学们更好地复习和备考。
一、信息检索基础知识1. 信息检索的定义和基本原理信息检索是指从大量信息中查找和获取所需信息的过程。
其基本原理包括信息需求分析、信息储存与组织、信息检索模型、检索评价等。
2. 关键词的选择和搜索策略在信息检索过程中,关键词的选择和搜索策略起着至关重要的作用。
学生需了解如何选择合适的关键词,并掌握常用的搜索策略,如布尔逻辑检索、通配符检索和短语检索等。
二、信息资源与检索1. 图书馆资源的检索与利用学生需熟悉图书馆资源的分类和编目规则,掌握常用图书馆资源的检索方法,如OPAC检索和图书馆数据库检索等。
2. 学术搜索引擎的使用学生需要了解学术搜索引擎的特点和使用方法,如Google学术、谷歌学术和百度学术等。
掌握高效的检索技巧,如使用引号搜索、高级搜索和文献引用等。
三、文献检索与阅读1. 文献检索的方法和工具学生需了解文献检索的常用方法和工具,如在线数据库检索、文献溯源和文献导航等。
可以根据具体需求选择合适的检索途径。
2. 文献综述的撰写和细节要求学生需要了解文献综述的撰写规范和细节要求,包括引言、方法、结果和讨论等部分的写作技巧和注意事项。
四、信息利用与知识管理1. 信息评估和筛选学生需要学会评估信息质量,判断信息的可信度和适用性,并掌握信息筛选和整理的方法,提高信息利用的效果。
2. 知识管理的基本理论和方法学生需了解知识管理的基本理论和方法,掌握知识管理工具的使用。
熟悉知识流程的各个环节,并学会运用相应的工具进行知识管理。
五、信息检索与利用的伦理问题1. 信息隐私和数据保护学生需了解信息检索与利用过程中产生的隐私问题和数据保护的重要性。
遵守信息伦理规范,保护用户隐私和信息安全。
2. 信息获取和版权保护学生需要了解信息获取的合法途径和版权保护的相关法律法规,学习在信息检索与利用过程中正确引用他人作品的方法和原则。
1、信息检索的定义:是指将信息按一定的方式组织和存储起来,并根据信息用户的需求找出相关的信息的过程和技术。
信息检索的作用:a:节省查找文献的时间。
b:有利于文献专题查找。
c:克服语言障碍。
2、信息:所有事物的存在方式和运动状态以及关于所有事物的存在方式和运动状态的陈述。
信息的特征:普遍性、客观性、抽象性、依附性、可加工性、传递性、共享性。
信息的作用:(1)信息是人类社会生存的条件,信息是人类社会发展的资源(2)信息是主客体的中介,信息是思维的材料(3)信息是组织的保证,信息的管理的基础(4)信息是决策的依据,信息是控制灵魂文献的特点:(1)数量急剧增长(2)内容交叉重复(3)专业文献出版分散(4)文献老化加快(5)文献语种繁多(6)文献载体形态增加文献类型:(一)按照载体的形式不同,文献可分为:1、印刷型2、缩微型3、声像型4、电子型(二)按照内容、性质和加工深度的不同,文献可分为:1、一次文献2、二次文献3、三次文献4、零次文献(三)根据性质、特点和出版形式的不同,文献可分为:1、科技图书2、科技期刊3、科技报告4、政府出版物5、会议文献6、专利文献7、学位论文8、标准文献9、科技档案10、产品样本a、主题语言主题检索语言是用语词来表达文献主题概念,它不管各语词之间相互关系如何,一律按字顺排列成主题词表,故称主题检索语言。
分为标题词语言、关键词语言和叙词型语言三种。
○2关键词语言:由于关键词语言能适应使用计算机的需要,因而大大加速了文献标引过程,缩短了检索工具出版的时间,便于用来检索最新文献,大大增加了检索点,使用灵活方便。
查准率和查全率较低。
○3叙词型语言:用途较广,既适合于手工检索,又适合计算机检索语言。
6、信息检索的途径:书名途径,著者途径,序号途径,分类途径,主题途径。
7、信息检索方法:(一)常用法所谓常用法,顾名思义是检索中最为常用的方法,指利用成套的检索工具检索文献信息的方法,也称之为工具法。
一、名词解释(4题,20分)目录:以一个完整的出版单位或收藏单位作为著录的基本单位,将一批著录款目按照一定的次序编排而成的一种揭示及报道文献的工具。
索引:将某一信息集合中的相关信息按照某中可查顺序排列并系统地指引给读者的一种检索工具。
年鉴:一种按年度出版,概述或反映上一年度有关领域的重大事件、重大进展和重要成果,汇集重要文献、详尽数据很统计资料的连续出版物。
手册:是汇集某一范围内基础知识和基本数据资料,以便于人们在生产、科研、教学等具体工作过程中可以经常查证的实用便览型参考工具。
OPAC:由开放的公共查询目录演化而来,是20世纪70年代末由美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。
CALIS:是经国务院批准的我国高等教育公共服务体系之一,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来。
信息检索:广义上,信息检索是指信息存储与查找的过程,狭义上,指信息查找的过程,信息查找是指通过查询机制从各种检索系统中查找出用户所需要的特定信息的过程。
搜索引擎:泛指网络上以一定的策略搜集信息,对信息进行组织和处理,并为用户提供信息检索服务的工具和系统,是网络资源检索工具的总称。
百科全书:是指收录了各个知识门类的知识,或者系统而完备地概述了某一知识门类知识的大型参考性工具,是最完备的参考工具,有“工具书之王”的美誉。
学位论文:学位论文是伴随着学位制度的实施而产生的,是高等院校或科研机构的毕业生为获取学位资格而撰写的学术性研究论文。
特种文献:一种介于图书与期刊之间的文献类型,通常在出版发行或获取途径方面比较特殊,因此也被称为灰色文献。
电子图书:是指以数字形式加工,通过计算机网络进行传播,,并借助于计算机或类似设备来阅读的图书,是电子出版物中最常见的文献形式。
参考工具书:是根据一定的社会需要以特定的编排方式和检索方法汇编某学科或特定范围的知识和资料,其目的是为人们解决疑难和提供数据或事实信息,是作为工具使用的专供查考的特定类型的图书。
元搜索引擎:是对搜索引擎进行搜索的搜索引擎,是对多个独立搜索引擎的整合、调用、控制和优化利用。
信息检索工具:能够让用户通过其检索出特定信息的一个工具,包括印刷型检索工具和网络信息资源检索工具。
二、不定项选择题(10题,20分)1、信息检索方法的分类(1)按检索对象的内容划分A、文献检索B、数据检索C、事实检索(2)按检索方式划分A、手工信息检索B、计算机信息检索(3)按检索要求划分A、特性检索B、族性检索(4)按检索的时间跨度划分A、定题检索B、回溯检索(5)按检索对象的信息表现形式划分A、文本检索B、多媒体检索C、超文本检索2、检索效果的评价指标(1)(2)(3)(4)3、搜索引擎的分类及其代表性引擎名称(1)目录型搜索引擎:雅虎、搜狐、新浪、Galaxy、Open Directory、Infoseek、The WWW Vitual Library、BUBL LINK、AOL Search、蓝帆(2)索引型搜索引擎:Google、百度、天网搜索、Alta Vista、Excite、Allthe Web、LYCOS、Inktomi、Hotbot、LookSmart(3)元搜索引擎:Ixquick、Vivisimo、Dogpile、MetaCrawler、WebCrawler、万维搜索4、了解知名搜索引擎及其检索功能等。
(1)搜狐:分类目录导航检索、简单检索、高级检索、结果显示(2)雅虎:主题分类目录浏览检索、关键词检索、结果显示(3)Galaxy:分类目录浏览、简单检索、高级检索、结果显示(3)Google:基本查询、高级搜索、搜索范围限制功能、查询结果、特色查询功能(4)百度:简单检索、高级检索、结果显示(5)Dogpile:简单检索、高级检索、定制偏好、结果显示(6)万维搜索:简单检索、高级检索、结果显示5、特种文献的类型。
特种文献主要包括:会议文献、学位论文、专利文献、标准文献、科技报告、政府出版物、产品样本、产品目录及档案。
6、国内学位论文的查检途径。
我国学位论文一般收藏于本院校的图书馆、国家图书馆、中国科技信息研究所和中国社会科学院信息所、国内各大学位论文数据库(如:万方数据知识服务平台中国学位论文数据库、CNKI中国优秀硕博士学位论文全文数据库、CALIS高校学位论文数据库等)。
7、所学过的检索技巧的应用。
(一)传统的信息资源检索技术(1)布尔逻辑检索A、或(+、OR)可以扩大检索范围,增加命中文献数量,有利于提高检索结果的查全率。
B、与(*、AND)对检索词进行限定,从而缩小检索范围,有利于提高检索结果的查准率。
C、非(—、NOT)缩小命中文献的范围,增强检索的准确性。
注意事项:A、执行顺序,NOT、AND、ORB、非在写关系式时,a – b 错误写法;a –b正确写法,- 跟b之间不能有空格(2)截词检索?表示单个字符 *表示多个字符不同检索工具,字符不一定相同A、后截断 stu*B、中截断 stu?ent 中截断只允许有限截断C、前阶段 *dent(3)位置检索A、词位置检索:提高检索的查全和查准率有重要作用,但网络检索中基本只支持(W)和(N)运算符W与nW: a(W)b a(nW)b 检索出来的词序不能颠倒W:所连接的词之间除了可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词或者字母。
nW:允许连接在两个检索词之间最多夹入n个其他单元词(冠词、介词、连接词)N与nN: a(N)b a(nN)b 检索出来的词序可以颠倒N:所连接的词之间除了可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词或者字母。
nW:允许连接在两个检索词之间最多夹入n个其他单词X与nX: a(X)a a(nX)a 检索出来的两侧检索词完全一致,并以指定顺序相邻X:所连接的词之间除了可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词或者字母。
nX:允许连接在两个检索词之间最多夹入n个其他单元词(冠词、介词、连接词)B、同句检索C、同字段检索(4)限制检索A、字段限制检索:可以缩小检索范围,提高查准率基本字段:题名(TI)、文摘(AB)、叙词(DE)等。
辅助字段:作者(AU)、刊名(JN)、语种(LA)、专利号(PN)、年代(PY)等。
B、限制符限制检索AU(作者)、CS(作者单位)、JN(刊物名称)、PY(出版年份)、LA(语言)等。
(5)加权检索A、词加权检索B、词频加权检索(二)信息资源检索方法(1)常规法A、顺查法:由远及近,适合检索理论性或学术性的课题B、倒查法:由近及远,多用于检索新课题或有新内容的老课题,或对某课题研究已有一定基础,需要了解其最新研究动态的检索课题C、抽查法:选择与该课题有关的文献信息最可能出现或最多出现的时间段,话费较少时间获得较多文献的检索方法(2)回溯法回溯法又称引文法,是指在已获得所需文献的基础上,再利用文献末尾所付的参考文献、相关书目、推荐文章和引文注释作为检索入口,依据文献之间的引证和被引证关系揭示文献之间的某种内在练习,进而查找到更多的相关文献的方法。
优点:在检索工具不全或检索系统收录内容不完整的情况下,借助此法非常有效。
缺点:费时、盲目性大,信息查全效果差(3)综合法综合法也称交替法或循环法,是将常规法和回溯法结合起使用的检索方法。
分阶段、按周期地交替使用两种方法,对检索效率的提高有很大帮助。
三、简答(6题,30分)1、信息检索的原理信息检索的实质就是将用户的检索提问标识与存储在信息检索系统中的信息特征标识进行比较、匹配,两者一直或者信息特征标识包含了检索提问标识,则具有该标识的信息就从检索系统中输出,输出的信息就是检索系统命中的信息。
2、文献检索及其内容文献检索是指以查找某一课题的相关文献为目标的检索。
文献检索包含全文信息检索和目录、题录、索引、文摘等二次文献信息检索。
3、手工检索与计算机检索的异同点。
手工检索和计算机检索的本质是相同的,都是从特定的检索系统中查找、匹配、输出所需要信息的过程;二者的区别在仅在于信息的载体形式、存储方式和匹配机制有所不同。
手工检索优点:检索过程灵活,可以随时修改检索策略,检索结果较为准确;缺点:检索速度慢、效率低、更新慢、查全率低。
计算检索优点:与手工信息检索系统相比较,计算机信息检索系统具有检索范围广、信息量大,检索速度快、效率高,检索不受时空限制,数据更新快,可以及时获得最新数据,查全率和查准率高,检索功能强,辅助功能完善,以及使用方便等特点。
缺点:费用高,需要较好的检索技术,还有一系列设备,且受网络影响稳定性相对较差。
4、提高信息检全率和检准率的方法(1)如何提高查全率? 1. 优先使用最简单常用的主题词; 2. 逐渐减少不重要的检索词; 3. 加用多个等同词,用“或”(OR、|)语法; 4. 换用上位词; 5. 增加检索途径;(2)如何提高查准率? 1. 换用专指性更强的主题词; 2. 逐渐加用主题词; 3. 加用辅助词; 4. 利用词和网页的外部特征限制输出结果; 5. 观察不相关检索结果的特征,使用“减”(-)语法排除; 6. 使用下位词5、所学过的图书、期刊数据库的简介及特点等。
《中国期刊全文数据库》是目前国内内容较为丰富的动态更新的中国期刊全文数据库。
至2006年3月31日,收录国内公开出版的7600多种重要期刊,其中含1735种核心期刊与专业特色期刊,累计1994年以来的全文文献1750万篇;其中4000多种刊物回溯至创刊,如1915年创刊的《清华大学学报(自然科学版)》、《中华医学杂志》等。
产品分为九大专辑:理工A、理工B、理工C、农业、医药卫生、文史哲、经济管理与法律、教育与社会科学综合、电子技术与信息科学。
推出网络数据库、专辑光盘数据库和专题数据库等服务。
中心网站及数据库交换服务中心每日更新。
《中文科技期刊数据库》是我国最大的数字期刊数据库,该库受到国内图书情报界的广泛关注和普遍赞誉,目前已拥有包括港澳台地区在内2000余家大型机构用户,是我国数字图书馆建设的核心资源之一,高校图书馆文献保障系统的重要组成部分,也是科研工作者进行科技查证和科技查新的必备数据库。
期刊总数:12000 余种核心期刊:1957 种文献总量:3000 余万篇更新周期:中心网站日更新全文质量:采用国际通用的高清晰PDF全文数据格式学科范围:社会科学、自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报检索方式:快速检索、传统检索、分类检索、高级检索、期刊导航《数字化期刊数据库》该库是万方数据资源系统的重要组成部分,由万方数据自主建设。