数字信息资源检索与利用..
- 格式:ppt
- 大小:4.63 MB
- 文档页数:85
第一章信息检索概述1. 信息检索的概念。
狭义信息检索是指用户找出有关信息的过程。
广义信息检索是将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
2. 信息检索的类型(1)按照检索对象的不同划分早期分为:文献检索、事实检索、数据检索。
当前三分方法:文本检索、音频与视频检索、数值检索。
(2)按检索手段划分:手工检索、机器检索3.简述信息检索的基本原理信息检索的基本原理:对信息集合与需求集合的匹配与选择。
实现信息检索,主要涉及三个关键要素:信息集合、用户信息需求、匹配选择。
一、信息集合:信息集合是指有关某一领域的,经采集、加工的信息集合体。
二、需求集合:用户的信息需求是在社会实践活动中产生的。
当人们在完成某一任务或工作时,经常觉得缺少某些知识,这就产生了信息需求。
三、选择与匹配:要在信息集合中快速获取用户所需信息,需要信息检索提供一种匹配机制,能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
匹配机制至少包括两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。
4.计算机信息检索经历了脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段。
5.信息检索领域的主要研究问题有哪些?⑴信息检索理论:检索语言、检索模型、标引理论、相关性理论、知识组织与表示理论⑵信息检索工具/系统:信息检索系统的结构、功能、设计开发、管理运营、应用评价等⑶信息资源及其收集、加工:信息存储、数据库⑷检索技术与方法:文本检索技术、数值检索技术、音频与视频检索技术、网络搜索技术⑸用户研究与检索策略:用户的查询心理、检索需求及其类型、用户查询信息的行为特征等、用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等⑹其他密切相关的自动化处理技术:自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互等。
信息检索的两种研究方式:以计算机为中心和以用户为中心,以计算机为中心的IR 问题是主流。
《信息资源检索与利用》课程要点1.信息资源信息是普遍存在的,但并非所有的信息都是信息资源,信息只有经过人类加工后,可被利用的信息才能称为信息资源。
2.信息资源的分类按信息资源的存在状态可将其分为潜在的信息资源和现实的信息资源两大类。
其中现实的信息资源依据其载体可分为体载信息资源、文献信息资源、实物信息资源和网络信息资源。
(1)体载信息资源体载信息资源指以人体为载体并能为他人识别的信息资源,按其表达方式又可分为口语信息资源和体语信息资源。
口语信息资源是人类以口头语言表达出来但未被记录下来的信息资源,如谈话、授课、讲演、讨论等;体语信息资源是以人的体态表达出来的信息资源,如表情、手势、姿态、舞蹈等。
(2)文献信息资源:文献信息资源是以文献为载体的信息资源。
A.按信息资源出版类型划分(10大信息源)①科技图书;②科技期刊;③科技报告;④会议文献;⑤专利文献;⑥学位论文;⑦标准文献;⑧政府出版物;⑨产品样本;⑩技术档案B.按加工层次划分①一次信息资源。
一次信息的载体形式称为一次信息资源,也称原始文献。
它是以作者本人的科研工作成果为依据而创作的原始文献,如期刊论文、科技报告、会议论文、专利文献、学位论文等,它具有新颖性、创造性和系统性等特征,参考和使用的价值较高。
个人专著(某某著书,而某某编的书不是一次文献而是二次或三次文献)。
②二次信息资源。
浓缩二次信息的载体形式称为二次信息资源,是查找一次信息资源的工具。
它是将分散的、无序的一次信息资源进行加工整理,使之成为系统有序的信息资源。
二次信息资源具有浓缩性、汇集性、有序性等特点,它的作用不仅在于报道信息的内容,更重要的是可以提供原一次信息资源的线索。
例如:书目(mar c数据)、题录、文摘、索引等。
(图书馆检索室)③三次信息资源。
三次信息的载体形式称为三次信息资源,它是指对一次信息资源进行综合分析、研究和评述而编写出来的成果。
如手册、百科全书、年鉴以及其他综述和评论性文章等。
信息检索与利用的名词解释信息检索与利用是指通过特定的工具和技术,从大量的信息中准确地获取所需的信息,并将其应用到实际问题中。
在当今信息爆炸的时代,信息检索与利用成为了人们获取知识和解决问题的重要手段。
本文将对与信息检索与利用相关的重要名词进行解释。
一、信息检索信息检索是指通过各种信息存储介质和检索系统,根据用户需求,从大规模信息资源中查找并提供相关信息的过程。
它包括了信息需求分析、检索策略制定、检索行为和结果评价等阶段。
信息检索的目标是根据用户的需求,准确地找到相关的信息。
1. 查询查询是用户通过检索系统输入的查找信息的指令或问题。
查询可以是关键词、短语甚至一整个句子。
合理构建查询是信息检索的关键,它决定了检索结果的准确性和全面性。
2. 检索系统检索系统是用来存储和组织大量信息资源,并为用户提供检索服务的系统。
它们通常由索引、搜索引擎、检索算法和用户接口等部分组成。
常见的检索系统包括网络搜索引擎、图书馆信息系统和企业内部知识库等。
3. 信息过滤信息过滤是通过自动化的方式,根据用户的兴趣和关注点,从大规模信息中筛选出符合用户需求的内容。
信息过滤可以根据各种条件和规则进行,例如关键词、时间范围、作者等。
它通过过滤无用信息,提供用户可能感兴趣的内容。
二、信息利用信息利用是将检索到的信息应用到实际问题中解决问题或产生价值的过程。
信息利用是信息检索的延伸和发展,它强调将获得的信息应用到实际场景中,以满足用户的具体需求。
1. 信息处理信息处理是将获取的信息进行整理、分析和加工的过程。
它包括信息的分类、筛选、归纳和汇总等操作,以便用户更好地理解和利用信息。
2. 知识发现知识发现是通过对大规模信息的分析、挖掘和模式识别,从中发现新的知识和规律的过程。
它利用数据挖掘、机器学习和人工智能等技术,从信息中抽取价值,用于决策支持和创新等领域。
3. 信息可视化信息可视化是通过图表、图形和其他视觉化方式,将信息呈现给用户,以提高信息的理解和交流效果。
信息检索与利用信息检索与利用随着数字化时代的到来,信息的数量和种类在不断增长,人们对于信息的需求也日益增强。
如何快速、准确、有效地获取所需信息,成为了信息时代的一大难题。
信息检索与利用成为破解这一难题的有效途径之一。
一、信息检索的概念及流程信息检索是指根据用户提出的检索词或检索式,在信息组织体系中寻找与之相关联的信息并找到其位置,提供用户预期的检索结果的过程。
信息检索可分为手动检索和机器检索两种方式。
手动检索是指通过人工筛选的方式进行检索,而机器检索则是在计算机或其他智能设备的支持下进行检索。
在信息检索过程中,我们需要遵循一定的流程,如图1所示。
图1 信息检索流程首先是明确检索目标。
明确检索目标是信息检索中最基本也是最关键的一步。
只有明确具体的检索目标,才能确定检索内容、检索方法和搜索策略。
第二步是制定检索策略。
搜索引擎检索策略是制定检索操作的指导方针和方法。
其中,关键词的选定和排列,是关键词检索的首要环节,直接影响检索结果的质量和检索速度。
接着是信息检索操作。
信息检索过程中必须要有一个有效的检索平台或检索工具。
通常,我们在搜索引擎、数据库或图书馆的数据库中进行检索。
在实际操作中,可以通过精细的查询语句进行检索,也可以通过分类、浏览等方式获取所需信息。
最后是反馈和评价。
通过反馈和评价,不仅可以对检索过程进行改进,还可以对检索结果进行分析、评价和处理。
同时,还可以通过反馈和评价获取更多更有价值的信息。
二、信息检索的方法信息检索方法根据检索策略的不同,主要可以分为以下几种。
1.关键词检索法关键词检索法,指的是以相关关键词为检索关键词组成查询语句,在检索工具中进行关键词检索的一种检索方法。
本方法适用于检索范围较广、目标较为明确的信息。
2.分类检索法分类检索法,是指根据先前设计好的分类知识体系,将信息按照分类学科进行归类,并在科学分类树中按照路径寻找所需信息的一种检索方法。
该方法适用于专业知识体系较为完善、信息明确的情况。
《数字信息资源检索与利用》综合作业题专业学号姓名一、填空题:(20分)1 文献按加工层次可划分为:零次文献、一次文献、二次文献和三次文献。
2 你知道图书馆可利用的文献资源有:图书、期刊、杂志、报纸。
3 河海大学使用的图书分类法是《中国科学院图书馆图书分类法》。
检索词是4能概括要检索内容的关键词检索逻辑组配方法有与、或、非。
5 查找学位论文文献,通常可以从全文、关键词和主题等字段进行检索。
6 超星数字图书馆普通检索,是在搜索框直接输入检索词,检索词可定位到作者、出版社、标题或出版时间中。
7 情报有三要素,即:知识或信息、经过传递、经使用产生效益。
8 会议文献的特征,有特色鲜明、内容广泛、数量庞大、参考价值高。
二、简答题:(25分)1简述文献信息源有哪些。
文献信息源,是一种经过加工的信息源,是记录在一定的物质载体上进行交流传播的信息源。
是最便于随时记录、广泛传播、系统积累、长期保存和直接利用的信息源。
是在空间和时间上积累和传播信息的最有效的手段,是获得信息的最基本、最主要的来源。
2列举3个含期刊全文文献的中外文数据库。
中文科技期刊数据库、维普期刊数据库、中国期刊全文数据库3万方数据提供了多种检索功能,请列出5种以上检索方式。
学术论文检索、期刊检索、外文文献检索、科技报告检索、图书检索4简述信息的定义。
信息是重要的战略资源(与物质、能量同称为三大资源),提供知识、智慧和情报;信息是社会的黏合剂,消除某种不确定认识;信息是人类认识世界的媒介,提示客观世界;信息是重要的、活跃的生产力要素,现代社会生产关系革命的先导。
三、操作题:(50分)1利用中国知网数据库,检索与“水利人才”、“教育培养”相关的文献,按检索步骤,写出检索过程(步骤)和检索结果(得到的文献数量)。
列出被引次数最高,下载次数最高的文献,并列举你需要阅读全文的5条文献记录(参考文献格式)。
检索过程:1、打开中国知网数据库网站2、选择高级检索3、检索条件选择全文,填水利人才并含教育培养4、点击检索5、得到检索结果6、排序中选择被引,得到被引次数最高的文献7、排序中选择下载,得到下载次数最高的文献被引用次数最高文献:[1]钱波. 应用型工科院校多元化实验教学体系的创新探究[J]. 实验室研究与探索,2011,08:121-124被下载次数最高文献:[1]袁博. 近代中国水文化的历史考察[D].山东师范大学,2014.需要阅读全文5条文献记录:[1]任平. 晚清民国时期职业教育课程史论[D].湖南师范大学,2010.[2]王睿. 面向企业技能需求的职业技术人才培养模式研究[D].河海大学,2005.[3]蔡妮. 我国地方高等学校办学特色研究[D].广西师范大学,2008.[4]宁志刚. 我国内地、香港、台湾的人才资源开发与管理策略比较研究[D].山西师范大学,2013.[5]刘宇瑛. 人才发展战略规划与实际案例分析[D].河海大学,2001.2在电子图书资源中,检索并阅读与自己所学专业有关的理论知识图书,列出5条文献信息(写明所用数据库名,书名、著者、出版社、出版时间,ISBN)数据库:河海大学电子图书资源[1]数字信号处理:原理、实验及综合应用978-7-5124-0352-9朱金秀, ... [等] 北京航空航天大学出版社2011[2]高频电子线路978-7-301-16520-1宋树祥, 周冬梅北京大学出版社2010[3]微机原理与嵌入式系统基础978-7-5606-2396-2赵全良, 马博, 孟李林西安电子科技大学出版社2010[4]模拟电子线路7-81050-589-0郑应光东南大学出版社2000[5]高等数学下册978-7-5630-2807-8丁莲珍河海大学出版社20113任选一个外文数据库,主题包含水利工程管理信息化,如:“Management information”、”conservancy project“”,或“GIS”,等等,检索2010年以来,被数据库收录的文献情况。
第一章1、情报定义:情报室人们用来解决特定问题所需要的,经过激活过程活化了的,具有使用价值的知识或信息。
2、文献定义:文献是记录知识的一切载体,即用文字、图形、符号或者声频等技术手段记录知识的物质载体。
或固化在物质载体上的知识。
文献具有三个属性即文献的知识性、记录性、物质性。
3、信息、知识、情报和文献的关系信息是物质存在的方式、形态和运动规律的表征,人脑对物质属性的感知形成信息,信息是起源,是基础;文献是信息、知识、情报的存储载体和重要的传播工具,信息知识和情报的内容只有记录在物质载体上才能构成文献;文献通过传递、应用于理论和实践又会产生新信息。
4、文献信息源文献信息也称文献资源,是用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。
5、文献信息源类型按照信息源的载体类型划分:印刷型缩微型声像型电子型按照信息源的加工程度划分:1)零次文献:零次文献是指尚未经过系统整理形成正式文献的零散资料或最原始的记录,如书信、手稿、笔记等。
2)一次文献:一次文献又称原始文献,是作者对自己研究的成果或创造性活动成果的直接记录。
一般是指公开出版的著作,期刊论文、科技报告、会议文献、学位论文、专利文献等。
3)二次文献:二次文献是将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。
二次文献包括目录、文摘、索引等,它们是二次文献的核心。
4)三次文献:三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献,包括素萍,百科全书、报告、年鉴、手册、字典等。
6、信息检索:广义上说信息检索是指将信息按照一定的方式组织和储蓄起来。
并根据信息用户的需求查找出相关信息的过程。
7、著录:是根据一定的规则,对文献的内容和形式特征进行分析、选择和记录的过程。
8、标引:1)按照标引的的工作方式分类:分为人工标引、计算机辅助标引、自动标引。
1.在网上可以找到的信息内容主要有:政府信息:(网上最有价值的信息之一):指国际组织、各国政府及其相关部门所发布的信息。
科研信息:指各类专业学术机构所设立的网站及其相关信息。
教育信息:指各大学所设立的网站及其相关信息。
文化信息:主要包括各类信息媒体的网站和世界各地图书馆的数字化公共检索目录(OPAC)消闲娱乐性信息:(网上“最成功”的领域)因特网信息资源评价主要的范围:准确性;权威性;新黎性;独特性;可靠性;连接2.因特网上信息资源的特点及信息利用价值:具有方便、及时快速和交互性的特点。
具体的可分为:信息资源极为丰富3因特网上信息资源的种类:万维网;Telnet 信息资源;FTP 信息资源;用户服务组信息资源;GOPHER信息资源4.信息资源评价方法:定性评价:即按照一定的评价标准对被评价站点的各方面特征、质量作出主观评判。
一般有问卷调查、专家评议等方式。
定量评价:即利用数量分析方法,对调查统计数据进行分析,进而作出较系统、客观的评判。
一般以统计访问次数、登录情况、链接数量等进行统计分析,进而对用户兴趣、网站影响力、站点所提供信息的水平和可信度等做出评判。
5.网络信息检索的一般方法:浏览:(偶然发现:这是在因特网上发现、检索信息的原始方法);通过网络资源指南来查找信息;利用搜索引擎进行信息检索(是较为常规、普遍的网络信息检索方式。
)6.网络信息检索的特点:信息检索空间的拓宽;交互式作业方式;用户界面友好且操作方便7.网络信息检索工具:网络信息检索工具是指因特网上提供信息检索服务的计算机系统,其检索的对象是存储在因特网信息空间中的各种类型的网络信息资源。
WEB检索工具是指利用超文本(或超媒体)技术在因特网上建立的一种提供网上信息资源导航、检索服务的专门WEB服务器或网站。
这是人们获取因特网信息资源的主要检索工具和手段,是网络检索工具的代名词。
9.网络检索工具如下部件构成:自动搜索引擎;数据库;检索代理软件网络信息检索工具的类型:WEB资源检索工具:以Web资源为检索对象,又以Web形式提供的检索工具,代表网络信息检索的较高水平,且应用较为普遍。
文献(document)指的是在存贮、检索、利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存贮有信息或数据的载体。
以文字、图形、符号、声频、视频、电磁信号等手段记录和传播知识的载体就是文献。
检索策略检索策略(Retrieval Strategy),是指为实现检索目标而制定的全盘计划或方案,是对整个检索过程的谋划与指导。
数据库数据库(Database)是至少由一种文档组成的,能够满足某种特定目的或特定数据处理系统需要的数据集合。
通俗地讲,数据库就是按照一定方式存贮的相互关联的信息集合。
目录目录(Catalog)是以完整的出版单元(如一种图书、一种期刊)为单位,按照一定次序编排的对文献信息进行描述和报道的工具,也称书目。
目录对文献的描述比较简单,每条记录的字段主要包括:文献题名、责任者、出版事项、分类号、主题词等。
禁用词禁用词(STOP WORD)是指不表达实际意义的虚词,如冠词、介词、连词等。
通常在检索系统生成索引的过程中会忽略这些虚词。
所以,检索时如关键词中间出现这些禁用词,会被检索系统忽略。
1.信息检索答:信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,又叫信息储存与检索,这是广义的信息检索。
狭义的信息检索则是仅指该过程的后半部分,即从信息集合中找出所需信息的过程。
2.追溯法(引文法)答:利用参考文献进行深入查找相关文献的方法。
追溯法包括两种方法: 一种是利用原始文献所附的参考文献进行追溯;另一种是利用引文索引检索工具进行追溯。
3.三次文献答:是在对有关的一次文献和二次文献进行分析研究的基础上,通过综合概括而编写出的文献,是文献信息研究的成果和产物,具有参考性和指导性。
如教科书、综述、工具书、进展、调查报告、标准等。
4.目录答:是对图书、期刊或其他单独出版物特征的揭示和报道。
目录以单位出版物为著录对象,一般只记录其外部特征。
如题名、著者、出版事项、载体形态等。