当前位置:文档之家› 实验二Internet信息检索

实验二Internet信息检索

实验二Internet信息检索
实验二Internet信息检索

《信息检索》实验任务书

实验二 Internet信息检索

1.实验目的

通过本实验,加深对Internet信息检索基本原理的理解,熟练掌握Internet信息检索的基本方法和技能。

2.基本原理和方法

基本原理:

本实验主要利用搜索引擎进行Internet信息检索。搜索引擎的一般工作流程是:首先由搜索器,即网络机器人从 Internet上收集各信息站点的摘要信息;再由索引器对该网页上的某些字或全部字作上索引,建立本地数据库;然后用户在检索时,通过搜索引擎的用户接口访问摘要信息数据库;检索器根据用户的查询条件快速检出文档,并对将要输出的结果进行排序和相关性处理;最后再通过用户接口将检索结果反馈给用户。

基本方法:

搜索引擎主要有简单搜索、高级搜索、二次搜索和分类目录等检索方法。

3.主要设备

联网计算机,较快的网速

4.实验方案

实验者运用典型搜索引擎的不同检索方法、检索途径进行检索,获取预期的检索结果。5.实验内容及步骤

实验内容:

(1)Baidu搜索引擎检索。

(2)Google搜索引擎检索。

实验步骤:

选择相关搜索引擎,根据检索需求,设置检索条件,实施检索,获取网页摘要信息,再依据网页摘要信息获取网页。

具体内容:

(1)利用百度搜索引擎检索网页标题中含有“信息素质教育”的ppt和word文件(要求写出各自检索表达式并注明命中文献总数及第一篇文献的题名、作者、详细网址)。

(2)利用搜索引擎搜索兰州工业学院网站内有关“毕业论文”的所有信息,共有几条?写出所用搜索引擎、检索步骤、表达式和命中结果数。在此结果基础上使用搜索引擎的二次检索功能查找和本系相关的结果,共有几条?写出检索步骤。

(3)分别通过Google网页搜索、学术搜索、图书搜索检索与自己专业相关的同一课题,要求记录检索表达式、命中结果数,浏览并比较检索结果内容,说明其差别。

(4)查找有关的就业信息网,写出主要网站(至少3个)的网址。

实验三网络数据库检索

1.实验目的

通过本实验,使学生加深对网络数据库检索基本原理的理解,熟练掌握通过单库、跨库和导航方式检索中文数据库,逐步缩小检索范围,最终获得所需信息的方法及检索结果处理方法。

2.基本原理和方法

基本原理:

登录相关检索系统,选择某个数据库,选择某种检索类型,根据检索需求,设置检索条件,编写检索表达式,实施检索,获取文献题录,再依据文献题录获取文献全文。

基本方法:

对于《中国期刊全文数据库》,有初级检索、高级检索的检索方法;对于维普《中文科技期刊数据库》,有快速检索、传统检索、高级检索的检索方法。3.主要设备

检索终端、网络、CNKI数据资源系统、维普数据资讯系统、CAJViewer6.0(CAJ浏览器)、Adobe Reader7.0(PDF浏览器)。

4.实验方案

实验者根据提供的固定题目,运用典型网络数据库检索系统的不同检索方法、检索途径进行检索,获取预期的检索结果。

5.实验内容及步骤

(1)在“中国期刊全文数据库”中,检索与自己同名的作者发表的论文,共有多少篇?要求记录检索项、检索表达式、检索结果数、检索步骤;记录与自己相同或相近专业的人所在单位和发表文章的数量及 2条文献的完整题录信息(题名、作者、刊名、年卷期)。

(2)通过万方数据库检索查找2012年发表的关键词和题名均为“网络安全”的博硕士论文共有多少篇?写出检索步骤和结果。

(3)在cnki“中国期刊全文数据库”中检索我校教师2010-2012年间发表的所有学术论文,共有多少篇?其中核心期刊多少篇?本系老师有多少篇核心期刊论文?要求写出:检索途径、检索表达式、检索步骤、命中文献数、本系老师核心期刊论文的题录信息(题名.作者.出处)。

(4)通过多种途径检索本专业核心期刊,记录检索途径、步骤和检索结果,并列举其中五种刊名。

信息存储与检索期期末试卷A

淮安信息职业技术学院2007~2008学年度第二学期 《 信息存储与检索 》期末试卷(A 卷) 考试班级:650514 1、模型、碑刻属于哪类信息资源( )。 A .口语信息资源 B. 体语信息资源 C.实物信息资源 D.文献信息资源 2、期刊、报纸属于哪种文献类型( )。 A . 图书 B. 工具书 C.连续出版物 D.特种文献 3、甲乙二人各有一条信息,二人交流后,每人拥有两条信息,说明信息具有( )。 A 客观性 B 相对性 C 依存性 D 共享性 4、查找特定类型的文件的高级搜索语法命令为( )。 A :filetype B :intitle C :site D :inurl 5、手册属于哪类检索工具书的范畴( )。 A.检索性工具书 B.参考性工具书 C.词语性工具书 D.图录性工具书 6、在没有检索工具或检索工具不齐备的情况下,我们可以使用( )。 A . 直接检索法 B. 抽查法 C.回溯检索法 D.循环检索法 7、下列各项属于类书的是( )。 A .《永乐大典》和《资治通鉴》 B. 《永乐大典》和《古今图书集成》 C. 《四库全书》和《古今图书集成》 D. 《天下郡国利病书》和《四库全书》 8、关于全文型(索引型)搜索引擎信息采集和索引机制,错误的说法是( )。 A. 采用网页采集机器人robot ,循着超链接不停采集访问到的页面 B. 网页采集机器人可以采集到所有的页面 C. 自动提取网页中的关键词建立索引 D. 网页的更新有一定的周期,有时候存储的网页信息已经过时 9、分类搜索引擎的典型代表是( ) 。 A .Google B .Baidu C .Yahoo! D .Search 系部 : 班 级: 学 号: 姓名 :

信息检索实验报告

信息检索与利用实验报告 课程名称:信息检索与利用 班级:自动化1001 学号:201004134017 姓名:王西

1. 何为信息素质?谈谈你对信息素质的理解. 信息素质,是人类素质的一部分,是人类社会的信息知识、信息意识、接受教育、环境因素影响等形成的一种稳定的、基本的、内在个性的心理品质。人才的知识创新需具有广博的知识和良好的智能结构。广博知识和良好的智能结构是通过信息素质获得的。信息素质?它主要有以下两方面的内涵:(1).信息意识。信息意识一般可分为纵向的层次结构和横向的内容结构。层次结构是由信息认知、信息情感和信息行为倾向三个层面组成的;内容结构是由信息心理状态和信息素养组成的对信息意识的控制,实际上就是对信息意识的操作,也就是通过教育、学习和训练等手段来完善信息意识的内容结构,并进而控制信息意识的层次结构。 (2).信息实践能力。信息实践能力实质上就是人们运用信息知识,操作信息活动的能力。学生学习计划的完成过程在信息学意义上就是信息的搜集加工和使用的过程,即信息实践能力的培养过程,同时也是学生智能的发展和创新人才的培养过程。 我觉得作为一个学生,具备信息素质是我们接受终身教育的前提条件,在这样一个信息爆炸的时代, 那么我们如果具有了信息素质,不管是在学校还是走入社会,都可成为学习的主体,主动获取知识和进行知识创新,使我们的学习不再受时空的限制。而且具有信息素质的学生,能够打破学科的界限,随时按照自己将来研究的方向,进行相应资料的获取、整理、研究、利用,实现学科的扩展交叉,从宏观上把握各学科间的联系,实现具有良好的智能结构和知识的创新所以也可以说具备信息素质是培养创新人才的先决条件。 2. 什么是电子图书?举例说明重要的国内外电子图书系统。 电子图书又称e-book,是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备使用,并可复制发行的大众传播体。类型有:电子图书、电子期刊、电子报纸和软件读物等。 电子图书拥有与传统书籍许多相同的特点:包含一定的信息量,比如有一定的文字量、彩页;其编排按照传统书籍的格式以适应读者的阅读习惯;通过被阅读而传递信息等等。但是电子图书作为一种新形式的书籍,又拥

信息检索实验答案

一:《中图法》网站的网址名称https://www.doczj.com/doc/4214357877.html,/ 我感兴趣的是情报学、情报工作分类号是 G35 二:以下图书的分类号 O621.25 有机化学及实验 I24 《三国演义》 O65 分析化学 O62 有机化学 I24 周恩来传 G64 研究生英语高级教程 Q814 酶工程技术 Q93 微生物学 Q939.9 生物芯片技术与实践 G64研究生英语高级教程 三.根据分类号,查所属类目 Q51 蛋白质⑨ O622 有机化学 J211.6 绘画材料和工具 I206 文学评论和研究 O657 仪器分析法(物理及物理化学分析法)⑨ H315.9 翻译 O61 无机化学 K29 地方史志 F742 国际贸易关系 O631 高分子物理和高分子物理化学 四.题名/责任者: 遗传毒物/(日)西冈一著张研译 出版发行项: 北京:科学普及出版社,1988.05 ISBN及定价: 7-110-00280-2/1.00

五:山东理工大学图书馆数字文献资源类型(根据出版形式划分) 图 书 中外文电子图书 期 刊 数字资源导航。 会议论文 中国重要会议论文全文数据库 学位论文 中国学位论文全文数据库 音像资料 超星名师讲坛:https://www.doczj.com/doc/4214357877.html,/ 专 利 国家知识产权局专利检索数据库 标 准 国道标准数据库 专 利 国家知识产权局专利检索数据库 报 纸 中国重要报纸全文数据库 六、美国四大科技报告简介 1.PB 报告 1946年,美国为了整理在第二次世界大战中从战败国缴获来的大量的内部科技资料,在商务部下成立了出版局(Office of the Publication Board ,U.S. Department of Commerce ,简称PB ),负责整理、公布这批资料,因每件资料都寇以“PB”作为标识,因此称为PB 报告。图 书 期 刊 会议论文 学位论文 音像资料 专 利 标 准 报 纸

信息检索作业

信息检索作业 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

信息检索 学院机电工程学院 专业机械制造及其自动化 学生姓名李海龙 学号 152080201016

1.写出目前我国国内的主要文献传递服务机构,阐述其主要特点及功能。 (1)中国高等教育文献保障系统(CALIS),中国高等教育文献保障系统(China Academic Library & Information System,简称CALIS),是经国务院批准的我国高等教育“211工程”“九五”“十五”总体规划中三个公共服务体系之一。CALIS的宗旨是,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。 特点:CALIS 采用的分布式文献服务传递,CALIS 管理中心设在北京大学,下设了文理、工程、农学、医学四个全国文献信息服务中心,华东北、华东南、华中、华南、西北、西南、东北七个地区文献信息服务中心和一个东北地区国防文献信息服务中心。 (2)国家科技图书文献中心(NSTL),国家科技图书文献中心(NSTL)是根据国务院领导的批示于2000年6月12日组建的一个虚拟的科技文献信息服务机构,成员单位包括中国科学院文献情报中心、工程技术图书馆(中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院、中国化工信息中心)、中国农业科学院图书馆、中国医学科学院图书馆。网上共建单位包括中国标准化研究院和中国计量科学研究院。中心设办公室,负责科技文

网络信息检索教案设计

网络信息检索教案设计 黑龙江省佳木斯市桦川县第一中学信息技术组马洪伟 教案背景 1、模块:信息技术基础 2、年级:高中一年级 3、所用教材章节:第二章第三节网络信息检索 4、学时数:40分钟 一、教材分析 教材中选取了分类检索和关键词查询两种常用信息检索方式,以关键词查询为主设计了活动,使学生通过操作理解这两种检索方式,为学生完成日常生活中所需信息获取提供了方法和途径,同时,也为学生今后的学习提供了强大的技术支持,从中培养学生信息获取的基本素养。并为选修教材中搜索引擎的学习打下基础。另外教材中还介绍了利用下载工具下载保存各类信息,并重点突出在下载前要建立分类文件夹,这为第四章信息资源管理的学习作了铺垫。 二、学情分析 需求分析:网络中信息资源分散,数量庞杂,从中寻找所需信息就像大海捞针一样,学生在平时完成活动的过程中已认识到这一点,因此对于本节课的学习学生是有一定需求的。 差异分析:学生动手操作能力都很强,在平时的生活学习中都能主动运用“搜索所需信息,一部分学生不仅能搜索到自己所需要的信息而且能利用工具下载,但绝大多数学生都没有知识产权和对信息进行管理的意识。大部分学生能积极主动的学习而且思维活跃,表达能力也很强,仅几名同学自控力不强,注意力易被分散。 情绪分析:学生对网络资源有着浓厚的兴趣,大部分学生都希望把喜欢的资源“据为已有”,这为本节课的学习奠定了良好的情绪基础。 三、教学目标 1、知识与技能 了解选择关键词的重要性;掌握分类检索和关键词查询的基本方法及技巧;能根据需要运用合适的探索方式和技巧检索信息;能使用合适的下载工具下载保存信息。 2、过程与方法 在实践中体验不同信息检索方式的检索效果,充分认识到搜索技巧在搜索信息过程中的重要性, 3、情感、态度价值观 树立合法获取信息的意识;初步体验信息资源管理中文件管理的重要性。 四、教学重、难点 重点:掌握因特网信息检索的基本方法与技巧;能够根据需要利用搜索引擎检索信息;掌握下载网络信息的常用方法。 难点:能够根据需要利用搜索引擎检索信息;能针对不同的信息选择合适的方法下载并保存。 五、教学策略设计 (1)教学方法 转变学生学习方式有利于学生知识的获取和构建、智力发展和非智力因素的培养,最终实现每一个学生全面发展的教育目标,根据这一新理念及教学内容和学生特点,我设计了诱思导学法、自主探究法、分组协作法、体验式教学法等 (2)学法指导 引导学生协作式学习、自主探究性学习、基于问题的学习,以亲自实践、积极动脑动手来学习新知。培养学生良好的学习方法与学习习惯,通过问题导学,以主题活动为主线,紧密联系生活实际,让学生从生活中发现问题,分析问题,从而解决问题。

信息存储与检索B卷

济南大学继续教育学院信息存储与检索试卷(B) 学年:学期: 年级:专业:学习形式:层次: (本试题满分100分,时间90分钟) 一.选择题(每题2分,共20分) 1.《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是()。 A、G636.33 B、G216.2 C、I247.4 D、H319 2.布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是() A、检索出除了中年教师以外的在职人员的数据 B、中年教师的数据 C、中年和教师的数据 D、在职人员的数据 3.()是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比 率。 A、查全率 B、查准率 C、误检率 D、漏检率 4.布尔逻辑检索中检索符号“OR”的主要作用在于()。 A、提高查准率 B、提高查全率 C、排除不必要信息 D、减少文献输出量 5.根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定 的方法编排,并指明出处,为用户提供文献线索的一种检索工具是()。 A、目录 B、题录 C、索引 D、文摘 6.文献按载体形式可分为:印刷型、缩微型、声像型和() A、甲骨型 B、金石型 C、电脑型 D、机读型 7.信息检索系统的功能为:报道文献信息、存储文献信息和() A、揭示文献信息 B、检索文献信息 C、宣传文献信息 D、介绍文献信息 8.知识是指人类对客观世界的认识。知识可分为() A、有用知识和无用知识 B、基础知识和高级知识 C、感性知识和理性知识 D、理论知识和实践知识 9.检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和() A、目次 B、题录 C、附图 D、正文(主文档) 10.为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的 标识叙述是正确的() A、TI是题名的标识符 B、AB是关键词的标识符 C、AU是摘要的标识符 D、AF是著者的标识符 二.多选题(每题2分,共20分) 1.信息检索的常用途径有:主题词、关键词、顺序号、引文和() A.题录 B.作者 C.全文 D.题名 E.分类 2.工具法查找文献信息资源的方法可分为() A.顺查法 B.调查法 C.抽查法 D.倒查法 E.取样法 3.常见的索引有以下几种() A.分类索引 B.主题索引 C.著者索引 D.编号索引 E.引文索引 4.信息检索效果评价标准为(A、D、E) A.查全率 B.错误率 C.准确率 D.查准率 E.漏检率 5.查找中文会议论文全文资料,可利用下列哪些数据库进行查找。() A.国研网 https://www.doczj.com/doc/4214357877.html,KI C.维普科技期刊全文数据库 D.人大复印资料 E.万方数据资源 6.用户在超星电子图书馆中可享受的服务为() A.下载图书 B.添加个人书签 C.发表评论 D.讨论 E.标注 7.Elsevier数据库(国外站点)SDOL主页的菜单栏内容:Home,Browse,Search和() A.My Alert B.My settings C.Help D.Tools E.Alert 8.SD数据库的期刊浏览提供的浏览方式为() A.依刊/书名字母顺序浏览 B.依文章的篇名字母顺序浏览 C.依期刊/图书内容所属学科主题分类浏览 D.个人定制内容浏览 第 1 页共2 页

中文数据库的检索实验报告

实验报告 课程名称计算机信息检索 实验项目名称 班级与班级代码 实验室名称(或课室) 专业 任课教师 学号: 姓名: 实验日期:

姓名实验报告成绩评语: 指导教师(签名)

年月日说明:指导教师评分后,学年论文交院(系)办公室保存。

实验一 一、实验目的 掌握常见中文数据库的检索方式。利用所学理论知识,结合实验分析不同数据库在信息组织、检索分式等方面的特点。 二、实验内容: 用一专题在六个中文数据库、检索结果主要也目录和摘要为主。 检索专题自选。 1、中国期刊网 2、维普中文科技期刊数据库 3、万方数据资源系统 4、国研网 5、中宏数据库 6、人大复印资料 7、高校财经数据库 三、实验环境 CPU:Intel(R) core?2 CPU 内存:1G 软件: IE 资源:互联网 四、实验步骤 1.进入广东商学院图书馆网页,点击数字资源,进入中国期刊数据库。 2. 根据自己检索课题的要求,采用分类检索与主题检索在加上 3.鉴于以上检索的结果记录数较多,而且与需求的相关性低,采用以下缩减手段:

(1)在检索导航中更改默认分类:只选择“经济与管理”类 (2)更改更新时间(2005~2009),得到结果; (3)把模糊匹配改为精确匹配得到结果; 4. 通过亲自查看其摘要,全文的方式,剔除一些不相关的文献,并归纳出剔除文章的原则。 5. 将最后的所得的与主题密切相关的文献题录信息拷贝下来,保存在作业文件夹中。并在实验报告中体现出来。 6. 把最后所得的期刊论文的全文都一一拷贝下来。保存在自己的移动硬盘中。作为后期撰写文献综述的依据之一。 7. 登陆到学校的重庆维普数据库、人大报刊索引全文数据库,万方全文数据库期刊、国研网子系统,重复2,3,4,5,6,将所得检索结果拷贝下来,放在作业文件夹 五、试验结果 实验步骤3(2)(3)的结果如下,其它数据库结果类似 六、实验分析 期刊网的主页上免费的资源有:学术研究、工具书检索、党和国家大事、文化与生活、学习教育、行业知识仓库等,在相应领域的信息检索中起着重要作用。

信息检索课后答案

作业习题 《信息检索》思考题及参考答案 (根据新编教学大纲内容选答) 第一讲信息检索基础知识 1.简述大学图书馆的地位和作用。 大学图书馆是大学的文献信息中心,是为教学和科研服务的学术性机构,是学校信息化和社会信息化的重要基地。高等学校图书馆的工作是学校教学和科学研究工作的重要组成部分。现代化的大学图书馆与学校高水平的教师队伍、先进的教学实验设备,共称为现代化大学的三大支柱。大学图书馆既是是学校的文献信息中心又是学习资源中心,是培养人才的重要基地,是自学深造的场所,是学生构建合理知识结构的第二课堂。 2.简述信息、知识、文献的概念及相互关系。 答:信息的概念:一般来说,信息是指与客观事物相联系,反映客观事物的运动状态,通过一定的物质载体被发出、传递和感受,对接受对象的思维产生影响并用来指导接受对象的行为的一种描述。从本质上说,信息是反映现实世界的运动、发展和变化状态及规律的信号与消息。 知识的概念:知识是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识和掌握,是人的大脑通过思维重新组合的系统

化的信息的集合。知识是人类在改造客观世界的实际中所获得的认识和经验的总和,是信息的一部分,是一种特定的人类信息。 文献的概念:文献是记录有知识的一切物质载体。具体地说是用文字、图形、符号、声频、视频等技术手段记录人类知识的一切物质载体。 信息、知识和文献之间的关系是:信息是事物发出的消息,信息经过人脑加工形成知识。只有将自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识,这种再生信息才构成知识。知识信息被记录在载体上就形成文献。 3.何谓信息资源?网络信息资源有何特点? 所谓信息资源,就是信息的来源。各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源。网络信息资源具有数量大、类型多、多媒体、非规范、跨时间、跨地域、跨行业、多语种等特点。正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。 4.试述《中图法》的体系结构及其在文献信息检索中的作用。 《中图法》将人类知识分为马列主义及毛泽东思想、哲学、社会科学、自然科学和综合性图书5大基本部类、22个大类。采用汉语拼音字母与阿拉伯数字相结合的混合号码,基本采用层累制编号法,用一个字母代表一个大类,以字母顺序反映大类的次序,在字母后用

文献检索作业

1、对照ACRL2006年《科学、工程和技术领域信息素养标准》写出自己目前具备的信息素养,哪些是本次课程学习需要达到的信息素养。 (对照三级指标每小项分别注明具备、课堂或者长期学习) 标准一:有信息具有信息素养的学生能确定所需信息的性质和范围(具备) 1、定义和描述信息需求:(具备) a. 识别并/或能对研究课题或其他信息需求(如指定的实验室活动或项目)进行关键词重述或转换。(课堂学习) b. 向教学人员或专家咨询研究主题、研究项目或实验等问题的合理性。(具备) c. 草拟一个论题或假设,并根据信息需求列出相关问题。(具备) d. 通过浏览广泛的信息源来熟悉课题。(具备) e. 限定或修改信息需求以抓住重点。(具备) 2、可找到多种类型和格式的信息来源:(课堂学习) a. 确定信息源的目标和受众。(例如:大众信息vs学术信息、当前信息vs历史信息、外部信息v s.内部信息、一次文献v s二次文献vs三次文献)。(课堂学习) … b. 将专家和其他研究者作为信息源。(具备) c.识别并区分各种格式(例如多媒体、数据库、网站、数据集、专利、地理信息系统、三维技术,公开文件报告,音视频报告、书籍、图表、地图等)存在的潜在信息源的价值和不同之处。(课堂学习) d.认识到信息可能需要从一次文献或实验的原始数据中析出。(具备) e.认识到各种潜在有用的信息数据可能属于保密的、限制访问的或在线免费使用的。(具备) f. 认识到这些潜在有用的信息可能需要特定的数据管理经验并了解生产信息的组织结构。(课堂学习) 3、具备学科领域文献的应用知识并了解其产生过程: (课堂学习) a.了解科技相关信息是如何正式或非正式一产生、组织以及传播的。(具备) b.认识到学科中一次、二次、三次文献源的不同重要性。(具备) c.知晓该领域的行业协会及其产生的文献。(具备) d.了解本学科领域的特殊文献源知识,如手册、小册子、专利、标准、材料/设备规格说明,当前的规章制度,工业常用参考资料、工业生产方法及实践手册、产品资料等。(长期学习) e.认识到知识可按学科分类,并考虑到复合学科可能会影响到信息获取方式,同时,其它学科文献也可能与信息需求相关。(具备) — f. 认识到档案信息的价值以及在不同学科专业中的用途和重要性,并认识到信息长期保存的重要性。(具备) 4、权衡获取所需信息的成本与收益:(具备) a.确定所需信息的可用性,并决定是否扩大检索范围以查寻本地馆藏以外的信息。如咨询同事、独立信息经纪人、行业专家或顾问,以及利用馆际互借服务或附近的图书馆或信息中心等。(具备) b.认识到获取信息需要付出的时间和费用。(具备) c.拟定一份现实可行的信息获取总体规划和时间表。(具备) d.认识到各研究领域保持竞争优势、跟踪新产品,改进过程,并监控竞争对手的营销策略等方面信息的重要性。有些还将涉及向专家和行业顾问咨询专利许可和知识产权方面的内容。(具备) e.认识到所需信息可能是外文文献,有必要进行翻译。(具备) 标准二:有信息具有信息素养的学生能有效地获取所需信息(具备) 1. 选择最合适的调研方法或信息检索系统来获取所需信息(具备):

信息存储与检索

第一章 1.信息的涵义: 申农(信息论创始人):用于消除随机不确定性的东西(信源、信宿) 广义信息是物质、能量存在和运动状态的表征. 狭义信息是人类社会共享的一切知识、学问以及从客观现象中提炼出来的各种消息的总和,即现代信息 2.资源的涵义 资源是一切被人类开发和利用的客观存在。 3.信息资源的涵义 狭义指文献资源或数据资源,抑或各种媒介和形式的信息的集合,包括文字、声像、印刷品、电子信息、数据库等。这都是限于信息的本身。 广义信息资源是信息活动中各种要素的总称。这既包含了信息本身,也包括了与信息相关的人员、设备、技术和资金等各种资源 (1)原始数据与信息的区别 原始数据经过加工处理变为信息 (2)信息与信息资源的区别 经过加工、可被利用的信息称为信息资源。 information resource为复数时,常指信息及与信息有关的设备、人员等集合,是经过人类选取、组织、序化的有用信息的集合。 (1)信息资源是信息的集体; (2)信息资源是经过人类选择、获取的有用信息的集合; (3)信息资源是经过人类组织序化的信息的集合。 4.信息的基本性质 (1)信息是内容是客观的(2)信息的形式是主观的(3)信息是一切物质的基本属性 5.与信息有关的概念 (1)知识。 是对客观事物规律性认识,是系统化和精炼化的信息 知识的三种存在方式:大脑、实物、文献 知识的七个特征:①不可替代性②不可相加性③不可逆性④不可磨损性⑤不可分性⑥可共享性⑦无限增值性 知识分类:①事实知识(Know What)②原理知识( Know why)③技能知识( Know how)④人力知识( Know who)⑤时间知识( Know When)⑥空间知识( Know Where)⑦数量知识( Know Quantity ) (2)文献。是记录知识的一切载体,即用文字、图形、符号、或声视频等记录方式在一定介质上所生成的物质成果 文献的三要素:记录、知识、载体 文献的功能:①存储功能②传递功能③认识功能 (3)情报。指为一定目的而搜集和传递的有特定效用的知识 情报的基本属性:传递性、效用性 6.信息资源的基本特征 (1)普遍性(2)传递性(3)时效性(4)价值性(5)可转换性(6)可利用性(7)可共享性

计算机信息检索实验报告(6个)

实验一网上中文搜索引擎及其使用 一、实验心得 在电脑已经成为生活必备品的现在,日常搜索是一件很平常的事情。俗话说,天天百度知识丰富。当然,我国国内主要的搜索引擎除了百度,还有谷歌、雅虎、搜狗、网易、新浪。 一般来说,百度和谷歌是最多人用的。不同的搜索引擎,不同的搜索方法,得到搜索结果的速度和准确度也不一样。所以我觉得学习计算机信息检索的主要目的就是更好地提高自己搜索的速度和准确度。 在这次实验当中,我们主要学习和掌握以下搜索技巧的运用。「“”」的基本用法、「+」或「空格」的基本用法、「+」的基本用法、「-」的基本用法、「OR」的基本用法、「site」的基本用法、「inurl」的基本用法、「intitle」的基本用法、「filetype」的基本用法。比起以前直接把整个问题打上去然后从网页中寻找满意的答案,灵活使用这些搜索技巧可以更快地找到准确率高的答案。这些技巧在现实生活中具有高度的可操作性和便捷性。 二、实验结果 (一)请使用Google或百度搜索引擎完成以下知识测验:(请将检索结果复制到题干之后,并把所有有关的网页都下载到你的作业文件夹中,以作为本作业评分的依据。) 1.谁根据小仲马的《茶花女》改编了同名歌剧( B ) https://www.doczj.com/doc/4214357877.html,/b/7602599.html A.奥斯汀 B.威尔第 C.福楼拜 2."生存还是死亡,这是一个问题。"出自莎士比亚的哪部作品?( A )https://www.doczj.com/doc/4214357877.html,/question/25934693.html A.《哈姆雷特》 B.《李尔王》 C.《麦克白》 3."侦探福尔摩斯"第一次出现是在下列哪部作品中: ( A ) https://www.doczj.com/doc/4214357877.html,/question/1306083005651.html A.《血字的研究》 B.《东方快车谋杀案》 C.《尼罗河上的惨案》 D.《难逃一生》 4.李清照词中名句"寻寻觅觅,冷冷清清,凄凄惨惨戚戚"的词牌名是: ( D ) https://www.doczj.com/doc/4214357877.html,/wenda/thread?tid=7c29ad4f072df739&hl=cn A.醉花阴 B.一剪梅 C.如梦令 D.声声慢 (二)请在网上寻找如下列图片。 1.寻找如下图所示世界名画《蒙娜丽莎》的指定图片和介绍她被偷的文章 提示:可试用以下检索词:Mona Lisa Louvre museum stolen 蒙娜丽莎 500岁蒙娜丽莎被偷卢浮宫 图片网址: https://www.doczj.com/doc/4214357877.html,/i?ct=503316480&z=0&tn=baiduimagedetail&word=Mo na+Lisa+Louvre+museum+stolen&in=31376&cl=2&lm=-1&pn=10&rn=1&di=101230 20660&ln=1&fr=&ic=0&s=&se=&sme=0&tab=&width=&height=&face=0&fb=0 文章地址:https://www.doczj.com/doc/4214357877.html,/hualang-1534-7665506.shtml

《信息检索》实习题目及答案11年

《信息检索》实习题目 一、OPAC检索 1、利用“中图分类法”查找自己所在专业的分类号TH,并记录。再使用书目查 询系统查找该分类下的一本图书,写出该书的书名机械创新设计、作者高志,黄纯颖主编清华大学,北京科技大学,中南大学编、出版社北京:高等教育出版社、出版年2010、索书号TH122/825(2)、馆藏复本数3、ISBN号978-7-04-029158-2/CNY、馆藏地自科一库[2楼东部](写一个即可) 2、查找作者姓“李”、索书号为“H31”的图书,记录下检索的结果数量 1314,再在结果中检索由中山大学出版社出版的图书,记录下检索结果的 数量7,并写下任一检索结果的作者谢春锦,葛磊,李惠芳编著 、书名现代海关英语、出版社广州:中山大学出版社、索书号H31/765、在图书馆中 有效的馆藏地点北京路校区北京路校区书库及馆藏复本数5、可借复本数5。 3、分类号是“TP311.1”的是关于哪方面内容的图书程序设计?写出此类书其中一 种图书的书名高级数据库系统及其应用、作者谢兴生、出版社北京:清华大学出版社和索书号。 TP311.13/1292 4、自行熟悉OPAC中“我的图书馆”各项功能,并写出今年所借阅的前两本书的 书名材料力学习题详解:《材料力学·第四版》(刘鸿文主编)理论力学解题方法和技巧,如果可能请进行续借。 二、电子图书检索 1.利用“读秀学术搜索”打开并阅读书名包含“竞争情报”,作者为“王知津” 的图书,写出该书的书名竞争情报”、出版社科学技术文献出版社、出版日期2005.2,并从书中查阅竞争情报的概念:为达到竞争目标,合法而合乎职业伦理地搜集竞争对手和竞争环境的信息,并转变为情报的连续的系统化过程。 2.利用“读秀学术搜索”检索二本有关美国前总统的图书,写出图书的书名、 著者、出版社。 白宫领袖美国已故37位总统从政生涯研究【作者】冯祥英著北京市:团结出版社 美国总统全书【作者】(美)威廉·A. 德格雷戈里奥(William A. DeGregorio)著;周凯等译 北京市:社会科学文献出版社 , 2007 3.利用“读秀学术搜索”找出与自己专业相关的图书,写出其中2本图书的书 名、作者和出版社。 《机械制图》蒋淑蓉,范志勇主编电子科技大学出版社 《机械设计》作者:孙志礼主编 4.利用“读秀学术搜索”检索出有关“纳米”的图书有多少种,并从结果中选 择一种图书查找其江苏省图书馆收藏该书情况。255 江苏省 ?苏州大学图书馆 ?东南大学图书馆 ?无锡江南大学图书馆

信息存储与检索复习资料答案

信息存储与检索复习资料答案

一、单项选择题 1. 以下哪个数据库提供同名作者检索功能:(D ) A.万方数据库 B.中国期刊全文数据库 C.复印报刊资料全文数据库 D.中文科技期刊全文数据库 2. _______提供一次文献的线索。(B)A.文摘、索引等B.图书C.百科全书D.手册 3. 以下属于特种文献的是( B)。A.图书 B.科技报告 C.报纸D.期刊 4. 用主题词检索只可以检索出对应的() 5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权 6. 利用分类途径进行检索,其检索标识为( C )A.主题词B.关键词C.分类号D.分子式 7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C ) A.Journal B.Report C.Conference D.Patent 8. 下列选项中,不属于信息能力的有( B ) A.鉴别B.传递 C.评价 D.有效利用 9. 从狭义上说专利文献就是指(专利注明书) 10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这

个按钮的作用是什么?(D) A.测试你当天的手气B.提供最相关的一组检索结果列表 C.提供最相关的一个检索结果的链接 D.直接跳转到系统认为是最相关的页面 11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况(D) A、Citation Index; B、Corporate Index; C、Permuterm Subject Index; D、Source Index; 12. 文献信息检索的全过程包括文献信息的______两个过程( C ) A.存贮和检索 B.存贮和编排 C.标引和编排 D.存贮和标引 13. 利用分类途径进行检索,其检索标识为( C )。A.主题词 B.关键词 C.分类号 D.分子式 14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找?( C. ) A.中文科技期刊全文数据库 B.复印报刊资料全文数据库 C. 超星数字图书馆 D.万方数据资源系统 15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?(C) A.关键词摘要intitle:知识管理 B.论文知识管理PDF C.学术论文知识管理 D.学术论文intitle:知识管理

网络信息检索实训操作题

网络信息检索实训操作题 1.学时:2 2.实验目标: 通过Internet网络信息检索,要求学生了解Internet概况,认识并掌握运用计算机信息检索技术,提高获取和利用文献信息的能力,为不断地吸收新知识,增强创新能力能力打下基础。 3.实验主要内容: 实验主要环节及操作内容: (1)、通过Internet信息检索工具间接地查找所需信息;即通过一些网页主动搜索信息,并自动索引的网页网站。运用Internet的主要综合搜索。 (2)、使用中国期刊网全文数据库的初级检索和高级检索查找文献的全文;学会下载文献资料、学会利用中国知网的免费资料。 (3)、学会使用校园网进入学校图书馆,用关键词检索和组合检索,查找“图书馆资料”以及查找借还书的情况等。 (4)、利用搜索引擎查出中国专利文献免费网站。并用找到的网站查找有关医学方面的专利文献。 4.实验类别:基础 5.实验类型:综合 6.实验要求:选修 7.主要仪器:每位学生操作一台可以上网络的计算机、中国知网数据库 8.本实验评价方法: 本次实验课同学们亲自动手在Internet网络检索文献,加深了对文献检索的基本理论、基本知识的理解,掌握使用计算机进行网上信息的查找。为其将来从事科研、教学工作,以及实现知识更新的继续教育奠定一个良好的基础。 4、实验课题: 1 利用百度搜索引擎搜索包含关键字“计算机软件测试的方法”的网页,并设定搜索的网页中要包含“测试前的准备工作”的完整关键词 2 利用百度搜索引擎搜索,在网页的网址中包含“cdbroad”的网页,并且只在四川范围内查找 3 在https://www.doczj.com/doc/4214357877.html,网站中搜索包含关键字为“公务员考试”的网页 4 利用百度搜索“四川新闻”,设定搜索结果每页显示20条,并且只搜索最近一周内的网页 5 利用百度搜索“四川新闻”,设定搜索结果每页显示20条,并且只搜索最 近一周内的网页 6 请利用百度搜索引擎,搜索中国有关印度洋海啸的报道。 7 利用google计算数学式:ln2*2^2

信息存储与检索练习题

信息存储与检索练习题 二、问答题 1.简述信息、资源的概念。 信息:是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。 资源的涵义:资源可分为两个范畴,一是自然界赋予的自然资源;二是人类社会中人的劳动创造的各种资源。资源是一切可被人类开发和利用的客观存在。 2.简述信息资源的概念及特征。 信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。 共享性这是信息资源区别于物质资源的根本属性之一。一般来说,信息资源可同时为众多的使用者享用,也可被不同时期的使用者使用,同一条信息可以同时为不同领域的人服务、满足不同的需要。而不象物质资源那样具有排他性,即特定的物质资源只能被某些国家、地区或某些群体、甚至个人占有和消耗。当然,一些人可控制或保密的信息,不具有这一特性。 时效性:一般来说,信息资源的时效性,是由事物运动变化的规律决定的。因此,信息资源能否转化为生产力,取决于收集、加工和利用信息是否适时,只有时机适宜,才能发挥最佳效益。 智能性:信息资源是人类按照一定次序开发与组织起来的信息,是人类脑力劳动的产物。 无限性与有限性并存 增值性即对信息资源的投入和使用,不但可以使自然资源、人力资源、资本资源增值,同时信息资源可以一次投入、多次开发利用,并不断产生新的信息使其自身增值。 3.简述电子信息资源含义。 含义:电子信息资源书是以数字化形式(即二进制代码0、1),把文字、图像、声音动画等,多种形式的信息存储在光、磁等非印刷型介质上,以光信号、电信号的形式传输,并通过相应的计算机和其他外部设备再现出来的信息资源。 4.什么是信息检索信息检索的类型有哪些 信息检索的概念:通过一定的方法和手段将用户的提问特征与数据源所采用的特征标志进行对比,然后将二者相一致或比较一致的信息提取出来供用户使用的过程。 类型:文献检索数据检索事实检索 5.简述信息存储与检索原理。 信息检索的全称形式或广义的信息检索,它既包括采用多种形式记录信息、排序信息的信息存储过程,也包括通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与过程。 信息存储与检索的基本原理:查询语言(检索提问)和系统标识语言所进行的“相符性比较”与“匹配运算”。 6.简述信息存储与检索类型。 一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数

信息储存与检索考点归纳

1. 信息检索的原理: 从下图可以看出,信息存储和信息检索有两个交汇处:一个是直接的,即表达信息主题内容的词语与表达需求主题内容的词语之间进行对比的交汇;另一个是间接的,即通过检索语言进行沟通,确保把存储用词和检索用词都统一到同一个检索语言体系中(对于自然语言检索系统来说,不存在存储与检索的间接交汇处)。 2.信息检索系统的物理结构一般包括硬件 软件 数据库3个部分。 信息检索系统的逻辑结构 3.信息检索的研究内容包括以下几个方面:(1)信息检索理论研究(2)信息检索方法研究 (3)信息检索技术研究(4)信息检索语言研究(5)信息检索系统研究 (6)信息检索服务研究(7)信息检索评价研究。 4. 任何检索策略都包括3 个部分:文档表示 查询表示 匹配函数。 5..信息检索模型到底是什么?其描述如下: 信息检索模型是一个四元组/D ,Q ,F ,R(qi, dj)/: (1)D 是文档集中的一组文档逻辑视图(表示),称为文档的表示; (2)Q 是一组用户信息需求的逻辑视图(表示),这种视图(表示)称之为查询; 信息资源信息搜集需求分析信息需求信 息用户信息分析信息表达词语 转 换需求表达词语转换数据库 检索结检 索语言 信息存储过 信息检索过 图1-1 广义信息检索的基本 词语子系统 匹配子系统 采选子系统 标引子系统 交互子系统 数据库 用户群 信息源 查询子系统 图1-9 信息检索系统逻辑结构

(3)F 是一种机制,用于构建文档表示,查询及它们之间关系的模型; (4)R(qi, dj)是排序函数,该函数输出一个与查询qi ∈Q 和文档表示dj ∈D 有关的实数,这样就在文档之间根据查询qi 定义了一个顺序。 6经典模型: 布尔模型 向量模型 概率模型。 7对于布尔模型而言,标引词权值变量都是二值的,即wi,j ∈{0, 1},查询q 是一个常规的布尔表达式。用qdnf 表示查询q 的析取范式,qcc 表示qdnf 的任意合取分量。文档dj 和查询q 的相似度可以定义为: . 8.布尔模型优缺点:优点: 一是实现起来比较容易,速度快,计算的代价相对较少; 二是查询语言表达简单,用户可以使用任意复杂的查询表达式,故得到广泛的应用. 缺点;1布尔逻辑式的构造不易全面反映用户的需求。 2匹配标准存在某些不合理的地方。 3检索结果不能按照用户定义的重要性排序输出。 9.( t1 and t2) or ( t3 not t4) 或者qj = ( t1 ∧ t2) ∨ ( t3 t4)。 10.计算机信息检索的基本原理仍是“匹配运算”,但是却不同于手工检索的“匹配运算”方式。 计算机匹配过程中,需要将检索提问式转化成计算机可以识别的形式,并且要使用系统中特定的检索指令、检索词和检索策略,由计算机自动对数据库中各文档记录进行查找。当检索标示、检索策略与数据库中的信息标示关系一致时,即为命中,将结果输出给用户。 11.逻辑提问式即为Q=A*B*C*D. 表展开法是将每个逻辑提问式转换成一个展开表, 如果有N 个提问式就可做N 个展开表。每个检索词对应表中的一行。其一般格式如下: 展开表的生成,根据算法描述的顺序方向划分为两大部分:前处理部分和后处理部分。 前处理部分,也叫正向扫描处理部分。按照逻辑提问式各项因子出现的先后顺序从左到右依次处理。 前处理算法描述: 地址是指该行所在展开表中的地址; 匹配成功时转向地址AFD ,给出一旦在检索词与文献记录中标引词匹配成功时,下一步应该处理的提问检索词在提问表中的地址; 匹配不成功时转向NFD 地址,给出一旦检索词与标引词匹配失败时应该转向展开表中的地址; “层级值” 栏表示当前检索词在提问式中的层次级别;

文献检索实验报告

《文献检索与利用》课后习题、实验报告与 课程报告 本课程理论课班号(五)组号( 5 )第(16 — 18 )周 学生姓名: 学生学号: 学生年级: 行政班级: 注:所有作业内容均要求手写,请同学们打印题目后手写完成,并保证不出现雷同,所有雷同与非手写作业一律0分计。课后复习题

第一讲文献检索与利用的基本理论 习题: 1现实生活中文献的获取途径有哪些? 2通过适当的获取途径,检索获取自己最喜欢的文献并列出目录。选择其中的一本阅读,并做简单的笔记。 3按出版形式划分,文献分为哪11种类型?其中哪些属于普通文献,哪些属于特种文献,不同文献各有什么特点,可以满足什么样的信息需求? 4在图书中有一类较特殊的种类,即参考工具书(如字词典、年鉴、百科全书、指南手册、图谱地图等),我校图书馆在405阅览室收藏,请找出本专业相关的参考工具书,以参考文献的格式列出其文献线索。 5了解掌握国内外著名的核心期刊收录体系,熟悉每种收录检索体系的学科专业覆盖面。 第二讲文献数据库检索的基本原理 习题: 6文献检索的概念是什么? 7数据库的定义? 8简单介绍文献数据库中的记录、字段与具体文献检索途径的联系? 第三讲文献的特征及文献数据库的检索途径

习题: 9文献特征分为哪2类?各举例说明。 10理解文献特征与文献检索途径、文献数据库字段之间的联系。 11以校图书馆中的文献数据库为检索系统,了解不同数据库(如维普、万方、CNKI等)提供的检索字段(入口)各有哪些?列表比较不同文献数据库的优缺点。 第四讲文献检索语言及其检索方法 习题: 12主题词与关键词的区别是什么? 13以我校图书馆提供的文献数据库为资源,列表说明不同数据库提供的哪些检索途径属于分类检索语言的实际应用? 14主题语言和分类语言各有什么检索特点? 第五讲文献数据库检索实例演示 习题: 15根据自己专业和学习兴趣,自命检索课题,检索相关文献并分析利用。写出检索步骤,记录检索结果,对有用文献做简单笔记。

2019年公需培训信息检索答案

信息检索 1、(单选,4分) 所有检索策略都包含三个要素,以下选项中不属于三要素的一项是() A、匹配函数 B、排序函数 C、文档表示 D、查询表示 答案:B 2、(单选,4分) 在向量模型中,不可以通过()来衡量文档和查询之间的相似度。 A、向量间距离 B、向量内积 C、向量间夹角大小 D、向量间正切值 答案:D 3、(单选,4分) T1、T2、T3表示特征项,D1、D2、D3、D4为文档向量,Q为查询向量,其中,D1=4T1+2T2+3T3,D2=T1+4T2+2T3,D3=5T1+2T3,D4= T2+3T3,Q=T1+0T2+2T3 。以上文档中和Q最大可能相关的是() A、D1 B、D2 C、D3 D、D4 答案:A 4、(单选,4分)

以下选项中属于概率模型的优点的是() A、模型具有内在的相关反馈机制,将文档根据相关概率按递减顺序排列 B、模型最初将文档分成相关的集合和不相关的集合 C、模型中所有的权值都是二值的 D、模型假设标引词相互独立 答案:A 5、(单选,4分) 信息检索模型中,神经网络模型属于() A、布尔模型 B、向量模型 C、概率模型 D、结构化模型 答案:B 6、(单选,4分) 以下关于网络爬虫的描述中,错误的一项是() A、在爬虫开始的时候,需要给爬虫输送一个URL列表,作为爬虫的起始位置 B、根据某种抓取策略爬行新发现的URL,如此重复下去 C、爬虫程序会抓取所有网页,以保证搜索正确性 D、对于商业搜索引擎来说,分布式爬虫是必须采用的技术 答案:C 7、(单选,4分) 在实际的搜索引擎系统中,通过存储()来存储文档信息 A、文档地址 B、文档简化序号

相关主题
文本预览
相关文档 最新文档