信息检索
- 格式:doc
- 大小:40.50 KB
- 文档页数:7
什么是信息检索?1、信息检索是一门关于如何查找文献、知识和信息的工具性课程,被认为是开启知识宝库的金钥匙。
2、信息检索课程是一门对于本科生到博士生都具有很强实用性的课程,对于帮助我们学生提高科研能力和拓宽科研领域具有重要的作用。
开设信息检索课的作用大学生需要学习,如何提高自己获取和利用文献信息的能力;进入工作岗位后如何更新自己的知识结构,使自己不落伍.所以,获取知识和信息的能力成为了大学生必须具备的重要能力之一.信息检索这门课主要讲授检索文献的一些基本方法,培养学生检索文献的技能.学习和科技需要文献,个人全面素质的提高需文献,生活中也离不开各种信息.我们在信息检索课中,老师侧重介绍了信息检索工具与检索技巧!但对于今后我们的生活中,这种检索思想将会发挥更大的作用,所以平时我们应多积累一些有关互联网上的检索工具(包括搜索引擎和检索技巧)方面的知识,这方面的能力可能带给我们更大的实惠。
信息检索课程作为一门方法课程,它不仅使我们的信息意识更为敏锐,而且使我们了解了信息组织与检索的原理,让我们学会了操作使用各种专业文献信息数据库和网络检索工具。
通过老师认真指导在我们不断练习的基础上,我们不仅掌握了娴熟的检索操作技能,而且逐步掌握了如何选择合适得信息源,如何确切表达特定的信息需求,以与如何应对检索过程中出现的各种问题。
在信息检索课中学习到了什么?1、通过信息检索课程学习,知道了什么是信息,信息的有哪些类型,信息有什么特征,信息有什么作用。
2、通过信息检索课程的学习,知道什么是信息检索,信息检索的类型有哪些,知道了信息检索的过程,知道了信息检索的方法和途径,知道了信息检索的技巧和策略,学会了如何去评价信息。
3、通过信息检索课程的学习,知道了网络上原来还有那么多数字图书馆,有那么多知识数据库。
4、通过信息检索课程的学习,发现搜索引擎并不是仅仅用来搜索网页和MP3,还可以用来搜索重要的知识,发现了搜索引擎原来还有如此多的笑秘密。
信息检索概念及分类
一、概念
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。
狭义的信息检索仅指信息查询(Information Search)。
即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。
广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。
又称信息的存储与检索。
一般情况下,信息检索指的就是广义的信息检索。
二、分类
(一)按存储与检索对象划分,信息检索可以分为:
文献检索
数据检索
事实检索
以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。
(二)按存储的载体和实现查找的技术手段为标准划分:
手工检索
机械检索
计算机检索
其中发展比较迅速的计算机检索是“网络信息检索”,
也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。
(三)按检索途径划分:
直接检索
间接检索。
信息检索的定义信息检索的定义信息检索是指在大量的数据中寻找到用户所需要的信息。
这种寻找过程通常是通过计算机程序来实现的,其目的是帮助用户快速准确地获取所需信息。
一、信息检索的概述信息检索是一种基于计算机技术和信息科学理论的应用性研究领域。
它主要涉及到如何从海量数据中提取出用户需要的有用信息,以及如何优化检索效率和结果质量。
信息检索技术已经广泛应用于互联网搜索引擎、电子图书馆、数字化档案管理、社交网络分析等领域。
二、信息检索的基本原理1.建立索引建立索引是实现信息检索最基本的步骤之一。
它将文档中出现过的词语进行统计和分类,并为每个词语分配一个唯一标识符,以便后续查询时能够快速定位到相关文档。
2.查询处理查询处理是指将用户输入的查询语句转换成计算机可处理的形式,并根据查询条件匹配相应文档。
查询处理包括了分词、去停用词、词干提取等步骤,以保证查询语句与文档库中的内容能够准确匹配。
3.评价指标信息检索系统的评价指标通常包括召回率、准确率和F值等。
其中,召回率是指检索到的相关文档数占所有相关文档数的比例;准确率是指检索到的相关文档数占所有检索到的文档数的比例;F值是综合考虑了召回率和准确率的综合评价指标。
三、信息检索的主要技术1.分词技术分词技术是将一段连续的自然语言文本切分成一个个单独的词语,并为每个词语赋予相应的权重。
这种技术可以有效提高查询效率和结果质量。
2.向量空间模型向量空间模型是一种用于表示文本内容和查询语句之间相似度的方法。
它将每篇文档表示为一个向量,并通过计算两个向量之间的余弦相似度来判断它们之间是否存在相关性。
3.机器学习机器学习是一种通过训练数据来优化信息检索系统性能的方法。
它可以帮助系统自动调整参数,从而提高系统对用户需求的理解能力和搜索结果质量。
四、信息检索面临的挑战1.语义理解信息检索面临的最大挑战之一是如何理解用户的搜索意图和查询语句。
由于自然语言存在歧义性和多义性,因此需要开发出更加智能化的算法来实现语义理解。
专业科训信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。
信息检索有广义和狭义的之分。
广义的信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
狭义的信息检索为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。
狭义的信息检索包括3个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。
一·按存储与检索对象划分,信息检索可以分为:1·文献检索·2数据检索 3·事实检索以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。
二·按存储的载体和实现查找的技术手段为标准划分:1·手工检索 2·机械检索 3·计算机检索其中现在发展比较迅速的计算机检索是“网络信息检索”,也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。
按检索途径划分:(1)直接检索,(2)间接检索三·检索方法信息检索方法包括:普通法、追溯法和分段法。
1.普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。
运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。
普通法又可分为顺检法和倒检法。
顺检法是从过去到现在按时间顺序检索,费用多、效率低;倒检法是逆时间顺序从近期向远期检索,它强调近期资料,重视当前的信息,主动性效果较好。
信息检索一、名词解释:1.信息检索:狭义的信息检索概念是指在信息的海洋中选取符合需要的信息的过程称为信息检索。
而如今发展为包括信息的储存、组织、查询、提取等多个工作过程,所以广义的信息检索又称为信息储存与检索。
2.CALIS:全称为中国高等教育文献保障系统(china academic library&information system),其联合目录数据库始建于1997年。
其资源类型包括原文、图片、阴文、文摘、馆藏、相关文献等;育种覆盖中文、英语和日语。
3.引文索引:利用文献引证关系检索相关文献的索引。
引文索引以某一文献(包括作者、题名、发表年份、出处等基本数据)作为标目,标目下著录引用或参考过该文献的全部文献及出处。
它主要供用户从被引文献查找引用文献。
4.截词检索:截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。
截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。
尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。
5.科技查新:科技查新是文献检索和情报调研相结合的情报研究工作,它以文献为基础,以文献检索和情报调研为手段,以检出结果为依据,通过综合分析,对查新项目的新颖性进行情报学审查,写出有依据、有分析、有对比、有结论的查新报告。
二、填空1.文献按内容层次可分为:一次文献、二次文献和三次文献。
2.计算机信息技术中常用的检索技术是:布尔逻辑检索、截词检索、限制检索、词位检索。
3.信息素质的内涵包括:信息意识、信息技能和信息道德。
4.SCI是什么的缩写:科学引文索引(science citation index)。
5.位置算符W:这个算符表示其两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序不可以颠倒,3N:此算符两侧的检索词之间允许间隔最多3个其他词或字母,且两者词序可颠倒。
航天与建筑工程学院《信息检索B》大作业
学号:2013022121
专业:建筑环境与能源应用工程
学生姓名:王世璞
2015年4月
一,请利用图书馆馆藏书刊系统的多字段检索,使用两个以上不同字段进行检索,写出检索词、检索字段(检索途径)、检出数量以及第一本书的题名、索书号,并说明该书我馆是否购买了电子图书,如果有写出一个所属电子图书数据库的名称。
(6分)
题名:理论力学
出版社:哈尔滨工业大学出版社
检索数量:7
第一本书题名:理论力学同步辅导.Ⅰ索书号:O31-42/L21/1 没有购买电子图书
二、在图书馆主页上或查看微信,找到并记录图书馆最新开放的“小组研讨室”预约流程。
(5分)
预约流程:①提交申请:申请人到图书馆读者协会(509房间)当场填写或带电子文档现场打印申请单→②现场审核→③分配房间和时段
→④给申请人进行开门受权→⑤申请人持本人校园卡使用小组研讨室
三、利用读秀学术搜索平台查找书名中包含“潜艇”的中文图书有多少种?其中本馆馆藏纸书和电子全文图书各多少种?“工业技术”学科中有多少种?(6分)共235种
本馆馆藏纸书68种
电子全文图书69种
“工业技术”学科中有5种
四、利用超星数据库或读秀学术搜索找到《如何阅读一本书》,记录其ISBN号,略读第三章—阅读的第一个层次:基础阅读(P22-29),完成该书p317-323页基础阅读测验一的测试,写出自己的正确率,并谈谈相关感受。
(6分)
7-100-04094-9 80%
觉得对一本书不可马马虎虎的读
五.请在Ebsco e-collection(Netlibrary)中利用高级检索查找标题字段中有“Robot”的书籍有几本,选择最新一本,记录第三章的题名。
(5分)
一共有30本书
ROBOTS
六,如何查找本专业的中文核心期刊?请结合数据库简述方法并查找出2个本专业的中文核心期刊,记录其刊名和ISSN号。
(6分)进入CNKI首页,点击“期刊”,进入后再点击期刊导航,在点击页面左侧“核心期刊导航”,按照分类找到第七编工业技术里的制冷工程类
制冷学报
低温工程 ISSN 1000-6516
七.请从下面课题中任选1个在CNKI数据库的期刊单库或维普期刊资源整合服务平台中利用高级检索或专业检索,写出使用的数据库、检索词、检索途径,及其他检索限制(年代、期刊类型等等),并写出是否进行了检索词、检索途径等的调整,按最后的检索结果写出相关度最高或被引次数最多的一篇文献的题名和
作者。
(10分)
1)基于单片机的目标搜索系统设计
2)激光探测器的FPGA模块设计
3)高校协同创新合作伙伴选择研究
4)黑龙江省装备制造企业绩效提升机理研究
选择激光探测器的FPGA模块设计
使用CNKI数据库的期刊单库
主题激光探测器并且 FPGA
相关度最高的文献题名一种用FPGA提高激光测距精度的改进方法
作者雷志勇;李永昌;刘星;雷鸣;
八,分别利用维普期刊资源整合服务平台中的“科学指标分析”中的热点论文查找本学科领域的文献和Elsevier SD数据库中本学科领域2014年10-12月TOP25的文献进行对比,试着找出其是否存在一定的关联性,或者直接分别写出两个数据库中排在第一的文献题名。
(6分)
维普期刊资源整合服务平台中题目高速铁路对河南沿线城市可达性及经济联系的影响
Elsevier SD数据库中题目 The Internet of Things: A survey
九.请选择一个中文学位论文数据库,查找:2010年以来哈尔滨工程大学以郝燕玲老师为导师的博硕士学位论文,请写出所选的数据库、满足该条件的检索结果数量以及其中2篇论文的作者、题目及论文答辩的年月。
(6分)
33条满足条件的结果
Cnki
十,自拟一本专业相关课题,先在CNKI或其它中文数据库中试检,确定检索策略,并将检索词译成英语,在本专业相关的任一外文全文数据库中检索,写出外文全文数据库名称、课题中英文名称、中英文检索词(至少两个)、检索途径及调整过程、并写出每个数据库最后的检索数量,可谈谈中外文数据库检索的不同感受。
(8分)
数据库名称Spring link
课题建筑环境 buildings and envirment
检所词建筑环境应用 building envirment application
途径高级检索
调整时间 2000至今
数量 3
CNKI 数量 3
需要用到专业词汇
十一,利用SCI数据库或SCOPUS数据库查找任一领域相关课题(可适度宽泛),写出使用的检索词、发文最多的机构名称和作者的姓名,以及发文最多的出版物名称和其2013影响因子。
(8分)
课题 building and application
检所词:building application
机构:CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE CNRS ( 作者:WANG YING
出版物:Advanced Materials Research
因子 5.321
十二,在Elsevier SD数据库中自拟课题,使用截词检索或短语检索,并记录课题名称、使用的检索词和检索技术,利用高级检索,写出找到的最新review类文章的题名,并就相同研究方向,利用图片检索找到需要的两幅图片,记录其中一幅图片的题名。
(10分)
课题:建筑环境与能源应用工程
检所词:Building environment energy applications review
技术:时间2000至今类型 all
最新文章题名:3 – Disaster Risk
十三,自行在开放存取的网站检索出相关研究领域的文献,写出网站地址、检到的相关文献数量,并说明第一篇文献是否可以直接看全文。
(6分)网址:
/search;jsessionid=E14499CF07E8CF804BC5D3F7CB 3E92F6.tomcat1?kw=建筑
数量690条
十四,请找到与自己学科领域相关的可看到视频的任一网上开放课程,写出网站名称,授课的学校与课程名称。
(6分)
有道公开课西安建筑科技大学中国建筑的文化解码
十五,利用Google scholar(/)自拟课题在高级检索中查找相关文献,写出课题名称、所使用的检索词,并说明第一篇文献是否
可以直接看全文,属于哪个数据库收录的文献。
(6分)课题;建筑
检索词;中国建筑。