计算机检索方法共76页
- 格式:ppt
- 大小:13.21 MB
- 文档页数:3
信息检索技术手册信息检索技术是一种能够帮助我们在大量信息之中寻找到所需信息的技术。
这项技术可以在互联网、数据库等各个领域得到广泛应用,应用非常广泛,因此学习和掌握这项技术是非常必要的。
本手册将详细介绍信息检索技术,并提供实际应用建议。
一、信息检索技术的基础信息检索技术主要涉及到以下几个方面:1. 网络爬虫技术:用于从网络获取信息的技术。
爬虫可以遍历互联网上的页面、文档等内容,并将数据收集到本地存储。
2. 数据库技术:用于有组织地存储数据的技术。
数据库可以通过检索功能快速查找出所需数据。
3. 相关性计算技术:用于计算文档之间相似度的技术。
相关性计算可以帮助我们在文档集合中找到与所需信息相关的文档。
二、信息检索技术的步骤信息检索技术可以分为以下几个步骤:1. 数据采集:使用网页抓取工具、数据库抽取工具等技术,将目标数据从各种数据源中采集。
2. 数据预处理:对采集来的原始数据进行清洗、去重、去噪等预处理。
3. 索引构建:构造适当的索引结构,以便加快检索速度。
4. 查询处理:利用相关性计算等技术,将检索请求转换为计算机可理解的查询语言。
5. 检索排序:将查询结果进行权重排序,将相关性较高的内容排在前面。
6. 结果展示:将查询结果展示给用户,以便用户可以选择所需信息。
三、信息检索技术的应用信息检索技术在各种场景下得到了广泛的应用,如以下几个方面:1. 搜索引擎:利用信息检索技术,搜索引擎可以帮助用户快速找到所需信息。
2. 电子商务:信息检索技术可以帮助用户在海量的商品中快速找到所需商品。
3. 医疗保健:信息检索技术可以帮助医生快速找到与疾病相关的文献。
4. 社交媒体:通过信息检索技术,社交媒体可以帮助用户快速找到感兴趣的话题。
四、信息检索技术的发展展望信息检索技术在未来仍将得到广泛的应用,其发展方向主要有以下几个方面:1. 自然语言处理:信息检索技术需要对用户的自然语言进行理解。
自然语言处理技术在这一领域有着广泛的应用。
名词解释1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。
3.CALIS:China Academic Library and Information System中国高等教育文献保障系统。
4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。
5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。
用户可以通过主题浏览和关键词检索的方式搜索所需信息。
6.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。
检索中,计算机会将所有含有相同部分标识的记录全部检索出来。
截词符一般用“?”或“*”表示,但不同的数据库中有所差别。
7.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。
8.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。
9.文献及其要素“文献”是泛指“有历史价值或参考价值的图书资料。
”要素:1、构成文献内核的信息、知识、数据、事实.2、载体信息、知识、数据、事实的物质载体。
3、记录信息、知识、数据、事实的符号系统。
10.专利文献:专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。
11.三大检索系统:SCI(《科学引文索引》,EI是美国《工程索引》(TheEngineeringIndex)的简称,ISTP是IndextoScientific&T echnicalProceedings的缩写。
1 研究生学习要会熟练运用三个工具最近让几个研究生查阅一些文献资料,结果几天下来查不到所需要的资料。
由此想到,现在可能还有一些研究有类似情况,今天在这里啰嗦几句,给还没有掌握基本获取文献信息的在研究生们几个建议。
这就是:(1)对国际文献资料的查阅,要熟练并灵活运用WEB OF SCIENCE(/)。
这个数据库是世界公认的从事科学研究必备的数据库之一。
关于它的介绍,这里引用一个从学校网站上下载的ppt供大家参考。
web of science(2)对于中文文献,建议熟练使用“中国知网”(/index.htm)。
目前这个网络数据库已经逐步在向WEB OF SCIENCE靠近,增加了很多功能。
具体可到网上查看。
遗憾的是目前还没有见到类似上述ppt的介绍。
但其网站上有“帮助”(含使用手册和视频)可供大家学习参考。
(3)对于中英文兼顾的资料搜索,建议使用“Google 学术搜索”(/)。
Google 学术搜索提供可广泛搜索学术文献的简便方法。
您可以从一个位置搜索众多学科和资料来源:来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和文章。
Google 学术搜索可帮助您在整个学术领域中确定相关性最强的研究。
Google 学术搜索的功能有:从一个位置方便地搜索各种资源、查找报告、摘要及引用内容、通过您的图书馆或在Web 上查找完整的论文、了解任何科研领域的重要论文等。
有了以上这三个数据库工具,能熟练操作和使用,并针对具体的问题能做到得心应手,对学习和研究来讲都会起到事半功倍的效果。
来源: /blog/vcitym.htm2 推荐一个可以下载文献的好网站/该网站能搜索到的资源还是比较丰富的,各杂志能够下载的年限不太一致,具体情况可能使用过之后才有更多的了解。
3广东省科技图书馆免费虚拟参考咨询与原文传递系统使用说明感谢rjgene的宣传,把广东省科技图书馆虚拟参考咨询和原文传递系统推介给广大虫友,不过有一点需要更正的是:这个地址不是一个免费下载原文的地址,而是一个基于用户互助和积分激励机制的免费原文传递和虚拟参考咨询平台,在合理使用网络资源的前提下为用户提供少量用于个人学习和科研活动的原文,请大家在使用本平台时,注意遵守知识产权的相关规定;平台有一批热情的原文传递专家为大家服务;用户们通过该平台可以获得别人的帮助,也可以通过帮助其他人获得积分奖励;提交原文请求的方式有两个,一个是通过平台的统一检索功能在指定的数据库中检索到所需文献题录后直接提交原文申请,也可以点击“原文请求”手动提交申请。