网络文献信息检索基础知识
- 格式:doc
- 大小:38.00 KB
- 文档页数:6
网络资源与信息检索(本科)讲课要点第一章信息检索的基础知识讲课要点:一、信息(一)基本概念(P1-2)1、信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。
2、文献:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。
也可以称为固化在一定载体上的知识。
3、资料:固化在一定的实物或载体上的知识。
4、信息的传递渠道(二)信息的类型及特点(P4-7)从不同的角度信息可以分为不同的类型1、加工层次(请注意这三者的不同与联系)(1) 一次信息(原始文献)(2) 二次信息(检索工具)(3) 三次信息(参考工具)2、出版形式——图书、期刊、特种文献,结合教材P24-25的内容(请从基本概念、内容特点、著录特点三个方面着重掌握图书、期刊、会议、专利、标准、学位六种类型)3、物理类型——印刷型、缩微型、机读型、声像型4、按信息的性质划分P75、按信息所表征的服务对象划分P7二、信息检索(P2-4)(一)信息检索就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。
它包括三个方面:数据检索、事实检索、文献检索数据检索、事实检索、文献检索三者中以文献检索为主。
数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。
(二)文献检索及其类型1、定义:检索系统的建立及检索工具的组织和积累文献的查寻,利用检索工具检出与课题相关的文献。
2、直接检索是从通过阅读原始文献直接获取所需信息快捷、方便漏查率高3、间接检索是通过检索工具的指导再查找原始文献而获取所需信息。
系统、全面滞后? 为什么间接检索是一种更为科学的检索方法?三、检索工具(P8-11)(一)基本概念:按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。
文献信息检索随着时代的不断发展与进步,人们对信息的需求与获取越来越迫切。
特别是在学术研究方面,文献信息的检索显得尤为重要。
本文将从文献信息检索的基本概念出发,介绍文献信息检索的过程、常用的检索工具与技巧,以及如何有效地获取文献信息等方面。
一、基本概念文献信息检索是指根据研究需要,在文献信息库中按关键词或主题进行检索,获取所需文献信息的过程。
文献信息检索不仅可以快速、方便地找到所需的文献,而且还能为研究者提供阅读与学习相应领域的知识。
文献信息库是指收集、整理、存储各类文献信息的数据库,包括图书馆、数据库、电子图书馆等。
文献信息库具有内容丰富、检索便捷、更新快速等特点,是进行文献信息检索的重要资源。
文献信息检索工具是指用于检索特定类型文献的软件或硬件工具,如图书索引、检索软件、文摘数据库等。
不同的文献信息工具在检索速度、检索精度等方面存在差异,使用不同的工具可以获得不同的结果。
二、文献信息检索的过程文献信息检索的过程主要包括以下几个步骤:1.明确研究目的和问题:在进行文献信息检索之前,首先要明确研究的目的和问题,确定所需的文献类型、主题和关键词等信息。
2.选择检索工具:在明确研究目的和问题后,选择合适的检索工具进行检索。
不同的检索工具针对不同类型文献,在检索速度、检索范围、检索精度等方面存在差异,要根据研究需要选择合适的工具。
3.建立检索式:根据研究目的和问题,建立符合逻辑和语法规则的检索式。
检索式包括主题词、关键词、文献类型等多个元素,要确保每个元素的选择正确,以获得更精确的检索结果。
4.执行检索:在建立检索式后,将其输入到相应的检索工具中进行执行。
检索工具会根据输入的检索式,在文献信息库中检索相关文献,并将结果展示出来。
5.结果评估:在获取检索结果后,需要对其进行评估。
可以通过筛选、修改检索式,再次执行检索等方式进行结果的优化。
6.获取文献信息:在得到所需的文献信息后,需要对其进行获取。
获取途径包括图书馆、网络、合作研究者等多个途径。
网络文献信息检索基础知识随着信息技术的飞速发展,信息已成为人类社会不可缺少的一种资源。
因特网是全世界最大的信息宝库,是人类进行科学研究、商务活动和共享资源的重要手段。
如何从这个宝库中迅速、准确地查找所需情报信息,是人们普遍关注的问题。
1. 网上信息源种类网上文献信息种类繁多,按文献信息加工层次,可以分为五类:(1)网上报刊由于网上文献信息传送速度快,越来越多的出版商注重在网上发行报刊。
据统计现已有数百种报纸,近千种期刊,其中很多是免费的。
(2)动态信息各级政府机构、高等院校、团体、公司在网上发布的消息、政策法规、会议消息、研究成果、产品目录、出版目录、广告等。
用户还可以通过Outlook设置所爱好的新闻热线。
在新闻热线上不仅能获得动态信息,而且还能发表自己的看法,与网友进行交谈。
(3)馆藏书目数据库网上有包括美国图书馆在内的6000多所著名公共图书馆、大学图书馆。
如中国数字图书馆(/)、美国国会图书馆(/)。
(4)网上文献数据库如我们常用的Dialog(http://www.dialogweb.com)、OCLC(http:/www.oclc.org)、STN(http://www.Jicst.go.jp;http://www.Fj2kar1sruhe.de;http://info.cas.org)等网络系统以及中情所的数据库检索系统(http://www.chinainfo.gov.cn)。
(5)参考工具书如大不列颠百科全书(http://www.eb.com),汉语词典(http://www.erols.com)等已进入了因特网。
2文献检索中常用符号为了准确表达检索内容,缩短上网时间,经常需用一些检索符号。
(1)布尔逻辑符它是一种最基本的计算机检索传统技术,主要有逻辑或,用“OR”或“+”表示,如A+B表示检索包含有A或B、A和B的文献信息。
逻辑与,用“AND”或“*”表示,如A*B表示检索包含有A和B的文献信息。
逻辑非,用“NOT”或“ ”表示,如A B表示检索不含有B的A的文献信息。
(2)截词符用“?”表示;如computer?,可检索到computer、computers、computerize、com puterization。
当对某词词尾不清楚时,截词很有作用。
(3)+/-号检索词前加+/-号表示该词必须/不能出现在被检文献信息中。
(4)“”或()表示输入的所有检索词为一个整体概念(术语),如中南工学院,若不加“”或()将检索到含有这五个字中的任意一个字的所有信息,在天网上将查到400余条信息,加上“”或()后,就只查到3条。
3网上信息资源检索3-1已知某站点浏览获取动态信息互联网上的各站点经常发布新闻及有关消息。
若已知某WWW地址,就可以在地址框中键入该地址,然后回车。
开始搜索,在主页上双击信息栏目。
如国家自然科学基金会(http://www.nsfc.gov.cn)、中国教育与科研网(http://www.edu.cn)、中国信息网(http://www.chinainfo.gov.cn.)等,他们经常在网上发表消息。
您可以将您常用站点放入您的书签中,以防忘记,同时便于今后使用。
如果您不知某重要网址,可使用WWW搜索引擎。
3-2WWW搜索引擎搜索引擎是一些在Web中主动搜索信息并将其自动索引的Web网站,其索引内容存储于可供检索的大型数据库中。
搜索引擎建立的索引与目录服务不同,前者搜集网页上的单词,后者搜集网页作者简短的特定描述内容。
许多搜索引擎索引它搜到的每张网页的每一个单词,而另一些搜索引擎则可能只索引网页的前二百个至五百个单词。
以网站管理员的角度来讲,搜索引擎就是一套用于检索的软件;而从普通用户的角度来讲,搜索引擎就是提供查询、搜索的网站,或称查询站点、导航站点,即因特网上具有检索功能的网页的总称。
目前网上中文检索引擎在检索信息的准确性、功能完备性以及信息网络度等方面均存在较大差异。
3-2-1搜索引擎的类型搜索引擎依其检索方式可以分为两种基本类型:一种是全文检索搜索引擎,比如Altavista(http://www.altavista.com)、Excite(http://www.excite.com,中文版为http://Chinese.excite.com);另一种是目录式分类搜索引擎,比如Yahoo(http://www.Yahoo,com,中文版为http://gbchinese.yahoo.com)、常青藤(http://www.tonghua.com.cn)。
全文搜索引擎和目录式分类搜索引擎都提供了一个文字输入框和按钮。
检索者可以在文字输入框中键入要检索的字、词或短语,再点击按钮,搜索引擎便会自动搜索,并将检索结果传回给检索者。
按钮的名称,有不同的叫法,有“开始”、“查找”、“搜索”、“查询”、“Start”、“Search”、“Go”、“Find”、“Getit”、“Submit”等称呼。
全文搜索引擎能把网站的每一页都抓进去,能够对每个网站的每篇文章的每个词进行搜索。
全文搜索引擎所检索到的结果,不是网站名、网址和内容提要,而是与在输入框中所键入的关键词相关的一个个网页的地址,和一小段文字。
在这段文字中,也许没有所键入的那个关键词,但在该网页中一定有所键入的那个关键词,或者相关的词汇。
当遇到一个网站时,目录式分类搜索引擎并不像全文搜索引擎那样,将网站上的全部信息都抓进去,而是首先把该网站划归来某个类目,再记录一些摘要,对该网站作概述性介绍。
目录式分类搜索引擎所检索到的结果是与在输入框中所键入的关键词相关的站名、网址和内容提要。
3-2-1 怎样使用搜索引擎如果要检索一个一般性(或综合性)的题目,不妨试一下像Yahoo这一类的目录式分类搜索引擎,准会意外地发现许多相关的网站;而要检索一个有关某个特定的(或不太清楚的)人或事物的信息,最好使用像Infoseek或Altavista这一类的全文搜索引擎。
除了较大的目录式分类搜索引擎和全文搜索引擎外,因特网上还有许许多多较小的搜索引擎,专门提供它们所感兴趣的特定领域的信息检索服务。
比如,若要检索有关某个电影明星的信息,那么http://us.imdb.com准会提供很多这方面的信息,提供的信息量远远超过像Altavista这类大型搜索引擎。
http://search.cnet.com是一个很好的用于查找专业搜索引擎的搜索引擎,它索引了很多搜索引擎,依分类组织。
检索专有名字、短语时,专有名字和短语要放在引号内。
这样做的话,有个好处,许多搜索引擎会找出在全文中只出现了引号内那个专有名字或短语的网页。
如果用小写字体键入关键词,那么许多搜索引擎会把大写字母开头的词和小写字体的词都找出来。
若要找出完全匹配的词,该用大写字体键入关键词。
如果使用一个非常常用的词去检索,如购物,那么一定会检索出一大串结果,所需要的信息几乎要被多余无用的信息所淹没。
一定要少用常用词,用同义词未限制检索范围。
限制检索范围的另一个办法是多使用几个词。
举个例子来讲,若要检索有关上海旅行方面的信息,试一下用短语“旅行AND上海”作为检索的关键词。
AND是布尔操作符,这样的话,就会检索到有关上海旅行方面的信息。
很多搜索引擎支持布尔操作符,有的搜索引擎使用加号“十”代替“AND”,也有的用空格代替。
可以使用NOT布尔操作符(有的搜索引擎使用减号“-”代替“NOT”)在输入框内去掉不需要的词。
例如:在输入框内键入“racingANDbikeNOTcar”,那么在检索结果里会去掉有关“carracing”内容的网页。
一些搜索引擎支持通配符星号(*)(有的搜索引擎用问号(?)表示通配符),可以在单词的末尾加一个通配符星号(*)来代替任意的字母组合。
例如,在输入框内键入Cook*,那么可以找到有关cooking、cooks、cookbooks、cookies等信息的网页。
有的搜索引擎提供范围限制功能,有分类范围、地域范围、时间范围、网站类型范围等,充分利用这些功能能更准确地找到所需要的信息。
当然,并非所有的搜索引擎都同时具备这些功能,有的具备这些,有的具备那些。
目前还没有一种搜索引擎能够满足用户全面搜索因特网信息的需要,也没有一种搜索引擎在质量和检索效率上达到完美无缺的程度,每一种搜索引擎在检索内容上都有所侧重。
因而,要想较全面地检索某一个主题的信息,完全有必要将几种搜索引擎配合起来使用。
万维网(WWW)是互联网上最流行的信息服务方式。
这里介绍几种WWW上重要的搜索引擎:l Yahoo!(http://www.yahoo.com)是互联网搜索引擎的先锋。
Yahoo是WWW上最流行的搜索网点,它由斯坦福大学的两位博士研究生DavidFilo和JerryYang创建。
Yahoo既可以从专题角度检索信息,也可以按关键词检索信息。
它在专题安排上,既包括了学术资源,也包括了大量的非学术资源和许多娱乐资源。
使用方法有三种:根据欲检索内容,在检索框中输入具体的检索词或检索式(含布尔逻辑式、字符串),点search;在主页上点某个与您检索内容相符的主题命名的链接;点主页上快速的重要链接以导向相应的信息,如PeopleSearch、News等。
Yahoo!中文版为http://gbchinese.yahoo.com / 。
l Infoseek(http://www.infoseek.com)是一个集目录查询、关键词检索、新闻服务于一体的搜索引擎,其优点是检索到的重复网页相对较少。
l 天网(http://e .pku.edu.cn/)中文搜索引擎。
天网WWW资源检索系统是中国教育和科研网示范工程应用系统课题之一,被列入CERNet“九五”攻关项目。
这是一个WWW资源索引和查询服务系统,它大约搜集了100万个WWW页面(国内)和14万Newsgroup文章。
通过Web浏览器访问北京大学站点,在北大主页面点击“天网搜索系统”目录,可进入该页面,或直接键入其网址即可连入该系统。
它提供了中国教育和科研计算机网上的Web资源及Newsgroup,只需输入所要检索的一个或多个关键词,系统将把与这些关键词相符的WebPages或Newsgroup中的文献依此列出。
天网WWW资源检索系统界面有简单和复杂两种查询方式。
l 搜狐(http:/www.sohoo.com.cn)“搜狐(Sohoo)”是以提供分类目录为主的中文搜索引擎,其分类原则是以图书分类为基础,与日常应用习惯相结合,由编辑人员分类,因此分类质量较高。
它的信息抓取范围较其它中文搜索引擎的范围要广,不仅有国内站点,还包含国外的中文站点,日访问率达五六千人次。
l 网易(/),“网易”是由广州网易计算机系统有限公司在1997年推出的中文搜索引擎,是目前网上检索功能最全、信息含量最大、最成熟的中文检索工具之一。