当前位置:文档之家› 浅谈互联网络信息检索的技巧

浅谈互联网络信息检索的技巧

113
2010年5月刊
网络技术
信息与电脑
China Computer&Communication
互联网是一个全球性的信息系统,据中国互联网络信息中心
CNNIC2010年1月发布的最新的互联网络状况调查显示,截至2009
年12月31日,中国网民规模达到3.84亿人,普及率达到28.9%。网民
规模较2008年底年增长8600万人,半年增长率为13.4%,中国网民
规模依然保持快速增长之势。2009年中国IPv4地址量达到2.32亿,
较2008年增长28.2%。2009年底域名总数为1682万,域名数量保持
平稳。
互联网络资源丰富,利用互联网我们可以很方便地阅读新闻等文
本类的单媒体信息;也可以方便地在线观看电影、电视剧等多媒体信
息,还可以下载我们所需的软件等资源。但有些人由于缺乏互联网信
息检索的技巧,导致检索不到自己想要的信息或者检索出来的信息不
能满足自己的需求,因此,掌握有关互联网信息检索的技巧,可以快
速检索到自己所需的互联网络资源,到达事半功倍的效果。
一、互联网信息检索的类型
总的来说,互联网信息检索主要有:基于超文本的信息检索、基
于搜索引擎的信息检索、基于目录的信息检索等。
1、基于超文本的信息检索
通过超文本链接逐步遍历庞大的Internet,从一个WWW服务器到
另一个WWW服务器,从一个目录到另一个目录,从一篇文章到另一
篇文章,浏览查找所需信息的方法称为浏览,也称基于超文本的信息
查询方法。
基于超文本的浏览模式是一种有别于传统信息检索技术的新型
检索方式,它已成为Internet 上最基本的查询模式。利用浏览模式进
行检索时,用户只需以一个节点作为入口,根据节点中文本的内容了
解嵌入其中的热链指向的主题,然后选择自己感兴趣的节点进一步搜
索。在搜索过程中,用户会发现许多相关的节点内容根本没被自己所
预想到,而是在浏览过程中不断蹦出来,提醒用户注意它。
2、基于搜索引擎的信息检索
搜索引擎又称WWW检索工具,是WWW上的一种信息检索软
件。WWW检索工具的工作原理与传统的信息检索系统类似,都是对
信息集合和用户信息需求集合的匹配和选择。基于搜索工具的检索方
法接近于我们通常所熟悉的检索方式,即输入检索词以及各检索词之
间的逻辑关系,然后检索软件根据输入信息在索引库中搜索,获得检
索结果(在Internet 上是一系列节点地址)并输出给用户。
搜索引擎实际上是Internet 的服务站点,有免费为公众提供服务
的,也有进行收费服务的。不同的检索服务可能会有不同界面,不同
的侧重内容,但有一点是共同的,就是都有一个庞大的索引数据库。
这个索引库是向用户提供检索结果

的依据,其中收集了Internet 上数
百万甚至数千万主页信息,包括该主页的主题、地址,包含于其中的
被链接档主题,以及每个文档中出现的单词的频率、位置等。
目前互联网上比较常见的中文搜索引擎有:百度、谷歌、必应、
搜狐公司的搜狗、腾讯公司的搜搜、新浪公司的爱问、雅虎公司的全
能搜和易搜、网易公司的有道、奇虎360公司的奇虎、TOM搜索、慧
聪的中搜、YOK超级搜索、孙悟空等。这些搜索引擎有一个共同点就
是搜索引擎的页面非常的简洁,搜索的功能比较强大,有些网站如百
度还提供了高级搜索的功能,来满足不同用户的需求。
还有一些搜索引擎提供的是某一领域或方向的检索服务,比如
搜读网(https://www.doczj.com/doc/bb6735964.html,,最好的小说搜索网站),我们可以在该网
站上搜索我们想要看的小说;再比如中央政府网站搜索(https://www.doczj.com/doc/bb6735964.html,.
cn),我们可以利用中央政府网站搜索(https://www.doczj.com/doc/bb6735964.html,)来进行国务
院公报搜索、政府网站搜索、图片搜索和文档搜索等操作。
由于搜索引擎的检索功能相对较弱,往往应付不了复杂的检索课
题。因此,通过搜索引擎的检索可以看作是检索的第一步,多用于处
理那些综合性的、不是很复杂的检索要求,或那些毫无头绪的检索题
目。一旦明确了检索的范围,或面对复杂的检索课题或学术信息时,
就需要深入到各个学科了解、熟悉和掌握各种专业的搜索引擎、网络
目录和专业数据库了。
3、基于目录的信息检索
为了帮助Internet 上用户方便地查询到所需要的信息,人们按照
图书馆管理书目的方法设置了目录。网上目录一般以主题方式来组
织,大主题下又包括若干小主题,这样一层一层地查下去,直到比较
具体的信息标题。目录存放在www 服务器里,各个主题通过超文本
的方式组织在一起,用户通过目录最终可得到所需信息的网址,即可
到相应的地方查找信息,这种通过目录帮助的方法获得所需信息的网
址继而查找信息的方法称为基于目录的信息查询方法。
有许多机构专门收集Internet 上的信息地址,并编制成目录提供
给网上用户。其目录按照一般主题组织,顶层按经济、计算机、教
育、政治、新闻、科学等分成多个大类目录,每一大类又分成若干子
类,层层递进。
典型的基于目录的信息检索网站有:Ezilon中国目录与搜索
引擎(https://www.doczj.com/doc/bb6735964.html,)、网址之家(https://www.doczj.com/doc/bb6735964.html,)、谷歌265
(https://www.doczj.com/doc/bb6735964.html,)等,以Ezilon中国目录与搜索引擎为例,例如我们
要搜索硬笔书法的网站,我们可以在Ezilon中国目录与搜索引擎的首
页面选择“人文艺术”,在二级目录中选择“美术作品”,在三级目
录中选择

“书法”,在四级目录中选择“硬笔书法”,然后在搜索结
果列表中选择任意的一个网站,例如“硬笔书法天地”,我们可以在
该网站查阅我们想要的信息。
浅谈互联网络信息检索的技巧
陈飞岩 马小雨 河南工程学院,河南郑州 451191
摘要:互联网是一个全球性的信息系统,互联网络资源丰富,掌握互联网信息检索的技巧,可以快速提升自己获取互联网络资源的效率,到
达事半功倍的效果。
关键词:互联网;信息;检索;技巧
中图分类号:TP393 文献标识码:A 文章编号:1003-9767(2010)05-0113-02114
2010年5月刊
网络技术
信息与电脑
China Computer&Communication
4、基于专业数据库文献的信息检索
世界范围来说,数据库发展的特点为: 发展速度快;巨型数据库
日趋专业化; 数据库已由科技文献型产品扩展到多品种体系; 数据库
服务范围从科技到经济、管理、市场、娱乐等等。许多著名的国际
联机数据库检索系统(Dialog、STN、OCLC) 都开设了与Internet 的接
口,用户可通过远程登录或www方式进行检索。另外,有许多传统
信息服务机构开发了网络数据库,如ISI 公司推出的Web of Science,
其中有SCI,SSCI,A8LHCI 三个引文数据库; 美国工程信息公司开
发的EIvillage; 英国的INSPEC 数据; EBSC0 公司提供的BSP(Business
Source Premier 商业资源数据库) 、ASP (Academic Search Premier学术
资源数据库) ; UMI 公司的PQDD( 硕、博土论文数据库) 等。国内著
名的数据库如《中国期刊全文数据库》、《中国优秀博硕士论文全文
数据库》、《中国重要报纸全文数据库》、《中国重要会议论文全文
数据库》、《万方数据资源系统》、《维普中文科技期刊数据库》、
《中国专利数据库》等。这些数据库由专门的信息机构或公司专业制
作和维护,信息质量高,是专业领域内常用数据库。网络文献数据库
是网上信息资源的基础,对检索专业性文献信息的用户来说应首先选
择。
二、检索互联网信息的技巧
1、正确使用各种检索语言
(1)布尔逻辑 not 表示逻辑“非”,使用not 寻找包含not 前的
关键词,但排除not 后的关键词的文档。例如: 大学not 职大,则检索
结果为包含大学,但排除其中有职大的资料。and 表示逻辑“与”,
使用and 操作符检索所得的文档中包含所有的关键字。例如: 生物and
医学,将检索包含生物和医学两个词的资料,我们不能检索任何只带
有生物或只带有医学的结果。在and 逻辑检索中,如果我们结合越多
的词在一起,将检索到越少的记录。and 的另一种表示方式是用空格
表示。
or 表示逻辑“或”,使用or 将检索出几个关键字中至少包含一
个的文档。

例如: 查询物理or 化学,则该检索式将检索到所有包含物
理的记录和所有包含化学的记录。一方面,or 逻辑式被普遍使用来检
索同义词或概念,检索所有包括至少一个词的检索结果。另一方面,
在我们使用逻辑或的过程中,结合越多的词或概念,我们将检索较多
的记录。or 的另一种表示方式是逗号。括号的作用和数字中的括号相
似,可用来使括在其中的操作符先起作用。以上四种操作符可互相结
合使用,但有一定的执行先后次序,其优先顺序依次为:括号、not、
and、or。
(2)“+、- 号” 在一个关键词前不留空格地加上一个“+”
号,表示该关键词一定要出现在检索结果中。“- ”号的情况正好相
反,表示该关键词一定不会出现在结果中。如: “+资源”表示检索结
果中一定有“资源”方面的资料,“- 资源”表示搜索结果中不包含
“资源”的资料。
(3)双引号的使用 双引号在网络检索中的作用,主要是将引
号中的词作为一个整体,在文本中查找。例如你要检索数字图书馆方
面的资料,那么你就要用“数字图书馆”表达,这样计算机才会将数
字图书馆作为一个整体进行检索,最后,显示出关于数字图书馆的信
息,如果不是用引号,那么,检索结果有可能出现“数字”或“图书
馆”的资料,而不是数字图书馆的专门资料。
(4)符号的使用有些网络数据库提供near 检索操作符,提供临
近位置检索,其彼此间距可以通过使用near 后的数值来控制,例如:
sky( 100N) sun 即,查找所有sky 和sun 的间隔不超过100 个单词的资
料。在一个长的记录中,很多不同的词将产生结合不真正相关的检索
结果,通过near 检索可以改变以上的检索结果,缩小不必要的记录出
现的比率。
(5)字段检索和限制检索在搜索引擎中,可以通过在检索词前
加“t”或“u”来表明是在特定的字段中进行检索,t 表示只在标题
中进行检索,u 表示只检索网址,这些符号可以用来控制检索结果的
相关性,提高检索效率。
2、使用恰当的检索方法
(1)一般性的浏览查询或强调获取较为综合、准确的信息时,
一般应利用目录检索,用户可按思维的逻辑顺序或按照其主题目录体
系的导引去浏览、追踪、查找信息。
(2)细节查询或强调获取较为具体、特定的信息时,一般应利
用关键词进行大范围的快速检索,方便、快捷地查询到针对性较强的
检索结果。
(3)在查询一些较模糊或就某一课题的网络资源进行调查、摸
底、综览时,使用多元搜索,进入专门数据库进行检索。
(4)在查询音频、视频等多媒体信息资源时,多用多媒体信息
检索工具进

行搜索。
3、使用恰当的检索词
(1)为了提高检索的精度,应尽量选专指词、特定概念或非常
用词,避免普通词、泛指概念。
(2)当检索结果数量太少,需扩大检索范围时,要使用同义
词、近义词。
(3)提高查全率的原则是减少检索约束条件,通常的方法有: 降
低检索词的专指度,调节检索式的网罗度; 进行载词检索; 增加检索途
径; 取消某些限制过严的前后缀符、限制符等。
(4)提高查准率的原则是增加检索约束条件,通常的方法有: 提
高检索式的专指度; 用“与”连接一些进一步限定主题概念的相关检
索项,增加相互制约; 限制检索出现的可检字段; 用位置符控制检索
词的词间顺序与位置; 利用限制符、前缀符等限制输出文献的外部特
征。
4、使用科学的检索策略
第一步: 分析检索主题,从而决定从何处开始进行检索。
第二步: 选择合适的网络检索工具。
第三步: 边检索边学习
第四步: 学会放弃那些没有效果的检索策略。
第五步: 回过头去试一试前面的检索策略。
5、使用帮助信息
各个搜索引擎和数据库都有自己的特点和特色,详细的“帮助”
信息,我们要善于利用。
参考文献:
[1]徐桂英. 网络学术资源的获取,中共贵州省委党校学报[J],
2008.6
[2]王仕雪. 网络信息获取模式试探,图书情报[J],2008.9
[3]董海军,吴小周. 浅析网络环境下体育信息资源及其获取方
式.内江科技[J],2008.8
[4]付鹏,徐吉平. 网络信息资源搜索引擎利用的方法与技巧,农业
网络信息[J], 2008.3

相关主题
文本预览
相关文档 最新文档