当前位置:文档之家› 第一章 网络检索

第一章 网络检索

第一章  网络检索
第一章  网络检索

第一章网络信息的基础知识

本章主要学习内容:网络基础;网络信息资源的基础知识

一、网络基础:(认识IP地址;认识网络地址和域名;域名与网络信息资源有什么关系?)

1、认识IP地址

人们为了通信的方便给每一台计算机都事先分配一个类似我们日常生活中的电话号码一样的标识地址,称作网络协议地址,是分配给主机的一个32位地址,由4个字节组成。分为动态IP地址和静态IP地址两种。

动态IP地址指的是每次连线所取得的地址不同,而静态IP地址是指每次连线均为同样固定的地址。如目前教室的无线上网就是动态IP地址,每次所取得的地址不同。

IP地址的分类:(A类IP地址;B类;C类;D类;E类)

A类地址

(1)A类地址第1字节为网络地址,其它3个字节为主机地址。网络地址的最高位必须是“0”

(2)A类地址范围:1.0.0.1—126.255.255.254

(3)私有地址和保留地址:

①10.X.X.X是私有地址(所谓的私有地址就是在互联网上不使用,而被用在局域网络中的地址)。范围(10.0.0.0-10.255.255.255)

②127.X.X.X是保留地址,用做循环测试用的。

B类地址

(1)B类地址第1字节和第2字节为网络地址,其它2个字节为主机地址。网络地址的最高位必须是“10”

(2)B类地址范围:128.0.0.1—191.255.255.254。

(3)B类地址的私有地址和保留地址

①172.16.0.0—172.31.255.255是私有地址

②169.254.X.X是保留地址。如果你的IP地址是自动获取IP地址,而你在网络上又没有找到可用的DHCP(动态主机设置协议)服务器。就会得到其中一个IP。

C类地址

(1)C类地址第1字节、第2字节和第3个字节为网络地址,第4个个字节为主机地址。另外第1个字节的前三位固定为110。

(2)C类地址范围:192.0.0.1—223.255.255.254。

(3)C类地址中的私有地址:192.168.X.X是私有地址。(192.168.0.0-192.168.255.255)

D类地址

(1)D类地址不分网络地址和主机地址,它的第1个字节的前四位固定为1110。

(2)D类地址范围:224.0.0.1—239.255.255.254

E类地址

(1)E类地址也不分网络地址和主机地址,它的第1个字节的前五位固定为11110。(2)E类地址范围:240.0.0.1—255.255.255.254

小问题

10.10.240.12是类IP地址?

192.168.0.1是类IP地址?

202.119.230.10是类IP地址?

230.0.0.1是类IP地址?

3、网络地址和域名

域名:虽然可以通过IP地址来访问每一台主机,但是要记住那么多枯燥的数字串显然是非常困难的,为此,Internet提供了域名(Domain Name)。

DNS(域名服务系统):是一种基于分布式数据库的系统,采用客户/服务器模式完成主机名称与IP地址之间的转换。通过建立DNS数据库,记录主机名称与IP地址的对应关系。DNS 驻留在服务器端,为客户端的主机提供IP地址解析服务。

域名解析:主机域名不能直接用于TCP/IP协议的路由选择中。当用户使用主机域名进行通

信时,必须首先要将其映射成IP地址。这种将主机域名映射为IP地址的过程称为域名解析,Internet的域名系统DNS能够完成此项工作。

域名层次:域名是有层次的,由若干部分组成,各部分之间用小数点分开。Internet主机域名的一般格式为:四级域名.三级域名.二级域名.顶级域名(并不一定分四级)。例如我校主机的域名是:“https://www.doczj.com/doc/dd6095040.html,”

网址:域名前加上传输协议信息及主机类型信息就构成了网址(URL),例如我校www主机的URL就是:“http:// https://www.doczj.com/doc/dd6095040.html,”。

通常,进行网络访问时,域名的www可以省略。如https://www.doczj.com/doc/dd6095040.html,/,可以直接输入https://www.doczj.com/doc/dd6095040.html,。不能省略的与域名服务器的配置有关。

域名一般不会变动。

●nslookup命令

● nslookup 域名

● nslookup IP地址

●是一个监测网络中DNS服务器是否能正确实现域名解析的命令行工具。

●Ping命令:验证与一个远程主机是否连接的实用程序。

用Ping工具测试TCP/IP协议的工作情况

(1)Ping回环地址,以确定本机是否正确配置了TCP/IP。

命令:Ping IP地址

(2)Ping工作站的IP地址,以验证工作站是否正确加入了网络,并检验IP地址是否冲突。

命令:ping 工作站IP地址

(3)Ping默认网关的IP地址,以验证默认网关设置是否正确。

命令:Ping 默认网关IP地址

(4)Ping 远程网络上主机的IP地址,以验证能否通过路由器进行通信。

命令:Ping 远程主机的IP地址

●Tracert命令

显示数据包到达目的主机所经过的路径,执行结果返回数据包到达目的主机前所经历的中转站清单,并显示到达每个中继站的时间。

网络地址---网址---URL

URL--(Uniform Resource Locator)

URL由三部分组成:协议类型,主机名和路径及文件名。

<协议:>//<主机名>:<端口号>/<文件路径>/<文件名>

●服务器标识符(协议类型)

通过选择服务器标识符能够确定将要访问的服务器的类型,URL中的服务器标识符可

以有HTTP://、FTP://、GOPHER://、TELNET://、NEWS://等等类型,分别指定为采用超文本传输协议连接、采用文件传输协议连接、与GOPHER服务器连接、与TELNET会话连接、与USENET新闻组相连接。

网络地址---网址---URL

信息资源地址信息资源地址是由两部分构成的,一是机器名称,如https://www.doczj.com/doc/dd6095040.html, 是用来指示资源所存在的机器;另一个是通信端口号,如HTTP的标准端口号为80,GOPHER 的标准端口号为70 ,TELNET的标准端口号为23,FTP的标准端口号为21等等。

路径名路径名是给出资源在所在机器上的完整文件名.

如:https://www.doczj.com/doc/dd6095040.html,/index.jsp

3、域名与网络信息资源的关系

由于Internet最初是在美国发源的,因此最早的域名并无国家标识,人们按用途把它们分为几个大类,它们分别以不同的后缀结尾:

.com 商业公司.edu 教育机构

.org 组织、协会等 . gov 政府部门

.net 网络服务.mil 军事领域

随着Internet向全世界的发展,除了edu、gov、mil、一般只在美国专用外,另外三个大类com、org、net则成为全世界通用,因此这三大类域名通常称为国际域名。ac 代表科研机构

由于国际域名资源有限,各个国家、地区在域名最后加上了国家标识段,由此形成了各个国家、地区自己的国内域名,如:

https://www.doczj.com/doc/dd6095040.html, 中国的商业.org.hk 香港的组织.net.jp 日本的网络

DNS域名结构

顶级的域名常见的有两类:

国家级顶级域名(地理模式)

通用顶级域名(组织模式)

国家级顶级域名(地理模式)

通用的顶级域名(组织模式)

全世界为美国打工

●根服务器:

要用来管理互联网的主目录,全世界只有13台。1个为主根服务器,放置在美国。其余12个均为辅根服务器,其中9个放置在美国,欧洲2个,位于英国和瑞典,亚洲1个,位于日本。所有根服务器均由美国政府授权的互联网域名与号码分配机构ICANN统一管理,负责全球互联网域名根服务器、域名体系和IP地址等的管理。美国政府对其管理拥有很大发言权。

幻灯片17

全世界为美国打工

●目前,全世界13台根服务器中有在美国,而且2台由美军使用,1台由美国国家航空

航天局使用。也就是说,每天世界各地的电子邮件有很多要先由美国人“过目”之后才能去它该去的地方。此外,美国私营公司掌握着全世界互联网域名的分配大权。假如美国与日本的关系急剧恶化,只要美国通过技术手段删去日本的域名“. jp”,日本马上就会成为“网上孤岛”,无法通过网络与外界联系。全世界的网络用户都要向

美国支付费用,“全世界都在为美国打工”。

幻灯片18

●我国顶级域名cn由CNNIC负责管理,在cn下可由经国家认证的域名注册服务机构注

册二级域名。我国将二级域名按照行业类别或行政区域来划分。自2003年始,在我国国家顶级域名.cn下也可以直接申请注册二级域名,由CNNIC负责管理。

●中国已经建成了世界第一个同时也是规模最大的纯IPv6网。日前,中国16个城市(群)

开展IPv6下一代互联网示范城市建设

幻灯片19

更多……

●www指的是什么?

即是万维网(WWW-World Wide Web):是基于超文本的、方便用户在因特网上搜索和浏览信息的信息服务系统。它将位于全世界因特网上不同地点的相关数据信息有机地纺织在一起。媒体形式可以是文本、图片、动画、声音等,可以跳转,“网上冲浪”。

●浏览web信息的网络浏览器有哪些?

微软IE (Internet Explorer )

火狐( Mozilla Firefox );谷歌Chrome

Opera;safari;Netscape

遨游(maxthon);世界之窗

腾讯TT浏览器

●Net Applications:2014年1月全球浏览器市场份额

●IE和Chrome两者成为了浏览器市场的赢家

2015年1月,占据全球浏览器排行榜首位的仍然是IE浏览器,总市场份额高达58.18%。Chrome浏览器位居第二位,最新市场份额23.54%。Firefox火狐浏览器以11.9%的市场份额位居第三位,而12月份的市场份额为11.91%,变化不大。

幻灯片22

来自Net Market Share的统计数据显示,2015年8月, IE浏览器仍然占据全球浏览器排行榜首位,总市场份额为52.17%,Chrome浏览器排名第二位,最新市场份额为29.49%, Firefox 火狐浏览器以11.68%的市场份额位居第三位

幻灯片23

●1989年仲夏之夜,蒂姆成功开发出世界上第一个Web服务器和第一个Web客户机是一

个所见即所得的超文本浏览/编辑器

●1989年12月,蒂姆为他的发明正式定名为World Wide Web,即我们熟悉的WWW;1991

年5月WWW在 Internet上首次露面,立即引起轰动,获得了极大的成功被广泛推广应用。

●Web通过一种超文本方式,把网络上不同计算机内的信息有机地结合在一起,并且可以

通过超文本传输协议(HTTP)从一台Web服务器转到另一台Web服务器上检索信息●伯纳斯·李的发明改变了全球信息化的传统模式,带来了一个信息交流的全新时代。

可是,伯纳斯·李并没有为“WWW”申请专利和限制它的使用,而是无偿地向全世界开放,为互联网的全球化普及翻开了里程碑式的篇章,让互联网走进千家万户。

二、网络信息资源概念、类型、特点

●网络信息资源概念

●网络信息资源类型

●网络信息资源特点

●网络信息资源优点

●网络信息资源评价与选择

●网络信息资源检索的特点

幻灯片25

●网络信息资源是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络

通信手段,在计算机等终端上再现的信息的总和。

网上有什么?

●政府信息,科研信息,教育信息,文化信息,休闲娱乐信息

网上不会有什么?

●商业秘密,军事机密,版权作品

1、网络信息资源概念

●广义:是网络信息活动中所有要素的总和,包括与网络相关的信息内容、信息网络、

信息人才、信息系统、信息技术等资源。

●狭义:是“数字化形式记录的、以多媒体形式表达的、存储在网络计算机磁介质、光

介质以及各类通信介质上、并通过计算机网络通信方式进行传递的信息内容的集合。”

2、网络信息资源的类型

按信息内容的表现形式和内容划分可分为

●全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网

络学院的各类教材,政府出版物,标准全文等;

●事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实

况、IP地址等;

●数值型信息:主要是指各种统计数据;

●数据库类信息:如DIALOG,万方等,是传统数据库的网络化;

●微信息(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。●其它类型:投资行情和分析,图形图象,影视广告等。

“第二代”网络(Web2.0)提供的服务

按信息加工层次分:

●网络零次信息:即在网上产生未经过信息组织者系统加工过的信息,如聊天记录、讨

论、邮件等

●网络一次信息:经初步加工整理并存放在网上的信息产品,如各种一次文献的电子版

等。

●网络二次信息:即关于网络一次信息的信息,如网络版目录、书目、指南、文摘、题

录,网上信息资源指引库和搜索型工具,特点是依据一定的方法将分散、无序的网络零次信息和网络一次信息加以整理、归纳、揭示其特征,形成有组织、有系统的信息系统。

●网络三次信息:即在一、二次资源信息的基础上,通过评价、筛选和按不同功能组织

加工所形成的信息产品,如作为工具类信息产品的网上成百科全书、词典、机构名录、邮件列表、人物传记,以及收录图书、报刊、专利、学位论文的全文数据库等。

按所采用的网络传输协议分为:

●WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能

方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。

●FTP信息资源:它使用ftp协议,该协议主要用于联网计算机之间传输文件。FTP相当

于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。

●TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。

许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。

●用户服务组资源:包括新闻组,电子邮件组等。这些电子通信组形式所传递和交流的

信息资源是网络上最自由、最具有开放性的资源。

●Gopher:一种基于菜单的网络服务,它为用户提供了丰富的信息,并允许用户以一种

简单的、一致的方法快速找到并访问所需的网络资源。全部操作是在一级级菜单的指引下,用户只需在菜单中选择项目和浏览相关内容,就可完成对Internet上远程联机

信息系统的访问,无需知道信息的存放位置和掌握有关的操作命令。

●RSS信息资源:RSS是一种起源于网景的技术,将用户订阅的内容传送给他们的通讯协

同格式(Protocol)。RSS可以是以下三个解释的其中一个:

Really Simple Syndication (简易信息聚合)

RDF (Resource Description Framework) Site Summary( RDF站点摘要)

Rich Site Summary (丰富站点摘要)

P2P应用:允许主机之间通过互联网直接进行相互通信,众多Peer之间形成一个P2P覆盖网络(Overlay Network),从而使各种数据(如文本文件、视频文件等)能方便地在普通主机之间共享。

目前人们认为其在全球的即时通信(如Skype)、文件共享(如BT)、分布计算(如SETI@home)、协同工作(如Groove)等方面大有前途。

常用的P2P应用有Gnutella、BitTorrent、Kazaa、eDonkey、eMule、Skype、Shareaza、Morpheus等,国内开发的主要有:QQ、POCO、PPLive、VNN、PP点点通、北大Maze等。

3、网络信息资源的特点

●复杂性:网络信息资源具有大数量、多类型、多媒体、非规范、跨时间、跨地域、跨

行业、多语种等特点。

●在很大程度上网络的增长和信息资源的动态快速增加是由用户驱动的,但缺乏有效的

统一管理机制,信息安全和信息质量的不均衡性。

●信息分布和构成缺乏结构和组织,信息源不仅分散无序,而且其更迭和消亡也往往无

法预测,因此增大了信息资源管理和利用的难度。

●信息发布具有很大的自由性和任意性,隐私型信息进入了公共信息传播渠道;由于缺

乏必要的过滤、质量控制和管理机制,不仅学术信息、商业信息,政府信息、个人信息、不合适(反动、黄色)的信息混为一体,质量良莠不齐。增加了信息识别和利用的难度。

●正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,

各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。

●网络营造了“地球村”,既极大地促进了人类信息资源的共享,又带来了一些意想不

到的问题,如文化冲突、信息侵略、信息威慑等。

●使用成本低

●共享程度高

●是信息资源的宝库……

4、网络信息资源的优点

●价廉

它是一种比印刷品便宜的信息提供方式。不仅提供信息线索引和著录信息,还提供有关信息的全文和原稿。

●新颖、深入

网上大量的灰色文献或边缘文献(gray of fringe literature),即在主流出版物渠道之外的文献,包括:研究报告、调查采访、研讨会发言、笔记、项目计划报告、政策方针等。它们反映了许多研究成果背后的原始数据或第一手资料,或是因为其内容太新或太专而未被纳入正式文献交流渠道。

●广泛、直接交流

因特网扩大了人际交流的范围,提供了更多的直接交流机会。如参加Usenet的新闻组(news group)、讨论组(discussion group)、邮件列表(mailing list)的讨论。

●非正式和自由发表园地

5、网络信息资源的评价与选择

评价网络信息资源的必要性

●第一,网络上信息资源量的爆炸式增长,使得人们从中淘取有用信息的难度越来越大。

●第二,因特网的松散、开放性等特点,决定了网络信息空间秩序混乱,网上信息良莠

不齐、真伪混杂、整体质量水平下降,人们选择信息更加困难。

●另外,在互联网上,信息不仅很容易被出版、传播,而且也极容易被篡改。

●相同内容的信息资源的载体形态或利用、获取的方式不同,可以根据需要选择。

网络信息资源的评价与选择主要是针对信息源。

●内容因素。内容是评价与选择的核心和重点,从中可以反映网络信息资源的本质。评

价网络信息资源的内容因素主要有:权威性、完备性、可靠性、原创性、新颖性、稳定性等。

●形式因素。形式指标反映了外部特征以及操作使用等方面,是为提示内容服务的,主

要包括:美观性、条理性、查检性、帮助性、快捷性、低耗性等。

●定量的评价:Google的pagerank,星数评价等级。

权威性

在本学科领域具有一定的影响、具有较高的学术水平、具有较高的知名度;Google网页级别评价作为重要的指标,非独特性资源网页级别需4/10以上。

主要关注如下问题:所采集的网站(页)的主办者是否为有声誉的大学、学会/协会、实验室?网站是否通过权威评价机构评价过?所选的站点是否被多个internet站点链接?网站是由某公司、机构还是某领域的著名的权威或专家赞助?信息提供者的教育背景和职业背景及其研究方向?责任者有知名的出版物吗?信息是否经过过滤?信息是否经同行评议过?资源是否由相关的权威推荐?是否有与权威机构的页面的共同链接?出版社是否知名和有声望?出版社是否是公认的出版界的权威?出版社是否是大学的出版社?是否有任何原创作品?选择的资源与其它作品有相关性吗?

准确性

信息资源需严肃正规、准确无误、完整规范。一方面是内容的准确性,另一方面是格式和链接的准确性。对资源的导航需能正常访问。

主要考虑所选网站(页)提供的信息是否准确?是否提供了信息的来源和出处以备用户进一步核查;网页引证的书目或提供的参考能否证实信息的准确性?页面的句法和拼写是否准确?有否排印错误?提供的信息是否完整规范?

稳定性

信息资源需有较长的稳定期或有稳定运行的保障机制。

主要看所选网站(页)提供信息的时间、更新频率、最近的修改日期,链接速度,断线率等。是否能持续提供给用户使用?

可获得性

信息资源揭示信息的层次中,至少一个能无障碍地获得。

主要要考虑的是题名信息还是文摘信息或全文信息? 是否有对信息结论的阐述标准?是否

给出了表明信息内容的关键词或主题词?希望在该网页上找到何种信息?主题的涵盖面是否全?索引或目次页是否隐含了综合性的内容?是否免费?是否注册?是否国际流量?是否符合标准?是否有其它格式或镜像? 某种类型的信息有使用期限制吗?访问资源的方式是否依赖用户使用的设备?是否需要专门软件(如浏览器)?是否有方便的导航?是否容易链接所需的信息?是否有清晰的链接标签?是否能分别打印页面和文献的某一部分?是否能发送到电子邮箱?是否提供多种检索方式?检索信息的效率如何?

网络信息资源的评价方法:

(1)定性评价方法:

根据评价标准和指标体系对网络信息资源进行评价的方法。如国内的(第三方评价法、用户评价法、层次分析法、网络影响力分析法),国外的评价指标体系(10C原则等:内容content、置信度credibility、批判性思考critical thinking、版权copyright、引文citation、连贯性continuity、审查制度censor shop、可连接性connectivity、可比性comparability、范围context。)

(2)定量评价方法:

按照数量分析方法,利用网络自动搜集和整理网站信息的评估工具。如“网络影响因子(Web Impact Factor, Web- IF)”成为网络信息资源评价的一个重要标准、“网络计量学Webometrics”将传统的情报计量方法用于网络信息的研究:链接分析法、概率统计法。基于链接分析的评价指标也非常多, 在链接数量上衡量的指标通常包括: 网站链接总数、指向内部的链接数、指向外部的链接数、被链接网站数。基于链接分布特征的衡量指标包括: 链接密度、页面平均链接数。而总的来说, 衡量网站影响力的指标则包括: 网站被链接次数、网站影响因子、扩散系数。

幻灯片52

●链接分析法:

通过分析站点被其他站点链接的情况来测定网络信息资源的重要性,从而可以帮助确定核心站点为网络信息资源的评价提供依据。“网络影响因子”可以作为评价站点和域名的一种工具。

假设某一时刻链接到网站上某一特定网站或区域的网页数为a,而这一网站或区域本身所包含的网页数为b,那么其网络影响因子的数值可以表示为a/b。

幻灯片53

●概率统计方法:

运用概率论和统计学方法对网络中的数据进行分析和研究,通过对网站和服务器的数量、网络用户特征及网络发展的增长率指标进行统计分析。

幻灯片54

6、网络信息资源检索的特点

●检索范围大

●检索效率高

●工具强大

●信息冗余大

网络信息检索试题及答案(DOC)

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有( C )特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含( B ): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

网络信息检索教案设计

网络信息检索教案设计 黑龙江省佳木斯市桦川县第一中学信息技术组马洪伟 教案背景 1、模块:信息技术基础 2、年级:高中一年级 3、所用教材章节:第二章第三节网络信息检索 4、学时数:40分钟 一、教材分析 教材中选取了分类检索和关键词查询两种常用信息检索方式,以关键词查询为主设计了活动,使学生通过操作理解这两种检索方式,为学生完成日常生活中所需信息获取提供了方法和途径,同时,也为学生今后的学习提供了强大的技术支持,从中培养学生信息获取的基本素养。并为选修教材中搜索引擎的学习打下基础。另外教材中还介绍了利用下载工具下载保存各类信息,并重点突出在下载前要建立分类文件夹,这为第四章信息资源管理的学习作了铺垫。 二、学情分析 需求分析:网络中信息资源分散,数量庞杂,从中寻找所需信息就像大海捞针一样,学生在平时完成活动的过程中已认识到这一点,因此对于本节课的学习学生是有一定需求的。 差异分析:学生动手操作能力都很强,在平时的生活学习中都能主动运用“搜索所需信息,一部分学生不仅能搜索到自己所需要的信息而且能利用工具下载,但绝大多数学生都没有知识产权和对信息进行管理的意识。大部分学生能积极主动的学习而且思维活跃,表达能力也很强,仅几名同学自控力不强,注意力易被分散。 情绪分析:学生对网络资源有着浓厚的兴趣,大部分学生都希望把喜欢的资源“据为已有”,这为本节课的学习奠定了良好的情绪基础。 三、教学目标 1、知识与技能 了解选择关键词的重要性;掌握分类检索和关键词查询的基本方法及技巧;能根据需要运用合适的探索方式和技巧检索信息;能使用合适的下载工具下载保存信息。 2、过程与方法 在实践中体验不同信息检索方式的检索效果,充分认识到搜索技巧在搜索信息过程中的重要性, 3、情感、态度价值观 树立合法获取信息的意识;初步体验信息资源管理中文件管理的重要性。 四、教学重、难点 重点:掌握因特网信息检索的基本方法与技巧;能够根据需要利用搜索引擎检索信息;掌握下载网络信息的常用方法。 难点:能够根据需要利用搜索引擎检索信息;能针对不同的信息选择合适的方法下载并保存。 五、教学策略设计 (1)教学方法 转变学生学习方式有利于学生知识的获取和构建、智力发展和非智力因素的培养,最终实现每一个学生全面发展的教育目标,根据这一新理念及教学内容和学生特点,我设计了诱思导学法、自主探究法、分组协作法、体验式教学法等 (2)学法指导 引导学生协作式学习、自主探究性学习、基于问题的学习,以亲自实践、积极动脑动手来学习新知。培养学生良好的学习方法与学习习惯,通过问题导学,以主题活动为主线,紧密联系生活实际,让学生从生活中发现问题,分析问题,从而解决问题。

网上搜索的方法和技巧

网上搜索的方法和技巧 我们已经知道网上有多种多样的教育资源,从技术上讲,它们是在Internet的多种服务功能的支持下实现的,包含WWW、e-mail、Usenet、FTP、BBS等,其中发展最快,也是最为流行的是WWW。因此我们着重介绍WWW信息的检索方法。 据1999年底的统计,网上大约有15亿个网页,并且以每天增加190万个网页的速度在增长,到2002年已达到80亿个网页。要想在这么大的一个资源库中查找一条具体的信息,犹如大海捞针一般。因此,有人发出这样的感叹:"我们淹没在数据资料的的海洋中,却又在忍受着知识的饥渴"。 现在出现了许多种在网上查找信息的方法。这些方法可以分为两类:一类是有既定目标的查找,一类是没有目标的查找,而后者往往是指一种网上"冲浪"游戏。在具有既定目标的情况下,如果已有信息线索,可以用浏览器航行的办法寻找信息对象;如果信息线索未定,则需要利用搜索工具首先获得信息线索。 搜索工具又有传统工具和现代工具之分。传统工具是在索引数据库中进行主题树/目录检索或KWDSEs(关键词搜索引擎)进行建设而索引库的建设是一个极其繁重的任务,现在已经可以利用"机器人"程序来帮忙,它们通过跟踪最新建立的HTML网页的URL对整个网络进行浏览,可以在网上从这一个网站爬到另一个网站,并记录下它们访问过的网页的各自特征(这种只有十来年历史的搜索技术就被称为传统工具了,你觉得奇怪吗?)。而现代搜索工具是利用智能代理来工作,它们不是对整个网络进行索引,而是在接到一个新任务时就出发,去搜索网上资源并提取有价值的信息。因此,智能代理是利用神经网络技术进行搜索,它试图去发现自然语言与样本网页的模式及它们之间的相互关系,这些将与新近发现的网上资源相匹配,最后以一串网址的形式供用户访问。图2_3_10显示了网上信息检索工具的选择方法。 (一)搜索工具 在Internet上现有的检索工具成百上千,比较普及且功能较强的就有几十种。这些检索按照其工作原理的不同,大概可以分为3种类型:

内蒙古科技大学网络资源检索考试题大全

一、根据课程所学内容完成以下填空(每空2分,共60分): 1、写出内科大图书馆订购的两种电子期刊数据库(CNKI 维普资讯) 2 在我馆的馆藏纸质图书文献中,题名包含“金属冶炼”的全部图书有(25 )种;我馆收藏的黑色金属冶炼设备是(西安重型机械研究所,鞍山钢铁大学)编写的。 3、逻辑运算与在调整检索策略时的作用是提高(检索结果查全)率。 4、世界著名的三大科技文献检索系统是(SCI(科学引文索引)、EI(工程索引)、ISTP(科技会议录索引)) , 5、在中国知网CNKI期刊数据库中,题名包含“冶金”的期刊有(89)种。 6、《CNKI---中国期刊全文数据库》中精确检索主题包含“中间包”的期刊论文全部数据有(2806)条;其中2011年第3期《钢铁》中的期刊论文有(2 )条。 7、我馆订购的可以实战操作英语四级考试环境的数据库是(银符时代考试试题库)。 8、我馆订购的学位论文的数据库有(3)个。 9指引用户到另一信息源以获得原文或其他细节的一类数据库叫(参考数据库)我校订购的是(EI) 10、利用EI 检索在摘要中检索含文献类型为期刊来源为中国的含有metall 的记录有(16258)条其中 A primary study of 8~14 μm band emittance 是于()年发表的。 11、分别利用CNKI《中国期刊全文数据库》的主题名和摘要途径,检索2011-2012年关键词包含“读书日”的期刊论文分别有相关记录(723)条、(575)条。12、请在CNKI期刊数据库中检索出2012年内蒙古科技大学发表的论文有(162)篇。 13、当检索结果输出篇数过少时,缩小检索范围的方法有(增加and的限制概念、用not限制将不相关的文献的输出) 14:参考数据库主要由( 文档、记录和字段)层次构成。 15、在EI中的专家检索时,atuostemming off 默认方式是(取消) 16、《美国工程索引Ei中国镜像站》是(科学文献)数据库。 17、计算机检索包括(信息的存储)和(检索)两个部分,即对应数据库的建立和查找两个部分。 18、世界公认的三大科技文献检索系统是(SCI 科学引文索引)、(EI 工程索引)、(ISTP 科技会议录索引)。 19、计算机检索发展的四个阶段(脱机检索阶段)、(联机检索阶段)、(光盘检索阶段)和(网络化检索阶段)。 20、数据库主要由(文档)、(记录)、(字段)三个层次构成。 21、CNKI的《中国期刊全文数据库》的全文阅读格式有(CAJ )和(PDF )。 22、有“打开世界化学文献宝库的钥匙”美称的化学化工专业的文摘刊物是(SciFinder Scholar)。 23、我管购买的能够查询和练习CET4 、CET6考试题库的数据库有(《网上报告厅》环球英语多媒体资源库)和(银符时代考试题库);我馆订购的视频资源数据有(万方学术视频库,美国探索教育视频资源库,库客视频图书馆);我馆图书的随书光盘资源可以从(内蒙古科技大学非书资源管理系统)数据库中下载。

网络信息检索作业

网络信息检索作业 1.网络信息资源检索常用的检索技术有哪些? 答:网络信息资源检索常用的检索技术有 (1)布尔逻辑检索(Boolean search) (2)截词检索技术(Truncation search) (3)短语检索 (4)临近检索 (5)加权检索技术(Weigh search) 2.搜索引擎主要分几类,例举各代表性的搜索引擎。 答:(一)按检索方式、方法可划分为:目录型搜索引擎、索引型搜索引擎 (1)目录型搜索引擎有代表性的目录型搜索引擎有:Yahoo! 、Galaxy、Look Smart、中文雅虎、新浪、搜狐、网易等。 (2)索引型搜索引擎有代表性的索引型搜索引擎:中英文Google、Hotbot、AltaVista、Ask Jeeves、百度、天网等。 (二)按搜索功能可划分为:独立型搜索引擎、元搜索引擎 (1)独立型搜索引擎大多数网络检索工具都是独立型的。 (2)元搜索引擎常用的元搜索引擎有:Dogpile、Metacrawler、Vivisimo、万纬搜索、搜乐搜索等。 (三)按检索内容、主题可划分为:综合型搜索引擎和专业型搜索引擎 (1)综合型搜索引擎常用的Yahoo!、百度、Google等。 (2)专用型搜索引擎如医学领域、化学领域、专利信息查询等专门性的网络检索工具。 3.什么是开放存取? 答:含义:对某文献的开放存取是指它在 Internet公共领域里可以被免费获取,并允许任何用户阅读、下载、复制、传递、打印、搜索、超链接,也允许用户为之建立索引,用作软件的输入数据或其他任何合法用途。用户在使用该文献时不受财力、法律或技术的限制,而只需在存取时保持文献的完整性,对其复制和传递的惟一限制,或者说版权的惟一作用应是使作者有权控制其作品的完整性以及作品被正确接受和引用。 4.网络参考信息有哪些类型? 答:(1)百科知识检索网站

网络信息检索及其检索工具

摘要 进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。 关键字:网络信息检索;检索工具;因特网;web资源检索

目录 摘要 .......................................................................................................................................... I 1 信息检索的定义. (1) 2网络信息检索简介 (1) 2.1网络信息检索定义 (1) 2.2 网络信息检索的原理 (1) 2.3网络信息检索与传统信息检索的区别 (2) 2.4网络信息检索技巧 (2) 3网络信息检索工具类型 (3) 3.1非web资源检索工具 (3) 3.2web资源检索工具 (3) 4网络信息检索工具的功能 (4) 5网络信息检索展望 (5) 5.1网络信息检索的展望 (5) 5.2网络信息检索工具展望 (5) 参考文献 (6)

浅谈网络信息检索及其检索工具 1 信息检索的定义 什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。 信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2网络信息检索简介 随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。 2.1网络信息检索定义 网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2.2 网络信息检索的原理 网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。 (1)布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询

文献检索作业考试答案

名词解释: 1.文献检索:是将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。广义的文献检索包括文献的存储和文献的检索两个过程。狭义的文献检索就是找出自己所需的文献。 2.检索语言:是用于描述检索系统中文献的内容特征及外表特征和表达用户检索提问的一种专门化的标识系统。检索的匹配就是通过检索语言的匹配来实现的。 3.后组织式语言:是指在检索前检索系统中的检索标识是独立的,实施检索后,才根据检索需要进行组配的检索语言。如叙词语言、单元词语言、关键词语言属此类型。 4.电子文献资源:电子文献资源是以电子数据的形式,把文学、声音、图像、视频等多种形式的文献存储在光、磁等非印刷纸质的载体中,以电信号、光信号的形式传输,并通过网络通信、计算机或终端和其他外部设备等方式再现出来的一种新型文献资源。 5.参考数据库:是指包括各种数据、信息或知识的原始来源和属性的数据库。数据库的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。一般来说,参考数据库主要针对印刷型出版物而开发的,它包括书目数据库和指南数据库两种。 6.OPAC:是英文Online Public Access Catlogue的首字母缩写,可以译为“联机公共书目查询系统”,是一个基于网络,供读者查询图书馆藏书目信息的联机检索系统。它是图书馆自动化的基础,也是未来数字图书馆的有机组成部分。 7.电子图书:又称为数字图书或Ebook,是随着电子出版、互联网以及现代通信电子技术的发展应运而生的一种新的图书形式。电子图书应具有三要素:(1)电子图书内容。(2)电子图书的数字存储设备。(3)电子图书的阅读软件。 8.网络电子图书:是以电子形式出版发型,以互联网为流通渠道、以数字内容为流通介质、以网上交易为主要支付手段的图书。 9.前方一致检索:也称为后截断检索,是指在某一检索项内容中,检索前方与检索字/词完全一致的文献。前方一致检索适用于数值索引的检索项。 10.多项双词逻辑组合检索:多项是指可以选择多个检索项;双词是指一个检索项中可以输入两个检索词(在两个输入框中输入),每个检索项中的两个词之间可进行五种组合:并且、或者、不包含、同句、同段,每个检索项中的两个检索词可以分别使用词频、最近词、扩展词;逻辑是指个检索项之间可使用逻辑与、逻辑或、逻辑非进行项间组合。 11. 双词频控制检索:是指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 12. 引文:所谓引文就是参考文献

网络信息资源检索与利用第二次作业

《网络信息资源检索与利用》课程实验第2次实验报告 实验内容及基本要求: 实验项目名称:网络搜索引擎的应用 实验类型:验证 每组人数:1 实验内容及要求: 1.请分别针对网络资源目录使用的分类方法进行举例。 2.在 yahoo 的分类目录中找到一条路径指向网站论文: https://www.doczj.com/doc/dd6095040.html,/Summer98/koumoutsakos.pdf。 3.在新浪网的分类目录中找到一条路径指向学校的网站:https://www.doczj.com/doc/dd6095040.html, 4.在 sohu 的分类目录中找到一条路径指向网页:https://www.doczj.com/doc/dd6095040.html,/newbook/ 5.请指出 yahoo,sina,sohu 的分类目录之间的异同和优劣(500 字以内) 6.请了解 google 和 baidu 在进行关键词检索中语法的异同,并说明这两者在针对某一主题进 行检索时检索结果的差异以及对检索意图理解准确度的差异。 实验结果: 1.请分别针对网络资源目录使用的分类方法进行举例。 (1)主题分类法 (2)学科分类法 (3)图书分类法 (4)分面组配法 2.在 yahoo 的分类目录中找到一条路径指向网站论文: https://www.doczj.com/doc/dd6095040.html,/Summer98/koumoutsakos.pdf。

3. 在新浪网的分类目录中找到一条路径指向学校的网站:https://www.doczj.com/doc/dd6095040.html, 4. 在 sohu 的分类目录中找到一条路径指向网页:https://www.doczj.com/doc/dd6095040.html,/newbook/ 5. 请指出 yahoo,sina,sohu 的分类目录之间的异同和优劣(500 字以内)

网上搜索超级技巧

网上搜索超级技巧 1.使用逻辑词辅助查找 比较大的搜索引擎都支持使用逻辑词进行更复杂的搜索界定,常用的有:AND(和)、 OR(或)、NOT(否,有些是AND NOT)及NEAR(两个单词的靠近程度),恰当应用它们可以使结果非常精确,另外,也可以使用括号将搜索词分别组合, 2.有针对性地选择搜索引擎 用不同的搜索引擎进行查询得到的结果常常有很大的差异,这是因为它们的设计目的和发展走向存在着许多的不同,比如: 购物客https://www.doczj.com/doc/dd6095040.html,是专用于网上购物的搜索引擎,能够进行价格等多种因素的比较;而Liszt(https://www.doczj.com/doc/dd6095040.html,)则是针对邮递列表、IRC等的搜索引擎。https://www.doczj.com/doc/dd6095040.html, 和https://www.doczj.com/doc/dd6095040.html,是综合搜索。 3.使用双引号进行精确查找 如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。例如在搜索引擎的Search(查询)框中输入"search engine",这会比输入search engine得到更少、更好的结果。如果按上述方法查不到任何结果,可以去掉双引号试试。 4.使用加减号限定查找 很多搜索引擎都支持在搜索词前冠以加号(+)限定搜索结果中必须包含的词汇,用减号(-)限定搜索结果不能包含的词汇。 5.逐步细化法 按照搜索引擎的分类一层一层地点击下去,这对一些关键字不太确定的资料查询十分有效。Yahoo把网上的各种资料归类整理,分得很细,有休闲与运动、娱乐、健康与医药、艺术与人文等很多类别,而且有每一大类的链接进入后分成很多小类,一层一层地进入链接,分类也就越来越细,离你的目标也就越来越近。由于都是链接形式,所以使用起来又方便又简单,不用我多说了吧。 6.根据要求选择查询方法 如果需要快速找到一些相关性比较大的信息,可以使用目录式搜索引擎的查找功能,如使用Yahoo(https://www.doczj.com/doc/dd6095040.html,)。如果想得到某一方面比较系统的资源信息,可以使用目录一级一级地进行查找。如果要找的信息比较冷门,应该用比较大的全文搜索引擎查找,如Altavista(https://www.doczj.com/doc/dd6095040.html,/)或Hotbot(https://www.doczj.com/doc/dd6095040.html,/)。 7.注意细节 在Internet上进行查询时如果能注意一些细节问题,常常能增加搜索结果的准确性,如许多搜索引擎都区分字母的大小写,因此,如果您正在搜索人名或地名等关键词,应该正确使用它们的大小写字母形式。 8.利用搜索引擎的特性进行查找 不同的搜索引擎有一些专用的特性,应用它们可以使查询事半功倍,比如:若想知道某个新闻组上最近一段时间发表的文章,可以在Dejanews的查找框中输入"~g 组名",例如"~g https://www.doczj.com/doc/dd6095040.html,ng.java.programmer"。 9.使用多元搜索引擎 多元搜索引擎是一种只需输入一次关键词就可以对多个搜索引擎进行查询的搜索代理网站,如Searchspaniel(https://www.doczj.com/doc/dd6095040.html,/)就可以同时对200多个搜索引擎进行查询。 10.利用选项界定查询 目前越来越多的搜索引擎开始提供更多的查询选项,利用这些选项人们可以轻松地构造比较复杂的搜索模式,进行更为精确的查询,并且能更好地控制查询结果的显示。

检索工具的分类

1.检索工具的分类 (1)按照信息搜集方法分类 按照信息搜集方法的不同,搜索引擎系统可以分为三大类: 1)目录式搜索引擎(Directory Search Engine) 以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory. 2)机器人搜索引擎(Crawler-Based Search Engine) 由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google. 3)元搜索引擎(Meta Search Engine) 这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的代表是WebCrawler、InfoMarket. 目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索"便搜索人工分类库,选择"网页搜索"便搜索机器人搜索引擎的索引库。一些传统的机器人搜索引擎也增加了人工分类的内容,以提供高精度的导航信息。另外搜索引擎站点有"门户化"的倾向,在提供搜索服务的同时,提供多样的网络服务,如新闻、股票、天气预报、虚拟社区、游戏、电子商务等等,成为名副其实的"网络门户". (2)按照检索软件分类 按照服务提供方式的不同,检索软件也可以分为三大类:全文数据库检索软件、非全文数据库检索软件、主题指南类检索软件。 全文数据库检索软件正常运作的前提是网站拥有大量的信息,因此必须依靠强大的数据库作为后盾。它能够提供完整的文献和信息检索,查全率很高。但由于信息量非常大,检索起来比较困难,对检索技术的要求很高。 非全文数据库检索软件具有速度快、使用简便、索引量大的特点,但仅提供部分全文检索,有时需要二次检索,感到不太方便。 主题指南类检索软件是目前网络检索中最常用的检索软件。这种软件查准率高、速度快、使用方便。现大部分网站都具备主题指南类检索功能。 (3)按照检索语言分类 目前,因特网几乎使用了世界所有语言。每一种语言都形成了自己独特的检索体系。比较常用的语言有英文、法文、德文、日文、俄文、中文等。 2.全文数据库的检索软件 (1)Alta Vista 检索引擎 Alta Vista检索引擎为数字设备公司(DEC)开发,号称是目前最大的Web索引数据库,Alta Vista检索引擎提供两种检索方法:简单检索和高级检索。高级检索包括了简单检索的

网络信息检索期末考试试卷及答案

第1页,共6页 第2页,共6页 学校 院系 学号 姓名 ……答……○……题……○……不……○……得……○……超……○……过……○……此……○……密……○……封……○……线…○… 绵阳师范学院历史文化与旅游管理学院 一、填空题(每空1分,共30分) 1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8.数据检索是指特定的数值型数据为对象的检索。 9.在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。 10.Internet 是基于TCP/IP 协议的网络。 11.二级域名https://www.doczj.com/doc/dd6095040.html, 是指教育机构。 12.目前WWW 环境中使用较多的网页浏览器有Microsoft 公司的IE 浏览器和360公司的360安全浏览器。 13.每种网络信息检索工具一般由信息采集子系统、数据库和检索代理软件三部分组成。 14.大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的:“+”表示限定搜索结果中必须包含的词汇,“-”表示限定搜索结果中不能包含的词汇。 15.一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如,用site 表示搜索结果局限于某个网站。比如,用intitle 表示到某个URL 地址指定的网页标题内进行检索。比如,用link 表示到某个URL 地 址指定的地址内进行检索。 16.搜索引擎中,在普通查询词前面加一个filetype 表示对文档类型限定。或例如:访问百度文档的地址也可以达到此效果,它的网址是: https://www.doczj.com/doc/dd6095040.html,/ 17.CNKI 数据库下载的全文格式很多,如:caj ,pdf ,nh ,caa ,kdh 需要下载安装CAJViewer 全文浏览器软件或Vip 全文浏览器软件才能阅读这些资源。 18.维普资讯网的高级检索中,查询语句“K=(CAD+CAM )*R=机械”表示的意思是查找文献或文摘中含有“机械”,并且关键词中含有CAD 或CAM 的文献或文摘 19.OPAC 中文或者英文的解释是联机图书馆公共检索目录 20.国内提供电子图书服务的网络站点很多,常用的有书生之家数字图书馆、方正Apabi 数字图书馆、中国数字图书馆等。 二、单项选择题(每题1分,共20分) 1.下面哪项不是情报构成的三要素之一( D )。 A .本质是知识 B .经过传递 C .经过用户使用产生效益 D .通过购买获取 2.一次文献是( A )。 A .最原始的信息资源 B .最主要的信息资源 C .对文献的集中提炼和有序化 D .按知识门类或专题组织、浓缩而成 3.下面哪一项是白色文献( A )。 A .期刊文献 B .科技报告 C .专利文献 D .学位论文 4.报纸区别于其它文献的特征是( B )。 A .创新性 B .及时性 C .学术性 D .全面性 5.有法律约束力和一定的时效性,经权威机构批准的规章性文献是(A )。 A .标准文献 B .学位论文 C .档案文献 D .科技报告 6.一般存在相应二次文献的是( A )。 A .期刊 B .产品样本 C .档案 D .报纸 7.常见的事实和数据检索工具书不包括( D )。 A .百科全书 B .年鉴 C .机构指南 D .杂志 8.在信息检索语言的分类语言中,国际上使用较多的分类表是( D )。

网络信息资源检索利用作业及答案

作业ID: 69924 1. 检索词A和B是并列关系,表示同时包含检索词A和B 的布尔逻辑检索符是()鼓励独立完成作业,严禁抄袭!! A. A. 逻辑“与” B. B. 逻辑“或” C. C. 逻辑“非” D. D. 逻辑“亦或” 正确答案:A 2. 中国历史上第一部系统地分析字形、解释字义的字书是() A. A. 《辞源》 B. B. 《尔雅》 C. C. 《说文解字》

D. D. 《汉语大字典》 正确答案:C 3. 下列哪个不属于十三经 A. A. 《周易》 B. B. 《孟子》 C. C. 《新元史》 D. D. 《尔雅》 正确答案:C 4. 查考1911~1949年间国内出版图书的总结性书目的工具书是() A. A. 《中国国家书目》 B. B. 《中国古籍善本书目》 C. C. 《民国时期总书目》 正确答案:C

5. 下列逻辑运算次序最优先的是 A. A. 逻辑“与” B. B. 逻辑“非” C. C. 放入符号“()”(半角)中 D. D. 逻辑“或” 正确答案:C 6.年鉴容纳内容的基本单元是 A. A. 栏目 B. B. 条目 C. C. 纪事 D. D. 标题 正确答案:A 7. 在年鉴标题制作的技术方法上,一般遵循-----------原则

A. A. 中心词前置 B. B. 中心词后置 C. C. 中心词倒置 正确答案:A 8. 工具书 正确答案: 工具书是一种汇集、编著或译述的材料,按特定的方法加以编排,以供解疑释难时查考之用的图书。 9. 相关度 正确答案: 所谓“相关度”,是指检索结果与输入的检索语词在内容上关联的疏密程度,由计算机根据词语主题关联分析技术自动处理完成。

信息检索考试题汇总(附答案)

4.国际标准书号的英文简称ISBN,新版国际标准书号2007 年正一、单项选择题(从下列各题四个备选答案中选出一个正确答案,式实施,国际标准书号由10 位升至13 位。(√)并将其代号写在答题纸相应位置处。每题 2 分,共30 分) 5 .检索效果的评价指标主要有查全率和漏检率。(×) 1 ._C_是题录型检索工具 1.NSTL 是(国家科技图书文献中心)的简称。 A.CABIB. 中国学术期刊文摘 C. 全国报刊索引(自然版) D. 经济纵 2. (信息检索系统)是指由一定的设备和信息集合构成,具有一横定存储、检索与传送技术设备,提供一定的存贮与检索方法及检 2. 浏览超星数字图书馆,应首先安装__D . 索服务功能的工作系统。体系分类表通常由(类目表、标记符号、说明和注释、 类目索 3. 世界上第一大联机检索系统是_A_。引) 4 个部分组成。 A.DIALOG 系统 B.OBRIT 系统 C.OCLC系统 D.STN系统4. 正式出版的中文期刊在检索工具和数据库中一般着录有国际 4. 利用baidu 搜索信息时,要将检索范围限制在网页标题中,应标准刊号 (ISSN )和国内统一刊号(CN)。该使用的语法是___B ___ 。 5. A.site: B.intitle: C.inurl: https://www.doczj.com/doc/dd6095040.html,: (JournalofAnalyticalChemistry )。5 .国际农 业和生物科学中心英文名称的简称为_A。 6.CASHL 是指(中国高校人文社会科学文献中心),其英文全称是ChinaAcademicSocialSciencesandHumanitiesLibrary ,是全 6. 信息检索根据检索对象不同,一般分为___C ____________ 。国性的、唯一的人文社科外文期刊 收藏和服务中心。2002 年开始 A. 二次检索、高级检索 B. 分类检索、主题检索规划建设,2004 年3 月15 日正式启动 C. 数据检索、事实检索、文献检索 D. 计算机检索、手工检索7. 电子期刊,指以(数字或称电子)形式出版发行的期刊,英文7. 国际上评价期刊最有 影响力的一个指标是___A ___ 。为(electronic A. 影响因子 B.读者统计数据 C.引文量 D. 价格Journal ),简称e-journal. 8. 二次检索指的是:___C _________ 。8. 国家知识 基础设施(NationalKnowledgeInfrastructure ,NKI)A.第二次检索B.检索了一次之

网络信息检索及技巧

网络信息检索及技巧 (物本061班2006061120 叶长强) [摘要]网络信息资源已经成为了现代社会人们获取信息的主要来源,但是由于用户检索经验不足,使得检索效率很低。本文通过对国内外几种搜索引擎的比较以及对布尔逻辑检索、截词检索、关键词检索等方法的介绍,引导用户正确应用网络信息检索技术,提高检索效率。文章还介绍了网络信息资源的概念以及检索过程中出现的问题,并且就这些问题提出了解决的技巧及策略。 [关键词]信息检索网络信息检索方法检索策略。 [Abstract] Network information resources has become a modern society, the main source of people's access to information, but due to the inexperience of the user search, making retrieval very low efficiency. In this paper, several search engines at home and abroad as well as Boolean logic, comparison searching, truncation search, keyword search methods such as introduction and guide users to the proper application of network information retrieval technology to improve retrieval efficiency. The article also introduces the concept of network information resources, as well as the problems in the retrieval process, and on these issues to address skills and strategies. [Keywords] information retrieval Network Information Retrieval Methods search strategy. 因特网以其丰富的信息资源成为了世界上最大的信息宝库,它是人类进行科学研究、商务活动、文化交流的主要途径。然而网络资源却没有统一的组织管理,从而使得人们虽然面对丰富的信息,却难以找到自己所需的信息。因此,我们需要通过一种科学的手段来获取信息,这种手段就是检索。信息检索是指将信息按一定的方式组织和贮存起来,并根据用户的需要找出有关信息的过程。所以,它的全称又叫信息存贮与检索,这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即根据用户的需要,借助于检索工具,从信息集合中找出所需信息的过程,相当于人们所说的信息查询。信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。本文主要研究的就是狭义的信息检索中出现的问题及解决策略。 1 网络信息检索类型 网络信息检索与其他检索工具相比有很大的优势:检索范围宽、信息量大、时效性强。缺点是:处理的信息类型繁杂,不易选择。我们根据网络的地域范围分类,可分为局域网信息检索和万维网信息检索两种类型。局域网中信息检索以传统的联机光盘检索为主。万维网中信息检索则是使用Web版联机检索。现对它们在服务的主要方面进行比较。 2网络信息检索存在的问题 2·1 信息过量、检索效率低 网络信息导航系统是一步一步追踪信息的,正是因为这个局限,使得客户机在查询信息时不得不根据屏幕提示一步一步查找下去,在这个过程中被迫接受了诸多垃圾信息,造成效率低下。 2·2 信息污染及网络安全的问题 网络是一个自由发布信息的世界,正因为如此,很多不健康的网站和信息,如反动思想、色

检索工具分类

1.检索工具的分类(1)按照信息搜集方法分类按照信息搜集方法的不同,搜索引擎系统可以分为三大类:1)目录式搜索引擎(Directory Search Engine)以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory。2)机器人搜索引擎(Crawler-Based Search Engine)由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google。3)元搜索引擎(Meta Search Engine)这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的代表是WebCrawler、InfoMarket。目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索”便搜索人工分类库,选择”网页搜索”便搜索机器人搜索引擎的索引库。一些传统的机器人搜索引擎也增加了人工分类的内容,以提供高精度的导航信息。另外搜索引擎站点有”门户化”的倾向,在提供搜索服务的同时,提供多样的网络服务,如新闻、股票、天气预报、虚拟社区、游戏、电子商务等等,成为名副其实的”网络门户”。(2)按照检索软件分类按照服务提供方式的不同,检索软件也可以分为三大类:全文数据库检索软件、非全文数据库检索软件、主题指南类检索软件。全文数据库检索软件正常运作的前提是网站拥有大量的信息,因此必须依靠强大的数据库作为后盾。它能够提供完整的文献和信息检索,查全率很高。但由于信息量非常大,检索起来比较困难,对检索技术的要求很高。非全文数据库检索软件具有速度快、使用简便、索引量大的特点,但仅提供部分全文检索,有时需要二次检索,感到不太方便。主题指南类检索软件是目前网络检索中最常用的检索软件。这种软件查准率高、速度快、使用方便。现大部分网站都具备主题指南类检索功能。(3)按照检索语言分类目前,因特网几乎使用了世界所有语言。每一种语言都形成了自己独特的检索体系。比较常用的语言有英文、法文、德文、日文、俄文、中文等。2.全文数据库的检索软件(1)Alta Vista 检索引擎Alta Vista检索引擎为数字设备公司(DEC)开发,号称是目前最大的Web索引数据库。Alta Vista检索引擎提供两种检索方法:简单检索和高级检索。高级检索包括了简单检索的所有特性,还允许使用布尔运算符和接近操作符、括号等,查找的结果按关键词排序。Alta Vista总能返回有用的信息,但由于没有对内容进行选择,它的”信噪比”也是最大的。使用Alta Vista检索引擎时应注意:要进行有效的检索,最好尽可能多而精确地输入描述所感兴趣的主题的词或词组。提供的词组越精确,检索结果就越好。如果你输入的词包含大写字母,则检索对大小写就比较敏感。如输入Telephone 则只检索含有这个词的内容,而输入telephone 则不论大小写都检索。如果要把一些词作为词组或一个整体来查询时,最好把它们加上双引号。如果要求特定单词包含在索引的文档中,可以在它前面加一个”+”号,如:+Telephone,并且在”+”号和单词之间不能有空格。相应的,如果要排除含有特定单词的文档,可以在它前面加一个”-”号,如-cool。进行简单查找的时候,可以在单词的末尾加一个通配符来代替任意的字母组合(最多可代替5个小写的

相关主题
文本预览
相关文档 最新文档