信息检索实验答案
- 格式:doc
- 大小:146.50 KB
- 文档页数:5
《大学生信息检索概论》模拟试题一、填空题1、文献的级次分为零次文献、一次文献、二次文献、三次文献2、《中图法》有五个基本部类,分别是马克思主义、列宁主义、毛泽东思哲学;社会科学;自然科学和综合性图书,在此基础上又划分为_22_个大类。
3、按内容可将计算机检索系统的数据库类型分为:文献书目型数据库、事实型数据库、数值型数据库和全文型数据库。
4、我国标准可分为国家标准、部标准和企业标准三大类。
5、在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法和综合法。
6、国际标准化组织简称:ISO 、本标准每5 年修订一次二、选择题1、如果需要检索某位作者的文献被引用的情况,应该使用( C )检索。
A.分类索引B.作者索引C.引文索引 D.主题索引2、利用图书馆的数据库检索期刊论文时,可供选择的中文数据库是( D )。
A.超星数字图书馆 B.万方学位论文 C.国研网 D.维普科技期刊 E.高校财经库3、如果检索有关多媒体网络传播方面的文献,检索式为(A D)。
A.多媒体and 网络传播 B.多媒体+网络传播 C.多媒体or 网络传播 D.多媒体*网络传播4、如果对某个课题进行主题检索时,可选择的检索字段有( A D E )。
A.关键词 B.作者 C.刊名 D.题名 E.文摘5、二次文献又称检索工具,包括:( A C D )。
A.书目B.百科C.索引D.文摘E.统计数据三、名词解释题1、文献:用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。
也可以理解为古今一切社会史料的总称。
2、体系分类语言:是以科学分类为基础,运用概念的划分与概括的逻辑方法,形成一个概念等级体系,按知识门类的逻辑次序,按照从总到分,从一般到具体,从低级到高级,从简单到复杂的原则进行概念的综分,层层划分,累累隶属,逐步展开而形成的一个等级体系。
3、引文语言:是根据文献所附参考或引用文献的特征进行检索的语言。
一、名词解释(5x4=20分)1.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。
检索中,计算机会将所有含有相同部分标识的记录全部检索出来。
截词符一般用“?”或“*”表示,但不同的数据库中有所差别。
2.信息检索:信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
3.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。
4.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。
5.引文索引:是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。
二、简答(5x6=30分)1.查找国内外学位与会议论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。
(1)国内外的学位论文数据库包括索引与摘要数据库和全文数据库,如CALIS的《学位论文库》,万方数据资源系统《中国学位论文数据库》,CNKI的《优秀硕博士论文数据库》,美国博硕士论文库PQDD(ProQuest Digital Dissertations),美国学位论文网络数字图书馆NDLTD (Networked Digital Library of Thesis and Dissertations)等。
(2)会议论文数据库包括:会议论文索引与摘要,如CALIS会议论文数据库,万方数据资源系统《中国学术会议论文数据库》,OCLC会议数据库——《在会议上提交的文章索引》(Papers First),《会议出版物索引》(Proceedings),Web of Knowledge的会议录引文索引CPCI(Conference Proceedings Citation Index)。
2.布尔逻辑检索的主要运算符有哪些?它们各代表什么含义?请分别举一例说明。
一、单项选择题1、分类途径是按照文献所属的学科分类,利用(C)进行检索的途径。
A学科名称B专业名称C分类号及分类名D以上均可2、利用文献后所附参考文献进行检索的方法叫(A )。
A.追溯法B.直接法C.抽查法D.综合法3、逻辑算符包括(D)算符。
A.逻辑与B.逻辑或C.逻辑非D.以上三项4、机检效果与检索人员的素质有着密切的关系。
人员的素质主要包括(D )。
A.对检索策略的掌握程度B.对数据库的掌握程度C.对检索语言的掌握程度D.以上三项5.最早的网络搜索引擎是(A)A. Yahoo B .Excite C. Archie D .Google6、我国最早的图书馆学专业教育机构创立于___年,它是__A____ 创始人_____A. 1920 武昌文华大学图书馆学专修科韦棣华B. 1922 武汉大学图书馆学专修科杜定友C.1927 南京金陵大学图书馆学系韦棣华D.1947 北京大学中国语言文学系图书馆学杜定友7、“我思故我在”,是____C____的名言,这句话说明思想的重要性。
人类的认知是不断进步的,随着人们不断的认识到新的事物思想也在不断转变A.帕斯卡尔B.伏尔泰C.笛卡儿D.孟德斯鸠8、Google和Baidu在其高级搜索中都提供特定格式文件的搜索,他们分别支持几种文件格式(D)A. 6 4 B .6 5 C.6 6 D. 6 79、4 中国互联网络信息中心(CNNIC)是在信息产业部的授权和领导下的,得到国际互联网络管理机构认可的,中立的,非盈利性的服务和管理机构,行使国家互联网络信息中心的职责,属于国家事业单位。
CNNIC在行政上受____A___的领导。
A. 信息产业部;B. 国务院信息化办公室;C. 中国互联网络协会;D. 中国科学院计算机网络信息中心;10、2003年12月1日是第16个“世界艾滋病日”,到目前为止,中国已有84万艾滋病病毒感染者,其中艾滋病病人8万名。
请问艾滋病的医学全名是什么?(C)A 、先天性免疫缺陷综合症B 、获得性免疫缺陷综合症C 、人类免疫缺陷综合症D 、动物免疫缺陷综合症11、1999年被列入“世界文化遗产”的大足石刻现有唐宋时期的摩崖造像75处,雕像共___C_____余尊。
智慧树知到《信息检索》章节测试答案第一章1、在大多数情况下,检索的目的是为了找到相关文献,而不是答案。
A:对B:错正确答案:对2、关于信息的概念,下面不同定义中不正确的说法是()A:信息是用以消除随机不定性的东西B:信息是指对消息接受者来说预先不知道的报道C:信息是那些只能由计算机进行处理的数据资料D:在计算机技术中,信息是经过组合后具有一定意义,能表明客观属性的数据集合正确答案:信息是那些只能由计算机进行处理的数据资料3、信息论的创始人是( )A:香农B:野中郁次郎C:维纳D:巴达拉科正确答案:香农4、文献是记录有知识的()A:载体B:纸张C:光盘D:磁盘正确答案:载体5、文献是记录知识的一切载体,即用文字、图像、符号等手段记录人类知识的各种载体()A:对B:错正确答案:对6、文献虽然是信息、知识、记录符号和物质载体的统一体,它的内涵是()A:图书B:期刊C:专利D:知识正确答案:知识7、知识是人们通过信息对自然办、人类社会以及思维活动规律的认识与掌握,是人的大脑通过思维重新组合的信息集合。
A:对B:错正确答案:对8、广义的信息检索包含两个过程()A:检索与利用B:存储与检索C:存储与利用D:检索与报道正确答案:存储与检索9、小刘计划今天与好友到郊外野营,他从报纸上获得了天气情况良好,于是他们出发了。
不料,中午时分狂风暴雨大作,于是他们埋怨天气预报不准确。
当他回到家里再拿出报纸核实,原来那是几天前的报纸。
经分析,由于小刘对信息的()特征没有做出慎重判断,以致野营不能顺利进行。
A:信息的共享性B:信息的价值性C:信息的时效性D:信息的来源正确答案:信息的时效性10、逻辑运算符包括()A:逻辑与B:逻辑或C:逻辑非D:A,B 和 C正确答案: A,B 和 C11、使用分类语言对信息进行描述和标引,主要是可以把()的信息集中在一起A:同一作者B:同一学科C:同一主题D:A+B+C正确答案:同一学科12、根据检索对象不同,信息检索可分为()A:二次检索、高级检索B:分类检索、主题检索C:数据检索、事实检索、文献检索D:计算机检索、手工检索正确答案:数据检索、事实检索、文献检索13、通过追溯检索获得的相关文献与原文献相比在发表时间上( )A:早B:晚C:相同D:不确定正确答案:晚14、分类检索语言又称分类法,是用分类号和类名来表达信息的主题概念,并且按照知识门类的逻辑次序将信息系统地组织和划分的语言。
第一章(共58題)1.下列哪项工具书不是资料性工具书()。
DA.类书 B.百科全书 C.年鉴 D.索引2.下列哪项工具书是资料性工具书()。
CA.字典 B.书目 C.年鉴 D.索引3.检索工具的特点是()。
CA.完整性、分散性、查考性 B.综合性、参考性、易检性C.完整性、易检性、查考性 D.易检性、综合性、分散性4.下列哪项不是印刷版工具书的排检方法()。
BA.部首法 B.检索词 C.拼音法 D.笔画笔形法5.高级检索不包括的检索技术是()。
CA.截词检索 B.布尔逻辑检索 C.嵌入检索 D.位置检索6.布尔逻辑运算符中表示逻辑“与”的符号是()。
CA.+ B.- C. * D./7. 布尔逻辑运算符中表示逻辑“或”的符号是()。
AA.+ B.- C. * D./8. 布尔逻辑运算符中表示逻辑“非”的符号是()。
BA.+ B.- C. * D./9.高级检索的检索特点是()。
DA.组配检索、清晰检索、限定检索 B.清晰检索、限定检索、模糊检索C.组配检索、清晰检索、模糊检索 D.组配检索、模糊检索、限定检索10.“中国大学”这个检索词中,中间共嵌入了几个检索词()。
AA.3个 B.6个 C.9个 D.不确定11.WWW检索工具,主要检索WWW站点上的资源,通常称为搜索引擎,常用的搜索引擎有很多,下列哪个不是搜索引擎的网址()。
DA. B.C. D.12. 信息检索中的检索词可分为四类,下列哪一项不属于检索词的分类()。
DA.表示主题的检索词 B.表示作者的检索词C.表示分类的检索词 D.表示数据的检索词13.手册的基本特点是()。
DA.侧重揭示文献内部特征B.内容新颖,连续出版C.著录内容标明出处D.所收资料侧重基础知识,注重实用性14书目数据库主要提供的是()BA.一次文献B.二次文献C.三次文献D.零次文献15.索引数据库主要提供的是()BA.一次文献B.二次文献C.三次文献D.零次文献16.被称为“检索性文献”的文献是()BA.一次文献B.二次文献C.三次文献D.零次文献17.被称为“线索性文献”的文献是()BA.一次文献B.二次文献C.三次文献D.零次文献18.综述主要提供的是()CA.一次文献B.二次文献C.三次文献D.零次文献19.述评主要提供的是()CA.一次文献B.二次文献C.三次文献D.零次文献20.一次文献具有的特点是()AA.原创性 B.检索性 C.综合性 D.参考性21.二次文献具有的特点是()BA.原创性 B.检索性 C.综合性 D.参考性22.三次文献具有的特点是()DA.原创性 B.检索性 C.分散性 D.参考性23.被称为“参考性文献”的文献是()CA.一次文献B.二次文献C.三次文献D.零次文献24.被称为“研究文献的文献”的是()CA.一次文献B.二次文献C.三次文献D.零次文献25.被称为“原始文献”的文献是()AA.一次文献B.二次文献C.三次文献D.零次文献26.被称为“第一手资料”的文献是()AA.一次文献B.二次文献C.三次文献D.零次文献27.下列哪项是年鉴的基本特征:()BA.揭示文献内容出处B.连续出版C.以编年形式D.提供形象化资料28.供寻检、征引、辑佚历史文献之用的资料工具书称为()。
信息检索技术(第二版)习题答案《信息检索技术》(第二版)书后习题及参考答案(部分)第1章绪论【综合练习】一、填空题1.文献是信息的主要载体,根据对信息的加工层次可将文献分为_________文献、__________文献、___________文献和___________文献。
2.追溯法是指利用已经掌握的文献末尾所列的__________,进行逐一地追溯查找_________的一种最简便的扩大情报来源的方法。
3.用规范化词语来表达文献信息__________的词汇叫主题词。
主题途径是按照文献信息的主题内容进行检索的途径,利用能代表文献内容的主题词、关键词、叙词、并按字顺序列实现检索。
4.计算机信息检索过程实际上是将___________与____________进行对比匹配的过程。
5.无论是手工检索还是计算机检索,都是一个经过仔细地思考并通过实践逐步完善查找方法的过程。
检索过程通常包含以下几个步骤_________、__________、__________、__________、_________。
6.检索工具按信息加工的手段可以分文__________、____________、___________。
7.《中国图书馆图书分类法》共分___________个基本部类,下分________个大类。
8.索引包括4个基本要素:索引源、___________、___________、和出处指引系统。
答案1.零次,一次,二次,三次2.参考文献,引文3.内容特征4.检索提问词,文献记录标引词5.分析课题,选择检索工具,确定检索途径及检索式,进行检索,获取原文6.手工检索工具,机械检索工具,计算机检索工具7.五,228.索引款目,编排方法二、判断题1.在检索信息时,使用逻辑符“AND”可以缩小收缩范围。
()2.逆查法是由近及远地查找,顺着时间的顺序利用检索工具进行文献信息检索的方法。
()3.按编制方法划分,信息检索工具可以分为:手工检索工具、机械检索工具、计算机检索工具。
《信息检索》实习题⽬及答案11年《信息检索》实习题⽬⼀、OPAC检索1、利⽤“中图分类法”查找⾃⼰所在专业的分类号TH,并记录。
再使⽤书⽬查询系统查找该分类下的⼀本图书,写出该书的书名机械创新设计、作者⾼志,黄纯颖主编清华⼤学,北京科技⼤学,中南⼤学编、出版社北京:⾼等教育出版社、出版年2010、索书号TH122/825(2)、馆藏复本数3、ISBN号978-7-04-029158-2/CNY、馆藏地⾃科⼀库[2楼东部](写⼀个即可)2、查找作者姓“李”、索书号为“H31”的图书,记录下检索的结果数量1314,再在结果中检索由中⼭⼤学出版社出版的图书,记录下检索结果的数量7,并写下任⼀检索结果的作者谢春锦,葛磊,李惠芳编著、书名现代海关英语、出版社⼴州:中⼭⼤学出版社、索书号H31/765、在图书馆中有效的馆藏地点北京路校区北京路校区书库及馆藏复本数5、可借复本数5。
3、分类号是“TP311.1”的是关于哪⽅⾯内容的图书程序设计?写出此类书其中⼀种图书的书名⾼级数据库系统及其应⽤、作者谢兴⽣、出版社北京:清华⼤学出版社和索书号。
TP311.13/12924、⾃⾏熟悉OPAC中“我的图书馆”各项功能,并写出今年所借阅的前两本书的书名材料⼒学习题详解:《材料⼒学·第四版》(刘鸿⽂主编)理论⼒学解题⽅法和技巧,如果可能请进⾏续借。
⼆、电⼦图书检索1.利⽤“读秀学术搜索”打开并阅读书名包含“竞争情报”,作者为“王知津”的图书,写出该书的书名竞争情报”、出版社科学技术⽂献出版社、出版⽇期2005.2,并从书中查阅竞争情报的概念:为达到竞争⽬标,合法⽽合乎职业伦理地搜集竞争对⼿和竞争环境的信息,并转变为情报的连续的系统化过程。
2.利⽤“读秀学术搜索”检索⼆本有关美国前总统的图书,写出图书的书名、著者、出版社。
⽩宫领袖美国已故37位总统从政⽣涯研究【作者】冯祥英著北京市:团结出版社美国总统全书【作者】(美)威廉·A. 德格雷⼽⾥奥(William A. DeGregorio)著;周凯等译北京市:社会科学⽂献出版社 , 20073.利⽤“读秀学术搜索”找出与⾃⼰专业相关的图书,写出其中2本图书的书名、作者和出版社。
注意:1、通读教材,根据页码提示完成下列题目。
2、最后一次上机课在线测试,范围不超出如下题目。
第一章一、单选1、报道范围主要为能源方面的科技报告为(D)。
A、ADB、PBC、NASAD、DOE{第7页}2、(C)是出版周期最短的定期连续出版物。
A、图书B、期刊C、报纸D、学位论文{第6页}3、(A)是高校或科研机构的毕业生为获取学位而撰写的。
A、学位论文B、科技报告C、会议文献D、档案文献{第6页}4、了解各个国家政治、经济、科技发展政策的重要信息源是(B )A、科技报告B、政府出版物C、标准文献D、档案文献{第8页}5、年鉴属于下列哪一类别(D)A、零次信息B、一次信息C、二次信息D、三次信息{第7页}(一次信息:图书、期刊论文、科技报告、会议论文、专利说明书及科技日记、杂记、实践记录)6、下列哪种文献属于一次文献(A )。
A、图书B、百科全书C、综述D、文摘{第4页}7、下列文献中属于一次信息的是(A )A、专利说明书B、百科全书C、目录D、综述{第4页}8、以下各项属于二次信息的是(A)A、索引B、期刊C、学位论文D、百科全书{第4页}(二次信息;目录、题录、文摘、索引、书目对一次信息有指引和报道作用)二、多选9、二次信息主要包括()等。
A、手册B、年鉴C、目录D、题录{第4页}10、信息的属性包括()A、客观性B、时效性C、传递性D、共享性{第3页}11、信息素质的内涵主要包括()。
A、信息意识素质B、信息能力素质C、信息道德素质D、信息职业素质{第9页}12、以下类型的信息属于三次信息的是()。
A、目录B、词典C、百科全书D、科技报告{第4页}附加:I)信息道德规范信息行为,主要包括()。
A、不制作、传播、消费不良信息B、不侵犯他人的知识产权、商业秘密、隐私权C、恰当使用与合理开发信息技术D、私下交易个人信息(第10页)II)根据信息的载体和表达方式的不同,信息源可分为()。
A、语言信息源B、二次信息C、实物信息源D、文献信息源(第4页)III)文献的基本要素有()。
1111111111111111111111试题1 单项选择题 (5.0分得分:5.0 难度:基本题)不同的数据库系统的字段代码是有所不同的,其中题名的常见表述有正确答案学生答案 TIAU KW AB试题2 判断题 (5.0分得分:5.0 难度:水平题)期刊是有固定名称,有一定的出版规律,标有刊期序号的一种论章成册的出版物。
正确答案学生答案真假试题3 单项选择题 (5.0分得分:5.0 难度:基本题)在进行信息检索的过程中,公式“(检索出的相关信息量/检索出的信息总量)×100%”计算的是:正确答案学生答案查准率查全率漏检率误检率试题4 单项选择题 (5.0分得分:5.0 难度:基本题)信息侵权主要包括侵犯______________和侵犯个人隐私权等。
正确答案学生答案社会隐私权著作权知识产权人权试题5 多项选择题 (5.0分得分:5.0 难度:难度题) 下列哪些语句能被检索式“information N/2 retrieval”命中()正确答案学生答案―information retrieval‖―retrieval information‖―information computer aided retrieval‖ ―retrieval of education information‖试题6 单项选择题 (5.0分得分:5.0 难度:基本题)按照信息的载体类型,可将信息资源划分为:______、缩微型、声像型、电子型和多媒体。
正确答案学生答案印刷型书本型视频型音频型试题7 多项选择题 (5.0分得分:0.0 难度:难度题)以下类型的文献属于三次文献的是()正确答案学生答案目录词典百科全书科技报告试题8 判断题 (5.0分得分:5.0 难度:水平题)信息可以记载在印刷纸本中,也可以存储在声、光、电、磁等介质中,如磁带、光盘、硬盘等。
正确答案学生答案真假试题9 多项选择题 (5.0分得分:5.0 难度:难度题)Chun,Lu,and n,“Dynamic Analysis of Clamped Laminated Curved Panels.”Composite Structures 30.4(1995):375-388. 这是一篇期刊论文描述(著录)的书写格式,其中包含的信息包括了()。
《信息检索》测试题 (二)答案1以下哪项表示在检索结果当中A和B必须同时出现?A. 【A,B】B. A OR BC. A NOT BD. A AND B2 使用检索式“book OR journal OR newspaper”进行检索,会出现以下哪种结果?A. book, journal, newspaper必须同时出现B. book, journal, newspaper出现一个即可C. book, journal, newspaper必须出现两个D. book, journal, newspaper都不出现3()在布尔逻辑检索中表示A. 无意义B. 不检索C. 必须同时出现括号内的内容D. 优先运算4在两个词之间使用位置检索符P/0包含了如下哪几个意义?(多选)A. 顺序不能颠倒B. 中间不能插入任何单词C. 允许插入空格D. 允许插入一个标点符号5 N/0连接两个词比P/0连接两个词检索得到的结果数量会有如何变化?A. 不变B. 更少C. 更多D. 根据词不同结果不同6 在检索中如果不加双引号,那么默认的运算规则是?A. ANDB. ORC. NOTD. 随机7截词检索有哪三种方式?(多选)A. 前截词B. 中间截词C. 后截词D. 将词断开进行检索8以下哪个缩写表示“题名”?A. TIB. AUC. ABD. PU9面对较为复杂的检索内容时,如何才能获得理想的检索结果?A. 利用多种运算符构造积木型检索式B. 太复杂了,我不算了C. 用最新的搜索引擎D. 尽可能少地选择关键词10在构建检索式时要注意考虑到一个词的多个写法,并用OR连接起来,以保证检全率。
A. 正确B. 错误。
《信息组织与检索》作业答案第一章布尔检索习题1-2考虑如下几篇文档:文档1 breakthrough drug for schizophrenia文档2 new schizophrenia drug文档3 new approach for treatment of schizophrenia文档4 new hopes for schizophrenia patientsa. 画出文档集对应的词项—文档矩阵;b. 画出该文档集的倒排索引(参考图1-3中的例子)。
Term-Documentmatrix:1 2 3 4approach 0 0 1 0breakthrough 1 0 0 0drug 1 1 0 0for 1 0 1 1hopes 0 0 0 1new 0 1 1 1of 0 0 1 0patients 0 0 0 1schizophrenia 1 1 1 1treatment 0 0 1 0Inverted Index:approach -> 3breakthrough ->1drug ->1->2for ->1->3->4hopes ->4new ->2->3->4of ->3patients ->4schizophrenia ->1->2->3->4treatment >3注意:倒排索引中的词表(dictionary)和每个词项的倒排列表(posting list)需要排序,便于查找。
这里我们暂不考虑词的正规化处理(如hopes->hope)。
补充习题1写出AND查询的伪代码面向过程风格的伪代码:给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId查询结果存放在answer列表里。
这里应用了“化归”思想(将新问题转化归为旧问题来解决)。
信息检索(练习)1、(单选,4分)所有检索策略都包含三个要素,以下选项中不属于三要素的一项是()A、匹配函数B、排序函数C、文档表示D、查询表示答案:B2、(单选,4分)在向量模型中,不可以通过()来衡量文档和查询之间的相似度。
A、向量间距离B、向量内积C、向量间夹角大小D、向量间正切值答案:D3、(单选,4分)T1、T2、T3表示特征项,D1、D2、D3、D4为文档向量,Q为查询向量,其中,D1=4T1+2T2+3T3,D2=T1+4T2+2T3,D3=5T1+2T3,D4= T2+3T3,Q=T1+0T2+2T3 。
以上文档中和Q最大可能相关的是()A、D1B、D2C、D3D、D4 答案:A4、(单选,4分)以下选项中属于概率模型的优点的是()A、模型具有内在的相关反馈机制,将文档根据相关概率按递减顺序排列B、模型最初将文档分成相关的集合和不相关的集合C、模型中所有的权值都是二值的D、模型假设标引词相互独立答案:A5、(单选,4分)信息检索模型中,神经网络模型属于()A、布尔模型B、向量模型C、概率模型D、结构化模型答案:B6、(单选,4分)以下关于网络爬虫的描述中,错误的一项是()A、在爬虫开始的时候,需要给爬虫输送一个URL列表,作为爬虫的起始位置B、根据某种抓取策略爬行新发现的URL,如此重复下去C、爬虫程序会抓取所有网页,以保证搜索正确性D、对于商业搜索引擎来说,分布式爬虫是必须采用的技术答案:C7、(单选,4分)在实际的搜索引擎系统中,通过存储()来存储文档信息A、文档地址B、文档简化序号C、文档编号D、文档编号差值答案:D8、(单选,4分)下面方法中,不是建立索引的方法的是()A、两边文档遍历法B、排序法C、归并法D、HITS 答案:D9、(单选,4分)关于PageRank标准算法与简化算法正确的是()A、PageRank简化算法对G中的每一个节点n,设定其初始值均为1/nB、PageRank简化算法可以保证迭代过程中的PageRank值之和为1C、PageRank标准算法不考虑没有超链接网页的情况D、在实际运算过程中,由于节点数n的值巨大,因此通常采用适用于稀疏矩阵运算的PageRank标准算法来对运算过程进行改善答案:A10、(单选,4分)关于HITS算法描述正确的是(C)A、算法最后输出的是按照内容权威度排序的结果列表B、如果在原有的扩展网页集合内添加删除个别网页或者改变少数链接关系,HITS算法的排名结果不会有非常大的改变C、HITS算法核心思想是对网页两个方面的权威程度进行评价,一个是内容权威度,另一个是链接权威度,两者具有相互增强的关系D、HITS是与查询相关的算法,计算效率较高答案:C11、(单选,4分)网页重定向属于下列哪种作弊方式(C)A、内容作弊B、链接作弊C、隐藏作弊D、Web2.0作弊答案:C12、(单选,4分)对网页进行两次抓取,第一次是正常的搜索引擎爬虫抓取,第二次以模拟人工访问页面的方式抓取,如果两次抓取到的内容差异较大,则认为是作弊页面,这属于()A、识别网页重定向B、识别页面隐藏C、反内容作弊D、链接反作弊答案:B13、(单选,4分)以下不是搜索引擎的主要功能模块的一项是()A、网络爬虫B、搜索引擎索引C、PageRankD、搜索排序答案:C14、(单选,4分)以下选项中描述不正确的是()A、爬虫的作用是为搜索引擎抓取大量的数据,抓取的对象是整个互联网上的网页B、根据具体应用的不同,可以将爬虫分为两种类型,即增量型爬虫和垂直型爬虫C、暗网是一些垂直领域网站,它们通常是网站提供组合查询界面,用户按照需求输入查询之后,才能获取相关数据D、倒排列表是指记载出现过某个单词的所有文档的文档列表、以及单词在该文档中出现的位置信息答案:B15、(单选,4分)以下选项中描述正确的是()A、动态索引包含2个关键的索引结构:倒排索引、临时索引B、查准率是衡量系统在实施某一作业时检出相关文献能力的一种测度指标,是对检索遗漏程度的度量。
1111111111111111111111试题1 单项选择题 (5.0分得分:5.0 难度:基本题)不同的数据库系统的字段代码是有所不同的,其中题名的常见表述有正确答案学生答案 TIAU KW AB试题2 判断题 (5.0分得分:5.0 难度:水平题)期刊是有固定名称,有一定的出版规律,标有刊期序号的一种论章成册的出版物。
正确答案学生答案真假试题3 单项选择题 (5.0分得分:5.0 难度:基本题)在进行信息检索的过程中,公式“(检索出的相关信息量/检索出的信息总量)×100%”计算的是:正确答案学生答案查准率查全率漏检率误检率试题4 单项选择题 (5.0分得分:5.0 难度:基本题)信息侵权主要包括侵犯______________和侵犯个人隐私权等。
正确答案学生答案社会隐私权著作权知识产权人权试题5 多项选择题 (5.0分得分:5.0 难度:难度题) 下列哪些语句能被检索式“information N/2 retrieval”命中()正确答案学生答案―information retrieval‖―retrieval information‖―information computer aided retrieval‖ ―retrieval of education information‖试题6 单项选择题 (5.0分得分:5.0 难度:基本题)按照信息的载体类型,可将信息资源划分为:______、缩微型、声像型、电子型和多媒体。
正确答案学生答案印刷型书本型视频型音频型试题7 多项选择题 (5.0分得分:0.0 难度:难度题)以下类型的文献属于三次文献的是()正确答案学生答案目录词典百科全书科技报告试题8 判断题 (5.0分得分:5.0 难度:水平题)信息可以记载在印刷纸本中,也可以存储在声、光、电、磁等介质中,如磁带、光盘、硬盘等。
正确答案学生答案真假试题9 多项选择题 (5.0分得分:5.0 难度:难度题)Chun,Lu,and n,“Dynamic Analysis of Clamped Laminated Curved Panels.”Composite Structures 30.4(1995):375-388. 这是一篇期刊论文描述(著录)的书写格式,其中包含的信息包括了()。
中文全文数据库实习题答案(2011-11-03 09:39:46)转载▼标签:杂谈CNKI中国知网1.检索《心血管康复医学杂志》上1999年至今用尼群地平治疗高血压的学术论文。
1)检索式或步骤:答:分析:通过百度及维普的同义词检索得知尼群地平还有尼莫地平这个同义词,高血压一般人也称高血压征或高血压危象,所以这个词因模糊。
检索字段可选择主题,增加查全率。
检索式:拼音刊名=XXGK 并且年 between(1999,2011)and((主题=中英文扩展(尼群地平) 或者主题=中英文扩展(尼莫地平))and (主题=中英文扩展(高血压)) (模糊匹配),专辑导航:全部2)检出 15篇。
2. 查找王静云在2003年《中华结核和呼吸杂志》上发表的论文,打开全文查看其参考文献的条数 7 。
3.利用学术搜索检索有关“尘肺的预防”的文献。
要求:分别列出学术论文、学位论文、图书、会议文献的结果数量;答:在检索框内输入:尘肺预防学术论文:24篇;会议论文:1篇;学位论文、图书:0篇。
中文科技期刊数据库(维普VIP)1.在传统检索界面中检索徐应军1989-2005年作为第一作者发表的文章有11 篇,其中有3篇是核心期刊上的。
任选一篇下载全文进行浏览并写出其摘要:答:题名:定群寿命表间比较时的偏倚及校正摘要:在各寿命表间进行累计概率比较时,可能出现一种偏倚。
这种偏倚是由于各参比人群的构成不同所致。
本文以实际证实了偏倚的存在,并在此基础上提出了校正偏倚的方法。
2.在高级检索界面中查找2005-2011年刊登在核心期刊上有关结核病的防治方面的论文,要求检索词出现在论文的题名中。
1)检索步骤或检索式:答:分析:首先考虑结核病和防治有无同义词,这个可通过它的同义词得知。
然后就是检索字段,一般为了提高查全率,可选择题名或关键词这个字。
检索式: (题名或关键词=结核病+钙质结核)*(题名或关键词=防治+防治措施+防治试验+防治效果)*核心期刊*年=2005-20112)命中篇数:90篇万方数据资源系统1.查找有关“维生素E与糖尿病”文献。
网络信息检索实验操作题1.学时:22.实验目标:通过Internet网络信息检索,要求学生了解Internet概况,认识并掌握运用计算机信息检索技术,提高获取和利用文献信息的能力,为不断地吸收新知识,增强创新能力能力打下基础。
3.实验主要内容:实验主要环节及操作内容:(1)、通过Internet信息检索工具间接地查找所需信息;即通过一些网页主动搜索信息,并自动索引的网页网站。
运用Internet的主要综合搜索。
(2)、使用中国期刊网全文数据库的初级检索和高级检索查找文献的全文;学会下载文献资料、学会利用中国知网的免费资料。
(3)、学会使用校园网进入学校图书馆,用关键词检索和组合检索,查找“图书馆资料”以及查找借还书的情况等。
(4)、利用搜索引擎查出中国专利文献免费网站。
并用找到的网站查找有关医学方面的专利文献。
4.实验类别:基础5.实验类型:综合6.实验要求:选修7.主要仪器:每位学生操作一台可以上网络的计算机、中国知网数据库8.本实验评价方法:本次实验课同学们亲自动手在Internet网络检索文献,加深了对文献检索的基本理论、基本知识的理解,掌握使用计算机进行网上信息的查找。
为其将来从事科研、教学工作,以及实现知识更新的继续教育奠定一个良好的基础。
4、实验课题:1 利用百度搜索引擎搜索包含关键字“计算机软件测试的方法”的网页,并设定搜索的网页中要包含“测试前的准备工作”的完整关键词2 利用百度搜索引擎搜索,在网页的网址中包含“cdbroad”的网页,并且只在四川范围内查找3 在网站中搜索包含关键字为“公务员考试”的网页4利用百度搜索“四川新闻”,设定搜索结果每页显示20条,并且只搜索最近一周内的网页5请利用百度搜索引擎,搜索中国有关印度洋海啸的报道。
7利用google计算数学式:ln2*2^28利用google翻译单词“abstract”9利用百度搜索引擎搜索歌曲“你的眼神”的MP3,之后再搜索其彩铃。
一:《中图法》网站的网址名称/ 我感兴趣的是情报学、情报工作分类号是 G35 二:以下图书的分类号
O621.25 有机化学及实验
I24 《三国演义》
O65 分析化学
O62 有机化学
I24 周恩来传
G64 研究生英语高级教程
Q814 酶工程技术
Q93 微生物学
Q939.9 生物芯片技术与实践
G64研究生英语高级教程
三.根据分类号,查所属类目
Q51 蛋白质⑨
O622 有机化学
J211.6 绘画材料和工具
I206 文学评论和研究
O657 仪器分析法(物理及物理化学分析法)⑨
H315.9 翻译
O61 无机化学
K29 地方史志
F742 国际贸易关系
O631 高分子物理和高分子物理化学
四.题名/责任者: 遗传毒物/(日)西冈一著张研译
出版发行项: 北京:科学普及出版社,1988.05
ISBN及定价: 7-110-00280-2/1.00
五:山东理工大学图书馆数字文献资源类型(根据出版形式划分)
图 书 中外文电子图书
期 刊 数字资源导航。
会议论文 中国重要会议论文全文数据库
学位论文 中国学位论文全文数据库
音像资料 超星名师讲坛:/
专 利 国家知识产权局专利检索数据库
标 准 国道标准数据库
专 利 国家知识产权局专利检索数据库
报 纸 中国重要报纸全文数据库 六、美国四大科技报告简介
1.PB 报告
1946年,美国为了整理在第二次世界大战中从战败国缴获来的大量的内部科技资料,在商务部下成立了出版局(Office of the Publication Board ,U.S. Department of Commerce ,简称PB ),负责整理、公布这批资料,因每件资料都寇以“PB”作为标识,因此称为PB 报告。
图 书
期 刊 会议论文
学位论文 音像资料
专 利 标 准
报 纸
PB报告的出版单位几经变化,从1970年9月起由美国商务部国家技术情报服务局(U.S. Department of Commerce National Technical Information Service,简称NTIS),负责收集、整理美国的研究报告,并继续沿用“PB”作为报告标志。
PB报告的编号原来采用PB代码加上流水号,1979年底,PB报告号编到PB-301431,从1980年开始使用新的编号系统,即PB+年代+顺序号,其中年代用公元年代后的末2位数字表示。
如:PB95-232070GAR 18-00797
2.AD报告
1951年5月,美国国防部将承担美国军事系统科技情报工作的中央航空文献局(Central Air Documents Office,简称为CADO)和海军情报研究所(NRS)合并,成立了美国武装部队技术情报局(Armed Services Technical Information Agency,简称为ASTIA),由它来负责美国军事系统科技情报资料的搜集、整理、出版的工作。
在1951年至1963年间,它所整理的情报资料都编有带AD字头的顺序号,产生了AD报告。
这时AD的涵义即为ASTIA Document。
1963年3月ASTIA扩建为国防科学技术情报文献中心(Defense Document Center for Scientific and Technical Information,简称为DDC),DDC所收集整理的报告,继续冠有AD字样,但其涵义已经与前者不同,是“Accessioned Document”的缩写,意为“入藏文献”。
DDC于1979年改名为国防技术情报中心(Defense Technical Information Center,简称为DTIC)。
AD报告的文献来源非常之广,报告范围不仅几几乎包括了与国防有关的各个领域,也涉及许多民用技术领域。
AD报告的密级有4种:机密(Secret)、秘密(Confidential)、内部限制(Restricted or Limited)、非密公开民行(Unclassified)。
AD报告根据密级不同,编号也不同。
1975年以前,不同的密级用不同的号码段区别,可以从编号最高位数字看出密级,最高位是1表示公开、秘密、机密混编,2、4、6、7表示公开,3、5表示秘密、机密,8、9表示非密限制发行。
1975年以后,则在编号前加不同的字母表示不同密级,A表示公开,B表示非密限制发行,C表示秘密、机密,D表示军事系统专利,E表示共享书目输入试验,L表示内部限制使用,P表示专题丛书或会议论文集中的单行本,R表示属于国防部和能源科技情报联合协调委员会提供的能源科学方面的保密文献。
如:AD-900000,AD-A000023,AD-B000089,AD-C000075,……
AD报告最早是美国军事技术情报局(Armed Services Technical Information Agency,简称ASTIA)出版的科技资料,即ASTIA的Document,用其两个首字母AD来命名。
它收集报道的文献多为国防部所属的军事研究机构和合同单位的科技报告。
ASTIA 于1951年成立后几经改组易名,现称国防技术信息中心(Defense Technical Information Center,简称DTIC ), 报告名仍延用AD,其含义已转为入藏文献(Accessioned Document)。
AD报告的来源单位有美国军事部门的研究单位、政府的科研部门、公司企业、大专院校以及一些国外和国际组织,报告内容不仅包括军事科技的,也涉及民用技术。
AD报告有密级,在其报告号用不同的字母表示。
自1975年起它的主要形式如下:
AD-A000001~A表示公开报告,占45%
AD-B000001~ B表示非密限制报告,占39%
AD-C000001~C表示秘密报告,占16%
AD-D000001~D表示美军专利文献
另外,还有AD-E是临时使用的试验号,AD-P是丛书或会议论文集的单行本,AD
-R是国防部和能源部能源学科的保密文献。
3.NASA报告
NASA报告是美国国家航空和航天局(National Aeronautics and Space Administration,简称为NASA)出版的科技报告,现也简称N报告。
NASA的前身是NACA(National Advisory Committee for Aeronautics)。
NASA报告主要是航空航天领域,年报告量约6000件。
NASA报告的报告号采用“NASA+报告出版类型+顺序号”的表示方法。
例如“NASA-CR-167298”表示一份合同用户报告。
在NASA编号系统中,由“TR”表示技术报告,“TN”表示技术札记,“TM”表示技术备忘录,“TP”表示技术论文,“TT”表示技术译文,“CR”表示合同用户报告,“SP”表示特种出版物,“CR”表示会议出版物,“EP”表示教学用出版社物,“RP”表示参考性出版物等。
4.DE报告
DE报告原称DOE报告,该报告因出版单位多次变化,先后由美国原子能委员会(Atomic Energy Commission,简称为AEC)、能源研究与发展署(Energy Research and Development Administration,简称为ERDA)和美国能源部(Department of Energy,简称DOE)出版,报告名称也从AEC、ERDA、DOE到DE多次变化,这套报告的报告号也较为混乱,但从1981年开始,能源部发行报告都采用“DE+年代+顺序号”的形式,如“DE95009428”表示1995年第9428号报告,而“DE+年代+500000”以上号码则表示从国外收集的科技报告,所以DOE报告在1981年以后又叫DE报告,DE报告现年发行量约为15000件(公开部分)。
七.熟悉网络文献的类型、特点、搜索引擎的种类与使用方法。
1.中文教育科研网站()上关于搜索引擎技巧的文章
搜索“搜索引擎and 技巧”获得86608 条结果,用时5828 毫秒。
检索式:搜索引擎and 技巧
2.结合本专业查找某门课程的课件(ppt)
找到约4,140,000 条结果(用时0.24 秒)
检索式:生物化学and生命科学学院
3.查阅“关于电子商务的PDF文档”
找到约7,219,404篇,用时3542 毫秒
检索式:电子商务andPDF文档
4.查找某机构的邮政编码、地址、电话、简介等
找到相关结果约5,210,000个,用时3544 毫秒
检索式:山东理工大学 or邮政编码or地址or电话or简介
5. 查询网上关于中国、美国和日本高等教育比较的资料
找到相关结果约8,270,000个,用时5544 毫秒
6.查询除欧洲杯以外的有关足球的资料
找到相关结果约6,120,000个,用时6544 毫秒
检索式:足球not欧洲杯
7. 查询网上关于中国高等教育、美国高等教育、日本高等教育的资料
找到相关结果约100,000,000个,用时5644 毫秒
检索式:(中国高等教育or美国高等教育or日本高等教育)at 资料
8. 在不知道“彧”字发音的情况下查找并写出其释义。
找到相关结果约11,200,000个,用时3644 毫秒
检索式:彧and发音and释义。