当前位置:文档之家› 搜索引擎与医学信息检索

搜索引擎与医学信息检索

搜索引擎与医学信息检索
搜索引擎与医学信息检索

搜索引擎及医学信息检索

一.用Google查找关于“病理生理学”、“正常人体解剖学”、“药理学”、“生理学”或所学相关课程教学资源(如:PPT课件、多媒体课件、讲义、大纲等)或学习资料(如模拟试题、软件教程等)并练习下载相关的资料。

资料在文件夹1

二.分别利用“百度在线词典”或“谷歌翻译词典”将“狂犬病、糖尿病、白血病、肾结石、肺结核”译成英文;将“hypertension、appendicitis、Thyroid、lung cancer”译成中文。

狂犬病: hydrophobia; rabies

糖尿病diabetes; diabetes mellitus

白血病leukemia

肾结石kidney stone; renal calculus; nephrolith

肺结核pulmonary tuberculosis; phthisis

Hypertension高血压

Appendicitis阑尾(或盲肠)炎

Thyroid甲状腺

lung cancer肺癌

三.利用Google搜索有关“甲型H1N1流感”的文献,并利用布尔逻辑运算再次检索不包含“儿童”内容在内的关于“甲型H1N1流感”的有关全文文献。

资料在文件夹3

四. 利用搜索引擎的分类目录体系查找与自己专业相关的网站,到与你专业相关的大学网站去,检索开设有与你相同专业的“专升本”的院校招生情况(例如药学专业、检验专业、护理专业等);检索广西医科大学护理、口腔专业专升本招生信息及开设课程。

资料在文件夹4

五. 2011-3-18我国一驻日本留学生从福岛回到中国,感觉头昏,乏力,恶心,有呕吐等症状,到医院检查,血常规检查结果出来了,WBC偏低,请问什么是WBC?正常值是多少?是否考虑受到了核辐射伤害?

WBC是白细胞高.可以积极的抗炎治疗.WBC一般代表的是白细胞。白细胞稍微高了一点点,最常见原因是细菌感染.白细胞低说明免疫低下,极易感染各种病毒和细菌

正常值范围:成人:4~10 ×10的9次方/L(4000-10000/mm3)。新生儿:15~20 ×10的9次方/L(15000-20000/mm3)。

第三问我不懂

六.李平想参加最近一次的大学英语(CET)四级考试,您能帮他检索最近一次的CET 考试报名时间和考试时间吗?请检索历年的考试大纲及模拟试题。

CET全国四六级考试的报名时间为:每年11月份、5月份(每年时间略有不同)

考试时间为:每年12月份、6月份的第三个星期六

资料在文件夹5

七.鉴别合法与非法期刊,只要登录国家新闻出版总署网站,请判断《广西医学》《柳州医学》等期刊的合法性。

《广西医学》是合法的

《柳州医学》是非法的

八.利用搜索引擎搜索《中文核心期刊要目总览》最新版本,了解与自己专业相关核心期刊的信息。试判断《中国新药杂志》、《广西医科大学学报》、《实用护理杂志》、《中国医学影像学杂志》、《新护理》等期刊是不是中文核心期刊。

资料在文件夹8

《中国新药杂志》是中文核心期刊

《广西医科大学学报》不是中文核心期刊

《实用护理杂志》是中文核心期刊

《中国医学影像学杂志》是中文核心期刊

《新护理》不是中文核心期刊

九.同学们想利用假期去云南丽江,请查火车车次及票价信息、景区状况(住吃行信息),并参考网上信息简单做出三日游计划。并查出近三日的天气预报。

十、如何乘坐公交车从我们学校到三门江国家森林公园?

[专利文献检索实习题]

一、请用“中国国家知识产权局专利全文数据库()检索以下专利,并查看专利说明书。

A、用发明设计人查找“ 柳州的李洪昌的15项专利”。

B、用申请(专利)号查找:96304606.3专利文献。

序号申请号专利名称

196304606.3药品包装盒(甲亢舒)

C、用名称查找:

“无针注射器” 或“涂药膜刀”;“点滴报警器”;“消化管腔内自充气气囊”

的专利。

无针注射器

窗体顶端

序号申请号专利名称

101805865.5具有两级注射速度的无针注射器

201805946.5微型无针注射器

301807774.9带有预装填药筒的无针注射器

401804822.6用于注射包含在预填充安瓿中的液体的无针注射器

501808275.0由双组分烟火装料运行的无针注射器601811507.1带有模块化储液器的无针注射器

701809065.6用于变量和定量配药的一次性廉价无针注射器系统800815814.2无针注射器用的通用防感染保护器

995196313.9适用于无针注射器内的医用玻璃容器1095102023.4无针注射器接管

1194191721.5用超声气流输注粒子的无针注射器

1296199060.0无针注射器药剂容器及充填方法

1399809804.3无针注射器

1499810941.X无针注射器筒体

1500810388.7具有嵌合件式注射头的无针注射器

1600810389.5与穿过一个壁的冲击波发生器一起使用的无针注射器17200580047288.7无针注射器

18200710144504.0电动无针注射器

1902823299.2具有自动失效特征的用于无针注射器的通用保护盖2002824660.8无针注射器

涂药膜刀”;

序号申请号专利名称

101276876.6涂药膜刀

“点滴报警器”;

序号申请号专利名称

192242826.3医用多功能点滴报警器

2 2.4点滴报警器

3 2.6一种光电式打点滴报警器

403250611.2点滴报警器

5 2.7一种点滴报警器

6 2.X点滴报警器

7 2.X点滴报警器

8 2.0点滴报警器

9 2.3一种挂盐水点滴报警器

10 2.7点滴报警器

11 2.9一种点滴报警器

12 2.5无接触便携式点滴报警器

“消化管腔内自充气气囊”

序号申请号专利名称

1 2.8消化管腔内自充气气囊

二、南京“六?三○”特大交通事故肇事案发生后,南京财经大学食品科学与工程学院的康杰、王常乾等同学就开始琢磨,是否能发明一种设备,从源头上防止司机酒后驾车。他们的想法得到温吉华教授的支持,王常乾与康杰、黄冠毅、徐丹、宁秀伟、赵璨等同学组成攻关小组。经过反复研究,他们拿出了酒后禁驾设备的开发方案。请检索南京大学生发明防司机酒后驾车的“醉立停”装置。

该装置为一圆形盒状物,大小恰好与汽车方向盘中轴匹配,厚度约为1.5cm,安装在方向盘中轴位置,控制线路与汽车点火装置相连。驾驶员进入车厢后,非接触呼吸式酒精传感器可自动探测空气中的酒精浓度,若超标,系统会自动将点火装置断开,使汽车无法正常启动。

与现有同类型设备相比,“醉立停”优势明显,属于自动连续检测,无人能够逃过它的“法眼”;其次是采用非接触式探测技术,比吹气检查更加卫生;三是成本低廉,配件获得容易,经过测算,每件售价只要200元左右

三、青霉素是谁最早发现的,他申请了制造青霉素的专利吗?后来是谁研究佛莱明的论文?研制青霉素,并大量运用在临床上?

是细菌学家佛莱明最初发现青霉素的,他没有申请专利,英国病理学家弗洛里(Howard Walter Florey)和生物化学家钱恩。

历史上的今天

1928年4月28日井冈山会师

1928年4月28日井冈山会师

1928年4月28日,朱德、陈毅率领的湘南起义部队与毛泽东领导的井冈山工农革命军在宁冈砻市胜利会师。1927年,毛泽东率领秋收起义部队到达井冈山,开始了“工农武装割据”。1928年2月新城战斗胜利后,以宁冈为中心的井冈山根据地初步形成。4月底,湘南暴动失败;朱德、陈毅率湘南起义部队到达井冈山,在宁冈砻市同毛泽东领导的秋收起义部队会师。5月4日,根据湘南特委决定,将朱毛两部合编为工农革命军第四军(6月4日,根据中共中央指示,改称为工农红军第四军),军长朱德,党代表毛泽东,政治部主任陈毅。井冈山会师和红四军成立,不仅对坚持井冈山地区的斗争,建立和扩大农村革命根据地,推动全国革命事业的发展产生了极其深远的影响。

?1758年- 美国第五任总统门罗诞辰

?1897年- 叶剑英诞辰

?1906年- 革命党与改良派大论战

?1922年- 直奉战争爆发

?1927年- 李大钊就义

?1936年- 16岁的法鲁克继承埃及王位

?1945年- 墨索里尼被处决

?1968年- 蔡廷锴逝世

?1984年- 邓小平会见里根

?1985年- 作家张天翼逝世

?1989年- 世界篮球大赛向职业球员开放

?2003年- 中国银监会正式挂牌

搜索引擎检索技巧

搜索引擎检索技巧

搜索引擎 搜索引擎(search engine),1995年开始搜索引擎以一定的策略从网络收集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。 搜索引擎站---“网络门户”

1、搜索引擎的工作原理 信息的收集处理 信息的检索输出

2、搜索引擎的分类 搜索引擎按其工作方式主要可分为三种: 目录索引类搜索引擎(Search Index/Directory) 机器人搜索引擎(全文搜索引擎)(Full Text Search Engine)元搜索引擎(Meta Search Engine)

2、搜索引擎的分类(续) 目录式搜索引擎 目录式搜索引擎:以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。 该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。 这类搜索引擎的代表是:yahoo!、Galaxy、Open Directory……

2、搜索引擎的分类(续) 机器人搜索引擎 由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。 该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。 这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google;国内代表为:百度等。

医学文献检索试题(含答案).

医学文献检索试题(A) 《医学信息检索》试题 一、名词解释(共 5 题,每题 3 分,共 15 分) 1. 信息素养:是指判断何时、何地需要信息,并能有效的定位、获取、评价和利用信息的一系列能力的总和。 2. 引文检索:是以被引用文献为检索起点来查找引用文献的过程。 3. 索引:将内容中有检索意义的标识提取出来,按某种方式进行排序,以便于查询。 4. 书目数据库:是一种提供文献的各种特征,如文献篇名、作者、文献出处、摘要、馆藏单位的数据库。 5. 元搜索引擎:也称集成搜索引擎,是建立在异地搜索引擎基础上的虚拟智能整体,本身不一定建立网络信息索引数据库。检索时,用户通过统一的检索界面,可同时链接多个或多种独立搜索引擎进行查询,将检索结果作出相关度排序后显示给用户。 二、单项选择题(共 15 题,每题 2 分,共 30 分) 1. 关于信息的说法错误的是( b )。 A.信息是客观事物的运动状态和特征的反映 B.信息是客观的 C.信息是无形的,不断变化发展的 D.信息的存储形式有多种 2. 以下属于二次文献的是( c )。 A.述评 B.研究报告 C.索引 D.专著 3. 检索文献数据库时,下列哪种方法不能扩大检索范围( a )。 A. 主题词加权 B. 用OR C. 用主题词扩展 D. 采用截词 4. 哪个途径是从文献的内部特征进行检索的( a )。 A. 分类途径 B. 号码途径 C. 作者途径 D. 刊名途径 5. 下列说法中错误的是( d )。 A. 综述是有关研究某一问题或某些问题的文章 B. 综述是从一定时间内的大量的文献中摘取的情报 C.综述是对特定的问题利用有关的情报进行的综合性叙述 D.综述的目的是建立新知识 6. 计算机文献检索中,每一种文献特征对应于计算机数据库中的( c )。 A. 一条记录 B. 一篇文献 C. 一个字段 D.一个文档

医学文献检索试题(含答案).

医学文献检索试题(A) 《医学信息检索》试题 一、名词解释(共5 题,每题 3 分,共15 分) 1. 信息素养:是指判断何时、何地需要信息,并能有效的定位、获取、评价和利用信息的一系列能力的总和。 2. 引文检索:是以被引用文献为检索起点来查找引用文献的过程。 3. 索引:将内容中有检索意义的标识提取出来,按某种方式进行排序,以便于查询。 4. 书目数据库:是一种提供文献的各种特征,如文献篇名、作者、文献出处、摘要、馆藏单位的数据库。 5. 元搜索引擎:也称集成搜索引擎,是建立在异地搜索引擎基础上的虚拟智能整体,本身不一定建立网络信息索引数据库。检索时,用户通过统一的检索界面,可同时链接多个或多种独立搜索引擎进行查询,将检索结果作出相关度排序后显示给用户。 二、单项选择题(共15 题,每题2 分,共30 分) 1. 关于信息的说法错误的是( b )。 A.信息是客观事物的运动状态和特征的反映 B.信息是客观的 C.信息是无形的,不断变化发展的 D.信息的存储形式有多种 2. 以下属于二次文献的是( c )。 A.述评 B.研究报告 C.索引 D.专著 3. 检索文献数据库时,下列哪种方法不能扩大检索范围( a )。 A. 主题词加权 B. 用OR C. 用主题词扩展 D. 采用截词 4. 哪个途径是从文献的内部特征进行检索的( a )。 A. 分类途径 B. 号码途径 C. 作者途径 D. 刊名途径 5. 下列说法中错误的是( d )。 A. 综述是有关研究某一问题或某些问题的文章 B. 综述是从一定时间内的大量的文献中摘取的情报 C.综述是对特定的问题利用有关的情报进行的综合性叙述 D.综述的目的是建立新知识 6. 计算机文献检索中,每一种文献特征对应于计算机数据库中的( c )。 A. 一条记录 B. 一篇文献 C. 一个字段 D.一个文档 1 ? 7. 下面哪个检索式的作用与短语检索"digiatal camera"等价:( a )。 A. digiatal (W) camera B. digiatal (N) camera C. digiatal AND camera D. digiatal OR camera 8. Medline光盘数据库的内容涵盖三种重要的纸本医学文献检索工具,它们是 ( d )。 A. BA、IM、EM B. BA、EM、International Nursing Index C. BA、Index to Dental Literature、International Nursing Index D. IM、Index to Dental Literature、International Nursing Index 9. 检索工具的功能主要体现在( c )。 A. 附录部分 B. 目次表格 C. 索引部分 D. 使用说明 10. SCI与其他文献检索刊物不同之处在于( b )。 A. 它具有团体索引 B. 它具有引文索引 C. 它可以了解某著者发表论文情况 D.它可以了解科研的最新动态

各种搜索引擎技巧

.html .asp/.aspx .php .jsp Html语言变量、函数、组建、流程、循环、结构 代码结构进行优化 URL 统一资源定位符号universal resources locator 网络地址 Filetype Intitle Inurl 美萍点播系统VOD down:43 Site: 在站内进行检索 Intext: Seo搜索引擎优化-》sem搜索引擎营销-》网络营销 【项目背景介绍】 信息社会,信息以爆炸式的方式增长,网络环境下,搜索引擎是我们通往目的地的必备武器,但是在浩如烟海的网络信息里面,很多网友都只会简单的搜索,往往不能够很好的达到搜索的目的,因此也无法完成对海量信息的综合处理。作为电子商务专业学生,如何高效的完成信息检索,无论是对个人依托网络进行的学习还是今后的网络商务工作,都十分重要。 【项目工具简介和环境要求】 互联网机房 能正常访问互联网、IE插件正常 【项目延伸思考题】 搜索引擎的商用价值 各类搜索引擎通用的高级搜索命令 提高网站被检索可能性的建议 【项目教学难点】 网站备案机制 网站支付流程的合理性 网站联系信息的真实性判断 【项目实施步骤】 项目简介—快速测试—软件包传送—学生自我摸索(安装、调试、搜索等)—手把手—应用场合分析—新模式联想 随着网络技术尤其是WWW站点的快速发展和普及,人们通过Internet获取全球信息的可能性越来越大。可以说,我们所需要的信息,绝大部分都可以通过因特网获取。但是网络信息内容庞杂、分散无序,各种有价值、所需的信息资源淹没在信息的“汪洋大海”中,给人们查询和利用网络信息资源带来了极大的不便。为了更有效地开发和利用网络信息资源,人们研制了许多网络信息检索工具,其中WWW是Internet上增长最快、使用最方便灵活的多媒体信息传输与检索系统,越来越多的用户将自己的信息以WWW的方式在网上发布。WWW服务器已称为互联网上数量最大和增长最快的信息系统,因而可以检索WWW网址网页以及新闻论坛、BBS文章的检索工具——搜索引擎称为查询网络信息的最主要的检索工具。 有人说,会搜索才叫会上网,搜索引擎在我们日常生活中的地位已是举足轻重。你也许是个刚买了“猫”兴冲冲地要上网冲浪,也许已经在互联网上蛰伏了好几年,无论怎样,要想在浩如烟海的互联网信息中找到自己所需的信息,都需要一点点技巧。对于企业而言,学习搜索,提高技巧,就能找到更多的潜在客户。

大学—医学信息检索——考试题库与答案

单选题 1、下列哪个文献的类型是属于零次文献:B 2、我国首次开通国际联机情报检索是在(C)。 3、我国首次开通国际联机情报检索是在(A)。 4、下列属于文献的外表特征的选项是(D)。 5、下列哪个文献的类型不属于三次文献( A)。 6、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现的“AU”字段代表的是( A)。 7、用Google准确搜索重庆医科大学应用技术学院有关资料应使用(C) 8、下列哪一过程是文献检索过程的最后一步(A)。 9、中文医学文献文摘式检索工具是(D)。 10、通用载体通常指的是(A)。 11、关键词可帮助读者在检索中:(D ) 12、下列属于二次文献的是:(A) 13、下列属于文献内容特征的是(B )。 14、在中国生物医学文献光盘数据库(CBMdisc)的记录中,代表文献“题目”的字段是:(A ) 15、用Adobe Reader可以阅读下列哪种格式的文章。A 16、下列哪一过程是文献检索过程的最后一步:(C) 17、下列属于文献内容特征的是:(A ) 18、下列哪一个是供读者使用的查阅IM的指南(D) 19、利用《中文科技资料目录》(医药卫生)查找有关“中药治疗高血压”方面的文献,如果从主题途径查找,本课题的检索策略是(A)。 20、下列属于三次文献的是:(D ) 21、下列哪个文献的类型不属于一次文献(C )。 22、属于文献内容特征的选项是(D) 23、某护士检索有关“哮喘患者自理行为”方面的文献,她从现在的开始往前逐年进行文献24、查找,此种检索方法称为:(A) 25、不属于文献外部特征的是(B)。 26、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现以下哪个字段代表的是文献的“著者”? :(D) 27、在《中文科技资料目录》(医药卫生)中,护理学的分类号为(D)。 28、在中国生物医学文献光盘数据库(CBMdisc)的记录中,代表文献“题目”的字段是(A )。 29、使用搜索引擎进行信息检索时,下列措施中对提高查全率没有帮助的是D 30、CBMdisc35个字段中AF代表的是(A)。 30、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现的“AU”字段代表的是:(A ) 31、下列哪个文献的类型是属于零次文献(B )。 32、下列属于文献的外表特征的选项是(C )。 33、利用综述文献后面所附的参考文献进行文献查找的方法称为(C)。 34、在中国生物医学文献光盘数据库(CBM disc)的记录中出现的“AB”字段代表的含义是:(A) 35、选项中哪一种文献属于一次文献(C )。 36、使用搜索引擎进行信息检索时,下列措施中对提高查准率有帮助的是D 37、下列哪个数据库是全文数据库?A 38、检索有关脑卒中康复效果及影响因素研究的中文相关文献,下列检索策略中,较好的检索式应为(C)

信息检索与搜索引擎技术实验向量空间模型

信息检索与搜索引擎技术实 验向量空间模型 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

昆明理工大学信息工程与自动化学院学生实验报告 ( 2014—2015学年第 1学期) 课程名称:信息检索与搜索引擎技术开课实验室:信自楼445 2014 年12月 23日 一、上机目的及内容: 给定文档语料: d1: 北京安立文高新技术公司 d2: 新一代的网络访问技术 d3: 北京卫星网络有限公司 d4: 是最先进的总线技术。。。 d5: 北京升平卫星技术有限公司的新技术有。。。 设计一个针对这些文档的信息检索系统。具体要求是: 1)给出系统的有效词汇集合(说明取舍原因)。 2)写出d1和d2在VSM中的表示(使用tf*idf,写出各项的数字表达式,具体数值不必 实际计算出来)。 3)画出系统的倒排文件示意图。 4)按照向量夹角的余弦计算公式,给出针对查询“技术的公司”的前3个反馈结果。 2

二、实验原理 1)给出系统的有效词汇集合(说明取舍原因)。 北京、安、立、文、高新、技术、公司、新、网络、访问、卫星、有限、先进、总线、升、平 的、是、最、有,这些词作为停用词不能加入系统的有效集合 一、代,去除后并不影响原来句子语义的表达也不能算作系统的有效集合。 2)写出d1和d2在VSM中的表示(使用tf*idf,写出各项的数字表达式,具体数值不必实际 计算出来)。 得到的矩阵: 3

4 说明: TF :表示词项在该文档或者查询词中出现 的频度。即该词项出现次数除以该文档的长度(所有词的个数) :表示词项k 在D i 中的出现次数。 :表示该文档的长度(所有词的个数) IDF :表示词项在文档集合中的重要程度。一个词项出现的文档数越多,说明该词项的区分度越差,其在文档集合中的重要性就越低。 N :表示集合中的文档数; :表示出现词项k 的文档数。 d1中各词项的数字表达式 “北京”的 “安”的 “立”的 北京 1 0 1 0 1 3 安 1 0 0 0 0 1 立 1 0 0 0 0 1 文 1 0 0 0 0 1 高新 1 0 0 0 0 1 技术 1 1 0 0 1 3 公司 1 0 1 0 1 3 新 0 1 0 0 1 2 网络 0 1 1 0 0 2 访问 0 1 0 0 0 1 卫星 0 0 1 0 1 2 有限 0 0 1 0 1 2 先进 0 0 0 1 0 1 总线 0 0 0 1 0 1 升 0 0 0 0 1 1 平 0 0 0 0 1 1

常用的几类搜索引擎技术

详细介绍常用的几类搜索引擎技术 因特网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找信息,就像大海捞针一样,搜索引擎技术恰好解决了这一难题,它可以为用户提供信息检索服务。目前,搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。 搜索引擎(Search Engine)是随着WEB信息的迅速增加,从1995年开始逐渐发展起来的技术。 据发表在《科学》杂志1999年7月的文章《WEB信息的可访问性》估计,全球目前的网页超过8亿,有效数据超过9TB,并且仍以每4个月翻一番的速度增长。例如,Google 目前拥有10亿个网址,30亿个网页,3.9 亿张图像,Google支持66种语言接口,16种文件格式,面对如此海量的数据和如此异构的信息,用户要在里面寻找信息,必然会“大海捞针”无功而返。 搜索引擎正是为了解决这个“迷航”问题而出现的技术。搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。 目前,搜索引擎技术按信息标引的方式可以分为目录式搜索引擎、机器人搜索引擎和混合式搜索引擎;按查询方式可分为浏览式搜索引擎、关键词搜索引擎、全文搜索引擎、智能搜索引擎;按语种又分为单语种搜索引擎、多语种搜索引擎和跨语言搜索引擎等。 目录式搜索引擎 目录式搜索引擎(Directory Search Engine)是最早出现的基于WWW的搜索引擎,以雅虎为代表,我国的搜狐也属于目录式搜索引擎。 目录式搜索引擎由分类专家将网络信息按照主题分成若干个大类,每个大类再分为若干个小类,依次细分,形成了一个可浏览式等级主题索引式搜索引擎,一般的搜索引擎分类体系有五六层,有的甚至十几层。 目录式搜索引擎主要通过人工发现信息,依靠编目员的知识进行甄别和分类。由于目录式搜索引擎的信息分类和信息搜集有人的参与,因此其搜索的准确度是相当高的,但由于人工信息搜集速度较慢,不能及时地对网上信息进行实际监控,其查全率并不是很好,是一种网站级搜索引擎。 机器人搜索引擎 机器人搜索引擎通常有三大模块:信息采集、信息处理、信息查询。信息采集一般指爬行器或网络蜘蛛,是通过一个URL列表进行网页的自动分析与采集。起初的URL并不多,随着信息采集量的增加,也就是分析到网页有新的链接,就会把新的URL添加到URL列表,以便采集。

医学文献检索试题及答案

医学文献检索试题及答 案 集团标准化办公室:[VV986T-J682P28-JP266L8-68PNN]

医学文献检索题目及答案期刊联合目录最大的作用是为了让读者了解: 选项: a、同一种期刊的不同版本 b、期刊的收藏单位 c、期刊的出版年代 d、ISSN号 标准答案:b 情报的三个基本属性是: 选项: a、新颖性、知识性、传递性 b、知识性、传递性、效用性 c、科学性、知识性、实用性 d、新颖性、科学性、效用性 标准答案:b

提供原绐文献线索的检索工具有: 选项: a、期刊目录 b、二次文献数据库 c、参考文献 d、图书分类法 标准答案:b 文献检索中,主题语言是一类检索语言,以下哪一个不是检索语言。选项: a、高级语言 b、主题词语言 c、分类语言 d、关键词语言 标准答案:a 下列哪个不是一次文献。 选项:

a、期刊论文 b、专利文献 c、综述 d、专题着述 标准答案:c 下列文献中属于一次文献的是: 选项: a、期刊论文 b、目录 c、综述 d、文摘 标准答案:a 医学文献只有经过哪一种处理,才能进入检索系统,提供使用。选项: a、编号 b、编排

c、标引 d、分类 标准答案:c 在A see B中,下列说法哪个是正确的。 选项: a、A是主题词 b、B是主题词 c、A、B都是主题词 d、A、B都不是主题词 标准答案:b 由美国国立医学图书馆创建医学文献分析与检索系统的英文缩写是:选项: a、MEDARS b、MEDLARS c、MEDARLS d、MELDARS

标准答案:b 在MEDLINE数据库检索中,要限定出版国别,应选用哪个字段选项: a、PC b、CP c、PY d、CY 标准答案:b 下列检索方法中,查全率较高的是: 选项: a、追溯法 b、倒查法 c、顺查法 d、分段法 标准答案:c 下列哪一个是中医药学的副主题词:

信息检索与搜索引擎课程报告

《信息检索搜索引擎技术》期末考试报告 学期:2016-2017学年第一学期 任课教师:毛存礼 专业年级:计科133 学号:201310405339、 201310405326、 201310405330、201310405325 学生姓名:李然、毛子铭、张倩、黄枫

目录 一、系统概述 (3) 二、系统需求分析 (3) 2.1功能需求分析 (3) 三、程序实现 (4) 3.1 爬虫的实现 (4) 3.1.1 对网页进行分析 (4) 3.1.2编写爬虫 (5) 3.2索引的实现 (7) 3.2.1分词的实现 (7) 3.2.2索引的建立 (8) 3.2.3检索索引 (9) 3.3向量空间模型的实现 (10) 3.3.1向量空间模型概述 (10) 3.3.2建立向量空间模型 (11) 3.4利用Lucene打分机制对文档打分 (13) 四、测试 (14) 五、心得体会 (17)

一、系统概述 随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就像大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜索软件或网络登录等方式,将Intenet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索做出响应,提供用户所需的信息或相关指针。 用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索。本系统基于HTMLUNIT框架,构建爬虫,基于LUCENE框架,构建索引,利用向量空间模型向量化表示文档间的相关性,利用LUCENE 给相关文档打分。 二、系统需求分析 2.1功能需求分析 该系统分为四个功能模块: (1)爬虫模块 (2)索引模块 (3)向量化表示模块 (4)打分模块 具体实现分工如下: ①爬虫模块:该模块采用Htmlunit框架,主要负责爬取网页内容,在 本地建立文档库,以便于索引功能模块,将文档库里的文档内容建立成索引。 (毛子铭所做) ②索引模块:该模块采用Lucene框架,功能分为两块:一是建立索引, 将爬取的内容建立成索引。二是检索索引,即提供给用户检索索引。(张倩所做) ③向量化表示模块:该模块采用向量空间模型,其功能是将查询文本和

医学信息检索试题及参考答案

、名词解释(共 5题,每题3分,共15 分) 、单项选择题(共 15题,每题2分,共30分) 1. 关于信息的说法错误的是 ( ) A. 信息是客观事物的运动状态和特征的反映 B.信息是客观的 C.信息是无形的,不断变化发展的 D.信息的存储形式有多种 2. 以下属于二次文献的是 ( ) 5.下列说法中错误的是( )。 A. 综述是有关研究某一问题或某些问题的文章 B. 综述是从一定时间内的大量的文献中摘取的情报 C. 综述是对特定的问题利用有关的情报进行的综合性叙述 D. 综述的目的是建立新知识 6. 计算机文献检索 中,每一种文献特征对应于计算机数据库中的 ( ) A. 一条记录 B. 一篇文献 C. 一个字段 1.信息素养 2.引文检索 3.索引 4. 书目数据库 5. 元搜索引擎 A.述评 B.研究报告 C.索引 D.专 3. 检索文献数据库时,下列哪种方法不能扩大检索范围 A. 主题词加权 B.用 OR C. 用主题词扩展 D. 采用截词 4. 哪个途径是从文献的内部特征进行检索的 A. 分类途径 B.号码途径 C. 作者途径 刊名途径 D. 一个文档

7. 下面哪个检索式的作用与短语检索"digiatal camera" 等价:(

A. digiatal (W) camera C. digiatal AND camera D. digiatal OR camera 8. Medli ne 光盘数据库的内容涵盖三种重要的纸本医学文献检索工具,它们是 ( A. BA 、IM 、EM B. BA 、EM International Nursing Index C. BA 、Index to Dental Literature D. IM 、Index to Dental Literature 9. 检索工具的功能主要体现在 ( A.附录部分 B.目次表格 10. SCI 与其他文献检索刊物不同之处在于 A.它具有团体索引 C.它可以了解某著者发表论文情况 11. 在CBMdisc 检索中,查找期刊《肿瘤》上的文献,其正确表达式为 A.肿瘤in SO B. SO=肿瘤 C.肿瘤in TA 12. 用CBMdisc 主题途径检索“米非司酮治疗异位妊娠”的文献,表达式为 A. 米非司酮/治疗应用and 妊娠,异位/药物疗法 B. 米非司酮and 异位妊娠 C. 米非司酮/治疗应用and 妊娠,异位/药物作用 D. 米非司酮and 治疗and 异位妊娠 B. digiatal (N) camera 、In ter nati onal Nursing In dex 、In ter nati onal Nursing In dex ) 。 C.索引部分 D ( 八 B.它具有引文索引 D ?它可以了解科研的最新动态 ( ) D ( 使用说明

信息检索技术方法及搜索引擎

信息检索技术方法及搜索引擎.txt 1 截词检索技术 2 邻近检索技术 3 字段检索技术 4 布尔逻辑检索是指通过标准的布尔逻辑关系算符来表达检索词与检索词间的逻辑关系的检索 方法. 主要的布尔逻辑关系词有:逻辑与(AND),逻辑或(OR),逻辑非(NOT) 1 布尔逻辑检索技术 逻辑与 逻辑乘: "and"或"*"表示 组配方式:A*B或者A and B 表示两个概念的交叉和限定关系,只有同时含有这两个概念的记 录才算命中信息 作用:增加限制条件,即增加检索的专指性,以缩小提问范围,减少文献输出量,提高查准率. 逻辑或 又称逻辑和:"or","+" 组配方式:A OR B或者A+B,表示检索含有A词,或含有B词,或同时包含A,B两词的文章. 作用:放宽提问范围,增加检索结果,起扩检作用,提高查全率. 逻辑非 又称逻辑差: "not" "-" 组配方式:A-B,表示检索出含有A词而不含有B 词的文章. 作用:逻辑非用于排除不希望出现的检索词,它和"*"的作用相似,能够缩小命中文献范围,增 强检索的准确性. 例如检索:"打印机驱动程序" 查询关键词:打印机,驱动程序 检索表达式:打印机 AND 驱动程序 例如检索:"微型计算机"方面的有关信息 查询关键词:微型计算机,微机 检索表达式:微型计算机OR 微机 布尔逻辑检索举例 布尔运算符优先级比较 有括号时:括号内的先执行; 无括号时:NOT > AND > OR 例:检索"唐宋诗歌"的有关信息. 关键词:唐,宋,诗歌; 检索表达式: (唐 OR 宋)AND 诗歌; 唐 AND 诗歌 OR 宋 AND 诗歌; 错误表达式: 唐 OR 宋AND诗歌; 唐 AND 宋AND诗歌;

搜索引擎

搜索引擎分析 在当今的社会,上网成为了我们大部分人每天必不可少的一部分,网络具有太多的诱惑和开发的潜力,查询资料,消遣娱乐等等,但是这些大部分都离不开搜索引擎技术的应用。今天在我的这篇论文里将会对搜索引擎进行一个分析和相关知识的概括。就如大家所知道的互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。1990年,加拿大麦吉尔大学计算机学院的师生开发出Archie。当时,万维网还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页,但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖。 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索

引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。百度和谷歌等是搜索引擎的代表。那么搜索引擎将来的发展方向和发展的前景又是如何?我们就先从以下的各类主流搜索引擎先进行一个大致的分析。 1.全文索引 全文搜索引擎是当今主要网络搜素时所应用的搜索引擎,在网络上也是大家所熟知的,比如google和百度都是我们平时经常使用的。它们从互联网提取各个网站的信息,建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序,俗称“蜘蛛”程序或“机器人”程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google 和百度就属于这种类型;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。在搜索引擎分类部分提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,就是每隔一段时间,搜索引擎就会发启“蜘蛛”程序,对一定IP 地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。而另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生很

医学文献检索@ 考试题及答案

医学文献检索考试题参考答案 一、简述题(每题10分) 1、结合实际案例阐述医学信息检索在临床科研中的作用?答:比如在对某一项课题研究过程中或者撰写科研论文准备发表时,通过医学信息检索可以了解到是否还有其它相同或者类似的文献报道,是否有前期的研究项目,如果有则可以借鉴其实验方法,也可以吸取经验,从而进行更为合理的科研设计,并且可以对比其人的研究成果总结自己研究的主要特点和创新点。 2、简述医学信息检索的基本过程? 答:1.分析检索课题,明确检索要求。 2.选择检索工具,确定检索方法。 3.选择检索途径,确定检索用词与检索策略。 4.评价和输出检索结果。 5.获取原始文献全文。 3、试列举一至二种主要的中文医学信息资源(数据库或网 站) ? 答:1.中国生物医学文献数据库(CBM) 2. 中国医院知识仓库或中国知网(CNKI) 3. 维普全文电子期刊(中国科技期刊全文数据库)

4. 万方数据网络版或万方数据知识服务平台 5. 国家科技图书文献中心(NSTL)网站 4、简要说明主题词检索与关键词检索有何不同?CBM的主题检 索有什么特点? 答:1. 主题词是代表文献内容实质的经过规范化的专业名词术语或词组,其特点是具有唯一性,每个相同概念、名语术语、同义词等在索引中只能用唯一一个术语表达,使内容相同或 相近的文献更加集中,更具有专业性,避免同义词的多次检 索。 2. 关键词指从文献中抽出来的,有实质内容的、未经或 略经规范化的名词术语以及增添的相关概念词,它属于 自然语言范畴,最大的特点是直接来源于文献,不考虑 规范化,抽词容易,使用起来比较灵活,常能揭示最新 出现的专业名词术语,因此编制关键词索引较容易。 3. CBM的主题检索特点:主题词有直接形式,也有倒置 形式;并且用主题树形式组织主题概念。提供包括加权 检索、扩展主题词检索和扩展副主题词检索等功能选 项。 5、简述PubMed中主题词检索(MeSH)的优势及不足? 答:优势:提高查准率、提高查全率 不足:1.只能检索MEDLINE数据(有主题词标引的数据) 2.不能检索出版商提供的数据、和加工中的数据和

实验五搜索引擎使用实验

实验五搜索引擎使用实验一、实验目的 1.了解搜索引擎的发展情况和现状;理解搜索引擎的工作原理;2.了解中英文搜索引擎的基本知识和种类; 3. 掌握中英文搜索引擎的初级检索与高级检索两种方式; 4. 分析和对比各种中英文搜索引擎的共性与区别; 5. 了解网络促销的主要方式二、实验内容: 1. 找网上的中英文搜索引擎,并列出5个中文搜索引擎和5个英文搜索引擎的名称; 2.掌握google、百度中高级搜索语法应用方法。 3. 用3个中文、2个英文搜索引擎对同一主题\同一检索词(关键词)进行检索,从检索效果分析得到的检索结果,并比较分析你所选择的搜索引擎的共性与区别。 4.了解网络促销的应用方式和网络广告促销的特点三、实验步骤 1. 搜索引擎的关键词检索(1)进入Google,熟悉并掌握以下功能:掌握Google 的网站检索功能,选取一些关键词在主页上使用“所有网页”检索网页,并通过使用运算符提高查准率;同时使用“高级检索”功能;掌握Google的图像检索功能;掌握Google的网上论坛功能;掌握Google的主题分类检索功能。(2)进入百度,熟悉并掌握Baidu各功能。搜索到至少两个专利介绍网站,并搜索一条关于手机防盗产品的专利技术,写出检索步骤并截图。 2. 搜索引擎的高级搜索语法应用(百度或谷歌) 3.浏览不同类型的网络广告。四、实验报告 1.进入Google,

搜索关键词“搜索引擎优化”,要求结果格式为Word格式;搜索关键词“电子商务”,但结果中不要出现“网络营销”字样;分别写出检索步骤并截图。 2. 精确匹配——双引号和书名号,分别加和不加双引号搜索“山东财经大学”,查看搜索结果。分别加和不加书名号搜索“围城”,查看搜索结果。 3. 搜索同时包含“山东财经大学”和“会计学院”的网页,并查看数量。 4.利用百度搜索两个专利介绍网站,并搜索一条关于手机防盗产品的专利技术,写出检索步骤并截图。 5.选择使用Google和百度,查询某商务信息(自定,如“海尔2012年销售额” )。要求写出:搜索引擎的名称、检索信息的主题、检索结果(列出前5个)。6.分析实验中所使用搜索引擎的优缺点。 7.比较说明中国和美国的网络广告发展情况。五.实验操作答案 1.(1)可以直接搜索word版的搜索引擎优化即可。如下图 (2)操作和上面差不多,看下图 2.不加引号搜索“山东财经大学”时,没有结果;而加引号时则有许多搜索结果。但是加不加引号搜索“围城”时,结果却是相同的。 3.大多为关于山东财经大学的信息,而会计学院则是属于山财的分支。 4. 1.进入

浙大《医学信息检索》模拟试卷2

浙江大学远程教育学院 《医学信息检索》模拟试题卷 一、名词解释(20分) 1.一次文献:通常是指原始创作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。 2.主题词:主题词:又称叙词(discriptor),其主要特点是采用的词语有较严格的限定。对一个概念的同义词、近义词及拼法变异词等进行“规范”,以保证词语与概念的一一对应,是典型的规范化语言。 3.目录:按照某种顺序编制的文献清单或清册,通常以一个完整的出版单位或收藏单位为著录的基本单位。 4.馆际互借:图书馆之间或图书馆与其他文献情报机构之间相互利用对方的文献资源来满足读者需求的一种服务形式。 5.期刊:具有相对固定的刊名、编辑机构及版式装帧的定期或不定期连续出版物。 二、选择题(包括单选和多选) 1.正式出版图书的版权页或其他部位标有一个国际标准书号,这是国际通行的出版物代码,具有唯一性和专指性。它的英文简称是( A )。 A.ISBN B. ISSN C. IBSN D. IBNS 2.以下哪个有关数据库结构的排列顺序是正确的?( B ) A. 字段>记录>文档>数据库 B. 数据库>文档>记录>字段 C. 数据库>字段>文档> 记录 D. 文档>数据库>记录>字段 3.请检索用利血平治疗高血压的医学文献,如利血平为主题词的话,副主题词应该是C 。 A.治疗 B. 药物疗法 C. 治疗应用 D. 药物作用 4.在中国生物医学文献光盘数据库中,要查李文的文献,正确的是( B )。 A.李文in au B. AU=李文 C. Li-W in au D. au=Li-W 5.下列文献类型哪些属于三次文献的范畴?(AD ) A.综述 B.索引 C. 期刊论文 D. 年鉴 6.下列检索途径中为根据内容特征进行检索的有:(BC ) A. 序号途径 B. 分类途径 C. 主题途径 D. 著者途径 7.MARC和OPAC属于哪种检索系统?( D ) A.文献检索系统 B. 事实检索系统 C.联机检索系统 D. 目录检索系统 8.在MEDLINE光盘检索中,“*”是 A 。 A..截词符号 B.多义词符号 C.近义词符号 D 同义词符号 9.机检时,用以下哪种算符可使文献检出结果增加 D 。 A.字段限定符 B. 位置算符 C.截词符 D. 布尔逻辑符OR 10.在WinSpirs MEDLINE的结果显示界面,点击下面哪个按钮可以浏览记录的所有字段?( B ) A.Brief Fields B. All Fields C. Search D. Options 11.通过主题途径检索有关肺癌的文献,以下哪个是正确的主题词:( C ) A. 肺癌 B.肺肉瘤 C. 肺肿瘤D.肺结核

各类搜索引擎的分类

各类搜索引擎的分类、特点、工作原理及代表 1,图片搜索引擎 图片搜索是通过搜索程序,向用户提供互联网上相关的图片资料的服务。 从所使用的技术上来分类,可分为: (1) 基于上下文本(context)的图片搜索,传统意义上图片搜索通常是通过Alt等锚来索引,搜索的,《浅谈图片搜索引擎的实现》中提出了跨越性的图片搜索的实现,具有很高的参考价值。如果这一设想可以实现,那将极大的改变人们的生活具有很高的参考价值。(2) 基于图片内容的搜索基于文本的图片搜索涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科,其相关技术主要包括:图像数据模型、特征提取方法、索引结构、相似性度量、查询表达模式、检索方法等。相似图片的检测主要涉及特征表示和相似性度量这两类关键技术。图像特征的提取与表达是基于内容的图像处理技术的基础。从广义上讲,图像的特征包括基于文本的特征(如关键字、注释等)和视觉特征(如颜色、纹理、形状等)两类。 2.全文索引 全文搜索引擎的代表是网络爬虫,网络爬虫是一个自动提取网页的程序,它为搜索引擎从Internet网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL 开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并放入等待抓取的URL队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页,并重复上述过程,直到达到系统的某一条件时停止。所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索;对于聚焦爬虫来说,这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导。 爬虫设计是否合理将直接影响它访问Web的效率,影响搜索数据库的质量,另外在设计爬虫时还必须考虑它对网络和被访问站点的影响,因为爬虫一般都运行在速度快,带宽高的主机上,如果它快速访问一个速度较慢的目标站点,可能导致该站点出现阻塞。Robot应遵守一些协议,以便被访问站点的管理员能够确定访问内容,Index是一个庞大的数据库,爬虫提取的网页将被放入到Index中建立索引,不同的搜索引擎会采取不同方式来建立索引,有的对整个HTML文件的所有单词都建立索引,有的只分析HTML文件的标题或前几段内容,还有的能处理HTML文件中的META标记或特殊标记。 3.目录索引 目录搜索引擎的数据库是依靠专职人员建立的,这些人员在访问了某个Web站点后撰写一段对该站点的描述,并根据站点的内容和性质将其归为一个预先分好的类别,把站点URL 和描述放在这个类别中,当用户查询某个关键词时,搜索软件只在这些描述中进行搜索。很多目录也接受用户提交的网站和描述,当目录的编辑人员认可该网站及描述后,就会将之添加到合适的类别中。 目录的结构为树形结构,首页提供了最基本的入口,用户可以逐级地向下访问,直至找到自己的类别,另外,用户也可以利用目录提供的搜索功能直接查找一个关键词。由于目录式搜索引擎只在保存了对站点的描述中搜索,因此站点本身的变化不会反映到搜索结果中,这也是目录式搜索引擎与基于Robot的搜索引擎之间的区别。分类目录在网络营销中的应用主要有下列特点: 通常只能收录网站首页(或者若干频道),而不能将大量网页都提交给分类目录;网站一旦被收录将在一定时期内保持稳定;无法通过"搜索引擎优化"等手段提高网站在分类目录中

医学文献检索试题及答案

医学文献检索题目及答案期刊联合目录最大的作用是为了让读者了解: 选项: a、同一种期刊的不同版本 b、期刊的收藏单位 c、期刊的出版年代 d、ISSN号 标准答案:b 情报的三个基本属性是: 选项: a、新颖性、知识性、传递性 b、知识性、传递性、效用性 c、科学性、知识性、实用性 d、新颖性、科学性、效用性 标准答案:b 提供原绐文献线索的检索工具有: 选项: a、期刊目录 b、二次文献数据库 c、参考文献 d、图书分类法 标准答案:b

文献检索中,主题语言是一类检索语言,以下哪一个不是检索语言。选项: a、高级语言 b、主题词语言 c、分类语言 d、关键词语言 标准答案:a 下列哪个不是一次文献。 选项: a、期刊论文 b、专利文献 c、综述 d、专题著述 标准答案:c 下列文献中属于一次文献的是: 选项: a、期刊论文 b、目录 c、综述 d、文摘 标准答案:a 医学文献只有经过哪一种处理,才能进入检索系统,提供使用。

a、编号 b、编排 c、标引 d、分类 标准答案:c 在A see B中,下列说法哪个是正确的。 选项: a、A是主题词 b、B是主题词 c、A、B都是主题词 d、A、B都不是主题词 标准答案:b 由美国国立医学图书馆创建医学文献分析与检索系统的英文缩写是:选项: a、MEDARS b、MEDLARS c、MEDARLS d、MELDARS 标准答案:b 在MEDLINE数据库检索中,要限定出版国别,应选用哪个字段? 选项:

b、CP c、PY d、CY 标准答案:b 下列检索方法中,查全率较高的是: 选项: a、追溯法 b、倒查法 c、顺查法 d、分段法 标准答案:c 下列哪一个是中医药学的副主题词: 选项: a、分离和提纯 b、生产和制备 c、预防和控制 d、供应和分配 标准答案:b 有关情报的形式需求,要明确关于文献检索,要明确的主要问题有:___、所需文献数量、文献语种、年代围、类型及作者,或其它外表特征。 选项:

搜索引擎的特性

网络信息搜索的主要策略和技巧 策略 网络信息检索策略设计应遵循快、准、全及低成本的原则,以实现检索策略最优化 1、明确检索目标,确定检索项 分析主题、使用布尔逻辑符等构造检索式 2、选择合适的检索系统 根据检索主题和检索系统的特点选择检索系统 3、正确对待检索结果 对漏检、错检、溢检、无检索结果的处理方式。 4、选择最佳上网时间 选择网速较快的时间段。 技巧 多数情况下,有一个好的搜索策略,能正确地应用布尔逻辑符,并熟悉每个搜索引擎的特性,就可得到一个好的检索结果。除此之外,在某些情况下还可用其他的一些技巧来改善检索结果。 1、扩大检索范围、提高查全率 2、缩小检索范围、提高查准率 3、Ctrl十F 用搜索引擎检索到所需文档并连接到相关网页后,有时会发现所要的文件并没有出现在当前视野中,这可能是因为文件存放在当前网页的底部。一个快捷的方法就是按“Ctrl十F”在当前页查找文件。 4、给检索结果作标签 避免再重复出现。 搜索引擎的相关知识 搜索引擎的分类 1、全文索引 搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与

用户查询条件相匹配的记录,按一定的排列顺序返回结果。 根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。 目录索引 虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo、新浪分类目录搜索。 目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定(也有例外)。 元搜索引擎 元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。 垂直搜索引擎 垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。 集合式搜索引擎 集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。 门户搜索引擎 门户搜索引擎:AOLSearch、MSNSearch等虽然提供搜索服务,但自身既没有分

相关主题
文本预览
相关文档 最新文档