医学一体化语言系统UMLS
- 格式:ppt
- 大小:1.40 MB
- 文档页数:52
一、名词解释(20分,每题4分)1、标准文献:是标准化工作的产物,是一种具有约束力的法律文献,同时也是生产和科研的共同依据。
2、科技期刊属于周期性出版物,具有品种多、数量大、报道速度快、内容新颖、能及时反映当前科技水平的特点。
科技期刊是人们传递科技信息,交流学术思想使用的最基本、最广泛的手段。
是一类重要的文献源。
3、信息的存储就是将搜集到的一次信息,经过着录其特征而形成的款目,并将这些款目组织起来成为二次信息的过程。
4、:中国法是一部等级体系分类法,按照从一般到具体、从简单到复杂的原则,进行划分和概括,形成了一个秩序井然、层层展开的概论等级体系。
5、文献工整理将大量分散的、无序的原文文献加以帅选,加工整理,按文献特征进行提炼、浓缩、简化、编译成系统的工具性文献。
如文摘、索引、书目。
填空(30分,每空1分)二、1. 获取原文的途径有以下四种:通过期刊主办机构或出版机构网站获取原文、通过搜索引擎获取原文、通过全文数据库获取原文和通过免费电子期刊网站获取原文。
2. 科研论文文题的构成要素有: 明确研究对象、突出研究目的、标明研究方法和阐述主要贡献3. 论文的正文包括五大部分:前言、方法、参考文献、结果和讨论。
4. 文献按载体可划分为:印刷型文献、缩微型文献、机读型文献、实物型文献、声像型文献。
5.期刊的文献特征有:刊名和编辑单位不变、定期出版,多为双月刊、有连续编号、一般不再版和重印6. CNKI数字图书馆提供多种检索途径:导航检索、主题词检索、二次检索、检索途径、高级检索。
7. 存储信息的主要形式为文献。
8. 记录知识或信息的物质载体叫文献。
三、单项选择题(请将正确答案的序号填在括号内,每题2分,共20分)BADCC CBCCB ACCCA1. 广义的信息检索包含两个过程()A 检索与利用B 存储与检索C 存储与利用D 检索与报道2. 下列哪种文献属于一次文献( )A 科技报告B 百科全书C 综述D 文摘3. 下列哪种文献属于二次文献( )A 专利文献B 学位论文C 会议文献D 索引4. 下列哪种文献属于三次文献( )A 标准文献B 学位论文C 数据手册D 文摘5. 少量载有某一学科大量有关文献的叫()A 科技图书B 科技期刊C 核心期刊D 科技报告6. 以下作为检索工具的是()A 零次文献B 一次文献C 二次文献D 三次文献7. 系统化了的信息叫()A 情报B 知识C 载体D 文献8. 以下作为检索对象的是()A 零次文献B 一次文献C 二次文献D 三次文献9. 以下作为情报研究成果的是()A 零次文献B 一次文献C 二次文献D 三次文献10. 广义的信息检索包含两个过程()A 检索与利用B 存储与检索C 存储与利用D 检索与报道11. 国际标准书号定长为()位数字A 10B 12C 8D 912. 期刊论文记录中的“文献出处”字段是指:()A 论文的整理B 论文整理的工作单位C 刊载论文的期刊名称及年卷期、起止页码D 收录论文的数据库13. 按执行功能分,下列不属于标准文献的是:()A 强制性标准文献B 一般性标准文献C 基础标准文献D 推荐标准文献14. 以下检索出文献最少的检索式是()A a and bB a and b or cC a and b and cD (a or b) and c15. 《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索数理科学方面的图书,需要在()类目下查找。
国外常用医学搜索引擎介绍1.Medical Matrix医源/Index.aspMedical Matrix 是一种由概念驱动的免费全文智能检索工具,包括4600多个医学网址,1994年由堪萨斯大学创建,现由美国Medical Matrix LLC主持,是目前最重要的医学专业搜索引擎。
它是一个可免费进入的I nternet临床医学数据库,提供了关键词搜索和分类目录搜索,最适合临床医师使用。
分类目录搜索是它的主要特色,按各种医学信息分为专业(Specialties)、疾病种类(Diseases)、临床实践(Clinical Practic e)、文献(Literature)、教育(Education)、健康和职业(Healthcare and Professionals)、医学计算机和Inter net技术(Medical Computing,Internet and Technology)、市场(Marketplace)等8大类。
每一大类下再根据内容的性质分为新闻(News)、全文和多媒体(Full Text/Multi-Media)、摘要(Abstracts)、参考书(Textbook s)、主要网址(Major Sites/Home Pages)、操作手册(Procedures)、实用指南(Practice Guidelines/FAQS)、病例(Cases)、影像学和病理切片(Images、Path/Clinical)、患者教育(Patient Education)、教育资源(Educ ational Materials)等亚类。
2.Medscape(医景,)/美国公司Medscape公司1994年研制,1995年6月投入使用,由功能强大的通用搜索引擎AltaVista支持,可检索图像、声频、视频资料,至今共收藏了近20个临床学科25000多篇全文文献,拥有会员50多万人,临床医生12万人。
医学知识推理研究现状与发展知识表示是为描述世界所做的一组约定,是知识符号化、形式化、模式化的过程,主要研究计算机存储知识的方法,其表示方式影响系统的知识获取、存储及运用的效率。
然而医学数据种类繁杂,存储方式不一,电子病历格式和标准不同,经常涉及交叉领域等特点,导致医学领域与其他领域在知识表示方面有所差异,同时也给医学领域的知识表示带来极大的挑战。
早期医疗知识库运用的知识表示方法有:谓词逻辑表示法,产生式表示法,框架表示法,语义网表示法等等。
比如,SNOMED-CT,早期的MYCIN 系统,大肠杆菌数据库EcoCyc等。
随着知识图谱中知识增长、关系复杂化,这些方法由于表示能力有限且缺乏灵活性,不再作为主要的知识表示方法,更多是作为医学知识表示的辅助或补充。
本体表示法以网络的形式表示知识,即以(实体1,关系,实体2)三元组来表示相关联的两个节点(实体),在知识图谱提出之后逐渐得到认可。
它借鉴了语义网表示法但又有所区别:本体关注的是实体固有特征,比后者更聚焦,更深入,因而也具有更大的发展潜力。
而本体的描述语言也多种多样:主要有RDF和RDF-S、DAML、OWL等。
使用本体表示医学术语可以提升数据整合能力:建立强大、可互操作的医疗信息系统;满足重用共享传输医疗数据的需求;提供基于不同语义标准的统计聚合。
医学领域本体的构建,需要深入分析医学术语的结构和概念,才能将晦涩甚至是跨语言的医学知识有效地表达出来。
目前的医学知识本体库有:医学概念知识库LinkBase,TAMBIS本体库(TaO)等等。
知识图谱的节点个数影响着网络的结构复杂度及推理的效率和难度。
知识表示学习借助机器学习,将研究对象的语义信息表示为稠密低维向量,有效解决数据稀疏问题,从而提升知识融合和推理性能[。
低维向量表示是一种分布式表示(distributed representation),它模仿人脑中使用多个神经元存储对象的工作机制,使用多维度向量表示对象的语义信息。
医疗数据中的关键信息提取技术综述医疗数据中的关键信息提取技术综述随着医疗领域的快速发展,医疗数据的规模和复杂性也在不断增加。
在这些庞大的医疗数据中,往往包含着丰富的各种疾病信息、患者病史以及医疗资源等重要的关键信息。
为了更好地利用这些信息,医疗数据中的关键信息提取技术应运而生。
关键信息提取是指从文本数据中自动抽取关键信息或实体的过程。
对于医疗数据而言,关键信息提取可用于识别疾病名称、病人信息、医疗术语等有意义的实体。
通过关键信息提取,可以提高医疗数据的可用性和价值,为医疗决策和研究提供了重要的支持。
医疗数据中的关键信息提取技术可以分为两类:基于机器学习的方法和基于规则的方法。
基于机器学习的方法使用训练数据集来训练模型,然后使用该模型对新的数据进行分类或抽取。
这些方法通常涉及特征选择、特征表示和分类器设计等步骤。
目前较为常见的机器学习方法包括支持向量机(SVM)、朴素贝叶斯(Naive Bayes)和深度学习等。
基于规则的方法则通过人工定义一系列规则来进行信息抽取。
这些规则通常基于医学领域的专业知识和语义规则。
例如,可以通过正则表达式或模式匹配的方式来识别特定的医疗术语或实体。
基于规则的方法具有较高的准确性和可解释性,但对于复杂的数据结构和文本语义的理解能力有限。
此外,还有一些混合方法结合了机器学习和规则的优点。
比如,可以使用机器学习方法训练一个分类器来区分不同的实体类型,然后使用规则来进一步限定提取的结果。
这样可以在一定程度上提高关键信息提取的准确性和效率。
除了提取关键信息,医疗数据中的关键信息提取技术还需要考虑数据的隐私和安全。
医疗数据是敏感的个人信息,因此在处理医疗数据时需要遵守相关的法律法规,确保数据的隐私和安全。
一些方法如数据脱敏和数据加密等可以用于保护医疗数据的隐私。
综上所述,医疗数据中的关键信息提取技术是一项重要的研究课题。
通过提取医疗数据中的关键信息,可以帮助医生和研究人员更好地理解疾病信息和患者病史,从而改善医疗决策和研究。