【CN110188342A】一种基于知识图谱与语义图技术的口语理解方法【专利】
- 格式:pdf
- 大小:859.60 KB
- 文档页数:12
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910284590.8(22)申请日 2019.04.10(71)申请人 华侨大学地址 362000 福建省泉州市丰泽区城东城华北路269号(72)发明人 王华珍 朱可韵 李善邦 王煜琨 (74)专利代理机构 厦门市首创君合专利事务所有限公司 35204代理人 张松亭 李艾华(51)Int.Cl.G06F 16/36(2019.01)G06F 17/27(2006.01)G06N 3/04(2006.01)(54)发明名称一种基于知识图谱的对外汉语学习内容的构建方法(57)摘要本发明公开了一种基于知识图谱的对外汉语学习内容的构建方法,包括:面向对外汉语学习领域的概念集进行设计,强调概念及概念关系的形式表达;根据概念集针对对外汉语学习语料进行实体和关系抽取,以三元组的形式存储,从而得到最终的对外汉语学习知识图谱;对用户选中的对汉语词语实现关联知识智能推荐和关联知识多角度深层次推理展示。
基于对外汉语教学资源中的知识点挖掘和知识图谱构建,将帮助海外汉语学习者有效进行汉语词语学习,提升汉语学习词语练习的交互性、智能化和个性化。
权利要求书2页 说明书5页 附图1页CN 110008354 A 2019.07.12C N 110008354A权 利 要 求 书1/2页CN 110008354 A1.一种基于知识图谱的对外汉语学习内容的构建方法,其特征在于,包括以下步骤:S1,面向对外汉语学习领域的概念集进行设计,获得概念及概念关系的形式表达,包括:S11,借助通用知识图谱中与中文学习相关的分类信息纲目表来构建种子概念集合;S12,基于通用知识图谱从种子概念集合得到对应的实体,加入核心实体集合,核心实体集合为由种子概念下的实体所组成的集合;S13,扫描核心实体,产生不在种子概念集合中的概念,称作候选概念,加入候选概念集合;候选概念集合为由核心实体所属并且未出现在核心概念集合中的概念所组成的集合;S14,计算候选概念集合中候选概念与核心概念集合之间的语义相关性,所述核心概念集合是由与对外汉语学习领域密切相关的概念所组成的集合,由种子概念和与其相似性较大的概念组成;S15,将大于给定阈值的候选概念作为相关概念,加入核心概念集合中;S16,以迭代方式增量地扩展核心概念集合,直至没有新的概念产生,就得到全部的与对外汉语学习相关的概念集;S17,根据步骤S16获得的概念集进一步进行概念清洗,将通过计算概念的IDF值来删除掉通用但和对外汉语主题相关性不强的概念;S18,概念融合,将具有别名或者特殊称呼的指代概念进行概念对齐,将利用通用知识图谱的同义词映射表和知识库Infobox表中的同义词描述属性,将指代概念关联到核心概念集中;S19,基于Infobox的概念关系挖掘;检查知识库中的Infobox,如果核心概念集合中的概念落入Infobox,则将该Infobox中的概念以三元组形式进行抽取,并加入该概念层集合C;S2,根据概念集针对对外汉语学习语料进行实体和关系抽取,以三元组的形式存储,得到最终的对外汉语学习知识图谱,包括:S21,构建对外汉语语料;S22,使用自然语言处理的方法并结合中文分词识别实体,先从一个句子中找出“关系”的位置,然后分别向前、向后寻找最近的核心实体或者名词实体;S23,根据步骤S22获得的实体集进一步进行实体清洗,将通过计算实体的IDF值来删除掉通用但和对外汉语主题相关性不强的概念;S24,实体融合,将具有别名或者特殊称呼的指代实体进行实体对齐,将利用通用知识图谱的同义词映射表和知识库Infobox表中的同义词描述属性,将指代实体关联到实体集中;S25,将实体、关系和实体三元组加入实例层E中;所述实例层是根据概念层进行数据实例化的结果,由与对外汉语学习领域密切相关的三元组所组成;S26,将步骤S25得到的三元组存储在Neo4j图数据库中,形成对外汉语知识图谱;S3,对用户选中的对外汉语词语实现关联知识智能推荐和关联知识多角度深层次推理展示,包括:S31,接收用户选中的对外汉语文本;S32,提取知识图谱特征,额外地使用一个实体的上下文实体特征;2。
专利名称:一种基于知识图谱的科学语义理解方法专利类型:发明专利
发明人:李嘉
申请号:CN201910415884.X
申请日:20190519
公开号:CN111966833A
公开日:
20201120
专利内容由知识产权出版社提供
摘要:本发明涉及知识库技术领域,具体涉及一种基于知识图谱的科学语义理解方法,包括分布式知识图谱模块、分布式语义分析模块和信息展示模块;所述分布式知识图谱模块,用于将不同图谱进行特征提取,建立图谱唯一的特征提取数据库;所述分布式语义分析模块,与所述分布式知识图谱模块相耦合连接,用于从所述分布式知识图谱模块获取所述知识图谱的相关特征数据,对所获得的特征数据进行智能分析匹配,建立与唯一图谱相匹配的对应语义,将不同图谱对应的唯一语义数据进行匹配保存,形成图谱与语义对应的匹配数据库,方便数据调取和图谱语义识别展示。
本发明解决了图谱与语义之间的相互关联与理解转化关系,具有较好的实用价值及推广意义。
申请人:苏州嘉森华碧智能科技有限公司
地址:215000 江苏省苏州市工业园区星湖街328号创意产业园10-1F-16
国籍:CN
更多信息请下载全文后查看。
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910438018.2(22)申请日 2019.05.20(71)申请人 天津科技大学地址 300456 天津市经济技术开发区第十三大街9号天津科技大学计算机学院(72)发明人 王嫄 徐涛 胡文帅 吴帅 丁文强 赵婷婷 孔娜 (51)Int.Cl.G06F 16/332(2019.01)G06F 16/36(2019.01)G06F 40/295(2020.01)(54)发明名称一种基于词向量技术和知识图谱检索的短文本问答方法及装置(57)摘要本发明涉及一种基于词向量技术和知识图谱检索的短文本问答方法及装置,包括:对输入的自然语言短文本问题进行分词,得到分词后的文本;对该文本进行命名实体识别和词性标注,识别出实体以及关键词;知识图谱检索实体返回其对应的全部属性并与关键词一同进行向量化;对全部向量进行余弦相似度计算,找出与关键词最为相近的某属性,并进行替换;组成三元组进行知识图谱的检索,并输出答案。
如何快速准确的在知识图谱中进行短文本问题答案的检索是实际应用中的关键问题,本发明提出一种基于词向量技术和知识图谱检索的短文本问答方法及装置,该方法基于词向量技术,使得生成的三元组更加精确,从而提高在知识图谱中进行问题答案检索的效率。
权利要求书2页 说明书4页 附图1页CN 112052311 A 2020.12.08C N 112052311A1.一种基于词向量技术和知识图谱检索的短文本问答方法及装置,其特征在于包括以下步骤:步骤1:对输入的自然语言短文本问题进行分词,得到分词后的文本。
步骤2:从步骤1中得到的分词后的文本,对该文本进行命名实体识别和词性标注,识别出实体以及关键词。
步骤3:从步骤2中获得的实体,将该实体放入三元组中进行知识图谱检索提取,得到该实体对应的全部属性。
步骤4:从步骤3中获得的实体对应的全部属性,将其与步骤2中获得的关键词,均进行向量化操作,得到全部属性和关键词的向量。
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201811520770.3(22)申请日 2018.12.12(71)申请人 北京文因互联科技有限公司地址 100020 北京市朝阳区向军北里28号院圣世一品B5-6A(72)发明人 马建强 鲍捷 杜会芳 苏尚君 张白驹 张强 (74)专利代理机构 北京中企鸿阳知识产权代理事务所(普通合伙) 11487代理人 李文丽(51)Int.Cl.G06F 16/332(2019.01)G06F 16/36(2019.01)G06F 16/33(2019.01)G06F 16/951(2019.01)G06F 40/211(2020.01)G06F 40/242(2020.01)G06F 40/289(2020.01)G06F 40/30(2020.01)(54)发明名称一种基于知识图谱的智能问答方法及系统(57)摘要本发明提出了一种基于知识图谱的智能问答方法及系统,包括:爬取互联网上的各个行业领域的数据源,分别建立针对每个行业领域的知识图谱,将知识图谱存储在数据库中;接收用户输入的自然语言问句;采用采用字典匹配法或词频统计法进行分词操作对自然语言问句进行分词操作,提取得到自然语言问句中的一个或多个关键词;判断出该自然语言问句所属的行业领域,然后在数据库中选择对应领域的知识图谱,从该知识图谱中根据关键词进行检索,生成相应的检索结果。
本发明通过对自然语言问句的语义分析提取关键词,根据关键词首先锁定相关技术领域的知识图谱,再利用关键词进行检索,二次检索步骤可以大大提高检索精度和答案匹配度。
权利要求书2页 说明书5页 附图1页CN 111309877 A 2020.06.19C N 111309877A1.一种基于知识图谱的智能问答方法,其特征在于,包括如下步骤:步骤S1,爬取互联网上的各个行业领域的数据源,分别建立针对每个行业领域的知识图谱,将所述知识图谱存储在数据库中;步骤S2,接收用户输入的自然语言问句;步骤S3,采用字典匹配法或词频统计法进行分词操作对所述自然语言问句进行分词操作,提取得到所述自然语言问句中的一个或多个关键词;步骤S4,根据步骤S3中得到所述关键词判断出该自然语言问句所属的行业领域,然后在所述数据库中选择对应领域的知识图谱,从该知识图谱中根据所述关键词进行检索,生成相应的检索结果,对所述检索结果进行自然语义处理,作为答案输出并显示给用户。
基于知识图谱的自然语言理解与推理技术研究近年来,随着人工智能技术的快速发展,自然语言处理和语义分析正在变得越来越重要。
基于知识图谱的自然语言理解与推理技术是其中一个热门领域。
在本文中,我们将深入探讨这一技术的概念、应用、挑战和发展前景。
一、概念知识图谱是一种将实体、属性和关系以图谱的形式表现出来的知识表示方法。
自然语言理解与推理技术是一种基于自然语言的知识获取、知识组织和自动推理的方法。
基于知识图谱的自然语言理解与推理技术通过将自然语言转换为知识图谱中的实体、属性和关系,实现了自然语言和机器语言之间的统一。
二、应用基于知识图谱的自然语言理解和推理技术具有广泛的应用前景。
例如:1. 智能搜索:基于知识图谱的搜索引擎可以将用户输入的自然语言转换为知识图谱中的实体、属性和关系,从而提高搜索精确度。
2. 情感分析:基于知识图谱的情感分析能够自动识别并理解用户的情感,更好地回答用户的问题。
3. 语义问答:基于知识图谱的问答系统可以理解用户的自然语言,从而更好地回答用户的问题。
4. 聊天机器人:基于知识图谱的聊天机器人能够自动理解用户的自然语言,并基于知识图谱进行自动推理,从而更好地回答用户的问题。
5. 自然语言生成:基于知识图谱的自然语言生成技术能够根据知识图谱中的实体、属性和关系自动生成符合语法逻辑的自然语言文本。
三、挑战尽管基于知识图谱的自然语言理解和推理技术具有广泛的应用前景,但是其仍然面临着很多挑战,例如:1. 开放域问题:知识图谱中的实体和关系都是有限的,而现实世界中的实体和关系是无限的。
如何对知识图谱进行扩充和更新是基于知识图谱的自然语言理解和推理技术面临的一个重要挑战。
2. 数据质量问题:知识图谱中的数据质量直接影响了基于知识图谱的自然语言理解和推理技术的精度和可靠性。
如何处理知识图谱中出现的不准确、不完整或者不一致的数据是基于知识图谱的自然语言理解和推理技术面临的另一个挑战。
3. 时间效率问题:基于知识图谱的自然语言理解和推理技术需要处理大量的自然语言文本和知识图谱中的实体、属性和关系。
基于知识图谱的汉语语义理解技术研究汉语语义理解技术一直是自然语言处理领域的研究热点之一,而基于知识图谱的汉语语义理解技术则是近年来备受关注的一种方法。
本文将介绍基于知识图谱的汉语语义理解技术的研究现状、应用场景以及未来发展趋势。
一、基于知识图谱的汉语语义理解技术的研究现状知识图谱是一种将实体、概念、关系等信息构建成图谱的技术手段,它可以方便地表达和利用知识背景。
基于知识图谱的汉语语义理解技术便是将中文文本通过自然语言处理技术转化为知识图谱中的节点和边,利用知识图谱中的结构和语义关系对文本进行语义理解和推理。
当前,基于知识图谱的汉语语义理解技术主要有以下研究方向:1.知识图谱构建方向知识图谱构建是基于知识图谱的汉语语义理解技术的基础,它涉及到实体抽取、关系抽取、实体链接等多个领域的自然语言处理任务。
目前,国内外学术界和工业界均有着大量的知识图谱构建工作,如Google的Freebase、微软的Satori等。
2.知识图谱应用方向基于知识图谱的汉语语义理解技术的应用场景丰富多样,包括问答系统、智能客服、搜索引擎、语义分析等多个领域。
例如,在问答系统中,我们可以将自然语言问题转化为知识图谱中的查询语句,从而得到精准的答案。
在智能客服中,则可以利用知识图谱来进行用户问题分类和自动回答。
在搜索引擎中,知识图谱则可以用于实体识别和链接,提供更加智能化的搜索结果。
二、基于知识图谱的汉语语义理解技术的应用场景基于知识图谱的汉语语义理解技术已经应用于多个领域,下面我们将分别介绍其应用场景。
1.问答系统问答系统是一种通过自然语言进行询问的人机交互系统,基于知识图谱的汉语语义理解技术可以提高答案的准确性和速度。
例如,百度的“度秘”和阿里巴巴的“小蜜”等智能语音助手就是基于知识图谱构建的问答系统。
2.智能客服智能客服是一种通过智能化技术为客户提供自助服务和在线咨询的服务方式,基于知识图谱的汉语语义理解技术可以帮助智能客服更加高效地回答用户问题。
专利名称:基于知识图谱的保险语义理解方法、装置、设备及介质
专利类型:发明专利
发明人:段丹丹
申请号:CN202210042199.9
申请日:20220114
公开号:CN114372157A
公开日:
20220419
专利内容由知识产权出版社提供
摘要:本发明涉及数据分析的技术领域,公开了一种基于知识图谱的保险语义理解方法、装置、设备及介质。
所述方法包括:获取用户输入的关于保险领域的用户问题;根据预设的实体和意图联合抽取模型,识别出所述用户问题中的实体内容和用户意图;确认知识图谱中与所述实体内容链接的目标实体内容;根据识别到的实体内容和用户意图,将所述用户问题转换成结构化查询语句,并根据所述结构化查询语句从所述知识图谱中查询到与所述目标实体内容对应的用户答案;将与所述用户问题对应的用户答案反馈至所述用户。
本发明能够能够提升用户问题中的实体内容和用户意图的识别效率和准确率。
申请人:平安健康保险股份有限公司
地址:200000 上海市徐汇区凯滨路166号B座16楼
国籍:CN
代理机构:深圳众鼎专利商标代理事务所(普通合伙)
代理人:谭果林
更多信息请下载全文后查看。
基于知识图谱的网络用语语义分析研究基于知识图谱的网络用语语义分析研究摘要:随着互联网的迅猛发展,网络用语作为一种重要的沟通方式,已经成为社交媒体和网络社区中的独特语言形式。
然而,由于网络用语的变化快速且复杂,其存在大量的新词汇、俚语和含义的多样性,使得传统的自然语言处理技术无法有效应对。
本文基于知识图谱的网络用语语义分析研究,旨在利用知识图谱的优势,对网络用语的语义进行深入分析与挖掘,以提高网络用语的理解和应用效果。
1. 引言随着社交媒体和网络社区的兴起,网络用语在人们的日常交流中扮演着越来越重要的角色。
网络用语作为一种特殊的语言形式,具有快速变化和多样化的特点,往往包含着丰富的情感和文化内涵。
然而,由于网络用语的语义多样性和常见问题,传统的自然语言处理技术很难准确理解和处理网络用语。
为了解决这一问题,本文将基于知识图谱的方法来进行网络用语的语义分析研究。
2. 知识图谱介绍知识图谱是一种将数据组织成图结构的技术,用于表示实体之间的关系和属性。
它由实体、关系和属性三部分组成,可以用来表示丰富的知识和语义关联。
知识图谱的特点是信息结构化、语义明确和关系丰富,可以提供对复杂数据的准确理解和分析。
因此,利用知识图谱进行网络用语的语义分析,可以克服传统自然语言处理技术的局限性,提高网络用语的理解和应用效果。
3. 网络用语语义分析的挑战网络用语语义分析面临着许多挑战,包括词义消歧、新词识别、俚语理解和情感情绪分析等问题。
首先,网络用语中存在大量的新词汇和俚语,传统的词典和语料库很难准确理解其含义。
其次,网络用语的词义经常发生变化,同一个词在不同上下文中可能具有不同的含义。
此外,网络用语通常包含大量的表情符号和缩略语,需要结合上下文进行正确理解。
最后,网络用语往往充满了强烈的情感和文化内涵,需要进行情感情绪分析以准确理解其意义。
4. 基于知识图谱的网络用语语义分析方法本文提出了一种基于知识图谱的网络用语语义分析方法,包括数据预处理、实体识别与关系抽取、语义关联建模和情感情绪分析等步骤。
专利名称:一种基于知识表示学习技术的知识图谱问答方法专利类型:发明专利
发明人:蒋泽军,王丽芳,陆新宇,贺世昌,赵孟,李荣涵,刘志强,杜承烈,陈进朝,尤涛
申请号:CN202010776098.5
申请日:20200805
公开号:CN112100342A
公开日:
20201218
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于知识表示学习技术的知识图谱问答方法,使用该方法构建了一个主题检测模块和谓词预测模块。
当用户提出一个自然语言问句时,通过主题检测模块与谓词预测模块识别到自然语言问句中的主题与谓词,将主题与谓词输入到知识图谱中,自动进行查找并返回知识图谱支持的正确答案。
本发明方法可以准确表示知识图谱组件的语义信息,能够维护知识图谱的固有结构,同时具备处理用户提出新的自然语言问句的能力。
申请人:西北工业大学
地址:710072 陕西省西安市友谊西路127号
国籍:CN
代理机构:西北工业大学专利中心
代理人:金凤
更多信息请下载全文后查看。
专利名称:一种基于语义理解和知识图谱实现智能通讯的方法及装置
专利类型:发明专利
发明人:黄剑艇
申请号:CN201810235897.4
申请日:20180321
公开号:CN108400933A
公开日:
20180814
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于语义理解和知识图谱实现智能通讯的方法,包括以下步骤:S1、建立用户的知识图谱数据库;S2、当用户接收到通讯请求,且用户未接受该通讯请求时,用户授权通讯机器人接收通讯请求进行通信。
本发明还公开了基于语义理解和知识图谱实现智能通讯的装置。
本发明的技术方案有效地将即时通讯、语义理解以及知识图谱相结合,不仅可以满足传统的通讯方式,还可以实现用户不在线或者不方便进行通讯的情况下,通过通讯机器人进行通讯,可以更方便和高效的进行通讯,基于知识图谱和语义理解,可以智能匹配近似正确的应答信息,让通讯方式更便捷,提升通讯体验。
申请人:广东您好科技有限公司
地址:510000 广东省广州市越秀区烟雨路24号1-5楼部分(部位:401之一)
国籍:CN
代理机构:成都顶峰专利事务所(普通合伙)
代理人:李永生
更多信息请下载全文后查看。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910315854.1
(22)申请日 2019.04.19
(71)申请人 杭州电子科技大学
地址 310018 浙江省杭州市下沙高教园区2
号大街
(72)发明人 姜明 滕海滨 张旻 汤景凡
戚铖杰 张雯
(74)专利代理机构 杭州君度专利代理事务所
(特殊普通合伙) 33240
代理人 朱月芬
(51)Int.Cl.
G06F 17/27(2006.01)
G06F 16/36(2019.01)
G06F 16/35(2019.01)
(54)发明名称一种基于知识图谱与语义图技术的口语理解方法(57)摘要本发明公开了一种基于知识图谱与语义图技术进行口语理解的方法。
本发明步骤:1.训练序列到动作序列神经网络模型,训练基于句子和句子逻辑表达式的口语理解神经网络;2.读取需要被解析的自然语言句子;3.使用文本映射算法扫描并替换句子中与知识图谱中语义资源相匹配的部分;4.使用序列到动作序列神经网络模型读取替换了语义资源后的句子,然后执行对应的动作序列生成与句子语义相符的语义图,然后使用深度优先算法遍历语义图得到句子的逻辑表达式;5.使用口语理解神经网络读入句子和逻辑表达式,生成意图信息和槽位信息。
本发明提出结合知识图谱和理解句子语义的方法进行口语
解析。
权利要求书3页 说明书6页 附图2页CN 110188342 A 2019.08.30
C N 110188342
A
1.一种基于知识图谱与语义图技术的口语理解方法,其特征在于包括以下步骤:
步骤1、训练序列到动作序列神经网络模型,训练基于句子和句子逻辑表达式的口语理解神经网络;
步骤2、读取需要被解析的自然语言句子;
步骤3、使用文本映射算法扫描并替换句子中与知识图谱中语义资源相匹配的部分;步骤4、使用序列到动作序列神经网络模型读取替换了语义资源后的句子,然后执行对应的动作序列生成与句子语义相符的语义图,然后使用深度优先算法遍历语义图得到句子的逻辑表达式;
步骤5、使用口语理解神经网络读入句子和逻辑表达式,生成意图信息和槽位信息。
2.根据权利要求1所述的一种基于知识图谱与语义图技术的口语理解方法,其特征在于步骤(1)中训练的序列到动作序列神经网络模型,包括如下步骤:
1-1.整理出已有的句子与逻辑表达式的关系作为样本集;
1-2.解析句子逻辑表达式生成语义图,对语义图进行深度优先搜索生成构造语义图的动作序列;
1-3.将句子本身与逻辑表达式生成的动作序列做对应,生成一个新的样本集;
1-4.将句子与动作序列的样本集,分割为比例为9:1作为训练集与测试集;训练集送入一个序列到序列的神经网络模型中,通过梯度下降算法调整模型参数,使得模型在测试集中的测试结果达到最优;
步骤(1)中所述的口语理解神经网络,包括如下步骤:
(1-1)整理已有句子的逻辑表达式与句子的意图信息和槽位信息做对应,整理为样本集;
(1-2)同样将样本集分割为9:1作为训练集与测试集;
(1-3)使用口语理解神经网络在训练集中进行学习,然后在测试集中测试结果;调整参数使用梯度下降法,使得最终槽位信息和意图信息达到尽可能准确。
3.根据权利要求1或2所述的一种基于知识图谱与语义图技术的口语理解方法,步骤
(1)或(5)中的口语理解模型,其特征在于,构建一个编码器、解码器结构的循环神经网络,具体如下:
①使用LSTM作为神经网络中的单元;
②编码器结构满足:
h i =LSTM(φ(x)(x i ),h i -1) (1)
其中,h i 表示对应于输入词语x i 的隐藏层状态,LSTM指长短时记忆网络的状态转移方程;φ(x)(x i )表示对于输入词语x i 映射到词向量;
③
解码器结构满足:
权 利 要 求 书1/3页2CN 110188342 A。