基于进化算法的本体匹配技术(英文版)(薛醒思,陈俊风,潘正祥著)思维导图
- 格式:xmin
- 大小:4.31 KB
- 文档页数:1
本体概念匹配技术的研究与实现
本体概念匹配技术是指通过对概念进行语义分析和语义匹配,实现对不同本体中相似或相同概念的匹配。
其研究与实现主要包括以下几个步骤:
1. 本体构建:首先需要构建本体,即建立概念之间的关系、属性和语义等信息。
可以利用本体建模语言,如OWL (Ontology Web Language)或RDF(Resource Description Framework)来描述本体。
2. 语义分析:对于给定的本体,需要对概念进行语义分析,从而抽取出概念的语义特征。
可以利用自然语言处理技术,如词频统计、词语关联性分析等方法来进行语义分析。
3. 语义匹配:根据语义分析的结果,可以通过计算概念之间的相似度来实现语义匹配。
常用的相似度计算方法包括语义距离计算、基于语义路径的匹配等。
4. 匹配算法:根据相似度计算结果,可以采用不同的匹配算法来实现概念匹配。
常见的匹配算法有基于规则的匹配算法、基于统计学的匹配算法等。
5. 实验评估:对于实现的本体概念匹配技术,需要进行实验评估,验证其效果和性能。
可以利用已有的本体库进行实验,对匹配结果进行比对和评估。
总的来说,本体概念匹配技术的研究与实现主要包括本体构建、
语义分析、语义匹配、匹配算法和实验评估等步骤。
通过这些步骤的组合,可以实现对不同本体中相似或相同概念的匹配,从而提高信息检索、数据集成和语义推理等应用的效果和效率。
第 54 卷第 8 期2023 年 8 月中南大学学报(自然科学版)Journal of Central South University (Science and Technology)V ol.54 No.8Aug. 2023基于知识图谱使用多特征语义融合的文档对匹配陈毅波1,张祖平2,黄鑫1,向行1,何智强1(1. 国网湖南省电力有限公司,湖南 长沙,410004;2. 中南大学 计算机学院,湖南 长沙,410083)摘要:为了区分文档间的同源性和异质性,首先,提出一种多特征语义融合模型(Multi-Feature Semantic Fusion Model ,MFSFM)来捕获文档关键字,它采用语义增强的多特征表示法来表示实体,并在多卷积混合残差CNN 模块中引入局部注意力机制以提高实体边界信息的敏感性;然后,通过对文档构建一个关键字共现图,并应用社区检测算法检测概念进而表示文档,从而匹配文档对;最后,建立两个多特征文档数据集,以验证所提出的基于MFSFM 的匹配方法的可行性,每一个数据集都包含约500份真实的科技项目可行性报告。
研究结果表明:本文所提出的模型在CNSR 和CNSI 数据集上的分类精度分别提高了13.67%和15.83%,同时可以实现快速收敛。
关键词:文档对匹配;多特征语义融合;知识图谱;概念图中图分类号:TP391 文献标志码:A 文章编号:1672-7207(2023)08-3122-10Matching document pairs using multi-feature semantic fusionbased on knowledge graphCHEN Yibo 1, ZHANG Zuping 2, HUANG Xin 1, XIANG Xing 1, HE Zhiqiang 1(1. State Grid Hunan Electric Power Company Limited, Changsha 410004, China;2. School of Computer Science and Engineering, Central South University, Changsha 410083, China)Abstract: To distinguish the homogeneity and heterogeneity among documents, a Multi-Feature Semantic Fusion Model(MFSFM) was firstly proposed to capture document keywords, which employed a semantically enhanced multi-feature representation to depict entities. A local attention mechanism in the multi-convolutional mixed residual CNN module was introduced to enhance sensitivity to entity boundary information. Secondly, a keyword co-occurrence graph for documents was constructed and a community detection algorithm was applied to represent收稿日期: 2022 −05 −15; 修回日期: 2022 −09 −09基金项目(Foundation item):湖南省电力物联网重点实验室项目(2019TP1016);电力知识图谱关键技术研究项目(5216A6200037);国家自然科学基金资助项目(72061147004);湖南省自然科学基金资助项目( 2021JJ30055) (Project (2019TP1016) supported by Hunan Key Laboratory for Internet of Things in Electricity; Project(5216A6200037) supported by key Technologies of Power Knowledge Graph; Project(72061147004) supported by the National Natural Science Foundation of China; Project(2021JJ30055) supported by the Natural Science Foundation of Hunan Province)通信作者:张祖平,博士,教授,从事大数据分析与处理研究;E-mail :***************.cnDOI: 10.11817/j.issn.1672-7207.2023.08.016引用格式: 陈毅波, 张祖平, 黄鑫, 等. 基于知识图谱使用多特征语义融合的文档对匹配[J]. 中南大学学报(自然科学版), 2023, 54(8): 3122−3131.Citation: CHEN Yibo, ZHANG Zuping, HUANG Xin, et al. Matching document pairs using multi-feature semantic fusion based on knowledge graph[J]. Journal of Central South University(Science and Technology), 2023, 54(8): 3122−3131.第 8 期陈毅波,等:基于知识图谱使用多特征语义融合的文档对匹配concepts, thus facilitating document was matching. Finally, two multi-feature document datasets were established to validate the feasibility of the proposed MFSFM-based matching approach, with each dataset comprising approximately 500 real feasibility reports of scientific and technological projects. The results indicate that the proposed model achieves an increase in classification accuracy of 13.67% and 15.83% on the CNSR and CNSI datasets, respectively, and demonstrates rapid convergence.Key words: document pairs matching; multi-feature semantic fusion; knowledge graph; concept graph识别文档对的关系是一项自然语言理解任务,也是文档查重和文档搜索工作必不可少的步骤。
图表目录图1知识工程发展历程 (3)图2 Knowledge Graph知识图谱 (9)图3知识图谱细分领域学者选取流程图 (10)图4基于离散符号的知识表示与基于连续向量的知识表示 (11)图5知识表示与建模领域全球知名学者分布图 (13)图6知识表示与建模领域全球知名学者国家分布统计 (13)图7知识表示与建模领域中国知名学者分布图 (14)图8知识表示与建模领域各国知名学者迁徙图 (14)图9知识表示与建模领域全球知名学者h-index分布图 (15)图10知识获取领域全球知名学者分布图 (23)图11知识获取领域全球知名学者分布统计 (23)图12知识获取领域中国知名学者分布图 (23)图13知识获取领域各国知名学者迁徙图 (24)图14知识获取领域全球知名学者h-index分布图 (24)图15 语义集成的常见流程 (29)图16知识融合领域全球知名学者分布图 (31)图17知识融合领域全球知名学者分布统计 (31)图18知识融合领域中国知名学者分布图 (31)图19知识融合领域各国知名学者迁徙图 (32)图20知识融合领域全球知名学者h-index分布图 (32)图21知识查询与推理领域全球知名学者分布图 (39)图22知识查询与推理领域全球知名学者分布统计 (39)图23知识查询与推理领域中国知名学者分布图 (39)图24知识表示与推理领域各国知名学者迁徙图 (40)图25知识查询与推理领域全球知名学者h-index分布图 (40)图26知识应用领域全球知名学者分布图 (46)图27知识应用领域全球知名学者分布统计 (46)图28知识应用领域中国知名学者分布图 (47)图29知识应用领域各国知名学者迁徙图 (47)图30知识应用领域全球知名学者h-index分布图 (48)图31行业知识图谱应用 (68)图32电商图谱Schema (69)图33大英博物院语义搜索 (70)图34异常关联挖掘 (70)图35最终控制人分析 (71)图36企业社交图谱 (71)图37智能问答 (72)图38生物医疗 (72)图39知识图谱领域近期热度 (75)图40知识图谱领域全局热度 (75)表1知识图谱领域顶级学术会议列表 (10)表2 知识图谱引用量前十论文 (56)表3常识知识库型指示图 (67)摘要知识图谱(Knowledge Graph)是人工智能重要分支知识工程在大数据环境中的成功应用,知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。
本体的相似性网络推理框架文贵华;江丽君【期刊名称】《东南大学学报(英文版)》【年(卷),期】2006(022)003【摘要】To properly compute the ontological similarity,an ontological similarity network-based reasoning framework is proposed.It structurally integrates extension-based approach,intension-based approach,the similarity network-based reasoning to exploit the implicit similarity,and the feedback from the context to validate the similarity measures.A new similarity measure is also presented to construct concept similarity network,which scales the similarity using the relative depth of the least common super-concept between any two concepts.Subsequently, the graph theory, instead of predefined knowledge rules, is applied to perform the similarity network-based reasoning such that the knowledge acquisition can be avoided.The framework has been applied to text categorization and visualization of high dimensional data.Theory analysis and the experimental results validate the proposed framework.%为了更恰当地计算本体相似性,提出了一种本体的相似性网络推理的集成框架.该框架集成了基于外延的方法,基于内涵的方法,计算间接相似的相似性网络推理,和检验相似性测度有效性的环境反馈.同时,提出了一种用于构造概念相似性网络的新测度,相似性网络上的推理则采用图论实现而不是预定义知识规则,这样可免去知识获取的困难.框架已经应用于文本分类和高维数据的可视化,理论分析和实验验证了相似性网络推理框架的有效性.【总页数】5页(P394-398)【作者】文贵华;江丽君【作者单位】华南理工大学计算机科学与工程学院,广州,510641;华南理工大学计算机科学与工程学院,广州,510641【正文语种】中文【中图分类】TP3因版权原因,仅展示原文概要,查看原文内容请购买。