当前位置:文档之家› 基于ontology的自然语言理解

基于ontology的自然语言理解

基于ontology的自然语言理解
基于ontology的自然语言理解

收稿日期:2003-04-07

作者简介:潘宇斌(1971)),男,福建人,工程师,研究方向:人工智能。

文章编号:1003-6199(2003)04-071-04

基于Ontology 的自然语言理解

潘宇斌,陈跃新

(国防科技大学计算机科学与工程学院,长沙 410073)

摘 要:本文分析传统意义上基于知识的自然语言理解(KB-NLU )和基于Ontolog y 的自然语言理解系统的基本模型,Ontology 是概念化的描述,以及Ontolog y 与语言知识的结合方式的三种类型:世界知识型、词汇语义型、句法语义型。

关键词:KB-NLU;Ontology;世界知识型;词汇语义型;句法语义型中图分类号: T P31 文献标识码:A

Ontology -Based Natural Language Understand

PAN Yu -bin,CH EN Yue -xin

(College of Computer Science and Engineering,National U niv.of Defense T echnolo gy,Changsha 410073)

Abstract:In this paper,w e analy ze the base model in the area of Knowledge -Based Natural Languag e Un -derstand (KB -NLU )and Ontolog y -Based Natural Language Understand.Ontology is a conceptual descrip -tion.In terms of their relationship w ith the natural language,this paper divides the different Ontolog ies into three ty pes,i.e.world know ledge,lexical semantics one and syntax semantics one.

Key words:KB-NLU ;Ontology;w orld knowledg e;lexical semantics;sy ntax semantics

1 引言

自然语言理解把用自然语言描述的一个受限世界(关于该世界的事实和假设),变换为用机器内部的表示法描述的一个世界模型。这个世界模型用作问题求解器的知识库,来求解各种问题。本文讨论了基于知识的自然语言理解(KB-NLU )[1]的一个新的研究方向)))以本体(Ontology)作为知识体进行自然语言理解。

Ontology 在哲学上是指/世界的本原0[2]

,它所要回答的问题是/所有事物的通用属性是什么?0。在知识工程领域,Ontology 本身作为知识实体是系统的知识库,它是由概念以及概念之间的联系所构成的知识实体,是对世界或者领域知识的概念化描述。本文主要介绍Ontolog y 作为一个知识体,结

合语言学知识,进行自然语言理解,即基于Ontolo -g y 的自然语言理解。

基于Ontology 的自然语言理解的主要任务是利用系统所拥有的知识,提取出文本的意义。它需要解决的问题是:Ontology 如何定义;对文本进行各个层面上的消歧;对文本的推理。本文将就以上问题解决方案进行阐述。

2 Ontology 的定义

2.1 Ontology 的概念

Ontology 可以作为对某个领域的描述词典。它和作为约定的Ontology 没有明显的区分,但是它的重点不是为了共享,而是为了建立起一个领域的概念化说明。从而,它作为领域的论域,所有的知识都是在它的基础之上建立的。

第22卷第4期2003年12月

计 算 技 术 与 自 动 化Computing T echnology and Automatio n

Vol 122,No 14 Dec 12003

Ontology 本身作为知识体(Body of Know -l

edge),这一般是应用到常识知识库中。常识知识库如CYC,利用上面所说的作为领域的描述词典的Ontology 作为基元,建立起关于世界的多个领域的常识知识。而这些常识知识可以作为其他知识系统的知识体。

实际上,这些定义都是很接近的,主要是应用的重点不同。它们都是作为知识的一种表示方法并且可以用来帮助知识系统组织知识。

2.2 基于Ontology 的自然语言处理系统的基本

模型

图1 基于Ontolog y 的基本模型

图1是基于Ontology 的自然语言处理系统的基本模型,语言学的知识包括词汇级、句法级、篇章级等不同层次的知识,在目前的应用Ontolog y 的研究中主要是考虑词汇级和句法级的知识。2.3 Ontology 的分类

根据Ontolog y 与语言知识的结合方式,我们把Ontology 分为三种类型:世界知识型、词汇语义型、句法语义型,它们在建立以及应用于NLU 的过程中都有不同的特征:

A.世界知识型:系统中Ontolog y 的知识的建立不考虑和语言知识的关系,仅仅是对世界知识的描述,在对源文本进行分析的时候,需要加上其它的语言知识接口,如美国T exas 公司CYC [3]

和中

科院盘古系统[9];

世界知识型Ontology 并不是以自然语言处理为唯一目标的,它为智能系统提供必要的世界知识。因此在建立的时候不必考虑和自然语言的结合,仅仅是建立人类对世界或者领域知识的理解和描述。

CYC 是由美国Tex as 的微电子和计算机技术公司开发的一个多语境的大型常识知识库以及推理引擎。到1994年,CYC 已经收集了有约40万条断言,其中包含各种事实与规则,它们是针对普通人的常识。CYC 包含了多个领域的知识,用微

理论(M icrotheory )表示,大约有500个微理论,所有的断言都连接到某个微理论。CYC 中的断言是由其中的常量和变量构成的,常量就是CYC 的基本概念。

/盘古系统0是中科院数学所承担的国家自然科学重点基金项目/常识知识的使用研究0。和CYC 比较,主要特点是它的常识的表示和组织方式。/盘古0是用Agent 和本体来组织常识的,A -gent 负责纵向结构,而本体用来组织各Agent 的横向联系。常识性知识就分布在Agent 个体以及体现Agent 的各种联系的本体中。而且,不仅包含静态知识,而且对常识的使用知识也分布在Agent 和本体中。Agent 能够对自身进行推理,具有主动性,而Agent 之间的推理知识包含在本体中。典型的,这类知识库包含的是常识知识,不仅拥有对多个领域的概念化描述,还包含了推理知识。因此,它们可以应用于自然语言处理的消歧和推理,但是需要加上和语言知识的接口。

B.词汇语义型(Lex ical Semantics):Ontolog y 与词典结合,在建立的过程中需要考虑概念和词汇的关系,分析文本时两者结合进行消歧和推理,如WordNet [4],M ikrokosmos [5,6]等;

词汇语义型Ontology 是与自然语言的词典结合,KB-NLU 系统一般把Ontology 与词典分成两个不同的知识体,词典内的词条映射到Ontolog y 中的概念,在建立的时候需要在两者之间交互。这种方法使得Ontolog y 能够独立于语言,从而更好的重用;而且使得词典和Ontolog y 的获取分离,减轻了开发负担。

这类Ontolog y 一般是特定领域的,仅仅包含了领域知识内的概念以及概念之间的关系,而把其它的实例化知识放在其它的知识库内,比如专有名称词典。此外,Ontology 中不包含推理知识,推理蕴涵在系统的推理机制中。

在分析源文本的时候,词典作为文本与Onto-l ogy 的接口,从词映射到概念,再利用概念所含有的约束进行消歧和推理。如果把系统看作是一个搜索系统,Ontolog y 构成搜索空间,概念间的约束知识作为启发式信息指导剪枝和搜索的进行。在推理的过程中,系统计算概念之间的距离,搜索出一条符合约束的最短距离。

具体的应用中,系统对词典和Ontology 的侧重点不同。例如在WordNet 中偏重于词典的建设,从英语词汇中形成概念,利用同义词集(synset)表示概念,并根据心理语言学理论中人类的记忆模

72计算技术与自动化2003年12月

型,把这些概念划分成不同的组织结构。其中名词型的概念形成了层次结构,而动词型的概念是一个语义网。WordNet中词汇与概念交织在一起,在建立的时候比较复杂;而且由于它的本意是为了建立一个在线词典,它所包含的概念并不是考虑如何组织一个领域的知识,因此它本质上是一个带语义信息的词典,这削弱了它的文本分析能力。

C.句法语义型(Syntax Semantics):Ontolog y 与句法级知识结合,建立过程中可以利用句法知识从语料中获取概念。分析文本时,需要结合词典,但是侧重句法级的语义分析,如GUM[7]。

句法语义型Ontology结合了自然语言的句法知识,它的典型代表是GUM。GUM(Generalized U pper Model)是由GM D/IPSI建造的多语言文本生成环境(KOMET-PENMAN)使用的Ontology。GUM的建立是以系统功能语言学为理论依据的,该理论把语言作为一种资源,认为语言主要有两种功能:一是作为交际功能;一是用于描述世界,存储世界知识。因此,语言的形式)))文本和语义的联系不是随意的,文本的组织也决定了知识的组织。

GUM的基本思想是,根据语言组织知识的方式,抽象出它们的句法模式;并对这些模式的功能组成元素不断的抽象,形成基本元素概念。句法模式和元素概念构成了上层概念模型(Upper Mod-el)。上层模型的概念是独立于领域和任务的,作为领域概念的基础。利用相同的抽象方法,可以获取领域中的概念。

3Ontology解决自然语言理解中的消歧、推理问题

Ontology是对世界知识概念化描述,它作为KB-NLP系统中的知识库,是由概念集合以及概念之间的关系所组成的计算实体。其中的概念描述世界中的某一类事物或者事件、过程等,而概念间的关系描述了事物、事件或者过程之间的关系。

Ontology中的概念一般采用框架结构,使用槽来表示概念的属性,以及概念之间的关系。概念之间的关系使得Ontology在整体上形成了一个语义网,其中所含的基本的结构的是层次结构和事件结构。层次结构是由概念中的IS-A属性所实现的,描述概念之间的继承关系;而事件结构是和时间有关的,由参与事件的各组成概念而构成的相对复杂的结构。例如,事件一般有主动者(Ag ent)、事件的对象(Theme)、事件发生的时间、地点、事件前后的变化等。

把Ontology作为系统的世界知识,利用Onto-l ogy中蕴涵的世界知识中的约束,结合语言知识, KB-NLP系统可以消歧和推理。

3.1消歧

消歧是在多个可能的意义中选择最适合的意义,系统利用Ontology中概念以及概念之间的约束关系消歧。例如,在/沙发/的/扶手/开始/活动/了/。0中,/活动0具有歧义。通过词典的语义映射,它可以对应到这些意思:(1)不牢固、动摇;(2)运动;(3)从事有目的的社会交往;(4)特指钻营、行贿等。仅仅从句法分析是无法消歧的。根据概念之间的约束,因为后三个概念都需要一个/有意识的人0作为行为者,而/扶手0是一个无意识的物体,不能完成后三个概念所表述的动作,因此,可以判断出在这个例子中/活动0的意义应该是/不牢固、动摇0。

3.2推理

推理是找出文本中没有明显表示出来或者有转义的意义,系统利用Ontolog y中缺省的知识填充空缺的意义,或者通过计算Ontology中概念的距离找出句子的转义。如在例子:/小王驾驶着一辆货车过来了。0中,根据/驾驶0概念中包含的位置约束,驾驶员必须位于其驾驶的车内,可以推理出小王的位置是在货车内。

推理是从一个概念集找到和它相关的另一个概念集,因为Ontology中的所有概念都是可以相互到达的,理论上来说是可以推理出结果,但是如果Ontology足够大的话,推理的效率将大大降低。因此,在推理的时候应该注意控制搜索的进程,以保证它是面向目标的[8]。

4结束语

Ontology是对世界或者领域的概念化描述,利用Ontology作为知识体进行KB-NLU,能够有效的把语言学知识和世界知识结合起来,运用世界知识对文本进行消歧。此外,Ontology与知识系统的知识库相融合,使得自然语言处理不仅仅是作为一种人机交互方式,而且能够与其它的基于知识的智能系统如专家系统整合。

但是Ontology的研究也存在一些问题:首先,它具有所有的知识系统面临的知识获取瓶颈,大部分研究中的Ontology的建立是没有理论支持的,而且都是采用人工提取概念,需要开发能够自动或者半自动提取概念的工具;其次,目前的研究还主

73

第22卷第4期潘宇斌等:基于Ontology的自然语言理解

要是停留在词汇级和句法级,所以只能做到句法级的消歧;再次,汉语是一种无语法规则的语言,把汉语文本的语法和语义分析分开进行相当困难,如何利用Ontology结合汉语的语法和语义信息分析文本,将是汉语自然语言处理的一种新的思路。对这些问题有待进一步的研究。

参考文献

[1]Philip J.Hayes an d Jaime G.Carbonell,A Tutori al on Techniques

and Application for Natural Language Processing,Carnegie-M e-l lon University,October,1983.

[2]M arek Obitko2001.Ontologie:Descri ption and Applications.

S eries of Research Reports,Report No:GL126/01,2001. [3]Wh i tten,D.1994.The Unofficial,Unauthorized CYC Frequent-

ly Asked Questions Information S heet.

[4]G.A.M iller,R.Bechwith,C.Fellbaum,D.Gross,K.M i ller.

1993.Introduction to WordNet:An On-line Lexical Database.

[5]M ahesh,K.1995.Ontology Developm ent for M achine Transla-

tion:Ideology and M ethodology.Technical report,new mexico state university,Computing Research Laboratory.

[6]M ahesh,K.and S.Nirenburg1995.A Situated Ontology for

Practical NLP.In Proceedings of the IJCAI-95W orkshop on Basic Ontological Issues in Know ledge S haring,Aug.19-21, 1995,M ontreal.

[7]Bateman,J.1993.Ontology construction an d natural language.

In Proceedings of th e International Workshop on Formal Ontolo-gy,Padova,Italy,M arch1993.

[8]Kavi M ahesh,Sergei Nirenburg1996.Know ledge-Based Sys-

tems for Natural Language Processing.Han dbook for Computer.

[9]陆汝钤,姬广峰.关于常识的研究[J].世纪之交的知识工程与

知识科学,2001(9):469~506.

(上接第62页)

11的第三名,其中服务器使用的是Rcsoccersim-8.05.6。在比赛中,CSU_YunluT eam仅以小比分输给北京理工大学队(2002年世界亚军)和上海大学队(2001年中国第三名),其余的都是以较高的比分胜了对手。

从实验和实战结果可知,基于本文提出的M ulti-Agent层次协作模型构建的CSU-Yun-luTeam是一支成功的队伍,说明本文提出的Multi -Agent层次协作模型是合理的、有效的。

参考文献

[1]https://www.doczj.com/doc/e88178094.html,/resource/Simulation/Docu-

ments,RoboCupOV2.zip,M ay,2002.

[2]Omicini A,Papadopoulos G A.Editorial:Why Coordination

M odels and Language in AI[J].Applied Arti fical Intelligence,

2001,15(1):1~11.

[3]Stone https://www.doczj.com/doc/e88178094.html,yered Learning in M ulti-agent Systems[J].Ph.D.

Th esis,Carnegie M ellon University,CM U-CS-98-187,

1998.

[4]Reis L P,Lau N,Oliveira E C.S i tuation Based S trategic Pos-i

ti oning for Coordinating a Team of Homogeneous Agents.

http://w w w.ieeta.pt/robocup/archive.htm,M ay,2002. [5]Cai Y P,Chen J,Yao J Y,Li S.Gl obal Planning from Local

Eyeshot:An Implementation of Observation-based Plan Coor-

dinati on in RoboCup S imulation Games.http://w ww.lits.ts-

https://www.doczj.com/doc/e88178094.html,/robocup/robo_CH I/s oftw are/softw are_doc.

html,M ay,2001.

[6]S tone P,Riley P,Veloso M.Defining and Using Ideal T eammate

and Oppon ent Agent M odel s.AT&T Labs,http://w w w.re-

https://www.doczj.com/doc/e88178094.html,/pstone.M ay,2001.

[7]汤哲,孙增圻.机器人足球中的协作.第四届全球智能与自动

化大会论文集[C].2002,6:469~473,上海.

74计算技术与自动化2003年12月

浅谈自然语言处理

浅谈自然语言处理 摘要 主要阐述了自然语言处理的定义,发展历史,并对其研究内容,以及目前相关领域的应用加以讨论。最后对自然语言处理的未来发展趋势做简单的介绍。 关键词 自然语言处理 Abstract The definition and the development history of Natural Language Processing(NLP) are explained,the research content and the applications in interrelated areas of NLP are discussed.And the develop direction of NLP in the future are simply introduced. Key Words: Natural Language Processing(NLP)

0.引言 早在计算机还未出现之前,英国数学家A.M.Turing便已经预见到未来计算机将会对自然语言处理研究提出新的问题。他指出,在未来我们可以“教机器英语并且说英语。”同时他觉得“这个过程可以仿效教小孩子说话的那种办法进行”。这便是最早关于自然语言处理概念的设想。 人类的逻辑思维以语言为形式,人类的多种智能都与语言有着密切的联系。所以用自然语言与计算机进行通信是计算机出现以来人们一直所追求的目标。 1.什么是然语言处理 美国计算机科学家Bill Manaris(马纳瑞斯)在1999年出版的《计算机进展》(Advances Computers)第47卷的《从人—机交互的角度看自然语言处理》一文中,曾经给自然与然处理提出了如下定义:“自然语言处理可以定义为研究在人与人交际中的语言问题的一门学科。自然语言处理要研制表示语言能力(linguistic competence)和语言应用(linguistic performance)的模型,建立计算框架来实现这样的语言模型,提出相应的方法来不断地完善这样的语言模型,根据这样的语言模型设计各种实用系统,并探讨这些实用系统的评测技术。”这个定义被广泛的接受,它比较全面的地表达了计算机对自然语言的研究和处理。 简单来说,自然语言处理就是一门研究能实现人鱼计算机之间用自然语言处理进行有效的通信与方法的一门学科,它是计算机科学领域与人工智能领域中的一个重要方向。普遍认为它主要是应用计算机技术,通过可计算的方法对自然语言处理的各级语言单位(字,词,语句,篇章等)进行转换,传输,存储,分析等加工处理的学科,是一门融合了语言学,计算机学,数学等学科于一体的交叉性学科。 互联网技术的发展,极大地推动了信息处理技术的发展,也为信息处理技术不断提出新的需求,语言作为信息的载体,语言处理技术已经日益成为全球信息化和我国社会及经济发展的重要支撑技术。

自然辨证法论文-浅析人工智能

浅析人工智能 21007002 关键词:人工智能、计算机、系统、哲学 摘要:人工智能是一门通过运用人类智能的机理来使机器模拟人的智能的学科。它是计算机学科的一个分支,也是计算机科学、语言学、心理学、哲学、数学、控制论、信息论、决定论、神经生理学等多种学科相互渗透而发展起来的综合性学科。本文了分三部分对人工作智能进行了简要的介绍与分析,第一部分给出了人工智能的科学定义及哲学定义,第二部分阐述了人工智能的发展现状及发展趋势,最后一部分分析了人工智能给人类带来的利与弊。 人工智能(Artificial Intelligence,简称AI)是计算机学科的一个分支,二十世纪七十年代以来被称为世界三大尖端技术(空间技术、能源技术、人工智能)之一,也被认为是二十一世纪三大尖端技术(基因工程、纳米科学、人工智能)之一。这是因为近三十年来它获得了迅速的发展,在很多学科领域都获得了广泛应用,并取得了丰硕的成果。它一方面成为人类智能的延长,另一方面又为探讨人类智能机理提供了新的理论和研究方法。 一、人工智能的定义 1、人工智能的科学定义 人工智能在科学层面上定义为一门通过运用人类智能的机理来使机器模拟人的智能的学科。具体来说就是通过研究人类智能活动的规律,构造具有一定智能的人工系统,让它去完成以往需要人的智力才能胜任的工作的基本理论、方法和技术。它是计算机科学的一个分支,也是计算机科学、语言学、心理学、哲学、数学、控制论、信息论、决定论、神经生理学等多种学科相互渗透而发展起来的综合性学科。 人工智能有三种,第一种是通常所认为的那样, 试图让机器做你所做的事,如在工厂里干活,把人们从繁重的体力和脑力劳动中解放出来;第二种是通过接受大量不同的科学训练及日常生活的训练,使机器具有可以理解不同种类的事情、语言、制造计划、测试计划、解决问题、监视我们行动的能力等等;第三种是包括具有动机、情感、情绪等能力的机器,例如感到孤独,窘迫、自豪、厌恶、兴奋等。 2、人工智能的哲学定义 在哲学意义上,人工智能被看作是一般性的智能科学,或更确切地说,被

自然语言理解

自然语言理解 自然语言也就是我们是日常使用的语言,像各国语言汉语,英语等只要能完成人们之间相互交流的语言就成为自然语言,自然语言是人类学习环境和互相通讯的工具。在人类历史上以语言文字形式记载和流传的知识占到知识总量的80%以上。就计算机的应用而言,据统计用于数学计算的仅占10%,用于过程控制的不到5%,其余85%左右都是用于语言文字的信息处理。所谓语言信息处理,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。根据可计算性理论,任一计算机的运算都是按一定程序,分步骤相继作用在离散对象之上所完成的,而这些对象又都以线性序列相邻接地排列组合所构成。而自然语言具有的离散性、序列性和邻接性三个特征其具备了“可计算性”,为自然语言处理奠定了物质基础。 语法是语言的组织规律。语法规则制约着如何把词素构成词,把词构成词组和句子。语言正是在这种严格的制约关系中构成的。用词素构成词的规则称为构词规则,如“学”+“生”构成“学生”。一个词又有不同的词形、单数、复数、阴性、阳性等等。这种构造词形的规则称为构形法,如“学生”+“们”构成“学生们”。这里,只是在原来的词的后面加上了一个具有复数意义的词素,所构成的并不是一个新词,而是同一个词的复数形式。构形法和构词法称为词法。语法中的另一部分是句法。句法可分为词组构造法和造句法两部分。词组构造法是把词搭配成词组的规则,例如,把“新”+“朋友”构成“新朋友”。这里,“新”是一个修饰“朋友”的形容词,它们的组合构成了一个新的名词。造句法则是用词和词组构造句子的规则,如“我们是计算机系的学生”就是按照汉语造句法构造的句子。 对于自然语言德理解,能够更好的处理计算机语言与人类语言的交互。他也就是利用计算机技术研究和处理语言的一门学科,即把计算机作为语言研究的强大工具,在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。自然语言理解通常又叫自然语言处理,因为处理自然语言的关键是要让计算机“理解”自然语言。但什么是“理解”呢?对于这个术语也存在着各式各样的认识。如心理学家认为,理解是“紧张的思维活动的结果”,哲学家认为,理解是“认识或揭露事物中本质的东西”,而逻辑学家则认为理解是“把新的知识、经验

浅谈人工智能

中国西部科技
2009年10月(下旬)第08卷第30期 总第191期
浅谈人工智能
李轶博
(吉林石化信息网络公司软信公司,吉林 132021) 摘 要: 人工智能作为计算机学科的一个分支,有其自身的特点,现已在社会生活各个领域都有应用,并将有更为广阔 的发展前景。 关键词: 人工智能;AI;模拟
关于人工智能的定义众说不一,美国斯坦福大学人工 智能研究中心尼尔逊教授下过这样的一个定义:“人工智 能是关于知识的学科——怎样表示知识以及怎么样获得知 识并使用知识的科学。”而麻省理工学院的温斯顿教授认 为:人工智能就是如何使用计算机去做过去只有人才能做的 工作。”人们普遍认为人工智能,它是研究、开发用于模 拟、延伸和扩展人的智能的理念、方法技术以及应用系统 的一门新的技术科学。它是从计算机应用系统的角度出 发,研究如何制造出人造的智能机器或智能系统,来模拟 人类智能活动能力,以延伸人们智能的科学。 人工智能就其本质而言,是对人的思维的信息过程的 模拟,人工智能不是人的智能,更不会超过人的智能,对 于人的思维模拟可是结构模拟,仿照人脑的结构机制,暂 时撇开人脑的内部结构,而从其功能过程进行模拟。 人工智能可以分为强人工智能和弱人工智能。强人工 智能观点认为有可能制造出真正能推理和解决问题的智能 机器,并且,这样的奇迹将被认为是有知觉的,有自我意 识的。弱人工智能观点认为不可能制造出能真正的地推理 和解决问题的智能机器,这些机器只不过看起来像是智能 的,但并不真正拥有智能,也不会有自主意识。 1 人工智能研究的历史与现状 人工智能的研究经历了以下几个阶段: 第一阶段:20世纪50年代人工智能的兴起和冷落。人工
此计划最终失败,但它的开展形成了一股研究人工智能的 热潮。 第四阶段:20世 纪 80年代末,精神网络飞速发展。 1987年,美国召开第一次精神网络国际会议,宣告了这一 新学科的诞生。此后,各国在精神网络方面的投资逐渐增 大,精神网络迅速发展起来。 第五阶段:20世纪90年代,人工智能出现新的研究高 潮。由于网络技术特别是国际互联网的技术发展,人工智 能开始由单个智能主体研究转向基于网络环境下的分布式 人工智能研究。不仅研究基于同一目标的分布式问题求 解,而且研究多个智能主体的多目标问题求解,将人工智 能面向实用。 人工智能研究范畴有自然语言处理、知识表现、智能 搜索、推理、知识获得、组合调度问题,感知问题,模式 识别,逻辑程序设计,软计算,不精确和不确定的管理, 人工生命,精神网络,复杂系统等。 2 人工智能是与具体领域相结合 目前,人工智能是与具体领域相结合进行研究的,有 如下领域:①专家系统。依靠人类已有的知识建立起来的 知识系统,目前专家系统是人工智能研究中开展最早、最 活跃、成就最多的领域。②机器学习。主要在三个方面进 行:首先是研究人类学习的机理、人脑思维的过程。其次 是机器学习的方法。最后是建立针对具体任务的学习系 统。③模式识别。研究如何使机器具有感知能力,主要研 究听觉模式和视觉模式的识别。④理解自然语言,计算机 如能“听懂”人的语言,便可以直接用口语操作计算机, 这将给人们带来极大的便利。⑤机器人学。机器人是一种 模拟人的行为的机械,对它的研究历经三代发展过程:第 一代机器人只能按程序完成工作。第二代机器人配备了像 样的感觉传感器,能取得作业环境、操作对象等简单的信 息,并由机器人体内的计算机进行分析处理,控制机器人 的动作。第三代机器人具有类似人的智能,它装备了高灵 敏度传感器,因而具有超过人的视觉、听觉、嗅觉、触觉 的能力,能对感知的信息进行分析,控制自己的行为,处 理环境发生的变化,完成各种复杂的任务。而且有自我学 习、归纳、总结、提高已掌握知识的能力。⑥智能决策支 (下转第41页)
智能概念首次提出后,出现了一批显著的成果,如机器定理 证明、跳棋程序、LISP表处理语言等。但由于揭发推理能力 有限,以及其翻译失败等,使人工智能走入低谷。这一阶段 的特点是:重视问题求解的方法,忽视知识重要性。 第二阶段:20世纪60年代末到70年代,专家系统出现使 人工智能研究出现新高潮,DENDAL化 学 质 谱 分 析 系 统 、 MTCIN疾 病 诊 断 和 治 疗 系 统 、 PROSPECTIOR探 矿 系 统 , Hearsay-II语言理解系统等专家系统的研究和开发,将人工 智能引向了实用化。1969年成立了国际人工智能联合会。 第三阶段:20世纪 80年代,随着第五代计算机的研 制,人工智能得到了很大发展。日本1982年开始了“第五 代计算机研制计划”,即“知识信息处理计算机系统 LIPS”,其目的是使逻辑推理达到数值运算那么快。虽然
收稿日期: 2009-09-06 修回日期:2009-10-16
作者简介: 李轶博(1982-),男,吉林籍,本科,助理工程师,主要研究方向为信息技术应用和管理。
58

浅谈人工智能与计算机

浅谈人工智能与计算机 王晨浩 计算机1506班201526810617 摘要人工智能一直处于计算机技术的前沿,人工智能研究的理论和发现在很大程度上将决定计算机技术的发展方向.人工智能作为计算机学科的一个分支,有其自身的特点,现已在社会生活各个领域都有应用,并将有更为广阔的发展前景。 关键词人工智能 / 发展 / 应用 / 机器人 / 智能研究 / 计算机学科 1.引言 在进入了二十一世纪之后,信息科学技术的发展越来越受到人们的重视,重视程度也超越了以往的任何时候。正是因为这样,人工智能技术的发展在进入新的世纪之后也有了非常快速的进步,那么,这项技术作为一种比较高端的信息科学技术,它主要是通过借助计算机的各种功能来非常形象的模拟我们人类的思维方式和思维结果,从而使人类的各种思维活动可以在计算机的程序当中得以实现[1]。2.人工智能的发展概述 人工智能的研究经历了以下几个阶段:第一阶段:20世纪50年代人T智能的兴起和冷落。人工智能概念首次提出后,出现了一批显著的成果,如机器定理证明、跳棋程序、LISP表处理语言等。但由于揭发推理能力有限,以及其翻泽失败等,使人工智能走入低谷。这一阶段的特点是:重视问题求解的方法,忽视知识重要性。第二阶段:20世纪60年代末到70年代,专家系统出现使人工智能研究出现新高潮,DENDAI。化学质谱分析系统、MTCIN疾病诊断和治疗系统、PROSPECTIOR 探矿系统,Hearsay-II语言理解系统等专家系统的研究和开发,将人工智能引向了实用化。1969年成立了国际人工智能联合会。第三阶段:20世纪80年代,随着第五代计算机的研制,人工智能得到了很大发展。日本1982年开始了“第五代计算机研制计划”,即“知识信息处理计算机系统LIPS”,其目的是使逻辑推理达到数值运算那么快。虽然此计划最终失败,但它的开展形成了一股研究人工智能的热潮一第四阶段:20世纪80年代末,精神网络飞速发展。1987年,美国召开第一次精神网络国际会议,宣告了这一新学科的诞生。此后,各国在精神网络方面的投资逐渐增大,精神网络迅速发展起来。第五阶段:20世纪90年代,人工智能出现新的研究高潮。由于网络技术特别是嗣际互联网的技术发展,人工智能开始由单个智能主体研究转向基于网络环境下的分布式人工智能研

浅谈人工智能的现状与未来

浅谈人工智能的现状与未来 摘要:作为二十世纪七十年代以来被称为世界三大尖端技术之一(空间技术、能源技术、人工智能),同时也被认为是二十一世纪三大尖端技术之一(基因工程、纳米科学、人工智能)。人工智能在很多科学领域都获得了广泛应用,并取得了丰硕的成果,本文将对人工智能的发展历程,现状以及发展趋势作一个初步的解读,人工智能应用于工程是是目前工程技术研究的热点之一,本文也将就人工智能中的专家系统、模拟逻辑、神经网络控制在机电一体化中的应用进行了探讨。 关键词:人工智能;机电一体化;专家系统;模糊控制;神经网络控制;AI发展前景; 什么是人工智能 人工智能(Artificial Intelligence) ,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。 人工智能与机电一体化系统的统一 近几十年来,人工智能得到了长足的发展,譬如,IBM 公司制造的深蓝计算机运用人工智能于1997年5月,战胜了国际象棋冠军卡斯帕洛夫。人工智能用于机电一体化是机电一体化发展的方向之一。这种智能主要通过控制技术加以设计和实现,即由机电一体化系统中的控制系统来具体实现。 专家系统、模糊逻辑、神经网络控制、学习控制和分层递阶是目前人工智能研究主要的几个领域,它们各自发展,又相互渗透,走向结合。其中,前三个领域是目前机电一体系统实现智能化的较成熟的领域。 一,自从第一个专家系统于1968年问世以来,经过30多年的发展,专家系统已经成为人工智能应用最活跃的领域。已经从最初的应用于医疗、科技等领域,向财政、金融、保险、商业和法律方向扩展,下面就与机电一体化有关的应用予以探讨。 (1)在装配制造业的应用:产品的生产,总是用零件来构造的,将不同的零件一起装配成一种新产品,叫做配里任务。专家系统应用于装配制造方面可以取得 可观的经济效益。比如, DEC公司的专家系统XCON,是应用于计算机配置的 第一个专家系统,现在每年为DEC公司盈利1。5亿美元 (2)在设备故障诊断中的应用:专家系统用于设备故障诊断,特别是针对大型的结构、复杂的故障诊断,可以尽快找到故障,大大缩短检修时间,有很多成功 的例子,比如美国西屋电气公司研制的GEN一AID专家系统,已经成功地应 用于诊断汽轮发动机的故障。IBM公司也曾经为其IBMATPC机配备了一个专家 系统,用来精确定位系统故障。 (3)在控制方面的应用:专家系统可以在机电一体化设备控制方面发挥作用,在伺服控制、数控机床、加工中心以及其它控制领域,已取得了进展。在这方面成 功的例子如AT&T公司为控制机械手,研制出在单个芯片上实现的专家系统。 最早的芯片包括16条规则的ROM,控制器以及处理数据与规则的推理机。采 用2。5um线宽的CMOS工作,最初只使用了芯片面积的四分之一,改用1。 5um线宽后可容纳256条规则,建立规则时采用模糊逻辑,执行速度可达到 80000LISP,比常规专家系统快1000倍。尽管大型专家系统的造价是很昂贵的,

自然语言理解技术

自然语言理解技术,未来人工智能的核动力 摘要:自然语言理解是人工智能研究重要的领域之一,同时也是目前前沿的难题之一。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,是未来人工智能的核动力。因此理解自然语言理解以及自然语言理解技术的含义,阐述自然语言理解的研究及其相关应用,综述自然语言理解技术研究方向变化并对自然语言理解的发展前景进行分析和展望,是十分有意义的。 关键词:自然语言理解技术;智能信息服务; 1.引言: 随着计算机科学的不断发展和成熟,计算机应用开始迈人知识处理、语言理解阶段,人们对计算机的智能提出了新的要求随着社会的日益信息化,人们越来越强烈地希望能更好地同计算机交流。自然语言就是这样一个媒介。 2. 1自然语言理解的含义: 广义的“语言”是任何一种有结构的符号系统。其中, 最重要的两类语言,自然语言和形式语言。而狭义的“语言”是人类在社会牛活中发展出来的用来互相交际的声音符号系统,是“自然语言”。 “自然语言理解”即Natural Language Understanding 俗称人机对话,指的就是使计算机来按照这种语言所表达的意义做出相应反应的机制。它主要研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。这在当前新技术革命的浪潮中占有十分重要的地位。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看,自然语言理解的任务是建立一种计算机模型,这种计算机模型能够给出象人那样理解、分析并回答自然语言(即人们日常使用的各种通俗语言)的结果。2. 1自然语言理解技术的含义: 首先, 自然语言是极其复杂的符号系统。一个人尽管可以对自己的母语运用自如, 但却无法把自己母语的构成规律、意义的表达规律和语言使用的规律用计算机可以接受的方式彻底说清楚。传统的语言学是在没有计算机参照的条件下发展起来的, 虽然为自然语言理解积累了宝贵的财富, 但那是讲给人的, 真正要让语言学知识变成计算机上可操作的, 绝不是那么简单, 也不能那么模糊。这个目标的实现,需要大量又懂语言学又懂计算机的人在正确的技术路线的指导下一起做非常大规模的基本建设, 绝不是一拍脑袋想出个“绝招”就能解决的。 其次, 自然语言的各个层次上都含有巨大的不确定性。在语音和文字层次上,有一字多

浅谈人工智能技术及其应用发展

2019.01科技论坛 浅谈人工智能技术及其应用发展 李思睿 (绵阳南山中学,四川绵阳,6n o o o) 摘要:本文就人工智能的定义以及其主要的相关技术题型进行阐述,并且探讨了人工智能技术所应用的一些热门领域。 人工智能技术目前作为一门交叉性的学科,未来其发展趋势会在很大程度上影响和改变我们的生活。 关键词:物联网;计算机技术;人工智能 Talking about Artificial Intelligence Technology and Its Application Development Li Sirui (Mianyang Nanshan Middle School,Mianyang Sichuan,621000) Abstract:In this paper,the definition of artificial intelligence and its main related technical topics are described,and some hot areas of application of artificial intelligence technology are discussed.Artificial intelligence technology is currently an interdisciplinary subject,and its future development trend will affect and change our lives to a large extent. K e y w o r d s:Internet of Things;Computer Technology;Artificial Intelligence 〇引言 AI(人工智能技术)其本质是模拟人类意识和思维信息 的过程,通过机器实现,模拟人类感知、识别、和决策功能的 技术。在大数据挖掘,云计算以及深度学习等理论支持下,人 工智能呈现出跨界融合、人机协同、自主操纵等特征。目前,人工智能技术广泛地应用于自动驾驶、智能家居、智慧医疗、图像识别、语音助手等领域。 1人工智能的相关技术 人工智能的应用领域包括问题求解、自然语言处理、人 工智能方法和程序语言等等,这些应用领域已经适用到了很 多行业,进而推动了社会科学的总体发展。对于人工智能技 术的实现技术体系而言,主要涉及以下四个方面:机器学习、自然语言处理技术、图像处理技术、人机交互技术。在机器学 习上,机器学习的能力是人工智能技术最为凸显的一种表现 手段,与此同时人工智能也在此技术上有了很多改变。自然 语言处理是融合了计算机科学、语言学和人工智能于一体的 交叉研宄方向,它的目的是“让计算机理解自然语言”,更高 效的完成工作任务。图像处理技术是将图像处理技术与人工 智能相结合的方法,在原有自动识别的基础上,我们提出一 种基于专家系统的知识识别方法。人机交互技术使用户与计 算机系统通过可以通过人机交互界面进行交流。机器显示大 量提示与请求,用户通过输入设备给计算机提供有关信息,从而达成人机互动。其知识结构体系如表1所示。 表1人工智能主要技术体系 技术体系技术方法 机器学习监督学习(监督分类学习,回归飞行系),无监 督学习,强化学习 图像处理技术遗传算法,图像降维,图像识别,图像分割,特 征提取 人机交互技术UI 设计、可视化技术、GIS跟踪技术、动作识人 机界面技术,语音识别技术 自然语言处理语音识别,语句分析,文本转化 1.1机器学习 机器学习指的是计算机通过分析、学习、归纳大量数据, 达到拥有能够自主做出最佳判断与决策的能力,简单的说, 机器学习是一种A I技术在不同应用场景下时‘命令行”语句 或者方法。机器学习主要内容包涵有深度学习、深度人工神经 网络、决策树、增强算法等。机器学习对于人工智能技术十分重 要,而算法的发展也对人工智能技术的发展起到了作用。 1.2自然语言舰 自然语言处理技术包含两个方面,一是将人类语言转化 为计算机可以处理的形式,二是将计算机数据转为人类语言 的自然形式,以此达到计算机能够理解人类语言的目的。目前,市面上已有应用该技术的产品,例如Apple的siri、微软 的C o r t m a,这些产品能够协助人们完成许多任务,其核心技 术不仅包括自然语言技术,也包含了深度学习。自然语言处 理综合了语言学、计算机科学、数学等学科,该技术内又包含 了信息检索、信息抽取、词性标注、语法分析、语音识别、语法 解析、语种互译等技术。 1.3图像顺支术 图像是人类获取信息的主要途径,人工智能技术要实现 模拟人类分析问题、解决问题的功能,图像处理技术不可缺 少。图像处理技术使计算机拥有视觉,可以处理、分析图片或 多维的数据。在大数据时代,如何对海量图像数据进行信息 iliiia m

浅谈人工智能原理及应用

模式识别与智能系统 摘要:人工智能(Artifical Intelligence)是关于知识的学科――怎样表示知识以及怎样获得知识并使用知识的科学。”而另一个美国麻省理工学院的温斯顿教授认为:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”这些说法反映了人工智能学科的基本思想和基本内容。即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。人工智能是当前科学技术发展中的一门前沿学科,是在计算机科学、控制论、信息论、神经心理学、哲学、语言学等多种学科研究的基础上发展起来的,以模拟人类智能、智能行为及其规律为研究内容的一门综合性边缘学科。由于人工智能自出现以来取得的巨大成就及其潜在的广阔应用前景,它又同空间技术、原子能技术并称为20世纪的三大科学技术成就。 关键词:人工智能;计算机科学;发展方向 ①、人工智能的定义 人工智能(Artificial Intelligence,AI),是一门综合了计算机科学、生理学、哲学的交叉学科。“人工智能”一词最初是在1956年美国计算机协会组织的达特莫斯(Dartmouth)学会上提出的。自那以后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。由于智能概念的不确定,人工智能的概念一直没有一个统一的标准。著名的美国斯坦福大学人工智能研究中心尼尔逊教授对人工智能下了这样一个定义“人工智能是关于知识的学科——怎样表示知识以及怎样获得知识并使用知识的科学。”而美国麻省理工学院的温斯顿教授认为“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”童天湘在《从“人机大战”到人机共生》中这样定义人工智能:“虽然现在的机器不能思维也没有“直觉的方程式”,但可以把人处理问题的方式编入智能程序,是不能思维的机器也有智能,使机器能做那些需要人的智能才能做的事,也就是人工智能。”诸如此类的定义基本都反映了人工智能学科的基本思想和基本内容。即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。

浅谈言语行为理论新认识

浅谈言语行为理论新认识 论文关键词:言语行为理论语言哲学逻辑学 论文摘要:言语行为理论是语言哲学领域的一个重大进步与突破。本文介绍了该理论产生的渊源及内容,并重,点探讨言语行为理论对逻辑学发展的重大意义。 20世纪50年代以来,语言哲学家对语言的认识既区分了语言和言语,又将语言作为人类的一种行为来对待,于是提出了言语行为理论。 一、言语行为理论产生的渊源 奥斯汀是言语行为理论的创始人,其学生塞尔修正并发展了这一理论,使之进一步系统化、严密化。在他们之前,弗雷格、马林诺夫斯基、维特根斯坦等先驱已对该理论提出了一些思想片断。 20世纪初,哲学产生了一次根本性的“语言转向”,语言取代认识论成为哲学研究的中心课题。弗雷格首先发起此次转向,罗素继承并发展,维特根斯坦完成了这一转折和过度。“语言转向”的产生标志着英美分析哲学时代的到来,从内涵上看分析哲学指“把哲学问题置于语言领域并在分析语言手段和语言表述的基础上解决哲学问题”。从使用的分析方法上看,分析哲学又分为逻辑分析学派和日常分析学派。前者主张应发明一种其语法形式在逻辑上是完善的语言,后者则侧重分析自然语言或日常语言。这些事实都充分说明了把交际中使用的语言作为一种行为来研究的思想并非只是从奥斯汀开始的而是由来已久的。

二、言语行为理论的内容 在《如何用语词做事》中,奥斯汀首先指出,“言”就是“行”。他认为,言语是人在特定场合对特定语言的具体运用,包括运用语言的说话行为和所说的话。因此,说话本身就是一种行为。奥斯汀区分了两类不同的话语:施事话语和记述话语,并用“适当与否”、“真假与否”两个评价标准来区分这两类话语。 之后,他又尝试提出言语行为理论来处理“说话就是做事”的问题。奥斯汀把作为整体的言语行为分为三个层次,即认为在说些什么时,可能以三种基本的方式在做些什么。他把这三层意义的做些什么分别称为以言表意行为、以言行事行为、以言取效行为。 以言表意行为指说话这一行为本身,发出一段声音,组词成句,音义结合;以言行事行为指在完成“说什么”这一行为的同时,所表达的说话者说出这个话语的“用意”,产生的某种语力,如某人说:“出去!”这句话的同时,就实施了一个“命令”的以言行事行为:以言取效行行为指说话者通过以言表意行为表达自己的用意之后,在听话者身上(也可能是说话者自己)产生的一定的影响,出现的一定效果。 塞尔在自然语言的基础上修正、完善、发展了奥斯汀的言语行为理论,并利用自己设计的一套人工语言符号来来表述分析他的言语行为理论,将言语行为分为话语行为、命题行为、以言行事行为和以言取效行为。即:说出一串语词(语素、语句)就是实施话语行为;进行指称和谓述就是实施命题行为。做出陈述、提出问题、发出命令、做出承诺等,就是实施以言行事行为,而这种以言行事行为对听话者在行动

自然语言处理一些相关技术以及相关任务浅析

自然语言处理一些相关技术以及相关任务浅析 本文根据自己的学习以及查阅相关资料的理解总结,简要的介绍一下自然语言处理(nlp)一些相关技术以及相关任务,nlp技术包括基础技术和应用技术。后续会抽空继续分专题完善这一个系列。限于作者水平有限,其中难免有错漏之处,欢迎读者斧正。 发展 一般认为1950 年图灵提出著名的“图灵测试”是自然语言处理思想的开端。20 世纪50 年代到70 年代自然语言处理主要采用基于规则的方法。基于规则的方法不可能覆盖所有语句,且对开发者的要求极高。这时的自然语言处理停留在理性主义思潮阶段。 70 年代以后随着互联网的高速发展,语料库越来越丰富以及硬件更新完善,自然语言处理思潮由理性主义向经验主义过渡,基于统计的方法逐渐代替了基于规则的方法。 从2008 年到现在,由于深度学习在图像识别、语音识别等领域不断取得突破,人们也逐渐开始引入深度学习来做自然语言处理研究,由最初的词向量到2013 年word2vec,将深度学习与自然语言处理的结合推向了高潮,并且在机器翻译、问答系统、阅读理解等领域取得了一定成功。再到最近的emlo、bert等,也许正在揭开下一个篇章。 定义 自然语言是指汉语、英语等人们日常使用的语言,是随着人类社会发展自然而然的演变而来的语言,不是人造的语言,自然语言是人类学习生活的重要工具。或者说,自然语言是指人类社会约定俗成的,区别于人工语言,如程序设计的语言。 处理包含理解、转化、生成等过程。自然语言处理,是指用计算机对自然语言的形、音、义等信息进行处理,即对字(如果是英文即为字符)、词、句、段落、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。实现人机间的信息交流,是人工智能界、计算机科学和语言学界所共同关注的重要问题。所以自然语言处理也被誉为人工智能的掌上明珠。 可以说,自然语言处理就是要计算机理解自然语言,自然语言处理机制涉及两个流程,包

自然语言理解语义分析

引用《统计自然语言处理基础》中的两句话来解答这个问题: ?语义可以分成两部分:研究单个词的语义(即词义)以及单个词的含义是怎么联合起来组成句子(或者更大的单位)的含义 ?语义研究的是:词语的含义、结构和说话的方式。 以上是书本中的定义,语义分析是一个非常宽泛的概念,任何对语言的理解都可以归纳为语义分析的范畴,笼统地谈语义是一个非常宽泛的概念。所以应该结合具体任务来看看什么是语义分析,以及语义分析的结果是什么。 从分析粒度上可以分成:词语级的语义分析,句子级的语义分析,以及篇章级别的语义分析。词语级的语义分析 词语级别的语义分析的主要研究词语的含义,常见的任务有:词语消歧、词表示、同义词或上下位词的挖掘。 ?词语消歧:一词多义是许多语言的固有属性。以“苹果”为例,可以指水果,又可以指美国的科技公司。词语消歧的任务是判断文中出现的词语是属于哪种意思。 ?词表示:深度学习兴起后,掀起了一波对词表示的研究浪潮。词表示的任务是用一个k维的向量表示一个词,并且该向量中包含着词语的意思。比较有代表性的工作是Tomas Mikolov的Word2Vec,该方法训练得到的词向量能够让语义相关的词具有相似的词向量,并且词向量间还具有逻辑推算能力。

?同义词和上下位词的挖掘:语言的多样性导致了多词义一,例如房子的近义词有房屋、房产。语言的层次性导致了词语间具有上下位关系,像房产、存款、股票可归纳为财产。可以使用一些机器学习的方法挖掘词语间的这种关系。 句子级的语义分析 句子级别的任务就更多了,常见的任务有:语义角色标注、蕴含分析、句子表示、语义依存分析。 ?语义角色标注(Semantic Role Labeling, SRL) 是一种浅层的语义分析技术,标注句子中某些短语为给定谓词的论元(语义角色) ,如施事、受事、时间和地点等。其能够对问答系统、信息抽取和机器翻译等应用产生推动作用。 ?文本蕴涵(Textual entailment)是指两个文本片段有指向关系。当认为一个文本片段真实时,可以推断出另一个文本片断的真实性。完成这样。完成这样的任务,也需要从语义角度出发进行解决。 ?句子表示:同词表示类似,句表示研究的是用一个k维的向量表示一句话的含义。 近几年,常用句向量在文本检索、问答系统中计算文档间的相似度。 ?语义依存分析(Semantic Dependency Parsing, SDP),分析句子各个语言单位之间的语义关联,并将语义关联以依存结构呈现。语义依存分析目标是跨越句子表层句法结构的束缚,直接获取深层的语义信息。比较有代表性的工作是哈工大刘挺老师实验室的LTP。 篇章级的语义分析

人工智能浅析解读

浅析人工智能及其发展 人工智能是20世纪50年代中期兴起,是计算机科学、控制论、信息论、语言学、神经生理学、心理学、数学、哲学等多种学科相互渗透而发展起来的综合性学科。人工智能又称为智能模拟,是用计算机系统模仿人类的感知、思维、推理等思维活动。 1.人工智能的定义 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。这词最初是在1956年美国计算机协会组织的达特莫斯(Dartmouth)学会上提出的。自那以后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。由于智能概念的不确定,人工智能的概念一直没有一个统一的标准。 着名的美国斯坦福大学人工智能研究中心尼尔逊教授对人工智能下了这样一个定义“人工智能是关于知识的学科——怎样表示知识以及怎样获得知识并使用知识的科学。”而美国麻省理工学院的温斯顿教授认为“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”童天湘在《从“人机大战”到人机共生》中这样定义人工智能:“虽然现在的机器不能思维也没有“直觉的方程式”,但可以把人处理问题的方式编入智能程序,是不能思维的机器也有智能,使机器能做那些需要人的智能才能做的事,也就是人工智能。”诸如此类的定义基本都反映了人工智能学科的基本思想和基本内容。即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。 2.人工智能的能做什么,应用的领域 目前,人工智能是与具体领域相结合进行研究的,有如下领域: (1)专家系统 专家系统是一种模拟人类专家解决某些领域问题的计算机程序系统。专家系统内部含有大量的某个领域的专家水平的知识与经验,能够运用人类专家的知识和解决问题的方法进行推理和判断,模拟人类专家的决策过程,来解决该领域的复杂问题专家系统是人工智能应用研究最活跃和最广泛的应用领域之一,涉及到社会各个方面,各种专家系统已遍布各个专业领域,取得很大的成功。根据专家系统处理的问题的类型,把专家系统分为解释型、诊断型、调试型、维修型、教育型、预测型、规划型设计型和控制型等10种类型。

语言学概论——解读语言的魅力

语言学概论——解读语言的魅力 1.语言三要素:语音、语义、语法 语言学是以语言(自然语言)为研究对象的科学研究人类的共同特点、一般规律 性质: 语言是音义结合的符号系统,既有语言形式,又有语音的表达内容。(语言的结构)语言是人类最重要的交际工具、思维工具。(语言的功能) 语言是符号系统,符号包含形式和意义两方面,语言中,符号是语音,内容是语义 语言符号中的形式和意义的结合完全由社会“约定俗成“。在两千多年前,我国著名哲学家荀子曾经说过:”名无固宜,约之以命,约定俗成谓之宜,异于约谓之不宜。名无固实,约之以命实,约定俗成谓之实名。“(《荀子·正名》) 2.语言符号的最大特点是它的音与义的结合是任意的,由社会约定俗成的。 语言符号层级结构“两层三级”音位层和符号层“三级”语素、词、句子 语言符号具有任意性、线条性、二层性、生成性 语言里的音位只有几十个(小于60个),语素的数目则有几千个。 3.组合关系指符号和符号组合起来的关系 符号与符号是怎样组合的? ①在语流中,语言符号之间的线性连接关系,横向组合,有规则,并非任意的 ②连接中的每一环都可以拆卸下来进行组装。 聚合关系语流之外,语言符号根据某一种共同特点(语音、语义、语法),而聚集在一起的类聚关系。 4.人类语言和所谓动物语言的根本区别 ①单位的明晰性人类说出来的是由界限清晰的单位按照交际的需要,语言的规则组装出来的句子 ②任意性 ③结构的二层性人类的语言是一种两层结构装置。动物“语言”不能分解成单位,谈不上有结构。 ④开放性人类能够运用有限的语言手段通过替换和组合造出无限的句子。动物“语言”是一种封闭的系统。它所能够传递的信息是固定的,是受刺激限定的。 ⑤传授性人类语言能力是先天具备的,但掌握什么语言,则是后天学会的,没有现实的语言环境,就学不会一种语言。动物的“语言”是与生俱来的本能,不用学习。 ⑥不受时、地环境的限制其他动物的交际都是当时当地的刺激引起的,是对具体情景的感性的反应,只能传递某种信息。人类语言信息的传递不受当时当地环境的限制。 5.语音是人的发音器官(生理属性)发出的代表一定语言意义(社会属性)的声音(物理属性) 音位是在语流中能够区别意义的最小的语音单位 记录音素的标写符号叫做音标,(从国际音标上讲)分为严式音标和宽式音标 音位学是研究语音的社会学,即研究语音的社会功能。 语音的单位:音节、音素、元音、辅音、声母、韵母、声调、音标 音节是人们从听觉和发音感知上感觉到的最小的语音单位。 音素是从音质角度划分的最小的单位 音素(元音、辅音)——音节(声、韵、声韵)——语流 语音四要素音高、音强(重)、音长、音色 发声器官三大部分:动力区(肺)、发音体(喉头、声带)、共鸣腔(口腔、鼻腔、咽腔) 6.元音和辅音的区别(P59)划分和归并音位的原则:互补原则、相似原则、对立原则 舌面元音舌位唇形图(P60) 辅音(P62) 7.音位对立和互补原则(P70) 音位变体处于互补关系中的各个音素就被看成为同一个音位在不同位置的代表,是同一个音位的不同变异形式 ①出现条件受环境的制约,叫做音位的条件变体 ②其间的相互交换是自由的,没有条件限制的,叫做音位的自由变体 以音素为材料,从音质的角度来分析的音位叫做音质音位。 有区别词的语音形式的作用的音高、音重、音长叫做非音质音位 ①有区别词的语音形式的作用的音高变化,叫做调位 ②语言学中把这种能区别词的语音形式的重音叫做重位或势位 ③英语还用元音的长短来区别词的语音形式,在语言学中叫做时位 8.有区别音位的作用的发音特征,叫做区别特征 音节是音位和音位组合起来构成的最小的语音结构单位 音位和音位组合的时候,或者由于受临音的影响,或者由于说话时快慢、高低、强弱的不同,可能发生不同的变化,这种变化,我们叫做语流音变

浅析现代汉语中的歧义现象的成因

浅析现代汉语中的歧义现象的成因 陈宇莹 歧义是自然语言中普遍存在的现象,无论是书面语还是口语,我们都随处可见。有一些语法学家把歧义现象作为一种消极的、不合规范的语言现象,要求大家尽量避免。事实上,歧义现象的研究对于探讨语言形式和语言内容的种种复杂的关系,揭示语法规律是很有意义的。研究歧义可以考察同一语言形式表达多种语义内容的可能性,考察表面相同的形式实质上的差异,进而深化对语言形式与内容的种种复杂对应关系的认识。所以,深入研究汉语歧义问题是很有必要的。 歧义就是指同一语言形式包含两种或两种以上不同意义的现象。即在理解上会产生多种可能,也可以说,就是可以这样理解也可以那样理解的句子。歧义又叫同形,一个着眼于内容,一个着眼于形式,是一个问题的两个方面。歧义必须是以同形作为前提,不同形就无所谓歧义。 现代汉语中歧义现象的产生从根本上说,它是由客观世界的无限复杂性同语言表达手段的有限性之间的矛盾造成的,以下就从几个方面来进行阐述。 一、从句法层面分析歧义现象成因 句法是三个平面的基础,语义和语用的分析都围绕句法展开,它着重研究词的功能类别、词语组合时所形成的成分关系和层次。 (一)词语含义多造成歧义现象的产生 尽管现代汉语在词汇方面大大超过了古代汉语,但是仍不免歧义词的产生。如“上面”一词有以下意思:①指位置高的地方;②序靠前的部分;③体的表面;④方面;⑤指上级;⑥指家族中的上一辈。只有将多义词放在一个特定的具体的语言环境中,才可能排除其他义项,消除歧义。如“我从上面听到点风声,公司非常重视本次整顿。”这里的“上面”指的是上级,“风声”指的是从上级那里传播出来的消息。 (二)词的功能不同引起歧义 词的不同词性也会引起不同的理解,以至于引起歧义。如: 1.锤不烂。 2.门没有锁。 例1中,“锤”既可以作名词,又可以作动词用,所以自然而然就可以从两个角度去理解,一是“锤打一个东西,但是东西很坚硬,不能轻易锤烂;” 二是“锤子没烂,是好的”。因此,这个有歧义。 例2中,“锁”既可作动词,又可作名词,句子既能理解成“门没有被锁上”,又能理解成,“门本来就是没有装锁的”。 (三)结构关系不同造成歧义 如常见的主谓关系与偏正关系交叉的歧义短语,动宾关系与偏正关系交叉的歧义短语等。如: 1.(主谓——偏正)条件转换经济发展铁路建 设家具设计

相关主题
文本预览
相关文档 最新文档