当前位置:文档之家› 基于神经网络的人机对抗人工智能系统

基于神经网络的人机对抗人工智能系统

基于神经网络的人机对抗人工智能系统
基于神经网络的人机对抗人工智能系统

基于神经网络的人机对抗人工智能系统

Harreke

摘要

人工智能是一门科学名称。自电子计算机发明后不久,人工智能学科即宣布创立,其目的就是要模拟人类的智力活动机制来改进计算机的软件硬件构成,使他们掌握一种或多种人的智能,以便在各种领域内有效替代人的脑力劳动,特别是解决用传统软硬件方法难以解决的问题,如模式识别,复杂的控制行为或对海量的数据进行实时评估等。

所谓人工智能,就是由人工建立的硬件或软件系统的智能,是无生命系统的智能。智能是人类智力活动的能力,是一个抽象的概念。一个软件或硬件系统是否有智能,只能根据它所表现出来的行为是否和人类某些行为相类似来做判断。

人工智能在计算机上的实现,有两种不同的方式。一种是采用传统的编程技术,使系统呈现智能的效果,而不考虑所用方法是否与人或生物机体所用的方法相同。这种方法称为工程学方法,它的编程方式虽然简单,智能效果显著,可是算法和程序一旦固定下来,智能就很难再进一步提高。另一种是模拟法,它不仅要看智能效果,还要求实现方法和人类或生物机体所用的方法相同或类似。人工神经网络是模拟人类或生物大脑中神经元的活动方式,属于模拟法。

人工神经网络入门难度大,编程者需要为每一个对象设置一个智能系统来进行控制,新设置好的智能系统,虽然一开始什么都不懂,但它拥有学习的能力,可以通过学习,不断提升智能,不断适应环境、应付各种情况。通常来讲,使用人工神经网络虽然编程复杂,但编写完成后的维护工作,将比使用其他方式编程后的维护更加省力。

本文采用人工神经网络构建一个完整的人工智能系统,并将该人工神经网络理论应用于电脑领域的项目DOTA。

关键词:人机对抗,神经网络,人工智能, DOTA

目录

第一章神经网络系统概述

1.1 生物学神经网络

1.2 人工神经网络

1.2.1 人工神经网络系统概念

1.2.2 人工神经网络系统的组成

1.3 神经网络的训练

1.4 相关数学知识

1.4.1 人工神经元输出的计算

1.4.2 反向传播方法

第二章人工神经网络应用的设计

2.1 应用设计

2.2 DOTA简介

2.2.1 DOTA概念

2.2.2 DOTA规则

2.2.3 DOTA现状

2.2.3 DOTA AI概念

2.2.4 现有DOTA AI弊端

2.3 新版DOTA AI的理论设计

2.3.1 巡查系统

2.3.2 控制系统

2.3.3 指令中心

第四章数学算法的实际应用

4.1 确定三大系统的参数和意义

4.1.1 巡查系统

4.1.2 控制系统

4.1.3 命令中心

4.2 三大系统的具体实现思路

4.2.1 巡查系统

4.2.2 控制系统

4.2.3 命令中心

第五章总结

参考文献

附录

第一章神经网络系统概述

1.1 生物学神经网络

人工神经网络系统是模拟人思维的一种方式,仿照生物的大脑来工作。为了帮助理解,首先介绍一下生物大脑的工作方式。

生物的大脑拥有称为皮层的组织。大脑分为两层:灰色的外层和白色的内层。灰色层只有几毫米厚,但其中却紧密地分布着数十亿个被称为神经元的微小细胞;白色层占据了皮层组织的绝大部分空间,是由无数神经元相互连接组成的。

神经元的构成是独特的。每个神经元都长有轴突,用来将信号传递给其他神经元。

神经元由一个细胞体、树突和一根轴突组成。树突由细胞体向各个方向长出,用来接收信号;轴突也有很多分支,通过分支的末梢和其他神经元的树突相接触,形成突触。一个神经元是通过轴突和突出把产生的信号送至其他神经元。每个神经元通过它的树突,与大约1万个其他神经元连接。

神经元利用电化学过程交换信号。输入信号来自另一些神经元。这些神经元的末梢和本神经元的树突相遇形成突触,信号就从树突上的突触进入本细胞。虽然信号在大脑中的传输过程极其复杂,但也可以把它看做与计算机一样,利用二进制的0与1进行操作。

每个神经元只有两种状态:兴奋和不兴奋。神经元把所有从树突的突触上接受来的激励信号,通过我们目前还未知的的方式相加。如果相加所得结果超过某种阈值,则该神经元就会被激励,变得兴奋,同时产生一个激励信号,通过它轴突的突触,把产生的信号传给其他神经元;如果相加所得结果没有超过阈值,该神经元就不会被激励。

虽然单个神经元的结构极其简单,功能有限,频率大约只有100Hz,但正因为有数量巨大的神经元,相互连接构成一个庞大的并行处理网络,所以整个神经网络系统具备难以置信的能

力:

1)能实现无监督的学习

功能完整的神经网络系统可以实现自行学习,而不需要导师的监督教导。如果一个神经元在一段时间内受到较高频率的刺激,则它和输入信号的神经元之间的连接强度就会在一定程度上改变,使得该神经元下一次受到刺激时,更容易兴奋。

2)对损伤有冗余性

神经网络系统即使受到了损伤,它依然能执行复杂的工作。

3)处理信息的效率极高。神经元之间的信息传递速度,与计算机CPU中数据传递的速度相比,是非常非常慢的。但因为神经网络系统采取了并行处理方式,使得整个系统可以同时处理巨量的数据,因此整体处理速度得到极大的提升。

4)善于归纳推广

神经网络系统和计算机不同,前者极其擅长模式识别,并能根据已经掌握的信息进行归纳推广。比如,一个人可以阅读另一个人手写的文字,即使这前者以前从未见过后者写的东西。5)拥有意识

这是神经学家和人工智能研究者至今仍在商讨的话题。人拥有意识,这是无可辩驳的,但除了人以外,拥有完整神经网络系统的其他事物,是否也拥有意识?

综上所述,一个人工的神经网络系统,所要完成的任务,就是在现有计算机规模的约束下,尽可能地模拟生物学大脑的这种并行处理机制,并且在其运作时,能够显示出许多与生物学大脑相类似的特性。

1.2 人工神经网络

1.2.1 人工神经网络系统概念

生物学大脑中的神经网络系统是由很多神经元组成的,模拟大脑的人工神经网络系统也是由很多称为人工神经元的单元组成。

人工神经元其实就是生物学神经元的简化版,但却是采用电子方式来模拟的。一个人工神经网络系统里使用的人工神经元数量,差别可以非常大,从简单的数个,到数千个,这完全取决与要用人工神经网络系统要实现的功能。

下面是一个人工神经元的结构图:

w称作权重,是浮点数。进入人工神经元的每一个信号都会与一个权重相联系。而正是有这些权重,一个人工神经元才会有活跃性,才会对输入的信号做出判断。

假设所有权重w的取值为-1到1之间的一个随机小数。因为权重有正有负,所以能够影响与它有关联的信号输入。如果权重为正,就会对相关联的信号输入起激发作用;如果权重为负,就会对相关联的信号输入起抑制作用。

一个人工神经元会把所有的输入信号,与其对应的权重分别相乘,然后把相乘的结果作为给神经元核的输入。神经元核把这些经过权重调整过的输入全部加起来,形成最终激励值,激发这个人工神经元进入兴奋或非兴奋状态。最终激励值也是一个浮点数,如果它超过这个人工神经元的某个阈值(假设阈值为1.0),则人工神经元会向外输出一个数值为1的兴奋信号,反之则输出一个数值为0的非兴奋信号。

这就是人工神经元最简单的一种激励方式。这里激励值产生输出值的过程,是由一个函数来完成,这个函数就叫阶跃激励函数。

1.2.2 人工神经网络系统的组成

生物学大脑里的神经元是和其他神经元相互连接在一起的。为了创建一个人工神经网络,人工神经元也要以相同的方式互相连接在一起。

所有人工神经网络系统中,中最容易理解并且也是最广泛地使用的,是前馈网络。该网络把人工神经元一层一层地连接在一起,每一层的人工神经元都向前一层馈送,直至获得整个网络的输出。

前馈网络共有3层。输入层中的每个输入都亏送到了隐藏层,作为该层的每一个人工神经元的输入;从隐藏层的每个人工神经元的输出,都连到了输出层的每一个人工神经元。

作为前馈网络,实际上可以有任意多个隐藏层,每一层也可以有任意数目的人工神经元,这完全取决与要解决目标的复杂性。

1.3 神经网络的训练

一旦神经网络构建完毕,就可以对其进行训练,使其处理数据的能力符合最初的设计要求。假设需要该神经网络识别物体A。

①为神经网络中,每一个层、每一个人工神经元里每一个权重赋予初始数值。

②对输入层中的人工神经元输入需要识别的一系列数据。

③对于每一种输入配置,检查它的输出是什么,并调整相应的权重。

输入一张图片,里面画的不是物体A,而是其他物品。这时网络应输出一个0。

对与每个非物体A的图片数据,都要调节网络权重,使得它的输出趋向于0;对于每个物体A 的图片数据,也要调节网络权重,使得它的输出趋向于1。

④成功识别出物体A后,通过再次训练,就可以使网络识别其他物体B、C、D等等。

这种类型的训练称为有监督的学习,用来训练的数据成为训练集。调整权重可以采用许多方法,这里采用反向传播方法。

第二章人工神经网络应用的设计

2.1 应用设计

本文将使用神经网络技术,设计一个人机对抗项目,并将这个人机对抗项目,应用于电脑上的一个多人的人人对抗项目DOTA中。

2.2 DOTA简介

2.2.1 DOTA概念

DOTA是电脑领域上新兴的一个多人对抗项目,全称为Defense Of The Ancients,即守卫遗迹。它的编写者名为Ice Frog。

2.2.2 DOTA规则

DOTA是一个多人的人人对抗项目。但它的规则在某些方面与象棋类似。

1)参与对抗的对抗者最多为10人,分为两大阵营,每方阵营各5人。

2)每个参与者扮演一名“棋子”。每个棋子拥有生命力、战斗力等属性,可以通过学习不同的技能,购买不同的物品提升自身的实力。

3)双方所有棋子在一定的地域内活动。同时,双方各有一座遗迹,和数个保卫遗迹的建筑物。4)每一方的棋子都必须不计一切代价保护己方的建筑物和遗迹,同时利用一切可行方式去摧毁敌方的建筑物和遗迹。

5)一旦一方棋子率先突破防御,摧毁了对方的遗迹,该方立即获胜,并宣告对抗终结。

2.2.3 DOTA现状:

DOTA于几年前年开始流行。随着它的编写者Ice Frog不断努力,DOTA的平衡性越来越高,内容越来越丰富,因此,DOTA迅速风靡全球。世界各地都频频举办大型DOTA竞技比赛,我国也在今年5月举办过世界级的竞技大赛(WCG2009)。

2.2.3 DOTA AI概念:

但正因为DOTA是多人对抗项目,为了能进行对抗电脑必须联网,而且还必须有他人参与。如果因为某些原因,比如电脑无法联网,或者参与的人数不足等,便无法正常进行对抗。

为了解决这些问题,一名国外编程高手Lazyfiend,简称RGB,于数年前编写了一套人工智能系统,可以生成数个电脑控制的角色(简称AI),来顶替人数的空缺,跟真正的人类竞技。这就是DOTA上最初的人机对抗项目。

这个人机对抗系统极大地缓解了因为电脑无法联网或人数不足等原因,而不能正常进行对抗的问题。使用DOTA 人工智能系统进行竞技的人不计其数。

因此,DOTA人机对抗项目独立出来,成为与DOTA人人对抗项目齐名的新形项目——DOTA人工智能系统,简称DOTA AI。人们也分成了两大类,一类跟其他人通过DOTA对抗,一类跟电脑通过DOTA AI对抗。

2.2.4 现有DOTA AI弊端

可是,随着时间的推移,RGB的DOTA AI的弊端也就浮现出来。RGB由于完全采用了工程学方法编程,电脑角色的一切行为全都固定化,电脑角色控制的棋子的行动套路全部是事先编好的,不会随机应变。虽然这种人工智能系统在当时打败了不少人,击溃了不少挑战,但现在,人们已经看破了这种人工智能系统的运作方式,找出了它的致命破绽。

这可以用一个例子来比喻,人跟电脑下象棋时,电脑很厉害,人下不过,但多下几局后,人发现,电脑下棋的方式是完全固定的,每一步走棋都严格重复上一把的套路。因此,人可以从电脑这一成不变的下法中找出破绽,摸索出完全克制电脑的套路,从而击败电脑。一旦有了克制的套路,人就可以一点都不动脑筋,只要简单地按这种套路下棋,就能轻易击败电脑——因为电脑不懂得随机应变。

遗憾的是,RGB只对他的DOTA AI更新过几次,就退出不再干了。流传至今的,还只是他数年前编写的、不懂得随机应变的那套人工智能系统。

现在DOTA的版本飞速更新换代,由于一直没有人接替RGB的工作,从根本上改变DOTA AI 智力底下的现状,导致DOTA与DOTA AI之间的差距越来越大。

还是用下象棋举例。电脑的程序更新之后,电脑就多了几种下法,不再一成不变地使用那套已经被人看破的套路了。一下棋,人自然又被电脑击败了。但再多下几次,人又发现了电脑的致命破绽——多出来的那几种套路,也全是固定不变的。只要人摸清了电脑全部的套路之后,自然能摸索出克制这些固定下法的套路。总而言之,就算程序再更新几次,也没有实质的用处;电脑的固定的套路无论有多少种,人只要多花点时间就能全部看破。

DOTA AI参与者的抱怨之声越来越大,这时候国外又出现一名编程高手BuffMePlz,简称BMP。但他同样没有能力从根本上改变DOTA AI智力低下的现状。他所做的,只有一件事,那就是不停地更新程序,为人工智能系统机械地加入更多的固定的算法。

人跟电脑下象棋,如果电脑只有固定的一种套路,人很快就能看破;如果电脑更新程序,多了几种不同的但仍然固定的套路,人就需要多花点时间看破;但如果电脑有了十几种、几十种、乃至上百种不同的套路,虽然每种套路还是固定的,可由于数量激增,人要想看破,就需要花巨量的时间。这种机械式的程序更新,从某种意义上来说,能极大缓解DOTA AI智力低下的问题。

固定套路数量的激增带来的,首先是程序容量的剧增——程序容量越大,就可能隐藏越多的错误,导致电脑出问题;其次是工作量的剧增——编写套路需要非常多的时间。

人们看破了电脑的套路后,编写者就要编出另外的套路。可人们会更快地看破,因此编写者又需要加快速度,绞尽脑汁再编写更多的套路——这种固定套路的人工智能系统,陷入了一个恶性循环,它的弊端无需置疑。

本人于去年开始尝试设计新的DOTA AI。

2.3 新版DOTA AI的理论设计

不同于RGB的完全工程学方法、完全固定套路的算法,本人将采用以模拟法为主导,工程学为辅助的算法,在理论上构建一个人工智系统。

理论上,一个完整的人工智能系统,应包含如下几大部分。

2.3.1 巡查系统

DOTA AI是建立在DOTA的基础上的,所以最重要的一点,是必须严格遵守DOTA的各项规则,电脑角色的各种行为不能超出DOTA规则所允许的范围之外。

这些规则将通过一个巡查系统实现。由于规则是完全固定的,不会,也不容许有任何更改,因此该系统使用工程学方法编程。

巡查系统是独立于所有电脑角色之外的裁判,应该有如下功能:

1)信号转化

把进行对抗时,所有传递给人类的、人类大脑可以识别的视觉、听觉等信息,转化为电脑角色可以识别的数字信号。

这个功能为电脑角色提供知觉能力。

2)行为限制

因为人类角色在进行对抗前,已经熟知了对抗规则,所以会自觉地避免让所控制棋子做出违规行为的情形。

而巡查系统就起着实时监控电脑角色行为的功能,如果某个电脑角色的数据,有可能指引它控制的棋子做出违规的行为,则巡查系统就对该电脑角色发出警告,使其修正数据。

2.3.2 控制系统

为了使电脑角色有效地控制它的棋子,必须有一个系统,能够接收电脑角色发出的指令,并使棋子执行该指令。

由于棋子应对电脑角色发出的指令绝对服从,因此控制系统也使用工程学方法编程。

控制系统应该有如下功能:

1)发布指令

电脑角色可以通过这一功能,对它控制的棋子下达各种指令,比如移动、攻击、撤退、防守,等等。

2)响应指令

电脑角色发布一个指令后,棋子就必须立刻响应该指令,并严格执行。

3)执行结果反馈

棋子执行指令后,要对电脑角色汇报指令的执行情况。如果由于一些不可抗拒因素,指令未被执行,或者指令执行不到位,电脑角色就要迅速做出其他决策。

2.3.3 指令中心

指令中心是整个人工智能系统的核心,它起着人类大脑的思维的作用。没有指令中心,所有电脑角色也只不过是一堆堆数据;有了指令中心,电脑角色就是真人一样的存在,才有类似真人一样的思维和行为。

指令中心应该有如下功能:

1)知己知彼

所谓“知己知彼,百战不殆”,电脑角色想要正确做出决策,必须全面掌握己方和敌方的详细数据。

虽然电脑角色可以控制的棋子种类很多,每个棋子的实力也不同,但由于棋子所有的能力(生命力、战斗力等)都可以用具体的数据来表示,因此无论任何时候,一个由电脑角色控制的棋子,它的整体实力都可以靠一系列实数完整地描述。所以这个功能用完全工程学方法实现。2)探索活动区域

DOTA的活动区域很大,而棋子的视野很小,所以电脑角色需要通过让棋子探索活动区域来掌握战场状况。因为存在少数几处固定的“兵家必争之地”,但由于其他(不论人类还是电脑)角色控制的棋子是活动的,懂得转移阵地或建立临时阵地,所以这个功能可以由半工程学方法、半模拟法共同实现。

3)提升棋子实力

为了战胜敌人,需要使自己控制的棋子变得更强。增强棋子实力的方式是获得经验值、提升等级、学习技能、购买物品。

DOTA中每个棋子都有经验值的设定,通过与敌人对抗,每次对抗的胜利者都会获得经验值。每当经验值累积到一定程度,棋子的等级就会提升。

棋子每提升一次等级,就可以学习一个技能。一个棋子可以从它的技能库中选择一个技能(五选一)进行学习。

DOTA中有数量众多的物品可供电脑角色购买,并装备给它控制的棋子。通过与敌人对抗,每次对抗的胜利者都会获得金钱奖励,当金钱奖励累积到一定程度,就可以从物品库中购买一个物品(多选一),装备给它的棋子。

每个电脑的棋子实力都不相同,因此不同技能和不同物品对棋子起到的能力提升作用也不同,组合数量非常巨大。虽然在技能学习和物品购买方面,存在一些已有的常识性规则,但更多时候还要靠模拟法实现。

4)实时评估

就算电脑角色知己知彼,也知道如何提升自己棋子的实力,但真正面对敌人时,就需要有快速反应能力,评估战场局势,是攻是退、是坚守阵地还是呼叫支援。

RGB的人工智能系统最大的弊端就在于,这一战场评估功能也采用了完全工程学编程,使得电脑角色没有主动的、实时的评估能力,只有被动的、反应速度慢的评估能力,而被人类角色用计谋轻易击败。

而新版人工智能系统采用模拟法编程,能使电脑角色拥有较强的分析能力和计谋使用能力,让其更不易被击败。

另外,电脑角色的实施评估能力要受到巡查系统的制约,即电脑角色不能以违规的方式对付敌方角色,敌方角色也不能以违规的方式对付己方角色。

拥有上述三大系统后,这个人工智能理论设计就完成了。

下面可以开始将数学算法应用于理论当中。

第四章数学算法的实际应用

4.1 确定三大系统的参数和意义

三大系统为巡查系统、控制系统和指令中心。每个系统都有传入、传出两类参数。

4.1.1 巡查系统

巡查系统使用完全工程学方法编写。

巡查系统的参数有:

1)信号转化方面

传入参数:

①内容:己方角色总数量及棋子总数量、每个己方角色当前金钱资源、每个己方棋子当前的实力数据(生命力、战斗力、已学技能、已购买物品),以及所处位置

敌方角色总数量及棋子总数量、每个敌方棋子当前的实力数据(生命力、战斗力、已学技能、已购买物品),以及出现在己方棋子视野中的每个敌方棋子的位置

②类型:视觉信号

③描述:对于人类角色,上述信号都是通过人类的双眼,以视觉图像方式传入大脑。

传出参数:

①内容:内存中的数据

②类型:实数组

③描述:上述各项信号虽然以视觉图像表达出来,通过人类的双眼传入大脑,但这些信号在电脑内存中都有对应的内存地址。信号转化实际上,是直接将这些信号对应的内存中的数据,传送给指令中心。

2)行为限制方面

传入参数:

①内容:每个电脑角色通过控制系统下达给棋子的指令

②类型:句柄——发布指令的电脑角色,句柄——执行指令的棋子,整数——指令本身,句柄——目标单位或目标地点

③描述:巡查系统检查电脑角色下达的指令,将其与内置的固定规则进行运算、比较

传出参数:

①内容:“允许”或“否决”

②类型:布尔值

③描述:如果下达给棋子的指令没有违反最根本的规则,就允许该指令;反之否决该指令,并给电脑角色一个“警告”惩罚,让其重新调整角色。

4.1.2 控制系统

控制系统也使用完全工程学方法编写。

控制系统的参数有:

传入参数:

①内容:电脑角色通过指令中心实施评估后,下达的指令

②类型:句柄——发布指令的电脑角色,句柄——执行指令的棋子,整数——指令本身,句柄——目标单位或目标地点

③描述:棋子接收到指令后会立刻响应。

传出参数:

①内容:棋子执行指令的结果

②类型:浮点数——指令完成度

③描述:用于反馈给命令中心,这次下达/响应指令是否成功。

4.1.3 命令中心

命令中心的参数有:

1)知己知彼方面

该功能使用完全工程学方法编写。

传入参数:

①内容:经过巡查系统转化过的各种信号

②类型:实数组

③描述:巡查系统为电脑角色提供知觉

传出参数:

①内容:己方角色及其控制的棋子的整体实力、敌方角色及其控制的棋子的整体实力

②类型:实数组

③描述:命令中心接收到巡查系统传来的数据后,经过相关计算,生成敌我双方目前实力的评估报告(一系列实数),储存于电脑角色的记忆数组中。

2)探索活动区域方面

该功能使用半工程学、半模拟法——前馈网络编写。

传入参数:

①内容:经过巡查系统转化过的各种信号

②类型:实数组

③描述:传入的信号主要是己方棋子的位置分布,和敌方棋子的活动记录。因为敌方棋子不可见,只有进入己方棋子的视线内才会被察觉,所以命令中心会根据传入参数,预测敌人出现的地点。

传出参数:

①内容:三维坐标,及坐标的重要程度

②类型:实数组

③描述:整个活动范围是三维的空间,用三个实数变量x、y、z表示一个三维坐标(x,y,z)。传出的三维坐标表示目的地,目的地所处的地域不同,重要性也不同。重要性是固定的,但命令中心会根据目的地的重要程度,自行决定是否派棋子去探索。

3)提升棋子实力方面

该功能使用半工程学方法、半模拟法编写。

传入参数:

①内容:经过巡查系统转化过的各种信号

②类型:实数组

③描述:传入的信号主要是跟电脑角色自己有关的数据,为自身当前拥有的金钱资源(用于购买物品),和棋子当前的实力(为了学习技能)。

传出参数:

①内容:技能的编号和物品的编号

②类型:整数

③描述:为了实现“有效提升”棋子实力这一目的,需要先掌握电脑角色和棋子当前的数据(一系列实数),然后输进一个训练好的神经网络系统。神经网络识别这一系列数据后,将迅速并准确地给出对应的具体实施方案。

4)实时评估方面

该功能使用模拟法——竞争网络编写。

传入参数:

①内容:经过巡查系统转化过的各种信号

②类型:实数组

③描述:电脑角色的棋子遇到敌方单个棋子时,需要迅速评估自己棋子和敌方棋子的实力;如果己方数个棋子同时遇见敌方数个棋子时,不仅需要评估每一个棋子的实力,还得考虑敌我双方棋子之间,互相配合的能力(换句话讲,就是计谋)

传出参数:

①内容:电脑角色对它的棋子发布的指令

②类型:句柄——发布指令的电脑角色,句柄——执行指令的棋子,整数——指令本身,句柄——目标单位或目标地点

③描述:电脑角色经过实时评估后,就会做出决策。决策的内容就是一系列指令,控制棋子做出一系列能够击败敌方棋子,或保全己方棋子的行动。行动包括直接上前攻击、迂回、诱敌深入、埋伏落单棋子、辅助己方棋子,或者撤退、掩护友方棋子等等。

4.2 三大系统的具体实现思路

4.2.1 巡查系统

1)信号转化功能

由于各种信息的视觉信号,都与电脑内存中具体的数据相对应,所以,只要将这种对应关系整理出来,列成一个可查询的表格,就能实现信号转化功能。

输入待转化信号→查询表格→得到输出结果

2)行为限制功能

违反规则的行为共有下列几种:

使用作弊工具,非法修改角色的金钱资源→非法改变金钱

使用作弊工具,非法修改棋子的实力→非法提升实力

以任何方式利用DOTA自身的漏洞→利用BUG

利用任何手段,直接侦测到敌方棋子的位置等不可见的数据→非法侦察情报

在附近没有敌方棋子防守的情况下,偷袭敌方建筑物→非法进攻

一方阵营的角色为它们棋子购买的特殊物品的总数量超标→违反物品限制

这些违规行为都可以通过多组数据描述。

一旦一个电脑角色发出的指令,其具体数据通过逐条比较后,与违规行为数据组中的数据整体相似,就可以认定这个指令违规。

4.2.2 控制系统

为了实现指令的发布与响应功能,这里构造一个指令队列系统。

构造方式如下:

1)系统为每一个电脑角色的棋子分配一个指令队列

2)每个指令队列中包含有编号1至编号10,一共10个(总数可变)指令单元

3)每个指令单元均有6项数据,分别是指令单元的指令、指令的目标单位、指令的目标地点、指令的计时器、指令的描述、指令的描述注解。

4)指令单元每项数据的作用:

数据名称描述

指令表示该棋子需要执行的指令

目标单位表示该单位需要对谁执行指令

目标地点表示该单位需要在哪里执行指令

计时器表示该单位执行该指令最多花费多长时间

描述表示该指令的行为描述,影响后续实时评估结果

描述注解表示其他必要的描述,影响后续实时评估结果

完成度表示这个指令完成度如何

表 2

5)指令队列中若存在指令,棋子将按编号从1至指令总数量(最大数量10),依次执行指令单元中的指令。

6)电脑角色对指令队列进行的操作,共有如下几种:

①下达一个立刻执行指令

下达的指令会直接替换编号1的指令单元中的指令,无论棋子刚才在做什么,现在都会立刻执行新下达的指令。

②在指定编号的指令单元中下达一个非立刻执行指令,或在指令队列最后附加一个非立刻执行的指令

这可以让棋子拥有做出一系列指定动作(即使用计谋)的能力。

③清除指令队列中所有指令

这可以让棋子处于原地待命状态。

④计算指令完成程度

如果指令根本没被执行,则输出0,否则输出完成度数值(百分比)

7)指令队列原理

发布指令给事物(电脑角色发布指令给队列)——事物接收指令并执行(棋子接收到指令,并执行),这一方式模拟了人类“思考”——“行动”的过程。

4.2.3 命令中心

1)知己知彼功能

一个角色的整体实力包括其拥有的金钱资源,棋子本身实力(生命力、战斗力)和技能、物品对棋子本身实力的提升。

由于DOTA的设定,一个角色和它控制的棋子自身各种数据一旦确定,就一定会有一个确定的整体实力数值。

设一个角色金钱资源为M,棋子本身生命力为H,棋子本身战斗力为A,棋子已经学习的技能对生命力、战斗力的提升为S、I,棋子已经购买的技能对生命力、战斗力的提升为S'、I',整体实力为T。

则会有一个线性函数F,使得T=F(M,H,A,S,I,S',I')。

对于每一个角色(无论敌我),由于它各种数值(除了坐标数值)虽然会改变,但在一定时间范围内(数秒到数分钟)可以保持稳定不突变(就算现在突然改变了,但也再会保持一定时间,才再次改变),因此在这段稳定期内,可以使用函数F求出整体实力T。

2)探索活动区域功能

①半工程学方面,由于整个活动区域内各项地形数值不会改变(地面不会在这里凸起一块,或凹进一块等),因此一个地域内的地形的重要性(是否利于防守、是否毫无战略价值等),在一开始就被设置好了,不会改变。

所以目标地点所处的地域,重要性也能通过一个可查询表格实现。

输入目标地点坐标→查询表格→得到输出结果

而目标地点坐标,可以通过对敌方棋子活动记录预测(敌人最后出现在哪里,就尝试去哪里探索),或者反向查询表格(输入重要性,得到目标地点)来求出。

②半模拟法方面,由于电脑角色只需要求出自身、敌方每个未露面棋子整体实力,然后通过简单权重计算,算出棋子到达未探索的目的地时,万一遇见敌方棋子时,是否敌得过即可。所以构建一个只有一个神经元的系统。

神经元有五个输入,为自身棋子的整体实力,与敌方每个未露面棋子的整体实力的大小比较。如果自身棋子的整体实力比一个敌方棋子强大,对应的输入就为1,否则为0.

神经元依次把五个输入与其对应的权重(电脑角色对于每个敌方角色的实力预估)相乘,并求积的总和。如果最终激励值超过神经元的阈值,则去目标地点探索承担的风险可以接受;否则表示去目标地点探索承担的风险太大,不可接受。

3)提升棋子实力功能

提升棋子实力主要通过两点,技能的(多选一)学习和物品的(多选一)购买。

技能的学习:

技能可以提升棋子的生命力或战斗力。

每个棋子每一等级可以学习一个技能(从自身技能库中五选一),由于一个技能不会同时提升生命力和战斗力,因此需要评估所有类别的技能的各项数据,找出学习哪一个技能后,棋子整体实力提升最明显。

对于一些棋子的部分技能,存在一些常识性学习规则,这些规则是人类角色通过无数次试验,得到的常识。如果一个棋子技能学习部分存在常识性学习规则,技能将优先按照该规则以固定的方式学习技能。

如果一个棋子没有或只有很少常识性学习规则,那么就需要使用一个通用技能学习神经网络,通过该网络求最优解。

由于通用技能学习神经网络需要做到五选一,存在竞争关系,因此需要使用竞争网络。

构建一个只有输入层和竞争层的双层竞争网络。

输入层由处理单元构成,处理单元的作用是将输入的,可以完整描述一个棋子自身实力的所有数据,转化为一个输入模式。对于每一个棋子,输入模式是通用的,但因为每个技能都不相同,所以竞争单元也不相同。

竞争层由五个竞争单元组成。每个竞争神经单元都与输入层的处理单元相连接,如果一个竞争单元输入的加权和最大,则该竞争单元对应的技能成为优胜者,被棋子学习。

由于技能的复杂性,这个竞争网络必须由人工监督训练。

物品的购买:

物品也可以提升棋子的生命力或战斗力。

物品总量众多,而且物品的购买不受棋子种类限制(就是说对于每一个棋子,它能购买的物品都是相同的)。物品的购买仅仅受限于电脑角色的金钱资源,和棋子所携带物品总量(一个棋子最多可以携带6个物品)。

电脑角色在为棋子购买物品时,不可能把每一个物品都买一遍,因此需要评估所有类别的物品的各项数据,找出购买哪一个物品后,棋子整体实力提升最明显。

对于一些棋子的部分物品,也存在一些常识性购买规则,这些规则是人类角色通过无数次试验,得到的常识。如果一个棋子物品购买部分存在常识性购买规则,物品将优先按照该规则以固定的方式购买。

如果一个棋子没有或只有很少常识性学习规则,那么就需要使用一个通用物品购买神经网络,通过该网络求最优解。

由于通用物品购买神经网络需要做到多选一,存在竞争关系,因此需要使用竞争网络。

构建一个只有输入层和竞争层的双层竞争网络。

输入层由处理单元构成,处理单元的作用是将输入的,可以完整描述一个棋子自身实力的所有数据,转化为一个输入模式。对于每一个棋子,输入模式都通用,竞争单元也通用的。无论棋子是什么种类的,只要它的输入模式与已知的符合,就可以购买对应的物品。

竞争层由多个竞争单元组成,数量取决与物品总数。每个竞争神经单元都与输入层的处理单元相连接,如果一个竞争单元输入的加权和最大,则该竞争单元对应的物品成为优胜者,被棋子购买。

由于物品的复杂性,这个竞争网络必须也由人工监督训练。

4)实时评估功能

发生遭遇战时,巡查系统会对每个电脑角色进行通告,并为其提供战况情报与数据。

对敌我双方临近战场棋子整体实力的评估,是通过一个神经元进行的。这个神经元构造与实现“探索活动区域”功能的神经元相似,只不过目的地坐标被自动设定为战场。

这个评估是告诉一个电脑角色,加入战斗有多大风险,多大的胜算。电脑角色将评估结果于自身的性格值结合,最后决定是否加入战斗。

电脑角色谋略的使用,是靠一个竞争网络实现的。

这个竞争网络的处理单元,将战场的地形、坐标、范围,以及参与战斗的敌我双方的棋子整体实力等详细数据,转化成一个输入模式。对于每一个棋子,输入模式都通用,竞争单元也通用。无论棋子是什么种类的,只要它的输入模式与已知的符合,控制它的电脑角色就会做出相应的一系列动作(即实施谋略)。

竞争层有多个竞争单元组成,数量取决与一个角色可以做出的谋略或配合的总数。对于电脑角色,它们一开始并不了解,也不能识别不同输入模式对应的行为的意义。所以这个竞争网络必须由监督人工训练,由人告诉电脑角色,什么样的行为是迂回、是诱敌深入或埋伏落单敌方棋子等,以及什么样的输入模式对应什么样的行为,等等。

第五章总结

人工智能与神经网络课程论文

1. 引言 (2) 2. 在农业生产管理与决策中的应用 (2) 2.1. 在农业机械化中的应用 (2) 2.2. 在智能农业专家系统中的应用 (3) 3. 在预测和估产中的应用 (3) 3.1. 在农作物虫情预测中的应用 (3) 3.2. 在作物水分和营养胁迫诊断及产量估测中的应用 (4) 4. 在分类鉴别与图像处理中的应用 (5) 5. 结束语 (5)

BP 神经网络的研究与应用 摘要: 本文概述了BP 神经网络在农机总动力预测、农业专家系统信息决策、虫情测报、农作物水分和养分胁迫、土壤墒情、变量施肥、分类鉴别和图像处理等领域的应用情况,总结了人工神经网络模型的优点,指出其在精准农业和智能农业中的重要理论技术支撑作用。 关键词: BP神经网络; 农业工程; 农业专家系统; 变量施肥; 土壤墒情 Research and Application of BP Neural Network Abstract: Application of BP neural network in prediction of total power in agriculture machinery,information decision-making by agricultural experts system,pest forecast,crops to water stress and nutrient stress,soil moisture condition,variable rate fertilization,identification and image processing were overviewed.Characteristics of artificial neural network model were summed.Supporting role for important theory and technology in precision agriculture and intelligent agriculture were pointed. Key words: BP neural network,Agricultural engineering,Agricultural experts system,Variable rate fertilization,Soil moisture condition

人工智能教程习题及答案第9章神经网络与遗传算法

第九章神经网络与遗传算法习题参考解答 9.1练习题 9.1 何谓人工神经网络?它有哪些特征? 9.2 生物神经元由哪几部分构成?每一部分的作用是什么?它有哪些特性? 9.3 什么是人工神经元?它有哪些连接方式? 9.4 B-P算法的网络结构是什么?简述B-P算法的学习过程。 9.5 什么是网络的稳定性? Hopfield网络模型分为哪两类?两者的区别是什么? 9.6 有教师学习与无教师学习的区别是什么? 请分析说明。 9.7 Hopfield模型与B-P模型的网络结构有何异同? 9.8 简述简单遗传算法的基本原理和一般过程,说明个体选择的常用策略,以及遗传操作“交叉”和“变异”所起的作用。 9.9 遗传算法有哪些特点?在应用遗传算法时要解决的最关键问题有哪些? 9.2习题参考解答 9.1 答: (略) 9.2 答: 生物神经元主要由三部分构成:细胞体、轴突和树突。 每一部分的作用是:(a)细胞体是神经元的新陈代谢中心,同时还用于接收并处理从其他神经元传递过来的信息。(b)轴突的作用相当于神经元的输出电缆,它通过尾部分出的许多神经末梢以及梢端的突触向其他神经元输出神经冲动。(c)树突的相当于神经元的输入端,用于接收从四面八方传来的神经冲动。 神经元的功能特性包括:(a)时空整合功能。(b)神经元的动态极化性。(c)兴奋与抑制状态。(d)结构的可塑性。(e)脉冲与电位信号的转换。(f)突触延期和不应期。(g)学习、遗忘和疲劳。 9.3 答: (略) 9.4 答: B-P算法的网络结构是一个前向多层网络。网络中不仅含有输入节点和输出节点,而且含有一层或多层隐(层)节点,网络中各处理单元间的连接如图6.16所示。当有信息向网络输入时,信息首先由输入层传递到隐层节点,经特性函数(人工神经元)作用后,再

人工智能(部分习题答案)

1.什么是人类智能?它有哪些特征或特点? 定义:人类所具有的智力和行为能力。 特点:主要体现为感知能力、记忆与思维能力、归纳与演绎能力、学习能力以及行为能力。 2.人工智能是何时、何地、怎样诞生的? 解:人工智能于1956年夏季在美国Dartmouth大学诞生。此时此地举办的关于用机器模拟人类智能问题的研讨会,第一次使用“人工智能”这一术语,标志着人工智能学科的诞生。 3.什么是人工智能?它的研究目标是? 定义:用机器模拟人类智能。 研究目标:用计算机模仿人脑思维活动,解决复杂问题;从实用的观点来看,以知识为对象,研究知识的获取、知识的表示方法和知识的使用。 4.人工智能的发展经历了哪几个阶段? 解:第一阶段:孕育期(1956年以前);第二阶段:人工智能基础技术的研究和形成(1956~1970年);第三阶段:发展和实用化阶段(1971~1980年);第四阶段:知识工程和专家系统(1980年至今)。 5.人工智能研究的基本容有哪些? 解:知识的获取、表示和使用。 6.人工智能有哪些主要研究领域? 解:问题求解、专家系统、机器学习、模式识别、自动定论证明、自动程序设计、自然语言理解、机器人学、人工神经网络和智能检索等。 7.人工智能有哪几个主要学派?各自的特点是什么? 主要学派:符号主义和联结主义。 特点:符号主义认为人类智能的基本单元是符号,认识过程就是符号表示下的符号计算,从而思维就是符号计算;联结主义认为人类智能的基本单元是神经元,认识过程是由神经元构成的网络的信息传递,这种传递是并行分布进行的。 8.人工智能的近期发展趋势有哪些? 解:专家系统、机器人学、人工神经网络和智能检索。 9.什么是以符号处理为核心的方法?它有什么特征? 解:通过符号处理来模拟人类求解问题的心理过程。 特征:基于数学逻辑对知识进行表示和推理。 11.什么是以网络连接为主的连接机制方法?它有什么特征? 解:用硬件模拟人类神经网络,实现人类智能在机器上的模拟。 特征:研究神经网络。 1.请写出用一阶谓词逻辑表示法表示知识的步骤。 步骤:(1)定义谓词及个体,确定每个谓词及个体的确切含义;(2)根据所要表达的事物或概念,为每个谓词中的变元赋予特定的值;(3)根据所要表达的知识的语义用适当的联接符号将各个谓词联接起来,形成谓词公式。 2.设有下列语句,请用相应的谓词公式把它们表示出来: (1)有的人喜欢梅花,有的人喜欢菊花,有的人既喜欢梅花又喜欢菊花。 解:定义谓词如下: Like(x,y):x喜欢y。 Club(x):x是梅花。 Human(x):x是人。 Mum(x):x是菊花。 “有的人喜欢梅花”可表达为:(?x)(Human(x)∧Like(x,Club(x))) “有的人喜欢菊花”可表达为:(?x)(Human(x)∧Like(x,Mum(x))) “有的人既喜欢梅花又喜欢菊花”可表达为:(?x)(Human(x)∧Like(x,Club(x))∧ Like(x,Mum(x))) (1)他每天下午都去玩足球。 解:定义谓词如下: PlayFootball(x):x玩足球。 Day(x):x是某一天。 则语句可表达为:(?x)(D(x)→PlayFootball(Ta)) (2)市的夏天既干燥又炎热。 解:定义谓词如下: Summer(x):x的夏天。 Dry(x):x是干燥的。 Hot(x):x是炎热的。 则语句可表达为:Dry(Summer(Taiyuan))∧Hot(Summer(Taiyuan)) (3)所有人都有饭吃。

人工智能习题&答案-第4章-计算智能1-神经计算-模糊计算

第四章计算智能(1):神经计算模糊计算4-1 计算智能的含义是什么?它涉及哪些研究分支? 贝兹德克认为计算智能取决于制造者提供的数值数据,而不依赖于知识。计算智能是智力的低层认知。 主要的研究领域为神经计算,模糊计算,进化计算,人工生命。 4-2 试述计算智能(CI)、人工智能(AI)和生物智能(BI)的关系。 计算智能是智力的低层认知,主要取决于数值数据而不依赖于知识。人工智能是在计算智能的基础上引入知识而产生的智力中层认知。生物智能,尤其是人类智能,则是最高层的智能。即CI包含AI包含BI 4-3 人工神经网络为什么具有诱人的发展前景和潜在的广泛应用领域? 人工神经网络具有如下至关重要的特性: (1) 并行分布处理 适于实时和动态处理 (2)非线性映射 给处理非线性问题带来新的希望 (3) 通过训练进行学习 一个经过适当训练的神经网络具有归纳全部数据的能力,能够解决那些由数学模型或描述规则难以处理的问题 (4) 适应与集成 神经网络的强适应和信息融合能力使得它可以同时输入大量不同的控制信号,实现信息集成和融合,适于复杂,大规模和多变量系统 (5) 硬件实现 一些超大规模集成是电路实现硬件已经问世,使得神经网络成为具有快速和大规模处理能力的网络。 4-4 简述生物神经元及人工神经网络的结构和主要学习算法。

生物神经元 大多数神经元由一个细胞体(cell body或soma)和突(process)两部分组成。突分两类,即轴突(axon)和树突(dendrite),轴突是个突出部分,长度可达1m,把本神经元的输出发送至其它相连接的神经元。树突也是突出部分,但一般较短,且分枝很多,与其它神经元的轴突相连,以接收来自其它神经元的生物信号。 轴突的末端与树突进行信号传递的界面称为突触(synapse),通过突触向其它神经元发送信息。对某些突触的刺激促使神经元触发(fire)。只有神经元所有输入的总效应达到阈值电平,它才能开始工作。此时,神经元就产生一个全强度的输出窄脉冲,从细胞体经轴突进入轴突分枝。这时的神经元就称为被触发。突触把经过一个神经元轴突的脉冲转化为下一个神经元的兴奋或抑制。学习就发生在突触附近。 每个人脑大约含有10^11-10^12个神经元,每一神经元又约有10^3-10^4个突触。神经元通过突触形成的网络,传递神经元间的兴奋与抑制。大脑的全部神经元构成极其复杂的拓扑网络群体,用于实现记忆与思维。 人工神经网络的结构 人工神经网络由神经元模型构成。每个神经元具有单一输出,并且能够与其它神经元连接,存在许多输出连接方法,每种连接方法对应于一个连接权系数。 人工神经网络的结构分为2类, (1)递归(反馈)网络 有些神经元的输出被反馈至同层或前层神经元。信号能够从正向和反向流通。Hopfield网络,Elmman网络和Jordan网络是代表。 (2) 前馈网络 具有递阶分层结构,由一些同层神经元间不存在互连的层级组成。从输入层至输出层的信号通过单向连接流通,神经元从一层连接至下一层,不存在同层神经元之间的连接。多层感知器(MLP),学习矢量量化网络(LVQ),小脑模型连接控制网络(CMAC)和数据处理方法网络(GMDH)是代表。 人工神经网络的主要学习算法 (1) 指导式(有师)学习 根据期望和实际的网络输出之间的差来调整神经元连接的强度或权。包括Delta规则,广义Delta规则,反向传播算法及LVQ算法。 (2) 非指导(无导师)学习 训练过程中,神经网络能自动地适应连接权,以便按相似特征把输入模式分组聚集。包括

神经网络在人工智能中的应用

神经网络在人工智能中的应用 摘要:人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。关键词:人工智能,神经网络 一、人工智能 “人工智能”一词最初是在1956 年Dartmouth学会上提出的。从那以后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。例如繁重的科学和工程计算本来是要人脑来承担的,现在计算机不但能完成这种计算, 而且能够比人脑做得更快、更准确,因之当代人已不再把这种计算看作是“需要人类智能才能完成的复杂任务”, 可见复杂工作的定义是随着时代的发展和技术的进步而变化的, 人工智能这门科学的具体目标也自然随着时代的变化而发展。它一方面不断获得新的进展,一方面又转向更有意义、更加困难的目标。 二、神经网络

神经网络是:思维学普遍认为,人类大脑的思维分为抽象(逻辑)思维、形象(直观)思维和灵感(顿悟)思维三种基本方式。 逻辑性的思维是指根据逻辑规则进行推理的过程;它先将信息化成概念,并用符号表示,然后,根据符号运算按串行模式进行逻辑推理;这一过程可以写成串行的指令,让计算机执行。然而,直观性的思维是将分布式存储的信息综合起来,结果是忽然间产生想法或解决问题的办法。这种思维方式的根本之点在于以下两点:1.信息是通过神经元上的兴奋模式分布储在网络上;2.信息处理是通过神经元之间同时相互作用的动态过程来完成的。 人工神经网络就是模拟人思维的第二种方式。这是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能实现的行为却是极其丰富多彩的。 人工神经网络是由大量的简单基本元件——神经元相互联接而成的自适应非线性动态系统。每个神经元的结构和功能比较简单,但大量神经元组合产生的系统行为却非常复杂。 人工神经网络反映了人脑功能的若干基本特性,但并非生物系统的逼真描述,只是某种模仿、简化和抽象。 与数字计算机比较,人工神经网络在构成原理和功能特点等方面更加接近人脑,它不是按给定的程序一步一步地执行运算,而是能够自身适应环境、总结规律、完成某种运算、识别或过程控制。三.神经网络在人工智能中的应用专家系统

人工智能之人工神经网络(PDF 23页)

1 第八章人工神经网络吉林大学地面机械仿生技术教育部重点实验室 张锐

2 8.1 神经网络的基本概念及组成特性 8.1.1 生物神经元的结构与功能特性 从广义上讲,神经网络通常包括生物神经网络与人工神经网络两个方面。生物神经网络是指由动物的中枢神经系统及周围神经系统所构成的错综复杂的神经网络,它负责对动物肌体各种活动的管理,其中最重要的是脑神经系统。 人工神经网络是指模拟人脑神经系统的结构和功能,运用大量的软、硬件处理单元,经广泛并行互连,由人工方式建立起来的网络系统。 生物神经元就通常说的神经细胞,是构成生 物神经系统的最基本单元,简称神经元。 神经元主要由三个部分构成,包括细胞体、 轴突和树突,其基本结构如图所示。 1. 生物神经元的结构 生物神经元结构 吉林大学地面机械仿生技术教育部重点实验室 张锐

3 从生物控制论的观点来看,作为控制和信息处理基本单元的神经元,具有下列一些功能与特性。 2. 神经元的功能特性 (1)时空整合功能 神经元对于不同时间通过同一突触传入的信息,具有时间整合功能;对于同一时间通过不同突触传入的信息,具有空间整合功能。两种功能相互结合,使生物神经元具有时空整合的输入信息处理功能。 (2)神经元的动态极化性 尽管不同的神经元在形状及功能上都有明显的不同,但大多数神经元都是以预知的确定方向进行信息流动的。 (3)兴奋与抑制状态 神经元具有两种常规工作状态,即兴奋状态与抑制状态。 (4)结构的可塑性 突触传递信息的特性是可变的,随着神经冲动传递方式的变化,其传递作用可强可弱,所以神经元之间的连接是柔性的,这称为结构的可塑性。 吉林大学地面机械仿生技术教育部重点实验室 张锐

人工智能习题作业神经计算I习题答案

第五章 神经网络课后习题及答案 一、选择题: 1. 在BP算法中,设y=f(xi)为xi的平滑函数,想知道xi对y增大变化的情况, 我们可求 ,然后进行下列的哪一项? ( B ) A 取最小 B 取最大 C 取积分 D 取平均值 2. 对于反向传播学习,无论是在识别单个概念的学习或识别两个概念的学习中,都涉及到下列的哪一个操作? ( A ) A 权值的修正 B 调整语义结构 C 调整阀值 D 重构人工神经元 3. 根据Hopfield网络学习的特点,能实现联想记忆和执行线性和非线性规划等求解问题其应用没有涉及到下列的哪一个内容? ( D ) A 模糊推理模型 B 非线性辨认 C 自适应控制模型 D 图象识别 4. 对于神经网络的二级推理产生式规则由三个层次构成,它不含下列的哪一个层次? ( C ) A 输入层 B 输出层 C 中间层 D 隐层 5. 人工神经网络借用了生理神经元功能的一些描述方式,它涉及到下列的哪一些内容? ( ABC ) A 模拟神经元 B 处理单元为节点 C 加权有向图 D 生理神经元连接而成

6. 在应用和研究中采用的神经网络模型有许多种,下列的哪一些是具有代表性的? ( ABD ) A 反向传递(BP) B Hopfield网 C 自适应共振 D 双向联想存储器 7. 下列的哪一些内容与反向传播学习算法有关? ( ABCD ) A 选取比率参数 B 误差是否满足要求 C 计算权值梯度 D 权值学习修正 8. 构造初始网络后,要用某种学习算法调整它的权值矩阵,使NN在功能上满足样例集给定的输入一输出对应关系,并由此产生推理,该矩阵必须满足下列的哪一个性质? ( A ) A 收敛性 B 对称性 C 满秩性 D 稀疏性 9. 在人工神经元的功能描述中,往往会用一激发函数来表示输出,常用的一般非线性函数有下列的哪一些项? ( ABD ) A 阀值型 B 分段线性强饱和型 C 离散型 D S i gm oid型 10. 基于神经网络的推理,其应用中必须涉及到下列的哪一些内容? ( ACD ) A NN的结构模型 B NN的推理规则 C NN的学习算法 D 从NN到可解释的推理网 二、填空题: 1. 前馈网络是一种具有很强学习能力的系统,结构简单,易于编程。前馈网络通

人工智能部分习题答案

人工智能部分习题答案 Document number:WTWYT-WYWY-BTGTT-YTTYU-2018GT

1.什么是人类智能它有哪些特征或特点 定义:人类所具有的智力和行为能力。 特点:主要体现为感知能力、记忆与思维能力、归纳与演绎能力、学习能力以及行为能力。 2.人工智能是何时、何地、怎样诞生的 解:人工智能于1956年夏季在美国Dartmouth大学诞生。此时此地举办的关于用机器模拟人类智能问题的研讨会,第一次使用“人工智能”这一术语,标志着人工智能学科的诞生。 3.什么是人工智能它的研究目标是 定义:用机器模拟人类智能。 研究目标:用计算机模仿人脑思维活动,解决复杂问题;从实用的观点来看,以知识为对象,研究知识的获取、知识的表示方法和知识的使用。 4.人工智能的发展经历了哪几个阶段 解:第一阶段:孕育期(1956年以前);第二阶段:人工智能基础技术的研究和形成(1956~1970年);第三阶段:发展和实用化阶段(1971~1980年);第四阶段:知识工程和专家系统(1980年至今)。 5.人工智能研究的基本内容有哪些 解:知识的获取、表示和使用。 6.人工智能有哪些主要研究领域 解:问题求解、专家系统、机器学习、模式识别、自动定论证明、自动程序设计、自然语言理解、机器人学、人工神经网络和智能检索等。 7.人工智能有哪几个主要学派各自的特点是什么 主要学派:符号主义和联结主义。 特点:符号主义认为人类智能的基本单元是符号,认识过程就是符号表示下的符号计算,从而思维就是符号计算;联结主义认为人类智能的基本单元是神经元,认识过程是由神经元构成的网络的信息传递,这种传递是并行分布进行的。 8.人工智能的近期发展趋势有哪些 解:专家系统、机器人学、人工神经网络和智能检索。 9.什么是以符号处理为核心的方法它有什么特征 解:通过符号处理来模拟人类求解问题的心理过程。 特征:基于数学逻辑对知识进行表示和推理。 11.什么是以网络连接为主的连接机制方法它有什么特征 解:用硬件模拟人类神经网络,实现人类智能在机器上的模拟。 特征:研究神经网络。 1.请写出用一阶谓词逻辑表示法表示知识的步骤。 步骤:(1)定义谓词及个体,确定每个谓词及个体的确切含义;(2)根据所要表达的事物或概念,为每个谓词中的变元赋予特定的值;(3)根据所要表达的知识的语义用适当的联接符号将各个谓词联接起来,形成谓词公式。 2.设有下列语句,请用相应的谓词公式把它们表示出来: (1)有的人喜欢梅花,有的人喜欢菊花,有的人既喜欢梅花又喜欢菊花。 解:定义谓词如下: Like(x,y):x喜欢y。 Club(x):x是梅花。 Human(x):x是人。 Mum(x):x是菊花。 “有的人喜欢梅花”可表达为:(?x)(Human(x)?Like(x,Club(x))) “有的人喜欢菊花”可表达为:(?x)(Human(x)?Like(x,Mum(x))) “有的人既喜欢梅花又喜欢菊花”可表达为:(?x)(Human(x)?Like(x,Club(x))? Like(x,Mum(x))) (1)他每天下午都去玩足球。 解:定义谓词如下: PlayFootball(x):x玩足球。 Day(x):x是某一天。 则语句可表达为:(?x)(D(x)?PlayFootball(Ta)) (2)太原市的夏天既干燥又炎热。 解:定义谓词如下:

人工智能神经网络

基于神经网络的人机对抗人工智能系统(理论) -------------------------------------------------------------------------------- 基于神经网络的人机对抗人工智能系统 Harreke 摘要: 人工智能是一门科学名称。自电子计算机发明后不久,人工智能学科即宣布创立,其目的就是要模拟人类的智力活动机制来改进计算机的软件硬件构成,使他们掌握一种或多种人的智能,以便在各种领域内有效替代人的脑力劳动,特别是解决用传统软硬件方法难以解决的问题,如模式识别,复杂的控制行为或对海量的数据进行实时评估等。 所谓人工智能,就是由人工建立的硬件或软件系统的智能,是无生命系统的智能。智能是人类智力活动的能力,是一个抽象的概念。一个软件或硬件系统是否有智能,只能根据它所表现出来的行为是否和人类某些行为相类似来做判断。 人工智能在计算机上的实现,有两种不同的方式。一种是采用传统的编程技术,使系统呈现智能的效果,而不考虑所用方法是否与人或生物机体所用的方法相同。这种方法称为工程学方法,它的编程方式虽然简单,智能效果显著,可是算法和程序一旦固定下来,智能就很难再进一步提高。另一种是模拟法,它不仅要看智能效果,还要求实现方法和人类或生物机体所用的方法相同或类似。人工神经网络是模拟人类或生物大脑中神经元的活动方式,属于模拟法。 人工神经网络入门难度大,编程者需要为每一个对象设置一个智能系统来进行控制,新设置好的智能系统,虽然一开始什么都不懂,但它拥有学习的能力,可以通过学习,不断提升智能,不断适应环境、应付各种情况。通常来讲,使用人工神经网络虽然编程复杂,但编写完成后的维护工作,将比使用其他方式编程后的维护更加省力。 本文采用人工神经网络构建一个完整的人工智能系统,并将该人工神经网络理论应用于电脑领域的项目DOTA。 关键词:人机对抗,神经网络,人工智能,DOTA 目录 第一章神经网络系统概述 1.1生物学神经网络 1.2人工神经网络

2019人工智能与健康试题及答案

2019人工智能与健康试题及答案 一、单项选择题 1.()是集机械、电子、控制、计算机、传感器、人工智能等多学科先进技术于一体的现代制造业重要的自动化装备。 D.工业机器人 2.()是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。 B.机器翻译 3.()是人工智能的核心,是使计算机具有智能的主要方法,其应用遍及人工智能的各个领域。 B.机器学习 4.()是人以自然语言同计算机进行交互的综合性技术,结合了语言学、心理学、工程、计算机技术等领域的知识。 A.语音交互 5.()是通过建立人工神经网络,用层次化机制来表示客观世界,并解释所获取的知识,例如图像、声音和文本。 A.深度学习 6.()是研究用计算机系统解释图,像实现类似人类视觉系统理解外部世界的一种技术,所讨论的问题是为了完成某一任务需要从图像中获取哪些信息,以及如何利用这些信息获得必要的解释。 B.图像理解 7.()是一个具有大量的专门知识与经验的程序系统,它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供的知识和经验,进行推理和判断,模拟人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题。 A.专家系统 8.()是一种处理时序数据的神经网络,常用于语音识别、机器翻译等领域。 C.循环神经网络 9.()是一种基于树结构进行决策的算法。 B.决策树 10.()是用电脑对文本集按照一定的标准进行自动分类标记。

C.文本分类 11.()是指能够按照人的要求,在某一个领域完成一项工作或者一类工作的人工智能。 C.弱人工智能 12.()是指能够自己找出问题、思考问题、解决问题的人工智能。 B.强人工智能 13.()是指在各个领域都比人类要强的人工智能。 A.超人工智能 14.()是指直接通过肢体动作与周边数字设备和环境进行交互。 A.体感交互 15.()是自然语言处理的重要应用,也可以说是最基础的应用。 C.文本分类 16.()宣布启动了“先进制造伙伴计划”“人类连接组计划”“创新神经技术脑研究计划”。 C.美国 17.()中共中央政治局就人工智能发展现状和趋势举行第九次集体学习。 B.2018年10月31日 18.《“健康中国2030”规划纲要》中提到,健康是经济社会发展的() B.基础条件 19.《“健康中国2030”规划纲要》中提到,全民健康是建设健康中国的() D.根本目的 20.1997年,Hochreiter&Schmidhuber提出()。 D.长短期记忆模型 21.2005年,美国一份癌症统计报告表明:在所有死亡原因中,癌症占() A.1/4 22.2012年,Hinton教授小组在ImageNet竞赛中夺冠,降低了几乎()的错误率。 B.50% 23.2017年,卡内基梅隆大学开发的一个人工智能程序在()大赛上战胜了四位人类玩家,这在人工智能发展史上具有里程碑式的意义。 C.德州扑克 24.50年前,人工智能之父们说服了每一个人:“()是智能的钥匙。” B.逻辑 25.癌症的治疗分为手术、放疗、化疗。据WTO统计,有()的肿瘤患者需要接受放疗。

人工智能-BP神经网络算法的简单实现

人工神经网络是一种模仿人脑结构及其功能的信息处理系统,能提高人们对信息处理的智能化水平。它是一门新兴的边缘和交叉学科,它在理论、模型、算法等方面比起以前有了较大的发展,但至今无根本性的突破,还有很多空白点需要努力探索和研究。 1 人工神经网络研究背景 神经网络的研究包括神经网络基本理论、网络学习算法、网络模型以及网络应用等方面。其中比较热门的一个课题就是神经网络学习算法的研究。 近年来己研究出许多与神经网络模型相对应的神经网络学习算法,这些算法大致可以分为三类:有监督学习、无监督学习和增强学习。在理论上和实际应用中都比较成熟的算法有以下三种: (1) 误差反向传播算法(Back Propagation,简称BP 算法); (2) 模拟退火算法; (3) 竞争学习算法。 目前为止,在训练多层前向神经网络的算法中,BP 算法是最有影响的算法之一。但这种算法存在不少缺点,诸如收敛速度比较慢,或者只求得了局部极小点等等。因此,近年来,国外许多专家对网络算法进行深入研究,提出了许多改进的方法。 主要有: (1) 增加动量法:在网络权值的调整公式中增加一动量项,该动量项对某一时刻的调整起阻尼作用。它可以在误差曲面出现骤然起伏时,减小振荡的趋势,提高网络训练速度; (2) 自适应调节学习率:在训练中自适应地改变学习率,使其该大时增大,该小时减小。使用动态学习率,从而加快算法的收敛速度; (3) 引入陡度因子:为了提高BP 算法的收敛速度,在权值调整进入误差曲面的平坦区时,引入陡度因子,设法压缩神经元的净输入,使权值调整脱离平坦区。 此外,很多国内的学者也做了不少有关网络算法改进方面的研究,并把改进的算法运用到实际中,取得了一定的成果: (1) 王晓敏等提出了一种基于改进的差分进化算法,利用差分进化算法的全局寻优能力,能够快速地得到BP 神经网络的权值,提高算法的速度; (2) 董国君等提出了一种基于随机退火机制的竞争层神经网络学习算法,该算法将竞争层神经网络的串行迭代模式改为随机优化模式,通过采用退火技术避免网络收敛到能量函数的局部极小点,从而得到全局最优值; (3) 赵青提出一种分层遗传算法与BP 算法相结合的前馈神经网络学习算法。将分层遗传算法引入到前馈神经网络权值和阈值的早期训练中,再用BP 算法对前期训练所得性能较优的网络权值、阈值进行二次训练得到最终结果,该混合学习算法能够较快地收敛到全局最优解;

人工智能习题答案

(此文档为Word格式,下载后可以任意编辑修改!)试卷装订封面

第一章绪论 1-1. 什么是人工智能?试从学科和能力两方面加以说明。 从学科角度来看:人工智能是计算机科学中涉及研究、设计和应用智能机器的一个分支。它的近期主要目标在于研究用机器来模仿和执行人脑的某些智能功能,并开发相关理论和技术。 从能力角度来看:人工智能是智能机器所执行的通常与人类智能有关的功能,如判断、推理、证明、识别、感知、理解、设计、思考、规划、学习和问题求解等思维活动 1-2. 在人工智能的发展过程中,有哪些思想和思潮起了重要作用?控制论之父维纳1940 年主张计算机五原则。他开始考虑计算机如何能像大脑一样工作。系统地创建了控制论,根据这一理论,一个机械系统完全能进行运算和记忆。 帕梅拉?麦考达克(Pamela McCorduck)在她的著名的人工智能历史研究《机器思维》(Machine Who Think,1979) 中曾经指出:在复杂的机械装置与智能之间存在着长期的联系。著名的英国科学家图灵被称为人工智能之父,图灵不仅创造了一个简单的通用的非数字计算 模型,而且直接证明了计算机可能以某种被理解为智能的方法工作。提出了著名的图灵测试。数理逻辑从19 世纪末起就获迅速发展;到20 世纪30 年代开始用于描述智能行为。计算机出现后,又在计算机上实现了逻辑演绎系统。 1943年由生理学家麦卡洛克(McCulloch)和数理逻辑学家皮茨(Pitts)创立的脑模型,即MP模型。60-70年代,联结主义,尤其是对以感知机(perceptron)为代表的脑模型的研究曾出现过 热潮, 控制论思想早在40-50 年代就成为时代思潮的重要部分,影响了早期的人工智能工作者。到 60-70 年代,控制论系统的研究取得一定进展,播下智能控制和智能机器人的种子。 1-3. 为什么能够用机器(计算机)模仿人的智能? 物理符号系统的假设:任何一个系统,如果它能够表现出智能,那么它就必定能执行输入符号、输出符号、存储符号、复制符号、建立符号结构、条件性迁移6种功能。反之,任何系 统如果具有这 6 种功能,那么它就能够表现出智能(人类所具有的智能)。 物理符号系统的假设伴随有3个推论。 推论一: 既然人具有智能,那么他(她)就一定是个物理符号系统。 推论二: 既然计算机是一个物理符号系统,它就一定能够表现出智能。 推论三: 既然人是一个物理符号系统,计算机也是一个物理符号系统,那么我们就能够用计 算机来模拟人的活动。 1-4. 现在人工智能有哪些学派?它们的认知观是什么?符号主义(Symbolicism) ,又称为逻辑主义(Logicism) 、心理学派(Psychlogism) 或计算机学派(Computerism) [ 其原理主要为物理符号系统( 即符号操作系统)假设和有限合理性原理。] 认为人的认知基元是符号,而且认知过程即符号操作过

人工智能神经网络例题

神经网络学习 假设w1(0)=0.2, w2(0)=0.4, θ(0)=0.3, η=0.4,请用单层感知器完成逻辑或运算的学习过程。 解:根据“或”运算的逻辑关系,可将问题转换为: 输入向量:X1=[0, 0, 1, 1] X2=[0, 1, 0, 1] 输出向量:Y=[0, 1, 1, 1] 由题意可知,初始连接权值、阈值,以及增益因子的取值分别为: w1(0)=0.2, w2(0)=0.4, θ(0)=0.3,η=0.4 即其输入向量X(0)和连接权值向量W(0)可分别表示为: X(0)=(-1, x1 (0), x2 (0)) W(0)=(θ(0), w1(0), w2 (0)) 根据单层感知起学习算法,其学习过程如下: 设感知器的两个输入为x1(0)=0和x2(0)=0,其期望输出为d(0)=0,实际输出为:y(0)=f(w1(0) x1(0)+ w2(0) x2(0)-θ(0)) =f(0.2*0+0.4*0-0.3)=f(-0.3)=0 实际输出与期望输出相同,不需要调节权值。 再取下一组输入:x1(0)=0和x2(0)=1,其期望输出为d(0)=1,实际输出为: y(0)=f(w1(0) x1(0)+ w2(0) x2(0)-θ(0)) =f(0.2*0+0.4*1-0.3)=f(0.1)=1 实际输出与期望输出相同,不需要调节权值。 再取下一组输入:x1(0)=1和x2(0)=0,其期望输出为d(0)=1,实际输出为: y(0)=f(w1(0) x1(0)+ w2(0) x2(0)-θ(0)) =f(0.2*1+0.4*0-0.3) =f(-0.1)=0 实际输出与期望输出不同,需要调节权值,其调整如下: θ(1)=θ(0)+η(d(0)- y(0))*(-1)=0.3+0.4*(1-0)*(-1)= -0.1 w1(1)=w1(0)+η(d(0)- y(0))x1(0)=0.2+0.4*(1-0)*1=0.6 w2(1)=w2(0)+η(d(0)- y(0))x2(0)=0.4+0.4*(1-0)*0=0.4 再取下一组输入:x1(1)=1和x2(1)=1,其期望输出为d(1)=1,实际输出为: y(1)=f(w1(1) x1(1)+ w2(1) x2(1)-θ(1)) =f(0.6*1+0.4*1+0.1) =f(1.1)=1 实际输出与期望输出相同,不需要调节权值。 再取下一组输入:x1(1)=0和x2(1)=0,其期望输出为d(0)=0,实际输出为: y(1)=f(w1(1) x1(1)+ w2(1) x2(1)-θ(1)) =f(0.6*0+0.4*0 + 0.1)=f(0.1)=1

人工智能复习题(答案)

一:单选题 1. 人工智能的目的是让机器能够(D),以实现某些脑力劳动的机械化。 A. 具有完全的智能 B. 和人脑一样考虑问题 C. 完全代替人 D. 模拟、延伸和扩展人的智能 2. 下列关于人工智能的叙述不正确的有(C)。 A. 人工智能技术它与其他科学技术相结合极大地提高了应用技术的智能化水平。 B. 人工智能是科学技术发展的趋势。 C. 因为人工智能的系统研究是从上世纪五十年代才开始的,非常新,所以十分重要。 D. 人工智能有力地促进了社会的发展。 3. 自然语言理解是人工智能的重要应用领域,下面列举中的(C)不是它要实现的目标。 A. 理解别人讲的话。 B. 对自然语言表示的信息进行分析概括或编辑。 C. 欣赏音乐。 D. 机器翻译。 4. 下列不是知识表示法的是(A)。 A. 计算机表示法 B. 谓词表示法 C. 框架表示法 D. 产生式规则表示法 5. 关于“与/或”图表示知识的叙述,错误的有(D)。 A. 用“与/或”图表示知识方便使用程序设计语言表达,也便于计算机存储处理。 B. “与/或”图表示知识时一定同时有“与结点”和“或结点”。 C. “与/或”图能方便地表示陈述性知识和过程性知识。 D. 能用“与/或”图表示的知识不适宜用其他方法表示。 6. 一般来讲,下列语言属于人工智能语言的是(D)。 A. VJ B. C# C. Foxpro D. LISP 7. 专家系统是一个复杂的智能软件,它处理的对象是用符号表示的知识,处理的过程是(C)的过程。 A. 思考 B. 回溯 C. 推理 D. 递归 8. 确定性知识是指(A)知识。 A. 可以精确表示的 B. 正确的 C. 在大学中学到的知识 D. 能够解决问题的 9. 下列关于不精确推理过程的叙述错误的是(B)。 A. 不精确推理过程是从不确定的事实出发 B. 不精确推理过程最终能够推出确定的结论 C. 不精确推理过程是运用不确定的知识 D. 不精确推理过程最终推出不确定性的结论 10. 我国学者吴文俊院士在人工智能的(A)领域作出了贡献。 A. 机器证明 B. 模式识别 C. 人工神经网络 D. 智能代理

人工智能论文

湖南理工学院 人工智能课程论文 题目:模式识别及人工神经网络 课程名称:人工智能 院系:计算机学院 专业班级: 姓名: 学号: 课程论文成绩: 指导教师: 2016年 6 月 26 日 模式识别及人工神经网络 摘要:人工神经网络是指模拟人脑神经系统的结构和功能,运用大量的处理部件,由人工方式建立起来的网络系统。该文首先介绍了神经网络研究动向,然后介绍了近年来几种新型神经网络的基本模型及典型应用,包括模糊神经网络、神经网络与遗传算法的结合、进化神经网络、混沌神经网络和神经网络与小波分析的结合。最后,根据这几种新型神经网络的特点, 展望了它们今后的发展前景。[2] 关键词:模糊神经网络;神经网络与遗传算法的结合;进化神经网络;混沌神经网络;神经网络与小波分析。 Pattern recognition and artificial neural network

Abstract: Artificial neural network is the system that simulates the human brain’s structure and function, and uses a large number of processing elements, and is manually established by the network system. This paper firstly introduces the research trends of the neural network, and then introduces several new basic models of neural networks and typical applications in recent years, including of fuzzy neural network, the combine of neural network and genetic algorithm, evolutionary neural networks, chaotic neural networks and the combine of neural networks and wavelet analysis. Finally, their future prospects are predicted based on the characteristics of these new neural networks in the paper. Key words: Fuzzy neural network; Neural network and genetic algorithm; Evolutionary neural networks; Chaotic neural networks; Neural networks and wavelet analysis 1 什么是人工神经网络? 所谓人工神经网络就是模仿生物大脑的结构和功能而构成的一种信息系统计算机,人士地球上具有最高智慧的动物,而人的指均来自大脑,人类靠大脑进行思考,联想,记忆和推理判断等,这些功能是任何被称为“电脑”的一般计算机所无法取代的,长期以来,许多科学家一直致力于人脑内部结构和功能的探讨和研究,并试图建立模拟人脑的计算机,虽然到目前对大脑的内部工作机理还不是完全清楚,但对其结构有所了解。粗略地讲,大脑是由大量神经细胞或者神经元组成的,每个神经元可看作是一个小的处理单元,这些神经元按某种方式连接起来,形成大脑内部的生理神经元网络。这种神经元网络中各神经元之间联结的强弱,按外部的激励信号做自适应变化,而每个神经元又随着所接收到的多个信号的综合大小而呈现兴奋或抑制状态。 1.1 人工智能网络的发展 (1)初期(萌发)期---MP模型的提出和人工升级网络的兴起 --1943年,美国神经生理学家Warren Mcculloch和数学家Walter Pitts 合写了一篇关于神经元如何工作的开拓性文章:“A Logical Calculus of Ideas Immanent in Nervous Activity”。该文指出,脑细胞的活动就像各种逻辑运算。

模糊控制与神经网络

BP神经网络 BP (Back Propagation)神经网络是一种神经网络学习算法,全称基于误差反向传播算法的人工神经网络。 如图所示拓扑结构的单隐层前馈网络,一般称为三层前馈网或三层感知器,即:输入层、中间层(也称隐层)和输出层。它的特点是:各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反馈连接,够成具有层次结构的前馈型神经网络系统。单计算层前馈神经网络只能求解线性可分问题,能够求解非线性问题的网络必须是具有隐层的多层神经网络。 在人工神经网络发展历史中,很长一段时间里没有找到隐层的连接权值调整问题的有效算法。直到误差反向传播算法(BP算法)的提出,成功地解决了求解非线性连续函数的多层前馈神经网络权重调整问题。 BP (Back Propagation)神经网络,即误差反传误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。 神经网络 神经网络是: 思维学普遍认为,人类大脑的思维分为抽象(逻辑)思维、形象(直观)思维和灵感(顿悟)思维三种基本方式。 逻辑性的思维是指根据逻辑规则进行推理的过程;它先将信息化成概念,并用符号表示,然后,根据符号运算按串行模式进行逻辑推理;这一过程可以写成串行的指令,让计算机执行。然而,直观性的思维是将分布式存储的信息综合起来,结果是忽然间产生想法或解决问题的办法。这种思维方式的根本之点在于以下两点:1.信息是通过神经元上的兴奋模式分布储在网络上;2.信息处理是通过神经元之间同时相互作用的动态过程来完成的。 人工神经网络就是模拟人思维的第二种方式。这是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能实现的行为却是极其丰富多彩的。 神经网络的研究内容相当广泛,反映了多学科交叉技术领域的特点。目前,主要的研究工作集中在以下几个方面: (1)生物原型研究。从生理学、心理学、解剖学、脑科学、病理学等生物科学方面研究神经细胞、神经网络、神经系统的生物原型结构及其功能机理。 (2)建立理论模型。根据生物原型的研究,建立神经元、神经网络的理论模型。其中包括概念模型、知识模型、物理化学模型、数学模型等。 (3)网络模型与算法研究。在理论模型研究的基础上构作具体的神经网络模型,以实现计算机馍拟或准备制作硬件,包括网络学习算法的研究。这方面的工作也称为技术模型研究。 (4)人工神经网络应用系统。在网络模型与算法研究的基础上,利用人工神经网络组成实际的应用系统,例如,完成某种信号处理或模式识别的功能、构作专家系统、制成机器人等等。 纵观当代新兴科学技术的发展历史,人类在征服宇宙空间、基本粒子,生命起源等科学技术领域的进程中历经了崎岖不平的道路。我们也会看到,探索人脑功能和神经网络的研究将伴随着重重困难的克服而日新月异。 【人工神经网络的工作原理】 人工神经网络首先要以一定的学习准则进行学习,然后才能工作。现以人工神经网络对手写“A”、“B”两个字母的识别为例进行说明,规定当“A”输入网络时,应该输出“1”,而当输入为“B”时,输出为“0”。 所以网络学习的准则应该是:如果网络作出错误的的判决,则通过网络的学习,应使得网络减少下次犯同样错误的可能性。首先,给网络的各连接权值赋予(0,1)区间内的随机值,将“A”所对应的图象模式输入给网络,网络将输入模式加权求和、与门限比较、再进行非线性运算,得到网络的输出。在此情况下,网络输出为“1”和“0”的概率各为50%,也就是说是完全随机的。这时如果输出为“1”(结果正确),则使连接权值增大,以便使网络再次遇到“A”模式输入时,仍然能作出正确的判断。

相关主题
文本预览
相关文档 最新文档