当前位置:文档之家› 机器学习大作业

机器学习大作业

机器学习大作业
机器学习大作业

机器学习大作业

题目机器学习大报告

学院电子工程学院

专业

学生姓名

学号

目录

第一章机器学习的基本理论及算法 (3)

1.1机器学习的基本理论 (3)

1.1.1 机器学习的概念 (3)

1.1.2 机器学习的发展历程 (3)

1.1.3 机器学习的模型 (4)

1.2机器学习主要算法 (5)

1.2.1 决策树算法 (5)

1.2.2 人工神经网络 (6)

1.2.3贝叶斯学习算法 (7)

1.2.4 遗传算法 (8)

1.2.5 支持向量机 (9)

第二章支持向量机(SVM)原理 (11)

2.1 SVM的产生与发展 (11)

2.2 统计学习理论基础 (12)

2.3 SVM原理 (12)

2.3.1.最优分类面和广义最优分类面 (13)

2.3.2 SVM的非线性映射 (16)

2.3.3.核函数 (17)

第三章支持向量机的应用研究现状 (19)

3.1 应用概述 (19)

3.2支持向量机的应用 (19)

3.2.1 人脸检测、验证和识别 (19)

3.2.2说话人/语音识别 (20)

3.2.3 文字/手写体识别 (20)

3.2.4 图像处理 (20)

3.2.5 其他应用研究 (21)

第四章基于SVM的实例及仿真结果 (23)

4.1 16棋盘格数据分类 (23)

4.2 UCI中iris数据分类 (25)

第一章机器学习的基本理论及算法

1.1机器学习的基本理论

1.1.1 机器学习的概念

机器学习是人工智能的一个分支,是现代计算机技术研究一个重点也是热点问题。顾名思义,机器学习就是计算机模仿人类获取知识的模式,通过建立相应的模型,对外界输入通过记忆"归纳"推理等等方式,获得有效的信息和经验总结,进而不断的自我完善,提高系统的功能。目前,机器学习的定义尚不统一,不同专业背景的学者出于不同的立场,对于机器学习的看法是不同的。下面主要介绍两位机器学习专业研究者赋予机器学习的定义。兰利(https://www.doczj.com/doc/b93742706.html,ngley)认为:“机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。米切尔(T.M.Mitchell)在其著作《机器学习》中谈到“机器学习”关注的问题是“计算机程序如何随着经验积累自动提高自身的性能”,也就是主要指的是归纳学习,另外“分析学习和增强学习也是学习的一个不可或缺组成部分”。两位学者的观点类似,都把机器学习看成是计算机或人工智能的一个分支学科,都强调的是归纳学习算法。

机器学习在人工智能领域中是一个相对比较活跃的研究领域,其研究目的就是要促进机器像人样可以源源不断获取外界的知识,建立相关学习的理论,构建学习系统,并将这些发明应用于各个领域。

1.1.2 机器学习的发展历程

机器学习(machine learning)是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和神经计算的核心研究课题之一。作为人工智能研究的一个新崛起的分支,机器学习的发展历程大至可分为如下几个时期:

(1)热烈时期:20 世纪50 年代的神经模拟和决策理论技术,学习系统在运行时很少具有结构或知识。主要是建造神经网络和自组织学习系统, 学习表现为阈值逻辑单元传送信号的反馈调整。

(2)冷静时期:20 世纪60 年代早期开始研究面向概念的学习, 即符号学习。

使用的工具是语义网络或谓词逻辑, 不再是数值或者统计方法。在概念获取中, 学习系统通过分析相关概念的大量正例和反例来构造概念的符号表示。在这一阶段, 人们认识到学习是个复杂而循序渐进的过程; 如果不要任何初始知识,则学习系统无法学到高层次的概念。

(3)复兴时期:20 世纪70 年代中期, 研究活动日趋兴旺, 各种学习方法不断推出, 实验系统大量涌现, 1980 年在卡内基·梅隆大学( CMU) 召开的第一届机器学习专题研讨会, 标志着机器学习正式成为人工智能的一个独立研究领域。(4)蓬勃发展时期:从20 世纪80 年代中后期到现在, 可以认为机器学习研究进入一个新阶段, 已经趋向成熟。神经网络的复苏, 带动着各种非符号学习方法与符号学习并驾齐驱, 并且已超越研究范围, 进入到自动化及模式识别等领域, 掀起一场联结主义的热潮,各种学习方法开始继承, 多策略学习已经使学习系统愈具有应用价值, 开始从实验室走向应用领域。

1.1.3 机器学习的模型

机器学习系统主要由三个部分构成:环境、知识库和执行部分,如图1.1所示。环境是信息的提供者,它向智能系统的学习部分提供所需信息,学习部分利用所得信息对知识库进行修改,不断地完善知识库,从而促使执行部分更加有效地完成任务,同时执行部分再把信息反馈给学习部分。

图1.1

影响学习系统设计的最重要的因素是环境向系统提供的信息。知识库里存放的是指导执行部分动作的一般原则,但环境向学习系统提供的信息却是各种各样的。如果信息的质量较高,与一般原则的差别较小,则学习部分比较容易处理。如果向学习系统提供的是杂乱无章的指导执行具体动作的具体信息,则学习系统需要在获得足够数据之后,删除不必要的细节,进行总结推广,形成指导动作的一般原则,放入知识库。这样,学习部分的任务就比较繁重,设计起来也较为困难。

影响学习系统设计的第二个因素是知识库。知识的表示有多种形式,比如特征向量、一阶逻辑语句、产生式规则、语义网络和框架等。这些表示方式各有特点,在选择时要兼顾 4 个方面:表达能力强;易于推理;容易修改知识库;知识表示易于扩展。

学习系统在没有任何先验知识的前提下不能凭空获取知识,它需要环境为其提供一定的知识作为基础,然后对其进行扩展和完善,从而完成学习。整个学习系统的关键在于执行,从而确定了执行部分的核心地位。学习部分进行学习的目标就是改进和完善执行部分的动作。

1.2机器学习主要算法

1.2.1 决策树算法

决策树可看作一个树状预测模型,它通过把实例从根节点排列到某个叶子节点来分类实例,叶子节点即为实例所属的分类。决策树的核心问题是选择分裂属性和决策树的剪枝。决策树的算法有很多,有ID3、C4.5、CART 等等。这些算法均采用自顶向下的贪婪算法,每个节点选择分类效果最好的属性将节点分裂为2个或多个子结点,继续这一过程直到这棵树能准确地分类训练集,或所有属性都已被使用过。下面简单介绍最常用的决策树算法—分类回归树(CART)。

分类回归树(CART)是机器学习中的一种分类和回归算法。设训练样本集L={x 1,x 2,…,x n ,Y}。其中,x i (i=1,2,…,n)称为属性向量;Y 称为标签向量或类别向量。当Y 是有序的数量值时,称为回归树;当Y 是离散值时,称为分类树。

在树的根节点t 1处,搜索问题集(数据集合空间),找到使得下一代子节点中数据集的非纯度下降最大的最优分裂变量和相应的分裂阈值。在这里非纯度指标用Gini 指数来衡量,它定义为:

2

()(/)(/)1[(/)]i j j i t p i t p j t p j t ≠==-∑∑

其中,i(t)是节点t 的Gini 指数,p(i/t)表示在节点t 中属于i 类的样本所占的比例,p(j/t)是节点t 中属于j 类的样本所占的比例。用该分裂变量和分裂阈值把根节点t 1分裂成t 2和t 3,如果在某个节点t i 处,不可能再有进一步非纯度的显著降低,则该节点t i 成为叶结点,否则继续寻找它的最优分裂变量和分裂阈值进行分裂。

对于分类问题,当叶节点中只有一个类,那么这个类就作为叶节点所属的类,若节点中有多个类中的样本存在,根据叶节点中样本最多的那个类来确定节点所属的类别;对于回归问题,则取其数量值的平均值。很明显,一棵很大的树可能过分拟合数据,但较小的树又可能无法捕获重要的结构。树的最佳大小是控制模型复杂性的调整参数,它应该由数据自适应的选择。一种可取的策略是增长一棵较大的树T0,仅当达到最小节点大小(比如5)时才停止分裂过程。然后利用剪枝策略和5折或10折交叉验证相结合的方法来修剪这棵树,从而将一些噪声和干扰数据排除,获得最优树。

1.2.2 人工神经网络

人工神经网络提供了一种普遍而且实用的方法,来从样例中学习值为实数、离散或向量的函数。ANN学习对于训练数据中的拟合效果很好,且已经成功地涉及到医学、生理学、哲学、信息学、计算机科学等众多学科领域,这些领域互相结合、相互渗透并相互推动。不同领域的科学家从各自学科的特点出发,提出问题并进行了研究。

ANN的研究始于1943年,心理学家W.Mcculloch和数理逻辑学家W.Pitts 首先提出了神经元的数学模型。此模型直接影响着这一领域研究的进展。1948年,冯·诺依曼在研究中提出了以简单神经元构成的再生自动机网络结构;20世纪50年代末,F.Rosenblatt设计制作了“感知机”,它是一种多层的神经网络,这项工作首次把人工神经网络的研究从理论探讨付诸工程实践;60年代初期,Widrow提出了自适应线性元件网络,这是一种连续取值的线性加权求和阈值网络,在此基础上发展了非线性多层自适应网络。这些实际上就是一种ANN模型;80年代初期,美国物理学家Hopfield发表了两篇关于ANN研究的论文,引起了巨大的反响。人们重新认识到神经网络的威力以及付诸应用的现实性。随即,研究人员围绕着Hop-field提出的方法展开了进一步的研究工作,形成了80年代中期以来ANN的研究热潮。

人工神经网络的研究在一定程度上受到了生物学的启发,因为生物的学习系统是由相互连接的神经元(Neuron)组成的异常复杂的网络。而人工神经网络与此大体相似,它是由一系列简单单元相互密集连接构成,其中每一个单元有一定数

量的实值输入(可能是其他单元的输出),并产生单一的实数值输出(可能成为其他很多单元的输入)。在ANN 的研究中提出了很多模型,它们之间的差异主要表现在研究途径、网络结构、运行方式、学习算法及其应用上。常见的ANN 模型有:多层前向神经网络MLFN 、自组织神经网络—SOM 和ART 、Hopfield 神经网络、模糊神经网络FNN 等。人工神经网络算法的重点是构造阈值逻辑单元,一个值逻辑单元是一个对象,它可以输入一组加权系数的量,对它们进行求和,如果这个和达到或者超过了某个阈值,输出一个量。如有输入值X 1,X 2,…,X n 和它们的权系数:W 1,W 2,…,W n ,求和计算出的X i ×W i ,产生了激发层a=(X 1×W 1)+(X 2×W 2)+ … +(X i ×W i )+ … +(X n ×W n ),其中X i 是各条记录出现频率或其他参数,W i 是实时特征评估模型中得到的权系数。神经网络是基于经验风险最小化原则的学习算法,有一些固有的缺陷,比如层数和神经元个数难以确定,容易陷入局部极小,还有过学习现象,这些本身的缺陷在SVM 算法中可以得到很好的解决。

1.2.3贝叶斯学习算法

Bayes 法是一种在已知先验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。设训练样本集分为M 类,记为C={c 1,…,c i ,…,c M },每类的先验概率为P(c i ),i=1,2,…,M 。当样本集非常大时,可以认为P(c i )=c i 类样本数/总样本数。对于一个待分样本X ,其归于c i 类的类条件概率是P(X/c i ),则根据Bayes 定理,可得到c i 类的后验概率P(c i /X):

(/)(/)()/()i i i P c X P X c P c P X =? (5)

若(/)(/),1,2,,i j i P c X Max P c X i M == ,则有X ∈ci 。(6)

式(6)是最大后验概率判决准则,将式(5)代入式(6),则有:

若; (/)()(/),1,2,,i i j i P c X P c Max P c X i M == ;j=1,2,…,M,则X ∈ci 。

这就是最大后验概率判决准则,这就是常用到的Bayes 分类判决准则。经过长期的研究,Bayes 分类方法在理论上论证得比较充分,在应用上也是非常广泛的。Bayes 方法的薄弱环节在于实际情况下,类别总体的概率分布和各类样本的概率分布函数(或密度函数)常常是不知道的。为了获得它们,就要求样本足够大。此

外,当用于文本分类时,Bayes法要求表达文本的主题词相互独立,这样的条件在实际文本中一般很难满足,因此该方法往往在效果上难以达到理论上的最大值。

1.2.4 遗传算法

遗传算法(Genetic Algorithm, GA)最早由Holland 于1975 年首次提出。它是一种模拟达尔文进化论的自然选择和遗传机制的随机优化搜索方法。其主要性质可以描述如下:

1. 直接对结构性对象进行操作,不存在求导和函数连续性限定。

2. 具有隐并行性和全局搜索能力。

3. 采用概率化的寻优方法,能够自动获取和指导优化的搜索空间,自适应调整搜索方向,不需要确定的规则。

由于遗传算法具有这些性质,它已经被广泛地应用于组合优化、信号处理、自适应控制和人工生命等领域。在用遗传算法求解问题时,问题的每一个候选解都被编码成一个“染色体”,即个体。若干个体构成了群体。遗传算法初始时,随机产生一些个体。并根据目标函数对每个个体进行评估,计算出适应度值。根据适应度值,选择个体来通过交叉、变异等遗传操作来生成下一代群体。遗传算法可以看做是有若干可行解组成的群体逐步进化的过程。图1.2 描述了遗传算法的基本流程。该图给出了遗传算法求解优化问题的基本框架,大多数遗传算法均可包含于此框架内。

图1.2

1.2.5 支持向量机

支持向量机是Vapnik 等人于1995年根据统计学习理论提出的一种学习方法。它是建立在统计学习理论的VC 维理论和结构风险最小原理基础上,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以获得最好的推广能力。其基本思想是:首先选择一个非线性映射,将输入空间映射到一个高维特征空间,在此高维空间中,利用结构风险最小化原则,构造最优决策函数,寻找输入变量和输出变量之间的非线性关系。

非线性支持向量分类机的数学模型可以描述如下:设给定训练集为{(x1,y1),(x2,y2),?,(x l,y l)},x i∈ R n为输入向量,y i∈ {?1,1},(1 ≤ i ≤ l)为样本类别标志,l 为样本总数。用非线性映射φ(?)将样本从原空间R n映射到高维特征空间,

在此高维空间中构造最优线性决策函数y(x) = sgn[w ? φ(x) + b]。其中 w 为权向量,b 为常数。求解支持向量机决策函数的参数可以通过求解对偶问题得到,即:

,111

11()()2..0

N N

N i j i j i j j i j j N i i i L y y K x x s t y ααααα=====-=∑∑∑∑

最大化公式得到解参数****12(,,,)n a αααα== ,对非支持向量数据点对应的αi ,

取值为 0。

以上算法是为二值分类问题设计的,当处理多类问题时,就需要构造多类分类器。构造支持向量机多类分类器的方法有两大类:一类方法是直接法,直接在目标函数上进行修改,将多个分类面的参数求解合并到一个最优化问题中,通过求解 该最优化问题实现多分类。这类方法看似简单,但其计算复杂度比较高,实现起来就比较困难。另一类方法是间接法,主要是通过组合多个二分类器来实现多分类器的构造,常见的方法有一对多法和一对一法两种:

1. 一对多法(one against all)。训练时一次把某个类别的样本归为一类,其它剩余的样本归为另一类。这样k 个类别的样本构造出k 个支持向量机。分类时将未知样本分类为具有最大分类函数值的那一类。

2. 一对一法(one against one)。其做法是在任意两类样本之间设计一个支持向量机,k 类样本需要设计k(k ? 1)/2个支持向量机。当对一个未知样本进行分类时,得到k(k ? 1)/2个分类结果,分类时采用一种投票策略,最后得票最多的类别即为该样本的类别。

第二章 支持向量机(SVM )原理

2.1 SVM 的产生与发展

支持向量机(Support Vector Machine)是Cortes 和Vapnik 于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。

支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy )和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(或称泛化能力)。

自1995年Vapnik 在统计学习理论的基础上提出SVM 作为模式识别的新方法之后,SVM 一直倍受关注。同年,Vapnik 和Cortes 提出软间隔(soft margin)SVM ,通过引进松弛变量i ξ度量数据i x 的误分类(分类出现错误时i ξ大于0),同时在目标函数中增加一个分量用来惩罚非零松弛变量(即代价函数),SVM 的寻优过程即是大的分隔间距和小的误差补偿之间的平衡过程;1996年,Vapnik 等人又提出支持向量回归 (Support Vector Regression ,SVR)的方法用于解决拟合问题。SVR 同SVM 的出发点都是寻找最优超平面,但SVR 的目的不是找到两种数据的分割平面,而是找到能准确预测数据分布的平面,两者最终都转换为最优化问题的求解;1998年,Weston 等人根据SVM 原理提出了用于解决多类分类的SVM 方法(Multi-Class Support Vector Machines ,Multi-SVM),通过将多类分类转化成二类分类,将SVM 应用于多分类问题的判断:此外,在SVM 算法的基本框架下,研究者针对不同的方面提出了很多相关的改进算法。例如,Suykens 提出的最小二乘支持向量机 (Least Square Support Vector Machine ,LS —SVM)算法,Joachims 等人提出的SVM-1ight ,张学工提出的中心支持向量机 (Central Support Vector Machine ,CSVM),Scholkoph 和Smola 基于二次规划提出的v-SVM 等。此后,台湾大学林智仁(Lin Chih-Jen)教授等对SVM 的典型应用进行总结,并设计开发出较为完善的SVM 工具包,也就是LIBSVM(A Library

for Support Vector Machines)。上述改进模型中,v-SVM是一种软间隔分类器模型,其原理是通过引进参数v,来调整支持向量数占输入数据比例的下限,以及参数 来度量超平面偏差,代替通常依靠经验选取的软间隔分类惩罚参数,改善分类效果;LS-SVM则是用等式约束代替传统SVM中的不等式约束,将求解QP 问题变成解一组等式方程来提高算法效率;LIBSVM是一个通用的SVM软件包,可以解决分类、回归以及分布估计等问题,它提供常用的几种核函数可由用户选择,并且具有不平衡样本加权和多类分类等功能,此外,交叉验证(cross validation)方法也是LIBSVM对核函数参数选取问题所做的一个突出贡献;SVM-1ight的特点则是通过引进缩水(shrinking)逐步简化QP问题,以及缓存(caching)技术降低迭代运算的计算代价来解决大规模样本条件下SVM学习的复杂性问题。

2.2 统计学习理论基础

与传统统计学理论相比,统计学习理论(Statistical learning theory或SLT)是一种专门研究小样本条件下机器学习规律的理论。该理论是针对小样本统计问题建立起的一套新型理论体系,在该体系下的统计推理规则不仅考虑了对渐近性能的要求,而且追求在有限信息条件下得到最优结果。Vapnik等人从上世纪六、七十年代开始致力于该领域研究,直到九十年代中期,有限样本条件下的机器学习理论才逐渐成熟起来,形成了比较完善的理论体系——统计学习理论。

统计学习理论的主要核心内容包括:

(1)经验风险最小化准则下统计学习一致性条件;

(2)这些条件下关于统计学习方法推广性的界的结论;

(3)这些界的基础上建立的小样本归纳推理准则;

(4)发现新的准则的实际方法(算法)

2.3 SVM原理

SVM方法是20世纪90年代初Vapnik等人根据统计学习理论提出的一种新的机器学习方法,它以结构风险最小化原则为理论基础,通过适当地选择函数子集及该子集中的判别函数,使学习机器的实际风险达到最小,保证了通过有限训练

样本得到的小误差分类器,对独立测试集的测试误差仍然较小。

支持向量机的基本思想是:首先,在线性可分情况下,在原空间寻找两类样本的最优分类超平面。在线性不可分的情况下,加入了松弛变量进行分析,通过使用非线性映射将低维输入空间的样本映射到高维属性空间使其变为线性情况,从而使得在高维属性空间采用线性算法对样本的非线性进行分析成为可能,并在该特征空间中寻找最优分类超平面。其次,它通过使用结构风险最小化原理在属性空间构建最优分类超平面,使得分类器得到全局最优,并在整个样本空间的期望风险以某个概率满足一定上界。

其突出的优点表现在:

(1)基于统计学习理论中结构风险最小化原则和VC维理论,具有良好的泛化能力,即由有限的训练样本得到的小的误差能够保证使独立的测试集仍保持小的误差。

(2)支持向量机的求解问题对应的是一个凸优化问题,因此局部最优解一定是全局最优解。

(3)核函数的成功应用,将非线性问题转化为线性问题求解。

(4)分类间隔的最大化,使得支持向量机算法具有较好的鲁棒性。由于SVM 自身的突出优势,因此被越来越多的研究人员作为强有力的学习工具,以解决模式识别、回归估计等领域的难题。

2.3.1.最优分类面和广义最优分类面

SVM是从线性可分情况下的最优分类面发展而来的,基本思想可用图1来说明。对于一维空间中的点,二维空间中的直线,三维空间中的平面,以及高维空间中的超平面,图中实心点和空心点代表两类样本,H为它们之间的分类超平面,H1,H2分别为过各类中离分类面最近的样本且平行于分类面的超平面,它们之间的距离△叫做分类间隔(margin)。

图2.1 最优分类面示意图

所谓最优分类面要求分类面不但能将两类正确分开,而且使分类间隔最大。将两类正确分开是为了保证训练错误率为0,也就是经验风险最小(为O)。使分类空隙最大实际上就是使推广性的界中的置信范围最小,从而使真实风险最小。推广到高维空间,最优分类线就成为最优分类面。

设线性可分样本集为}1,1{,,,...,1),,(x _-+∈∈=y R x n i y d i i 是类别符号。d 维空间中线性判别函数的一般形式为是类别符号。d 维空间中线性判别函数的一般形式为b x w x g +?=)(,分类线方程为0=+?b x w 。将判别函数进行归一化,使两类所有样本都满足1|)(|=x g ,也就是使离分类面最近的样本的1|)(|=x g ,此时分类间隔等于||||/2w ,因此使间隔最大等价于使||||w (或2||||w )最小。要求分类线对所有样本正确分类,就是要求它满足

n i b x w y i ,...,2,1,01])[(=≥-+? (2-1) 满足上述条件(2-1),并且使2||||w 最小的分类面就叫做最优分类面,过两类样本中离分类面最近的点且平行于最优分类面的超平面H 1,H 2上的训练样本点就称作支持向量(support vector),因为它们“支持”了最优分类面。

利用Lagrange 优化方法可以把上述最优分类面问题转化为如下这种较简单的对偶问题,即:在约束条件,

01=∑=i n i i

y α (2-2a )

n i i ,...,2,1,0=≥α (2-2b)

下面对i α求解下列函数的最大值:

∑∑==-=n

j i j i j i j i n i x x y y 1,1

i )(21Q αααα)( (2-3) 若*α为最优解,则∑==n

i i y w 1

**αα (2-4) 即最优分类面的权系数向量是训练样本向量的线性组合。

这是一个不等式约束下的二次函数极值问题,存在唯一解。根据kühn-Tucker 条件,解中将只有一部分(通常是很少一部分)i α不为零,这些不为0解所对应的样本就是支持向量。求解上述问题后得到的最优分类函数是:

})(sgn{})sgn{()(1***

*∑=+?=+?=n

i i i i b x x y b x w x f α (2-5) 根据前面的分析,非支持向量对应的i α均为0,因此上式中的求和实际上只对支持向量进行。*b 是分类阈值,可以由任意一个支持向量通过式(2-1)求得(只有支持向量才满足其中的等号条件),或通过两类中任意一对支持向量取中值求得。

从前面的分析可以看出,最优分类面是在线性可分的前提下讨论的,在线性不可分的情况下,就是某些训练样本不能满足式(2-1)的条件,因此可以在条件中增加一个松弛项参数0i ≥ε,变成:

n i b x w y i i i ,...,2,1,01])[(=≥+-+?ε (2-6)

对于足够小的s>0,只要使

∑==n

i i F 1)(σσεε (2-7)

最小就可以使错分样本数最小。对应线性可分情况下的使分类间隔最大,在线性不可分情况下可引入约束:

k c ≤2||w || (2-8)

在约束条件(2-6)幂1(2-8)下对式(2-7)求极小,就得到了线性不可分情况下的最优分类面,称作广义最优分类面。为方便计算,取s=1。

为使计算进一步简化,广义最优分类面问题可以迸一步演化成在条件(2-6)的约束条件下求下列函数的极小值:

)(),(21,1

∑=+=n i i C w w w εεφ)( (2-9) 其中C 为某个指定的常数,它实际上起控制对锩分样本惩罚的程度的作用,实现在错分样本的比例与算法复杂度之间的折衷。

求解这一优化问题的方法与求解最优分类面时的方法相同,都是转化为一个二次函数极值问题,其结果与可分情况下得到的(1-2)到(1-5)几乎完全相同,但是条件(1-2b)变为:

n i C ,...,1,0i =≤≤α (2-10)

2.3.2 SVM 的非线性映射

对于非线性问题,可以通过非线性交换转化为某个高维空间中的线性问题,在变换空间求最优分类超平面。这种变换可能比较复杂,因此这种思路在一般情况下不易实现。但是我们可以看到,在上面对偶问题中,不论是寻优目标函数(1-3)还是分类函数(1-5)都只涉及训练样本之间的内积运算)

(i x x ?。设有非线性映射H R d →Φ:将输入空间的样本映射到高维(可能是无穷维)的特征空间H 中,当在特征空间H 中构造最优超平面时,训练算法仅使用空间中的点积,即)()(j i x x φφ?,而没有单独的)(i x φ出现。因此,如果能够找到一个函数K 使得

)()()(j i j i x x x x K φφ?=? (2-11)

这样在高维空间实际上只需进行内积运算,而这种内积运算是可以用原空间中的函数实现的,我们甚至没有必要知道变换中的形式。根据泛函的有关理论,只要一种核函数)(j i x x K ?满足Mercer 条件,它就对应某一变换空间中的内积。因此,在最优超平面中采用适当的内积函数)(j i x x K ?就可以实现某一非线性变换后的线性分类,而计算复杂度却没有增加。此时目标函数(2-3)变为:

∑∑==?-=n

j i j i j i j i n

i i x x K y y Q 11,1)(21)(αααα (2-12)

而相应的分类函数也变为

})(sgn{)(1**∑=+?=n

i j i i i b x x K y x f α (2-13)

算法的其他条件不变,这就是SVM 。

概括地说SVM 就是通过某种事先选择的非线性映射将输入向量映射到一个高维特征空间,在这个特征空间中构造最优分类超平面。在形式上SVM 分类函数类似于一个神经网络,输出是中间节点的线性组合,每个中间节点对应于一个支持向量,如图2.3所示

图2.3 SVM 示意图

其中,输出(决策规则):})(sgn{1∑=+?=n

i i i i b x x K y y α,权值i i i y w α=,)

(i x x K ?为基于s 个支持向量s x x x ,...,,21的非线性变换(内积),),...,,(21d x x x x =为输入向量。

2.3.3.核函数

选择满足Mercer 条件的不同内积核丞数,就构造了不同的SVM ,这样也就形成了不同的算法。目前研究最多的核函数主要有三类:

(1)多顼式核函数

q i i x x x x K ]1)[(),(+?= (2-14)

其中q 是多项式的阶次,所得到的是q 阶多项式分类器。

(2)径向基函数(RBF)

}||exp{),(22

σi i x x x x K --= (2-15)

所得的SVM 是一种径向基分类器,它与传统径向基函数方法的基本区别是,这里每一个基函数的中心对应于一个支持向量,它们以及输出权值都是由算法自动确定的。径向基形式的内积函数类似人的视觉特性,在实际应用中经常用到,但是需要注意的是,选择不同的S 参数值,相应的分类面会有很大差别。

(3)S 形核函数

])(tanh[),(c x x v x x K i i +?= (2-16)

这时的SVM 算法中包含了一个隐层的多层感知器网络,不但网络的权值、而且网络的隐层结点数也是由算法自动确定的,而不像传统的感知器网络那样由人凭借经验确定。此外,该算法不存在困扰神经网络的局部极小点的问题。

在上述几种常用的核函数中,最为常用的是多项式核函数和径向基核函数。除了上面提到的三种核函数外,还有指数径向基核函数、小波核函数等其它一些核函数,应用相对较少。事实上,需要进行训练的样本集有各式各样,核函数也各有优劣。B.Bacsens 和S.Viaene 等人曾利用LS-SVM 分类器,采用UCI 数据库,对线性核函数、多项式核函数和径向基核函数进行了实验比较,从实验结果来看,对不同的数据库,不同的核函数各有优劣,而径向基核函数在多数数据库上得到略为优良的性能。

第三章支持向量机的应用研究现状

3.1 应用概述

SVM方法在理论上具有突出的优势,贝尔实验室率先对美国邮政手写数字库识别研究方面应用了SVM方法,取得了较大的成功。在随后的近几年内,有关SVM的应用研究得到了很多领域的学者的重视,在人脸检测、验证和识别、说话人/语音识别、文字/手写体识别、图像处理、及其他应用研究等方面取得了大量的研究成果,从最初的简单模式输入的直接的SVM方法研究,进入到多种方法取长补短的联合应用研究,对SVM方法也有了很多改进。

3.2支持向量机的应用

3.2.1 人脸检测、验证和识别

Osuna最早将SVM应用于人脸检测.并取得了较好的效果。其方法是汽接训练非线性SVM分类器完成人脸与非人脸的分类。由于SVM的训练需要大量的存储空间,并且非线性SVM分类器需要较多的支持向量,速度很慢。为此,马勇等提出了一种层次型结构的SVM分类器,它由一个线性SVM组合和一个非线性SVM组成。检测时,由前者快速排除掉图像中绝大部分背景窗口,而后者只需对少量的候选区域做出确认;训练时,在线性SVM组台的限定下,与“自举(bootstrapping)”方法相结合可收集到训练非线性SVM的更有效的非人脸样本,简化SVM训练的难度,大量实验结果表明这种方法不仅具有较高的检测率和较低的误检率,而且具有较快的速度。

人脸检测研究中更复杂的情况是姿态的变化。叶航军等提出了利用支持向量机方法进行人脸姿态的判定,将人脸姿态划分成6个类别,从一个多姿态人脸库中手工标定训练样本集和测试样本集,训练基于支持向量机姿态分类器,分类错误率降低到1.67%。明显优于在传统方法中效果最好的人工神经元网络方法。

在人脸识别中,面部特征的提取和识别可看作是对3D物体的2D投影图像进

行匹配的问题。由于许多不确定性因素的影响,特征的选取与识别就成为一个难点。凌旭峰等及张燕昆等分别提出基于PCA与SVM相结合的人脸识别算法,充分利用了PCA在特征提取方面的有效性以及SVM在处理小样本问题和泛化能力强等方面的优势,通过SVM与最近邻距离分类器相结合,使得所提出的算法具有比传统最近邻分类器和BP网络分类器更高的识别率。王宏漫等在PCA基础上进一步做ICA,提取更加有利于分类的面部特征的主要独立成分;然后采用分阶段淘汰的支持向量机分类机制进行识别。对两组人脸图像库的测试结果表明,基于SVM的方法在识别率和识别时间等方面都取得了较好的效果。

3.2.2说话人/语音识别

说话人识别属于连续输入信号的分类问题,SVM是一个很好的分类器,但不适合处理连续输入样本。为此,忻栋等引入隐式马尔可夫模型HMM,建立了SVM和HMM的混合模型。HMM适合处理连续信号,而SVM适台于分类问题;HMM的结果反映了同类样本的相似度,而SVM的输出结果则体现了异类样本间的差异。为了方便与HMM组成混合模型,首先将SVM的输出形式改为概率输出。实验中使用YOHO数据库,特征提取采用12阶的线性预测系数分析及其微分,组成24维的特征向量。实验表明HMM和SVM的结合达到了很好的效果。

3.2.3 文字/手写体识别

贝尔实验室对美国邮政手写数字库进行的实验,人工识别平均错误率是

2.5%,专门针对该特定问题设计的5层神经网络错误率为5.1%(其中利用了大量先验知识),而用3种SVM方法(采用3种核函数)得到的错误率分别为4.0%、4.1%和4.2%,且是直接采用16×16的字符点阵作为输入,表明了SVM的优越性能。

手写体数字O~9的特征可以分为结构特征、统计特征等。柳回春等在UK心理测试自动分析系统中组合SVM和其他方法成功地进行了手写数字的识别实验。另外,在手写汉字识别方面,高学等提出了一种基于SVM的手写汉字的识别方法,表明了SVM对手写汉字识别的有效性。

3.2.4 图像处理

(1)图像过滤。一般的互联网色情网图像过滤软件主要采用网址库的形式来

JAVA学生管理系统期末大作业

JA V A学生管理系统大作业 课程名称:JA V A编程基础 题目:学生信息管理系统 专业:计算机软件 班级:计算机软件121班 学号:8000612030 学生姓名:李俊楠 完成人数:1人 起讫日期:第十六周至第十八周 任课教师:龚根华职称:副教授 部分管主任: 完成时间:2015-1-2

目录 ------------------------------2 课题设计内容------------------------------3 程序功能简介 需求分析--------------------------------------------------3 总体设计---------------------------------------------------3 模块详细设计---------------------------------------------------4 数据库设计 ------------------------------5 主体内容 ------------------------------6 心得体会 -----------------------------11 参考书籍 -----------------------------12

一:课题设计内容 学生管理系统 学生信息管理系统是学校管理的重要工具,是学校不可或缺的部分。随着在校大学生人数的不断增加,教务系统的数量也不断的上涨。学校工作繁杂、资料众多,人工管理信息的难度也越来越大,显然是不能满足实际的需要,效率也是很低的。并且这种传统的方式存在着很多的弊端,如:保密性差、查询不便、效率低,很难维护和更新等。然而,本系统针对以上缺点能够极大地提高学生信息管理的效率,也是科学化、正规化的管理,与世界接轨的重要条件。所以如何自动高效地管理信息是这些年来许多人所研究的。 二:程序功能简介 2.1 需求分析 本系统需要实现的功能: (1)、管理员对学生信息和课程信息进行增加、删除、修改、查找等操作,对选课信息进行管理,对成绩信息和用户信息进行修改、查找等操作。 (2)、学生对学生信息和成绩信息进行查看,对个人的密码信息进行修改等。 2.2 总体设计 学生信息管理系统主要包括管理员和学生两大模块。管理员模块包括:学生信息管理、课程信息管理、选课信息管理、成绩信息管理、用户信息管理等。用户模块包括:学生信息查看、成绩信息查看、个人信息管理等。系统总体结构如图所示。 总体结构图 2.3 模块详细设计 1、学生信息管理模块 学生信息管理模块包括增加、删除、修改、查询、显示全部等。具体的结构图如图所

工业机器人设计(大四机器人课设作业)(DOC)

“工业机器人”设计大作业 作品题目:货物装卸机器人 专业:机械设计制造及其自动化 姓名:班级:学号: 姓名:班级:学号: 姓名:班级:学号: 指导教师:陈明

1 前言 货物装卸作业是指用一种设备握持工件,是指从一个加工位置移到另一个加工位置。货物装卸机器人可安装不同的末端执行器以完成各种不同形状和状态的工件货物装卸工作,大大减轻了人类繁重的体力劳动。目前世界上使用的货物装卸机器人愈10 万台,被广泛应用于机床上下料、冲压机自动化生产线、自动装配流水线、码垛货物装卸、集装箱等的自动货物装卸。部分发达国家已制定出人工货物装卸的最大限度,超过限度的必须由货物装卸机器人来完成。装卸货物装卸是物流的功能要素之一,在物流系统中发生的频率很高 2 设计方案论证 本课题通过对货物装卸机器人工作对象及工作场所的分析研究,深入了解其工作是 如何进行,各部分零部件应该如何运行以及如何紧密配合,先确定其总体结构再对主要 零部件进行设计计算确定其尺寸大小以及确定电机型号。 2.1 基本思想 (1)设计要考虑要求和工作环境的限制。 (2)考虑到货物装卸货物时所需要精确度不是很高,为了简化结构,境地成本,采用 角铁焊接结构。 (3)为了满足设计要求,须设计三个独立的电机驱动系统,各部分之间通过计算 机控制、协调工作。 (4)本次设计只是该题目的机械部分,而对应控制部件的考虑较少。 3 仓库货物装卸机器人的设计计算 3.1 货物装载伸缩装置的设计 3.1.1 确定传动方案 我们所学的传动方式有以下几种:带传动、链传动、齿轮传动、蜗轮蜗杆传动和钢 丝绳传动等,一般地说,啮合传动传递功率的能力高于摩擦传动;蜗轮传动工作的发热 情况较为严重,因而传动的功率不宜过大;摩擦轮传动由于必须有足够的压紧力,故而 在传递同一圆周力时,其压轴力比齿轮传动的大几倍,因而不宜用于大功率传动。带传

宋强 1202121332 统计机器学习大作业

统计机器学习大作业 学院:支持向量机理论 学院:电子工程 姓名:宋强 学号:1202121332

1 统计机器学习理论 目前机器学习的一个比较热门的方向是统计机器学习(另外一个可能是图模型,按照Jordan的说法是统计机器学习属于频率主义,而图模型属于贝叶斯主义),对于每一个做统计机器学习的研究者来说,他们大致可以分为两类:一类做统计学习理论相关工作,如泛化界、约简或一致性;一类做优化算法,如支持向量机、Boosting等。作为一个纯统计机器学习的学者来说,我想这两块内容都得了解。优化算法的门槛低点,可能比较容易上手,了解他们并不太难,比如支持向量机本质上是求解一个RKHS上的二次优化问题,Boosting是函数空间上的梯度下降优化问题。统计学习理论的门槛高点,需要的基础数学知识多点,离计算机出生的人比较远,因而常常使人望而生畏。最近本人对统计学习理论这块做了些整理,发现其实这块东西并非如想象的那么难,他们的本质无非是概率集中不等式在机器学习上的应用,下面以泛化界为例讲一下自己对那块内容的理解。 Talagrand(1996)说过: "A random variable that depends (in a "smooth way") on the influence of many independent variables(But not too much on any of them) is essentially constant". 中文上的意思是,依赖于许多独立随机变量的随机变量本质上是个常量,举个例子,经验风险就是一个依赖于一个随机训练样本集合的随机变量,因而经验风险本质上应该是个常量。正因为如此,这个随机变量离开它均值的概率就以指数形势衰减,因此这就是泛化界中常见的如下论述:“以1-\sigma的概率,作如下论断”的由来。目前使用的各种泛化界分析工具本质上正是基于这个原理,下面介绍下目前主流的三种泛化界分析方法,VC维,R复杂度和稳定性分析。 为了叙述清楚,如一个游戏开始之前需要设置游戏规则一样,这里简单介绍一下机器学习问题设置。统计机器学习研究的问题一般是,给定一堆带标签的训练样本集合,需要从训练集合中学习出一个预测器来,对新的样本进行预测,使得预测结果尽可能的接近它的真实标签。相应的,对统计机器学习理论分析,我们需要做如下一些假设:假设训练样本集合是从一个未知但固定的分布中独立同分布的抽取出来,学习的目标是根据这样一个样本集合,从一个事先给定的分类器集合中挑选出一个分类器,使得分类器的对从同一个分布中随机抽取的样本在给定的一个损失评价下的风险最小。一个需要特别注意的是,在统计学习泛化界分析时,分类器的风险常常被认为是随机样本集上的一个随机变量,这样的随机风险集合(以分类器为索引)在统计上被叫做经验过程。

机械原理大作业

机械原理大作业 This model paper was revised by the Standardization Office on December 10, 2020

机械原理大作业三 课程名称:机械原理 设计题目:齿轮传动设计 院系: 班级: 设计者: 学号: 指导教师: 设计时间: 1、设计题目 机构运动简图 机械传动系统原始参数

2、传动比的分配计算 电动机转速min /745r n =,输出转速m in /1201r n =,min /1702r n =, min /2303r n ,带传动的最大传动比5.2max =p i ,滑移齿轮传动的最大传动比4m ax =v i ,定轴齿轮传动的最大传动比4m ax =d i 。 根据传动系统的原始参数可知,传动系统的总传动比为: 传动系统的总传动比由带传动、滑移齿轮传动和定轴齿轮传动三部分实现。设带传动的传动比为5.2max =p i ,滑移齿轮的传动比为321v v v i i i 、、,定轴齿轮传动的传动比为f i ,则总传动比 令 4max 1==v v i i 则可得定轴齿轮传动部分的传动比为 滑移齿轮传动的传动比为 设定轴齿轮传动由3对齿轮传动组成,则每对齿轮的传动比为 3、齿轮齿数的确定 根据滑移齿轮变速传动系统中对齿轮齿数的要求,可大致选择齿轮5、6、7、8、9和10为角度变位齿轮,其齿数: 35,18,39,14,43,111098765======z z z z z z ;它们的齿顶高系数1=* a h ,径向间 隙系数25.0=*c ,分度圆压力角020=α,实际中心距mm a 51'=。

管理学大作业--A卷

北京理工大学继续教育学院夜大 2009年上半年 专业层次:电子商务专科 《管理学》期末考试卷(A卷) (卷面满分100分) 班级:姓名:学号:成绩: 案例一:王工程师为什么要走 助理工程师王一明,一个重点大学的高材生,毕业后工作已7年,于3年前应聘到一 家大厂负责技术工作,工作勤恳负责,技术能力强,很快就成为厂里有口皆碑的“四大金刚” 之一,名字仅排在工厂技术部主管张工之后。然而,工资却同仓库管理人员不相上下,夫妻小 孩三口尚住在来时住的那间平房里。对此,他心中时常有些不平。 胡厂长,一个有名的识才老厂长,“人能尽其才,物能尽其用,货能畅其流”的孙中山先生名言,在各种公开场合不知被他引述了多少遍,实际上他也是这样做了。3年前, 王一明来报到时,门口用红纸写的“热烈欢迎王一明工程师到我厂工作”几个不凡的红色大 字,是胡厂长亲自吩咐人安排的,并且交待要把“助理工程师”的“助理”两字去掉。这确实 使王一明当时春风不少,工作更卖劲。 两年前,厂里有指标申报工程师,王一明能满足申报条件,但名额却让给一个没有文凭、工作平平的老同志。他想问一下厂长,谁知,他未去找厂长,厂长却先来找他:“王工,你年轻,机会有的是”。去年,他想反映一下工资问题,这问题确实重要,来这里其中一个目的不就是想得高一点工资,提高一下生活待遇吗?但是几次想开口,都没有勇气讲出来。因为厂长不仅在生产会上大夸他的成绩,而且,有几次外地人来学习,胡厂长当着客人的面赞扬他:“王工是我们厂的技术骨干,是一个有创新的…” 最近,厂里新建好的一批职工宿舍,王一明决心趁这个机会要反映一下住房问题,谁知 道这次胡厂长又先找到他,还是像以前一样,笑着拍拍他的肩膀:“王工,厂里有意培养你入

机器人大作业

IRB1600型机器人的运动学分析及仿真

目录 1.引言................................................................................................................ - 2 - 1.1 ABB公司简介.................................................................................... - 3 - 1.2ABB发展历史 .................................................................................... - 4 - 2. IRB1600 ........................................................................................................ - 5 - 2.1 IRB1600的资料................................................................................. - 6 - 2.2建立基于D-H方法的连杆坐标系 ................................................... - 8 - 2.3建立六自由度点焊机器人的运动学方程....................................... - 10 - 3. 虚拟样机的建立........................................................................................ - 12 - 3.1 导入.................................................................................................. - 12 - 3.2 添加约束副...................................................................................... - 13 - 3.3 基于ADAMS的机器人运动学仿真 ............................................. - 14 - 4. 结语............................................................................................................ - 18 - 5. 参考资料.................................................................................................... - 19 -

大工《人工智能》大作业参考题目及要求【内容仅供参考】647

题目:人工智能 1.谈谈你对本课程学习过程中的心得体会与建议? 人工智能是研究如何利用计算机来模拟人脑所从事的感知、推理、学习、思考、规划等人类智能活动,来解决需要用人类智能才能解决的问题,以延伸人们智能的科学。掌握人工智能的基本概念、基本原理、知识的表示、推理机制和求解技术,以及机器学习的技术方法,掌握人工智能的一个问题和三大技术,即通用问题求解和知识表示技术、搜索技术、推理技术。 人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。关于什么是“智能”,就问题多多了。这涉及到其它诸如意识、自我、思维等等问题。人唯一了解的智能是人本身的智能,这是普通人认可的观点。但是我们对我们自身智能的理解都非常有限,对构成人的智能的必要元素也了解有限,所以就很难定义什么是“人工”制造的“智能”了。 2.《人工智能》课程设计,从以下5个题目中任选其一作答。 《人工智能》课程设计 题目三:深度优先搜索算法

要求:(1)撰写一份word文档,里面包括(算法思路、算法程序框图、主要函数代码)章节。 (2)算法思路:简单介绍该算法的基本思想,至少100字。 (3)算法程序框图:绘制流程图或原理图,从算法的开始 到结束的程序框图。 (4)主要函数代码:列出算法的具体代码。 (5)简单描述在人工智能的哪些领域需要使用深度优先搜 索算法。 答:深度优先搜索是图论中的经典算法,利用深度优先搜索算法可以产生目标图的相应拓扑排序表,利用拓扑排序表可以方便的解决很多相关的图论问题,如最大路径问题等等。一般用堆数据结构来辅助实现DFS算法。 1.深度优先遍历图算法步骤: (1)访问顶点v; (2)依次从v的未被访问的邻接点出发,对图进行深度优先遍历;直至图中和v有路径相通的顶点都被访问; (3)若此时图中尚有顶点未被访问,则从一个未被访问的顶点出发,重新进行深度优先遍历,直到图中所有顶点均被访问过为止。 上述描述可能比较抽象,举个实例: DFS在访问图中某一起始顶点v后,由v出发,访问它的任一邻接顶点w1;再从w1出发,访问与w1邻接但还没有访问过的顶点w2;然后再从w2出发,进行类似的访问,......如此进行下去,直至到达

专业点题北航机械原理

一、齿轮传动的基本概念 渐开线齿轮的啮合特点:(1)渐开线齿廓能够保证定传动比;(2)渐开线齿廓之间的正压力方向不变;(3)渐开线齿廓传动具有可分性。 齿轮机构的特点是:传动平稳、适用范围广、效率高、结构紧凑、工作可靠、寿命长。但制造和安装精度高、制造费用大,且不适合于距离较远的两轴之间的传动。齿轮传动可以用来传递任意轴间的运动和动力。 齿轮传动按照一对齿轮传递的相对运动分为平面齿轮传动和空间齿轮传动,平面齿轮传动又分为直齿圆柱齿轮传动、斜齿圆柱齿轮传动和人字齿轮传动;按照工作条件可以分为开式传动、半开式传动和闭式传动。 齿轮传动的基本要求是:传动准确、平稳;承载能力强。 二、齿轮传动的设计与计算 齿廓曲线与齿廓啮合基本定律:在啮合传动的任一瞬时,两轮齿廓曲线在相应接触点的功法线必须通过按给定传动比确定的该瞬时的节点。 渐开线齿轮啮合的正确条件:啮合轮齿的工作侧齿廓的啮合点必须总是在啮合线上,即两齿轮的模数和压力角应该分别相等。 齿轮传动的无侧隙啮合及标准齿轮的安装:一个齿轮节圆上的齿厚等于另一个齿轮节圆上的齿槽宽是无侧隙啮合的条件;外啮合齿轮的标准中心距为,内啮合是标准中心距为。

齿轮及其变位的相关计算:相关参数为齿数、模数、分度圆压力角、齿顶高系数和顶隙系数及标准直齿轮的几何尺寸计算,包括分度圆直径、齿顶高、齿根高、齿全高、齿顶圆直径、齿根圆直径、基圆直径、齿距、齿厚、齿槽宽、中心距、顶隙以及变位齿轮的变位系数等。 渐开线齿轮的根切现象:用展成法加工齿轮式,若刀具的齿顶线或齿顶圆与啮合线的焦点超过被切齿轮的极限点,则刀具的齿顶会将被切齿轮的齿根的渐开线齿廓切去了一部 分。避免根切的最小齿数,用标准齿条刀具切制标准齿轮时,因为 ,最少齿数为17。 三、机构的组成 构件指独立的运动单元,两个构件直接接触组成仍能产生某些相对运动的连接叫运动副。运动副按照相对运动的范围可以分为平面运动副和空间运动副;按运动副元素分为:低副-面接触、应力低;高副-点接触或线接触,应力高。其中运动副元素是只形成运动副的组建之间直接接触的部分。 四、机构自由度的计算 机构相对于机架所具有的独立运动的数目,叫机构的自由度。设一个平面机构由N个构件组成,其中必定有一个构件为机架,其活动构件数为n=N-1.设机构共有个低副、 个高副,因为在平面机构中每个低副和高副分别限制两个自由度和一个自由度,故平面机构的自由度为。在计算平面机构的自由度时,应该注意三种特殊情况:(1)复合铰链:三个或更多的构件在同一处联接成同轴线的两个或更多个转动副,就构成了复合铰链,计算自由度时应该按照两个或更多个运动副计算。(2)局部自由度:在有些机构中,为了其他一些非运动的原因,设置了附加机构,这种附加机构的运动是完全独立的,对整个

管理会计大作业暨期末考试

期末大作业 一、资料:A 公司某年的相关资料如下:(20分) A 公司盈亏临界点的月销售额为50000元,在其他指标不变而固定成本增加5000元时,为了实现保本需增加销售额8000元。 要求:(1)计算原固定成本总额度 (2)计算边际贡献率 (3)计算变动成本率 二、资料:K 企业生产经营甲产品,单价为250元/台,单位变动成本为160元/台,固定成本为15万元。2007年实现销售量4000台,获得利润总额20万元。经调研分析企业按25%的销售利润率预测2008年企业的目标利润基数,预计20×8年企业销售收入为120万元。(20分) 要求:(1)根据资料确定该企业的目标利润; (2)实现目标利润需要采取的各单项措施。 三、资料:乙企业20×7年12月31日简略式资产负债表如表所示: 20×8年计划销售额将达到480 000元,假定其他条件不变,仍按基期股利发放率支付股利,按计划提取折旧12 000元,其中35%用于当年更新改造支出;厂房设备能力已经达到饱和状态,有关零星资金需要量为7 000元。(20分) 要求:试用销售百分比法预测20×8年的追加资金需要量。 四、资料:假设W 公司有5000小时剩余生产能力,可用来生产A 产品或B 产品,有关资要求:分析生产哪种产品?

五、资料:大众制衣公司计划从银行借款430000元购置一台新设备,预计可使用5年,期末残值30000元,使用该设备可以使大众制衣公司每年增加收入360000元,每年的付现营业成本为200000元,企业采用直线法计提折旧,银行借款利率为16%。(20分) 要求:试用净现值法分析该投资方案是否可行。

机器人测控技术大作业

机器人测控技术 大作业 题目: 电气工程学院 学院名称:电气工程学院 专业班级:自动 学生姓名: 学号: 2015 指导教师:张世杰

考虑如图1所示的双关节刚性机械臂,试分析以下问题: 图1 双关节机械臂示意图 (1) 用D-H 建模法建立上述机械臂的运动学方程; (2) 忽略重力、摩擦力和干扰项的情况下,建立该机械臂的动力学 方程; (3) 如果取11l =,20.8l =,120.5m m ==,初始状态: 11220.100.10q q q q ???? ????????=?????????? ?? 试设计一个PD 控制器,让其跟踪一条如下指定的曲线: 12sin 2sin 2d d q t q t ππ=?? =?,并利用Matlab 中给出仿真结果。 解: Y 0 X 0 X 1 Y 1 X 2 Y2

①建立坐标系 a 、机座坐标系{0} b 、杆件坐标系{i } ②确定参数 d i ——相邻坐标系x 轴之间的距离; θi ——相邻坐标系x 轴之间的夹角; l i ——相邻坐标系z 轴之间的距离; αi ——相邻坐标系z 轴之间的夹角。 ③相邻杆件位姿矩阵 M 01=Rot(z,θ1)·Trans(l 1,0,0) = 1 00 01000011 011θθθθc s s c - 1 000010000101 l 001 = 1 01001 1011 1 1011θθθθθθs L c s c L s c - 同理可得: M 12=Rot(z,θ2)·Trans(l 2,0,0) = 1 01002 20222 2022θθθθθθs L c s c L s c - M 23(h )=Rot(z,θ3)·Trans(l 3,0,0) = 1 01003 30333 3033θθθθθθs L c s c L s c -

机器学习大作业

机器学习大作业 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

机器学习大作业 支持向量机是基于统计学习理论的结构风险最小化原则的,它将最大分 界面分类器思想和基于核的方法结合在一起,表现出了很好的泛化能力。由 于SVM方法不仅考虑了对渐进性能的要求,而且在现有有限信息的条件下得 到最优结果,并且能够根据有限的样本信息在模型的复杂性和学习能力之间 寻求最佳折中,从而获得最好的推广能力。SVM主要是应用于分类,简单而言,就是如果有一堆已经分好类的东西(可是分类的依据是未知的),当有 新的未知数据进来时,SVM能够预测这个新的数据要分到哪一堆去。 第一章理论知识 1.1最优间隔分类器 SVM的主要思想是针对两类分类问题,在高维空间寻找一个最优分类超 平面作为分类平面,来保证最小的分类错误率。我们的目标是寻找一个超平面,使得离超平面比较近的点有更大的间距,也就是说,我们不考虑所有的 点都必须远离超平面,我们关心的只是想要求得的超平面能够使得所有点中 离它最近的点具有最大间距。形象的说,我们将上面的图看作是一张纸,我 们要找一条折线,按照这条折线折叠后,离折线最近的点的间距比其他折线 都要大。形式化表示为: 上面描述的这种情况是建立在样例线性可分的假设上,当样例线性不可分时,可以引入松弛变量,它允许在一定程度上违反间隔约束。我们可以尝试使用核函数来将特征映射到高维,这样很可能就可分了。然而,映射后我们也不能100%保证可分。那怎么办呢,我们需要将模型进行调整,以保证在不可分的情况下,也能够尽可能地找出分隔超平面。 看下面两张图:

哈工大机械原理大作业凸轮机构第四题

Harbin Institute of Technology 机械原理大作业二 课程名称:机械原理 设计题目:凸轮机构设计 姓名:李清蔚 学号:1140810304 班级:1408103 指导教师:林琳

一.设计题目 设计直动从动件盘形凸轮机构,其原始参数见表 1 表一:凸轮机构原始参数 升程(mm ) 升程 运动 角(o) 升程 运动 规律 升程 许用 压力 角(o) 回程 运动 角(o) 回程 运动 规律 回程 许用 压力 角(o) 远休 止角 (o) 近休 止角 (o) 40 90 等加 等减 速30 50 4-5-6- 7多 项式 60 100 120

二.凸轮推杆运动规律 (1)推程运动规律(等加速等减速运动) 推程F0=90° ①位移方程如下: ②速度方程如下: ③加速度方程如下: (2)回程运动规律(4-5-6-7多项式) 回程,F0=90°,F s=100°,F0’=50°其中回程过程的位移方程,速度方程,加速度方程如下:

三.运动线图及凸轮线图 本题目采用Matlab编程,写出凸轮每一段的运动方程,运用Matlab模拟将凸轮的运动曲线以及凸轮形状表现出来。代码见报告的结尾。 1、程序流程框图 开始 输入凸轮推程回 程的运动方程 输入凸轮基圆偏 距等基本参数 输出ds,dv,da图像 输出压力角、曲率半径图像 输出凸轮的构件形状 结束

2、运动规律ds图像如下: 速度规律dv图像如下: 加速度da规律如下图:

3.凸轮的基圆半径和偏距 以ds/dfψ-s图为基础,可分别作出三条限制线(推程许用压力角的切界限D t d t,回程许用压力角的限制线D t'd t',起始点压力角许用线B0d''),以这三条线可确定最小基圆半径及所对应的偏距e,在其下方选择一合适点,即可满足压力角的限制条件。 得图如下:得最小基圆对应的坐标位置O点坐标大约为(13,-50)经计算取偏距e=13mm,r0=51.67mm.

管理学原理期末大作业案例

欧阳健的管理方式 蓝天技术开发公司由于在一开始就瞄准成长的国际市场,在国内率先开发出某高技术含量的产品,其销售额得到了超常规的增长,公司的发展速度十分惊人。然而,在竞争对手如林的今天,该公司和许多高科技公司一样,也面临着来自国内外大公司的激烈竞争。当公司经济上出现了困境时,公司董事会聘请了一位新的常务经理欧阳健负责公司的全面工作。而原先的那个自由派风格的董事长仍然留任。欧阳健来自一家办事古板的老牌企业,他照章办事,十分古板,与蓝天技术开发公司的风格相去甚远。公司管理人员对他的态度是:看看这家伙能呆多久!看来,一场潜在的“危机”迟早会爆发。 第一次“危机”发生在常务经理欧阳健首次召开的高层管理会议上。会议定于上午9点开始,可有一个人姗姗来迟,直到9点半才进来。欧阳健厉声道:“我再重申一次,本公司所有的日常例会要准时开始,谁做不到,我就请他走人。从现在开始一切事情由我负责。你们应该忘掉老一套,从今以后,就是我和你们一起干了。”到下午4点,竟然有两名高层主管提出辞职。 然而,此后蓝天公司发生了一系列重大变化。由于公司各部门没有明确的工作职责、目标和工作程序,欧阳健首先颁布了几项指令性规定,使已有的工作有章可循。他还三番五次地告诫公司副经理,公司一切重大事务向下传达之前必须先由他审批,他抱怨下面的研究、设计、生产和销售等部门之间互相扯皮,踢皮球,结果使蓝天公司一直没能形成统一的战略。 欧阳健在详细审查了公司人员工资制度后,决定将全体高层主管的工资削减10%,这引起公司一些高层主管向他辞职。 研究部主任这样认为:“我不喜欢这里的一切,但我不想马上走,因为这里的工作对我来说太有挑战性了。” 生产部经理也是个不满欧阳健做法的人,可他的一番话颇令人惊讶:“我不能说我很喜欢欧阳健,不过至少他给我那个部门设立的目标我能够达到。当我们圆满完成任务时,欧阳健是第一个感谢我们干得棒的人。” 采购部经理牢骚满腹。他说:“欧阳健要我把原料成本削减20%,他一方面拿着一根胡萝卜来引诱我,说假如我能做到的话就给我油水丰厚的奖励。另一方面则威胁说如果我做不到,他将另请高就。但干这个活简直就不可能,欧阳健这种‘大棒加胡萝卜’的做法是没有市场的。从现在起,我另谋出路。” 但欧阳健对被人称为“爱哭的孩子”销售部胡经理的态度则让人刮目相看。以前,销售部胡经理每天都到欧阳健的办公室去抱怨和指责其他部门。欧阳健对付他很有一套,让他在门外静等半小时,见了他对其抱怨也充耳不闻,而是一针见血地谈公司在销售上存在的问题。

机器人视觉大作业

机器人视觉论文 论文题目:基于opencv的手势识别院系:信息科学与工程学院 专业:信号与信息处理 姓名:孙竟豪 学号:21160211123

摘要 文中介绍了一种易于实现的快速实时手势识别算法。研究借助计算机视觉库OpenCV和微软Visual Studio 2008 搭建开发平台,通过视频方式实时提取人的手势信息,进而经二值化、膨胀腐蚀、轮廓提取、区域分割等图像处理流程甄别出当前手势中张开的手指,识别手势特征,提取出人手所包含的特定信息,并最终将手势信息作为控制仪器设备的操作指令,控制相关设备仪器。 0、引言 随着现代科技的高速发展及生活方式的转变,人们越发追求生活、工作中的智能化,希望享有简便、高效、人性化的智能操作控制方式。而伴随计算机的微型化,人机交互需求越来越高,人机友好交互也日益成为研发的热点。目前,人们已不仅仅满足按键式的操作控制,其目光已转向利用人体动作、表情变化等更加方便、友好、直观地应用智能化交互控制体系方面。近年来,国内外科学家在手势识别领域有了突破性进展。1993 年B.Thamas等人最先提出借助数据手套或在人手粘贴特殊颜色的辅助标记来进行手势动作的识别,由此开启了人们对手势识别领域的探索。随后,手势识别研究成果和各种方式的识别方法也纷然出现。从基于方向直方图的手势识别到复杂背景手势目标的捕获与识别,再到基于立体视觉的自然手势识别,每次探索都是手势识别领域内的重大突破。 1 手势识别流程及关键技术 本文将介绍一种基于 OpenCV 的实时手势识别算法,该算法是在现有手势识别技术基础上通过解决手心追踪定位问题来实现手势识别的实时性和高效性。 基于 OpenCV 的手势识别流程如图 1 所示。首先通过视频流采集实时手势图像,而后进行包括图像增强、图像锐化在内的图像预处理,目的是提高图像清晰度并明晰轮廓边缘。根据肤色在 YCrCb 色彩空间中的自适应阈值对图像进行二值化处理,提取图像中所有的肤色以及类肤色像素点,而后经过膨胀、腐蚀、图像平滑处理后,祛除小块的类肤色区域干扰,得到若干块面积较大的肤色区域; 此时根据各个肤色区域的轮廓特征进行甄选,获取目标手势区域,而后根据目标区域的特征进行识别,确定当前手势,获取手势信息。

机器学习大作业

机器学习大作业Revised on November 25, 2020

题目:机器学习 授课老师:韩红 基于BP 神经网络的非线性函数拟合 摘要:BP(Back Propagation)神经网络是 1986年由 Rumelhart和 McCelland 提出的,它是一种误差按反向传播的多层前馈网络,是目前应用最广泛的神经网络模型之一。 BP神经网络具有非常强的非线性映射能力,能以任意精度逼近任意连续函数,因此在人工智能的许多领域都得到了广泛的应用。 通常,BP算法是通过一些学习规则来调整神经元之间的连接权值,在学习过程中,学习规则以及网络的拓扑结构不变。然而一个神经网络的信息处理功能不仅取决于神经元之间的连接强度,而且与网络的拓扑结构(神经元的连接方式)、神经元的输入输出特性和神经元的阈值有关,因而神经网络模型要加强自身的适应和学习能力,应该知道如何合理地自组织网络的拓扑结构,知道改变神经元的激活特性以及在必要时调整网络的学习参数等。 1 BP神经网络概述 BP神经网络是一种多层前馈神经网络,该网络的主要特点是信号前向传递,误差反向传播。在前向传递中,输入信号从输入层经隐含层逐层处理, 直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出, 则转入反向传播,根据预测误差调整网络权值和阈值,从而使B P神经网络预测输出不断逼近期望输出。BP神经网络的拓扑结构如图 图1中, X1, X2, …, X n是BP神经网络的输入值, Y1, Y2, …, Y m是BP神经网络的预测值,ωij和ωjk为BP神经网络权值。从图2可以看出, BP神经网络可以看成一个非线性函数, 网络输入值和预测值分别为该函数的自变量和因变量。当输入节

《管理学》大作业

网络教育学院 《管理学》课程大作业 学习中心:奥鹏远程教育济南学习中心(直属)[25]层次:专升本 专业:电气工程及其自动化 年级: 学号: 姓名: 完成日期:

题目五:你认为什么情况下采用矩阵型组织结构比较好? 答: 矩阵型组织是一种混合体,是职能型组织结构和项目型组织结构的混合。它既有项目型组织结构注重项目和客户(业主)的特点,也保留了职能型组织结构的职能特点。这种结构将职能与任务很好地结合在一起,既可满足对专业技术的要求,又可满足对每一项目任务快速反应的要求矩阵制是将按职能划分的部门与按产品或按项目划分的小组(项目组)结合成矩阵型的一种组织结果形式。 矩阵制是将按职能划分的部门与按产品或按项目划分的小组(项目组)结合成矩阵型的一种组织结果形式。这种组织结构形式多用于项目管理。 例如研发型企业、软件公司、工程企业。矩阵型就是一方面服从项目的管理,一方面服从公司各个职能部门的管理,形成一种矩阵。 特点:加强了横向联系,组织的机动性加强,集权和分权相结合,专业人员潜能得到发挥,能培养各种人才。 距阵型组织是一种很有效的组织结构,在西方国家被普遍采用。引进这种组织结构,对处在快速发展中的我国企业来说,具有非常现实的意义。然而一物有一利必有一弊,矩阵结构的缺点是:项目负责人的责任大于权力,因为参加项目的人员都来自不同部门,隶属关系仍在原单位,只是为"会战"而来,所以项目负责人对他们管理困难,没有足够的激励手段与惩治手段,这种人员上的双重管理是矩阵结构的先天缺陷;。 学习心得 答: 。 管理作为一种实践活动,可以说和人类的历史一样悠久。没有学习管理学之前,一直以为管理就是小到对自身日常生活的计划,大到国家对各个事物的领导与规划。学习了管理学后才开始明白,管理学上所研究的管理是指发生在组织中的管理活动,是组织中的管理者为了实现组织的目标对组织成员施加的影响的行为。 管理活动贯穿与生活的方方面面,管理已经成为现代社会最重要的一项活动。而且随着社会的发展,管理活动变得越来越重要,离开了管理,国家将无法

大工19秋《数据挖掘》大作业题目及要求答案

网络教育学院 《数据挖掘》课程大作业 题目:题目一:Knn算法原理以及python实现 姓名: XXX 报名编号: XXX 学习中心:奥鹏XXX 层次:专升本 专业:计算机科学与技术 第一大题:讲述自己在完成大作业过程中遇到的困难,解决问题的思路,以及相关感想,或者对这个项目的认识,或者对Python与数据挖掘的认识等等,300-500字。 答: 数据挖掘是指从大量的数据中通过一些算法寻找隐藏于其中重要实用信息的过程。这些算法包括神经网络法、决策树法、遗传算法、粗糙集法、模糊集法、关联规则法等。在商务管理,股市分析,公司重要信息决策,以及科学研究方面都有十分重要的意义。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术,从大量数据中寻找其肉眼难以发现的规律,和大数据联系密切。如今,数据挖掘已经应用在很多行业里,对人们的生产生活以及未来大数据时代起到了重要影响。

第二大题:完成下面一项大作业题目。 2019秋《数据挖掘》课程大作业 注意:从以下5个题目中任选其一作答。 题目一:Knn算法原理以及python实现 要求:文档用使用word撰写即可。 主要内容必须包括: (1)算法介绍。 (2)算法流程。 (3)python实现算法以及预测。 (4)整个word文件名为 [姓名奥鹏卡号学习中心](如 戴卫东101410013979浙江台州奥鹏学习中心[1]VIP ) 答: KNN算法介绍 KNN是一种监督学习算法,通过计算新数据与训练数据特征值之间的距离,然后选取K(K>=1)个距离最近的邻居进行分类判(投票法)或者回归。若K=1,新数据被简单分配给其近邻的类。 KNN算法实现过程 (1)选择一种距离计算方式, 通过数据所有的特征计算新数据与

第一学期《管理学原理》大作业资料.doc

2016年第一学期《管理学原理》大作业(完成) 第一大题:简答题 1、简述管理环境的分类。 2、简述权变理论的主要观点 3、简述两种不同的社会责任观。 4、简述德尔菲法和头脑风暴法的异同点。 5、简述计划编制的程序。 6、简述扁平式组织结构和锥形组织结构形式的优缺点。 7、简述克服沟通障碍的途径。 8、简述直接控制和间接控制的优劣。 9、简述管理创新的内容。 第二大题:论述题 1、试论述管理的二重性原理 2、联系实际,谈谈建立学习型组织的主要途径。 3、联系实际,谈谈如何加强管理伦理建设。 4、结合实际,谈谈你对目标管理的看法。 5、结合实际,谈谈控制的过程及其注意事项。 6、假如你是一个企业的管理者,你将如何对待管理创新。 第三大题:案例分析题 案例1:“菁菁校园”是一所新型的私立学校,专门为大学生、高中生提供暑期另类课程如登山、探险、航海等集体项目的专业培训,以及为在职人员提供团队合作课程培训。该学校的创办人刘岩是个成功的企业家,他酷爱登山,并坚信这是一项锻炼个人品质,同时学习集体协作精神的完美运动。在刘岩看来,这个学校是个非营利性的企业,但是无论如何得自己维持自己的运转。因为如果没有充裕的资金,学校就不可能发展。学校开办以来,学生的数目逐年增多。学校的课程主要分为两类,一类是普通课程,一类是特殊课程。普通课程是学校的起家项目,针对大中学生的集体训练开设。每年暑假,总有大批学生报名参加登山、探险等充满新鲜感的这类项目。虽然这部分的收入占了整个学校全部营业收入的70%,但是这种项目并不盈利。特殊课程是应一些大公司的要求,专门开办的短期团队合作培训。这部分课程是最近才设立的,深受各大公司经理们的欢迎,在非正式的反馈中,他们都认为在这些课程里获益很多,他们所属的公司也愿意继续扩大与“菁菁校园”的合作。同时,这类课程为学校带来丰厚的利润。但是,在实施特殊课程的时候,刘岩和他的好友们也有疑虑:这种课程的商业化倾向非常重,如果过分扩张,可能会破坏“菁菁校园”的形象。另外,特殊课程的学员大多是中高级经理,他们的时间非常紧张,课程一旦设立下来,就不能改动,因此总会遇到与普通课程的冲突。在学校成立初期,刘岩并没有特别关注管理问题,他觉得很简单:每年暑假开始,学校就招生开课,到暑假结束就关门。但是随着知名度的提高和注册学生的不断增多,学校变得日益庞大复杂,管理问题和财政状况开始受到关注。最明显的是学校暑期过于繁忙,设施不足,而淡季则设备人员闲置。他还发现无法找到足够的技术熟练、经验丰富的从事短期工作的指导老师,如果要常年聘请他们花销实在太大。与此同时,在社会上出现了相似的竞争者,学校面临内外两方面的评估和战略方向的重新确定。 请结合案例分析: 1、“菁菁校园”的未来应如何定位? 2、“菁菁校园”的项目该如何发展?

机器人技术大作业

大作业:PUMA 机器人 1. 坐标系建立 利用D-H 参数法建立坐标系: 2.D-H 参数表 关节 i θ(?) i α(?) i l i d 运动范围 1 90 -90 0 0 -160°~160° 2 0 0 a 2 d 2 -225°~45° 3 90 90 -a 3 0 -45°~225° 4 0 -90 0 4d -110°~170° 5 0 90 0 0 -100°~100° 6 6d -266°~266° 3. 正运动学推导

3.1变换矩阵求取 1 i-1i 11Rot(,) Trans(0,0,d ) Trans(l ,0,0) Rot(,) = 00 1i i i i i i i i i i i i i i i i i i i i i i c s c s s l c c c c c s l s A z x s c d θθαθαθθ θαθαθθααα----????-? ?=?????? 列各D-H 变换矩阵如下: 110101010010000 01-????? ?=??-? ???c s s c A 2212222 02220200 10 001c s a c s c a s A d -??????=?? ???? 33233 03 3303301000001c s a c s c a s A -?? ??--??=?? ? ? ?? 344404040400100001-??????=??-????c s s c A d 45 50 5 0505001000001c s s c A ????-??=?? ?? ?? 5666-6 066000010 001c s s c A d ?? ????=?? ???? 注:为书写方面,本文中cos ,sin i i ci si θθ== 又由00123456123456T A A A A A A =?????,利用Matlab 进行符号运算,运行程序PUMAzhengyundongxue (程序详见附录)得: ??????? ?? ???=10 0060 pz az sz nz py ay sy ny px ax sx nx T 其中 - c6*(s5*(c1*c2*s3 + c1*c3*s2) + c5*(s1*s4 - c4*(c1*c2*c3 - c1*s2*s3))) - s6*(c4*s1 + s4*(c1*c2*c3 - c1*s2*s3))s6*(c1*c4 - s4*(c2*c3*s1 - s1*s2*s3)) - c6*(s5*(c2*s1*s3 + c3*s1*s2) nx ny == - c5*(c1*s4 + c4*(c2*c3*s1 - s1*s2*s3)))s4*s6*(c2*s3 + c3*s2) - c6*(s5*(c2*c3 - s2*s3) + c4*c5*(c2*s3 + c3*s2))nz ??? ??? ?=??

相关主题
文本预览
相关文档 最新文档