当前位置：文档之家› 独立分量分析的基本问题与研究进展

独立分量分析的基本问题与研究进展

文献翻译-变分贝叶斯独立分量分析

(本科毕业设计论文) 毕业设计（论文）外文资料翻译作者：学科专业：学号：班级：指导老师： 2014年6月

变分贝叶斯独立分量分析摘要信号的盲分离通过info-max 算法在潜变量模型中被视为最大似然学习潜变量模型。在本文我们提出一个变换方法最大似然学习这些模型,即贝叶斯推理。它已经被证明可以应用贝叶斯推理来确定在主成分分析模型潜在的维度。在本文我们为去除在独立分量分析模型中不必要的来源维度获得类似的方法。我们给一个玩具数据集和一些人为的混合图像提出结果。 1.引言独立分量分析的目的是为一个基于概率性的独立原件找到一个表示法。实现这样的表示方法是给潜变量是独立约束的潜变量模型拟合一个数据。我们假设一个,有潜在的尺寸W ,观察到的尺寸P 和我们的数据集包含样本n 的模型M 。在ICA 方法中通常把潜在的维度称为“来源”。因此我们为独立生成潜在变量X 寻找模型表示，我们将任何给定的数据点n 带入 ∏== I i in n x p x p 1 )()( 假设高斯噪声,观察到的变量的每个实例化的概率,带入 )2 exp(2),,,(2μβ πβμβ--= n x n n n W t W x t p 其中W 是PXI 矩阵的参数,B 代表了一种逆噪声方差和u 是一个向量的方法。 1.1源分布众所周知在独立分量分析,潜在分布的选择是很重要的。特别说明它必须是非高斯。非高斯源分布可以分成两类,那些积极的峰度或“沉重的尾巴”和那些消极的峰度或“光明的尾巴”。前者被称为超高斯分布，后者是亚高斯。如果我

们真正的源分布属于这两个中的任何一个类我们可以尝试分开。对于我们的ICA 模型,我们遵循?(1998)选择超高斯或者是亚高斯灵活的源分布。的运算结果的模型应用于两个可能发生的事。阿蒂亚斯选择了每个因素的混合物M 高斯模型 () ∏∑==?? ????=I i m m ni M m m n m x x N p 121 ,)(σπ }{m π是混合系数和每个组件是由一个意思毫米和方差q2m 。阿蒂亚斯提到作为独立的因子分析模型。我们可能现在写下一个可能性,是一个函数的参数W,β,μ ()()()?∏==x x x t n n n n N n d p W p W p μβμβ,,,,,t 1 这个功能现在可以最大化的参数来确定独立的组件。传统的优化执行限制作为B 倾向于零。这种方法由贝尔和介绍了盲源分离作为信息最大化算法。与最大的关系可能是由不同的作者包括卡多佐指出(1997)和麦(1996)。 2.ICA 的贝叶斯形式主义在本文中我们提出，按照推断模型的参数化的贝叶斯方法，而不是通过最大似然学习的参数。这要求我们把先验对模型参数。我们的目标是如何通过一个特定的选择我们的先验分布的显示P(W)我们可能自动判断哪些已经产生了数据源的数量。我们是主教的贝叶斯PCA （1999年），它的目的是确定在启发我们的方法主要子空间的自动维数。我们选择将噪音精密β，与以前的马, ()() b ββαββ，gam p = 这里我们定义伽玛分布 ()() ()τττ b a b a a a b -Γ= -exp ,gam 1 对于混合矩阵W ,我们认为高斯之前。特别是每一个的相关性输入可通过使用自动相关性确定（ARD ）来确定前（尼尔，1996；麦凯，1995年） ()() ∏∏==-=I i P p i ip N W p 11 1 ,0αωα

基于独立分量分析的多源冲击定位方法

振　动　与　冲　击第28卷第8期 JOURNAL OF V I B RATI O N AND SHOCK Vol .28No .82009　基于独立分量分析的多源冲击定位方法基金项目:国家高技术研究发展计划(863计划)(2007AA03Z117);国家自然科学基金项目(60772072) 收稿日期:2008-07-28　修改稿收到日期:2008-08-06第一作者苏永振男,博士生,1980年生通讯作者袁慎芳女,博士,博士,1968年生苏永振,袁慎芳 (南京航空航天大学智能材料与结构航空科技重点实验室,南京　210016) 摘　要:结构健康监测中常用声发射信号进行声发射源的定位及特征描述。多个冲击事件发生时,声发射信号是多个信号的混叠,而且混合方式未知,这使利用声发射信号对冲击源进行定位变得非常困难。而近年来兴起的基于独立分量分析的盲源分离技术为解决这一难题提供了可能。采用基于信息极大化原理的反馈网络结构对同时作用在铝梁上的两个冲击事件产生的声发射混合信号进行分离,估计出各个源信号到达传感器的时延后,运用两点直线定位公式对两个冲击源进行定位。混合仿真实验验证了基于信息极大化原理的独立分量分析方法估计时延的有效性,铝梁上的两源冲击实验,进一步表明运用独立分量分析方法能较好的解决多冲击源定位问题。关键词:盲源分离;独立分量分析;时延;冲击定位中图分类号:T B52;TG115.28 文献标识码:A 航空材料结构在服役过程中不可避免的要承受具有不同能量的各种物体的冲击,由冲击所诱导的损伤,使结构承载能力大大降低、结构强度及稳定性严重退化[1]。因此,很有必要利用结构健康监测技术[2] 对冲击事件进行实时监测。目前对冲击定位的研究多是以单个冲击源为研究对象,常通过求解由冲击产生的声发射信号到达不同传感器的时延进行定位。在对多个冲击源进行定位时,一些常规的求解时延方法[3] 如互相关函数法,能量法、阈值法等不再有效。因为在多个冲击源的情况下,声发射信号是多个源信号的混叠,上述方法只能求解出一个时延,因此无法实现多个冲击源的定位。近年来兴起的基于独立分量分析(I CA )的盲源分离(BSS )技术为这一问题的解决提供了有效途径。盲源信号分离是指在不知道源信号和混合参数的情况下,仅根据源信号的一些统计特性和有限的观测数据恢复出源信号。盲源信号分离技术在通信、生物医学信号处理、语音信号处理、阵列信号处理等获得了广泛的应用。 BSS 根据混合方式可分为瞬时混合和卷积混合,瞬时混合模型常假定信号源是同时混合的,不能容忍时延,而实际上混合源中有到达时间的区别。传感器测得的由冲击产生的声发射信号是结构的脉冲响应函数与源信号的卷积,而且由于传播介质的影响(时延和反射等),信号是多路径到达的,因此本文采用卷积混合模型模拟两个冲击源信号的混合过程。BSS 的卷积混合模型为:x =A 3s,其中“3”代表卷积,x 为t 时刻 M 维的观测信号向量,s 为t 时刻的N 维源信号向量,A 为M ×N 维的F I R 混合滤波器矩阵。解混目标是寻找一逆F I R 滤波器矩阵W 使得解卷积后的输出y =W 3s 是源信号s 的估计。本文以同时作用在铝梁上的两个冲击源的定位问题为例,研究基于BSS 技术的多源冲击定位问题。根据BSS 的卷积混合模型,采用基于信息最大化原理的反馈分离网络结构,对两个冲击源的混叠信号进行分离,求出各个冲击源到达传感器的时延,再根据波速,利用两点直线法实现两个冲击源的定位。 1　I nfomax 方法 1988年L inskers [‘4] 提出了可用非线性单元来处理任意分布的输入信号的信息最大化(I nfomax )原理,它可描述为:网络的输入端和输出端的互信息达到最大时,等价于输出端各分量间的相关性最小。1995年, A.J.Bell 和T .J.Sejnowski [5] 提出了基于信息最大化(I nf omax )原理的盲源分离算法。I nfomax 算法的独立性判据为信息极大传输准则,即通过对分离矩阵的调整,使非线性输出y 和网络输入x 之间的互信息I (y,x )极大。由信息论可知: I (y,x )=H (y )-H (y |x ) (1)由于H (y |x )不依赖于分离矩阵W ,可以看出,通过最大化输出信号的联合熵,就可实现输入输出之间的互信息最大。输出信号的联合熵为: H (y )=-E [log (f y (y ))] (2)f y (y )为非线性输出y 的概率密度函数,设输入经过非线性函数g (x )得到y,当g (x )为单调上升或下降时,输出输入概率密度函数之间的关系则可以写为: f y (y )=f x (x )/det (J ) (3)det (J )为网络的雅克比行列式,f x (x )为输入信号的概

独立分量分析(ICA)简单认识

ICA (Independent Components Analysis)，即独立分量分析。它是传统的盲源分离方法，旨在恢复独立成分观测的混合物。FastICA是一个典型的独立分量分析(ICA)方法。它是信号盲处理的基础，对信号独立分量分析的检测是信号盲处理的起点。现有的信号盲处理的算法，大都是基于独立分量分析的，通过对独立分量分析的研究就可以把这些算法统一起来。一、信号分类： 1.无噪声时：假设混叠系统由m个传感器和n个源信号组成，并且源信号与观测信号遵从如下所示的混叠模型： x(t)=As(t)，其中，x(t)=[x1(t),x2(t),...,x m(t)]T表示m维观测信号矢量； A为m*n维混叠权系数为未知的混叠矩阵； n个源信号的组合为：s(t)=[s 1(t),s 2 (t),...,s n (t)]T 2.有噪声时：若考虑噪声的影响，则有： x(t)=As(t)+n(t)，其中，从m个传感器采集来的噪声集合为：n(t)=[n1(t),n2(t),...,n m(t)]T 针对式子：x(t)=As(t)+n(t) 独立分量分析(ICA)就是要求解分离矩阵W，使得通过它可以从观测信号x(t)中恢复出未知的源信号s(t)，分离系统输出可通过下式表示：y(t)=Wx(t)其中，y(t)=[y1(t),y2(t),…,y n(t)]T为源信号的估计矢量，即：y(t)=S(t) 二、用ICA方法的信号分析——基于小波变换和ICA的分离方案（分离步骤）首先介绍下语音分离的大体思路。先采用小波变换对各个带噪混叠语音进行预消噪处理，然后进行预处理，最后用ICA的方法对消噪后的混叠语音进行分离；最后根据分离信号的特点进一步提出对其进行矢量归一和再消噪处理，最终得到各个语音源信号的估计。 1.预消噪处理——小波变换这里采用的是小波阈值法去噪，它类似于图像的阈值分割。（阈值就是临界值或叫判断设定的最小值）设带噪语音信号为: f(t)=As(t)+n(t)，式中: s(t)是纯语音信号, n(t)为噪声。对式子作离散小波变换。首先对被噪声污染的语音信号进行离散序列小波变换, 得到带有噪声的小波系数；然后用设定的阈值作为门限对小波系数进行处理,对低于阈值的小波系数作为由噪声引起的,仅让超过阈值的那些显著的小波系数用来重构语音信号。 2.约束条件

英语独立成分分析

一、独立成分：插入一个词或一个词组，不作任何成分，又和这些成分没有语法关系，叫句子的独立成分。有感叹词、肯定词(yes)、否定词(no)、称呼语和插入语等。 1、感叹词，表喜、怒、哀、乐。如： Oh, it’s you! Hello! This is Shirley speaking. Well, here we are at last. 好啦，我们终于到了。 2、肯定词和否定词： Yes, it is. No, they are not. 3、称呼语(The Direct Address)，称呼人的用语叫做称呼语。 Well, how about it, young man? 怎么样？小伙子。 I haven’t seen you for ages, Jack. 杰克，好久没有看见你了。 Hurry up, comrades, or we’ll be late. 赶快吧，同志们！否则我们要迟到了。 4、插入语，在句子里往往可以插入一些情态词（或叫语气词，如perhaps, certainly）、短语（如of course, to be frank, in other words, generally speaking）或句子（如I am sure, I am afraid, I suppose, I think）。 This is all we have got, you see. 我们所有的都在这儿，你瞧。 He may not come, I am afraid. 恐怕他不会来。 He is a good Party member, I believe. 我认为他是个好党员。注意：如果把句子中间的或放在句子后面的I think, I suppose, I believe, I am afraid等放到句子前面，这时不是插入语，它就成为一个主句，而原来的句子就变成一个从句了。如： I believe he is a good Party member. I think this is a good way to practise speaking English. 比较：This, I think, is a good way to practise speaking English. 我认为这是练习说英语的好办法。介词短语、不定式短语、现在分词短语、副词、形容词短语及从句都可以用作独立成分。

第3章基于信息论的独立分量分析算法

第3章基于信息论的独立分量分析算法 3.1 引言由于没有任何参照目标，学习只能是自组织的。学习过程的第一步：建立一个以W 为变元的目标函数()W L ,如果某个W ?能使()W L 达到极大（小）值，该W ?即为所需的解。第二步：用一种有效的算法求W ?。按照()W L 定义的不同和求W ?的方法不同可以构成各种ICA 算法。ICA 方法可归结为如下式子：ICA 方法＝目标函数＋优化算法。由ICA 的性质可知ICA 以统计独立为基本原则，统计独立的衡量为ICA 算法的关键。因此需选择一个恰当的目标函数。目标函数给定后，可以采用经典的优化算法最优化目标函数，如梯度法、拟牛顿法等。ICA 方法的特性取决于目标函数和优化算法两项。ICA 方法的统计特性（如一致性、鲁棒性）取决于目标函数的选取；算法特性（收敛速度、内存要求）取决于优化算法的选择。对于同一个目标函数可以有不同的优化算法，同一个优化算法可应用于不同的目标函数。衡量一个优化算法的主要性能指标有收敛速度，占用内存情况，稳定性等。算法的研究可分为基于信息论准则的迭代估计方法和基于统计学的代数方法两大类，从原理上来说，它们都是利用了源信号的独立性和非高斯性。基于信息论的方法研究中，各国学者从最大熵、最小互信息、最大似然和负熵最大化等角度提出了一系列估计算法。如FastICA 算法, Infomax 算法，最大似然估计算法等。基于统计学的方法主要有二阶累积量、四阶累积量等高阶累积量方法。在此我们主要讨论基于信息论的几种独立分量分析算法。 3.2 数据的预处理一般情况下，所获得的数据都具有相关性，所以通常都要求对数据进行初步的白化或球化处理，因为白化处理可去除各观测信号之间的相关性，从而简化了后续独立分量的提取过程，而且，通常情况下，数据进行白化处理与不对数据进行白化处理相比，算法的收敛性较好。若一零均值的随机向量()T M Z Z Z ,,1 =满足{}I ZZ E T =，其中：I 为单位矩阵，我们称这个向量为白化向量。白化的本质在于去相关，这同主分量分析的目标是一样的。在ICA 中，对于为零均值的独立源信号()()()[]T N t S t S t S ,...,1=，有：{}{}{} j i S E S E S S E j i j i ≠==当,0，且协方差矩阵是单位阵()I S =cov ，因此，源信号()t S 是白色的。对观测信号()t X ，我们应该寻找一个线性变换，使()t X 投影到新的子空间后变成白化向量，即： ()()t X W t Z 0= （3.1）其中，0W 为白化矩阵，Z 为白化向量。

基于独立分量分析的结构模态参数识别

振动与冲击第２９卷第３期ＪＯＵＲＮＡｌ，ＯＦＶＩＢＲＡＴＩＯＮＡＮＤＳＨＯＣＫＶ０１．２９Ｎｏ．３２０１０基于独立分量分析的结构模态参数识别静行１，袁海庆１，赵毅２（１．武汉理工大学土木工程与建筑学院，武汉４３００７０；２．武汉理工大学设计研究院，武汉４３００７０）摘要：简要介绍了独立分量分析的基本原理及算法，探讨了结构的正规坐标与独立分量的关系。分析认为，结构自由振动响应的振型分解可以看做是一个ＩＣＡ问题。因此，可以把独立分量分析发展成为一种利用结构自由振动响应时域信号进行模态参数识别的方法。结合数值仿真算例及振动试验，验证了独立分量分析用于结构模态参数识别的有效性。结果表明，独立分量分析可以准确的从结构自振响应中，分离出各正规坐标，同时估计出各阶模态振型向量，适用于环境激励下的工作模态参数识别。关键词：独立分量分析；参数识别；正规坐标中图分类号：ＴＵ３１１．３；ＴＮ９１１．６文献标识码：Ａ模态参数识别是结构动力特性研究的一个重要课题，主要任务是从测试所得的数据中，确定振动系统的模态参数，其中包括模态固有频率、模态阻尼比及振型等。目前模态参数识别方法主要有频域法、时域法、时一频分析方法等‘１．２｜。传统的模态识别方法往往要求同时测得结构上的激励和响应信号。但是，在实际工程应用中，对一些大型结构无法施加激励或施加激励费用很昂贵，因此，直接利用环境激励下的振动响应数据进行模态参数识别逐渐引起了人们的重视【３．４Ｊ。独立分量分析一一７ｊ（ＩｎｄｅｐｅｎｄｅｎｔＣｏｍｐｏｎｅｎｔＡｎａｌｙ?ｓｉｓ，ＩＣＡ）是伴随着盲源分离问题而发展起来的一项统计信号处理的新技术，其处理对象是相互统计独立的信号源经线性组合而产生的一组混合信号，最终目的是从混合信号中分离出各独立的信号分量。相对于主成分分析（ＰｒｉｎｃｉｐｌｅＣｏｍｐｏｎｅｎｔＡｎａｌｙｓｉｓ，ＰＣＡ）而言，ＩＣＡ不仅含有信号的一、二阶信号，而且利用了信号的高阶信息，因此ＩＣＡ方法是处理非高斯信号的一种有效手段，也可以看作是ＰＣＡ方法的推广。本文在简单介绍独立分量分析的基本原理及算法后，探讨了结构的正规坐标与独立分量之间的关系，并结合数值仿真算例与振动试验，验证了ＩＣＡ用于结构模态参数识别的实用效果。１独立分量分析１．１问题描述独立分量分析是从多元（多维）统计数据中寻找其内在因子或成分的一种方法。ＩＣＡ问题可简单描述为：假定共有Ⅳ个传感器拾取到Ⅳ个观测信号石；（ｉ＝１，２，…，Ⅳ），每个观测信号是肘个独立源信号ｓ，（．『－１，２，…，Ｍ）的线性混合，即Ｘ＝Ａ?Ｓ。其中，Ｘ＝收稿日期：２００８一１２—２２修改稿收到日期：２００９—０５—１９第一作者静行男，博士生．１９８２年生［茗ｌ，戈２，…，戈＿ｌｖ］７和Ｓ＝［ｓｌ，ｓ２，…，５＾，］１是混合信号矢量和源信号矢量，Ａ是Ｎ×Ｍ的未知混合矩阵。ＩＣＡ就是要在仅能观测到ｚ；的情况下，同时估计出矩阵Ａ和ｓ，。因此，ＩＣＡ可以定义为寻找一个分离矩阵Ｗ，从混合信号中分离出相互独立的源信号，即Ｓ＝ｗ?Ｘ，并希望．ｓ能较好地逼近真实源信号．ｓ，如果矩阵Ｗ能够估计出，对其求逆就能得到矩阵Ａ。ＩＣＡ方法的关键问题是建立一个能够度量分离结果独立性的判决准则和相应的分离算法。１．２判决准则ＩＣＡ分解的基本原则可以粗略的概括为两条【６］：一是非线性去相关；二是使输出尽可能非高斯化。在众多的ＩＣＡ算法中，科研工作者从不同的角度提出了多种度量各分量之间独立性的判决准则，如信息极大化（ｉｎｆｏｍａｘ）判决准则、互信息极小化（ｍｉｎｉｍｉｚａｔｉｏｎｏｆｍｕｔｕａｌｉｎｆｏｒｍａｔｉｏｎ，ＭＭＩ）判决准则等。而本文采用的判决准则是建立在中心极值定理和信息熵基础上的。根据中心极值定理，非高斯随机变量之和比原变量更接近高斯变量。对ＩＣＡ过程来说，混合信号是多个独立源信号的线性混合，故混合信号较各独立源信号更接近高斯分布，或者说前者较后者的高斯性强（或非高斯性弱）。因此可以通过对分离结果的非高斯性的度量来监测分离结果之间的相互独立性，当各分离结果的非高斯性达到最强时，表明已完成对各独立分量的分离。一个非常重要的非高斯判据就是负熵判据。对于一概率密度函数为Ｐ（Ｙ）的随机量Ｙ，其负熵的定义如下：Ｊ（Ｙ）＝日（％。）一Ｈ（Ｙ）（１）其中Ｙｓａ。是与Ｙ具有相同相关（和协方差）矩阵的高斯随机变量，日（?）为随机变量的信息熵：ｎ（ｙ）＝一Ｉｐ（），）ｌｏｇｐ（ｙ）ｄｙ（２）信息论中的一个基本结果指出：在具有相同方差的所万方数据

改进的复值快速独立分量分析算法

第37卷第5期 2015年10月探测与控制学报Journal of Detection &Control Vol .37No .5Oct .2015 一?收稿日期:2015-02-11作者简介:尹洪伟(1987 ),男,江苏徐州人,博士研究生,研究方向:目标中近程探测二识别与信息对抗技术三E -mail :y inhon g wei168@https://www.doczj.com/doc/c213883630.html, 三改进的复值快速独立分量分析算法尹洪伟,李国林,路翠华 (海军航空工程学院,山东烟台264001) 摘一要:针对复值快速独立分量分析算法(CFastICA ) 对初始权值敏感且收敛速度较慢的问题,提出了改进的CFastICA 算法三该算法首先利用牛顿下降因子优化牛顿迭代的收敛方向, 使分离矩阵在一定程度上接近最优值,然后去除牛顿收敛因子,利用普通牛顿迭代实现分离矩阵快速收敛三仿真实验表明:提出的算法拥有和牛顿下降CFastICA 同样的收敛精度,收敛时间比牛顿下降CFastICA 减少了近53%,且在低SNR 下,提出算法的综合收敛性能明显优于CFastICA 和牛顿下降CFastICA 算法三关键词:盲源分离;复值快速独立分量分析算法;牛顿迭代中图分类号:TN974一一一一文献标志码:A 一一一一文章编号:1008-1194(2015)05-0022-04 An Im p roved Com p lex Value Fast ICA Al g orithm YIN Hon g wei ,LI Guolin ,LU Cuihua (Naval Aeronautical and Astronautical Universit y ,Yantai 264001,China )Abstract :An im p roved CFastICA al g orithm was p ro p osed to solve the p roblem of initial value sensibilit y and to im p rove conver g ence s p eed .First ,Newton decline factor was used to o p timize Newton iteration conver g ence direction to make the se p arated matrix be close to the o p timal value to a certain extent ,then remove the conver -g ence factor and use the ori g inal Newton iteration realize fast conver g ence .Simulation results showed that the p ro p osed al g orithm had the same conver g ence p recision with Newton decline CFastICA ,and its conver g ence time was 52.85%less than Newton decline CFastICA .The combination p ro p ert y of p ro p osed al g orithm was si g -nificantl y better than both of CFastICA and Newton decline CFastICA under the low SNR . Ke y words :blind source se p aration ;com p lex value FastICA ;Newton iteration 0一引言由于盲分离算法对信号先验知识无依赖性, 近年来其在雷达二声呐二语音二通信二图像和医学等领域都得到了快速发展[12]三而一些领域,如阵列信号处理,其信号往往是复数形式,针对该特点,实数盲分离算法被扩展到了复数领域[3]三其中最典型的算法为复值快速独立分量分析(FastICA )算法,该算法因采用牛顿迭代而具有较快的收敛速度三但该算法存在一个大的缺陷,即当初始分离矩阵偏离最优值较远时,特别是含噪声条件下,不容易收敛到到最优点,甚至无法收敛[45]三为解决这个问题,国内外不少学者进行了研究三但总体来看,对该问题的解决方法主要有三种:一是对算法中非线性函数的优化,如文献[6-8],该方法虽可以在一定程度上缓解上述问题,但是也只是起到改善的效果,并不能从根源上解决;二是引入牛顿下降因子以保证牛顿迭代朝着最优值方向,如文献[9-11],虽然效果很好,但这使得本来具有快速收敛优势的牛顿算法速度被削减;三是先利用最速梯度法改善初始分离矩阵,然后再利用牛顿迭代获取最优分离矩阵,如文献[5,12],但是该算法中的所谓最速梯度,实际上就是牛顿算法[12],并不能起到良好的稳定效果三本文针对此问题,提出了改进的 CFastICA 算法三

独立成分分析技术研究

(本科毕业设计论文) 本科毕业设计论文题目独立成分分析技术研究系别专业班级学生姓名学号指导教师报告日期

毕业设计任务书一、题目独立成分分析技术研究二、指导思想和目的要求 1、利用已有的专业知识，培养学生解决实际工程问题的能力； 2、锻炼学生的科研工作能力和培养学生的团结合作攻关能力；三、主要技术指标 1. 研究独立成分分析算法； 2. 完成演示程序四、进度和要求第01周----第02周：英文翻译；第03周----第04周：学习主成分分析与独立成分分析技术；第05周----第10周：研究独立成分分析算法；第11周----第16周：设计演示程序；第17周----第18周：撰写毕业设计论文，论文答辩；五、主要参考书及参考资料 [1]《Independent Component Analysis》 Aapo Hyvarinen, Juha Karhunen, Erkki Oja , Wiley-Interscience; 1 edition, 2001 [2]《Independent Component Analysis: A Tutorial Introduction 》 James V. Stone, A Bradford Book , 2004 [3]《Bayesian Reasoning and Machine Learning Hardcover》 David Barber Cambridge University Press 2012 学生指导教师系主任 ___________

摘要主成分分析（Principal Components Analysis，PCA）是一种分析、简化数据集的技术。主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量，同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析，也是数学上处理降维的一种方法。独立成分分析(I ndependent Component Analysis ,简称ICA)或独立分量分析是一种利用统计原理进行计算的方法。它是一个线性变换,这个变换把数据或信号分离成统计独立的非高斯的信号源的线性组合。目前比较流行的ICA算法又Infomax算法（信息最大化）、FastICA算法（定点算法，Fixed-point、快速ICA算法），方法分类的依据主要是求取分离矩阵W的方法不同。计算最大似然估计时，假设了与之间是独立的，然而对于语音信号或者其他具有时间连续依赖特性（比如温度）上，这个假设不能成立。但是在数据足够多时，假设独立对效果影响不大，同时如果事先打乱样例，并运行随机梯度上升算法，那么能够加快收敛速度。在诸多ICA算法中，固定点算法(也称FastlCA)以其收敛速度快、分离效果好被广泛应用于信号处理领域。该算法能很好地从观测信号中估计出相互统计独立的、被未知因素混合的原始信号。本论文对，独立成分分析的一个改进的梯度学习算法进行了分析，简称正交信息极大化算法(OrthogonalIn fomax,O rth-Infomax)这个算法综合了Infomax算法和Fixed-Point（不定点）算法的优点。从语音信号和fMRI信号两方面来比较这三个算法。就语音信号的分离准确度来说，Orth-Infomax算法具有最好的分离精度。对于真实的fMRI数据来说，Orth-Infomax算法具有最佳的估计脑内激活的时间动力学准确性。相应的做出了语音数据的实验结果和fMRI数据的实验结果。

(完整word版)独立成分分析ICA

独立成分分析ICA 1. PCA用于数据降维，而且只对高斯分布的数据有效。对于非高斯分布的数据，需要采用ICA进行BSS。 2.经典的鸡尾酒会问题：假设在party中有n个人，他们可以同时说话，我们也在房间中一些角落里共放置n麦克风用来记录声音。宴会过后，我们从n麦克风中得到了一组数据，i表示采样的时间顺序，也就是说共得到了m组采样，每一组采样都是n维的。我们的目标是单单从这m组采样数据中分辨出每个人说话的信号。也就是说：有n个信号源，，每一维都是一个人的声音信号，每个人发出的声音信号独立。A是一个未知的混合矩阵（mixing matrix），用来组合叠加信号s，那么这里的X是一个矩阵，其由采样数据构成。其中每个列向量是， A和s都是未知的，x是已知的，我们要想办法根据x来推出s。这个过程也称作为盲信号分离。令，那么将W表示成其中，其实就是将写成行向量形式。那么得到： 3.不确定性：由于w和s都不确定，那么在没有先验知识的情况下，无法同时确定这两个相关参数。比如上面的公式s=wx。当w扩大两倍时，s只需要同时扩大两倍即可，等式仍然满足，因此无法得到唯一的s。同时如果将人的编号打乱，变成另外一个顺序，如上图的蓝色节点的编号变为3,2,1，那么只需要调换A的列向量顺序即可，因此也无法单独确定s。这两种情况称为原信号不确定。还有一种ICA不适用的情况，那就是信号不能是高斯分布的，或者至多只能有一个信号服从高斯分布。 4.密度概率及线性变换假设我们的随机变量s有概率密度函数（连续值是概率密度函数，离散值是概率）。为了简单，我们再假设s是实数，还有一个随机变量x=As，A和x都是实数。令是x的概率密度，那么怎么求？