投影寻踪方法及应用
- 格式:doc
- 大小:366.00 KB
- 文档页数:10
投影寻踪方法及应用
投影寻踪方法是一种图像处理技术,主要用于跟踪或寻找图像中的某个目标或区域。
它通过对目标的投影进行分析和处理,从而实现目标的寻找和跟踪。
常见的投影寻踪方法包括:
1. 基于阈值的方法:将图像转换为二值图像,然后使用阈值来提取目标的投影,通过对投影进行分析和处理来实现目标的寻踪。
2. 基于模板匹配的方法:使用预先定义的模板与图像进行比较,通过对比图像中的局部区域与模板的相似度来实现目标的寻踪。
3. 基于特征点的方法:通过检测图像中的特征点,并使用特征点间的相对位置和运动信息来实现目标的寻踪。
4. 基于边缘检测的方法:通过检测图像中的边缘,并利用边缘的形状和分布信息来实现目标的寻踪。
投影寻踪方法在许多领域都有应用,例如:
1. 视频监控:用于实时跟踪目标物体,如行人、车辆等。
2. 机器人导航:用于机器人的自主导航和避障。
3. 动作识别:用于分析和识别人体动作,如姿态跟踪、手势识别等。
4. 医学图像处理:用于跟踪和分析医学图像中的病变和器官。
5. 航空航天:用于航空器或卫星的轨迹预测和跟踪。
总的来说,投影寻踪方法是一种重要的图像处理技术,可以在许多领域中应用,实现目标的寻找和跟踪。
投影寻踪方法及应用内容摘要:本文从投影寻踪的研究背景出发,给出了投影寻踪的定义和投影指标,在此基础上得出了投影寻踪聚类模型,随后简单介绍了遗传算法。
最后结合上市公司的股价进行实证分析,并给出结论和建议。
关键词:投影寻踪投影寻踪聚类模型遗传算法一、简介(一)产生背景随着科技的发展,高维数据的统计分析越来越普遍,也越来越重要。
多元分析方法是解决高维数据这类问题的有力工具。
但传统的多元分析方法是建立在总体服从正态分布这个假定基础之上的。
不过实际问题中有许多数据不满足正态假定,需要用稳健的或非参数的方法来解决。
但是,当数据的维数很高时,即使用后两种方法也面临以下困难:第一个困难是随着维数增加,计算量迅速增大。
第二个困难是对于高维数据,即使样本量很大,仍会存在高维空间中分布稀疏的“维数祸根”。
对于核估计,近邻估计之类的非参数法很难使用。
第三个困难是对低维稳健性好的统计方法,用到高维时则稳健性变差。
另一方面,传统的数据分析方法的一个共同点是采用“对数据结构或分布特征作某种假定——按照一定准则寻找最优模拟——对建立的模型进行证实”这样一条证实性数据分析思维方法〔简称CDA法)。
这种方法的一个弱点是当数据的结构或特征与假定不相符时,模型的拟合和预报的精度均差,尤其对高维非正态、非线性数据分析,很难收到好的效果。
其原因是证实性数据分析思维方法过于形式化、数学化,受束缚大。
它难以适应千变万化的客观世界,无法真正找到数据的内在规律,远不能满足高维非正态数据分析的需要。
针对上述困难,近20年来,国际统计界提出采用“直接从审视数据出发—通过计算机分析模拟数据—设计软件程序检验”这样一条探索性数据分析新方法,而PP就是实现这种新思维的一种行之有效的方法。
因此,高维数据尤其是非正态高维数据分析的需要,加上80年代计算机技术的高度发展是PP产生的主要背景。
(二)发展简史PP最早由Kruskal于70年初建议和试验。
他把高维数据投影到低维空间,通过数值计算得到最优投影,发现数据的聚类结构和解决化石分类问题。
【R】R语⾔常⽤包汇总⼀、⼀些函数包⼤汇总时间上有点过期,下⾯的资料供⼤家参考基本的R包已经实现了传统多元统计的很多功能,然⽽CRNA的许多其它包提供了更深⼊的多元统计⽅法,下⾯要综述的包主要分为以下⼏个部分:1)多元数据可视化(Visualising multivariate data)绘图⽅法 基本画图函数(如:pairs()、coplot())和 lattice包⾥的画图函数(xyplot()、splom())可以画成对列表的⼆维散点图,3维密度图。
car 包⾥的scatterplot.matrix()函数提供更强⼤的⼆维散点图的画法。
cwhmisc包集合⾥的cwhplot包的pltSplomT()函数类似pair()画散点图矩阵,⽽且可以在对⾓位置画柱状图或密度估计图。
除此之外,scatterplot3d包可画3维的散点图,aplpack包⾥bagplot()可画⼆变量的boxplot,spin3R()可画可旋转的三维点图。
misc3d包有可视化密度的函数。
YaleToolkit包提供许多多元数据可视化技术,agsemisc也是这样。
更特殊的多元图包括:aplpack包⾥的faces()可画Chernoff’s face;MASS包⾥的parcoord()可画平⾏坐标图(矩阵的每⼀⾏画⼀条线,横轴表⽰矩阵的每列); graphics包⾥的stars()可画多元数据的星状图(矩阵的每⼀⾏⽤⼀个星状图表⽰)。
ade4包⾥的mstree()和vegan包⾥的spantree()可画最⼩⽣成树。
calibrate包⽀持双变量图和散点图,chplot包可画convex hull图。
geometry包提供了和qhull库的接⼝,由convexhulln()可给出相应点的索引。
ellipse包可画椭圆,也可以⽤plotcorr()可视化相关矩阵。
denpro包为多元可视化提供⽔平集树形结构(level set trees)。
地图投影的应用和变换1. 引言地图投影是将地球的三维表面展示在平面上的一种转换方法。
由于地球是一个球体,而大部分的地图都是平面图,为了准确地表示地球表面上的地理信息,地图投影成为了不可或缺的工具。
本文将介绍地图投影的应用和变换。
2. 地图投影的意义和应用地图投影对于地理信息的准确传达非常重要,它可以帮助我们更好地理解和解读地球上的各种地理现象和空间关系。
以下是地图投影的主要应用领域:2.1 地理信息系统(GIS)地理信息系统(GIS)是一种用于收集、存储、分析、管理和展示地理信息的系统。
地图投影在GIS中广泛应用,用于将地球表面的地理信息转换为平面图,并进行空间分析和数据处理。
2.2 地图制作和导航地图投影在地图制作和导航中起着至关重要的作用。
通过地图投影,我们可以将地球上的各种地理特征准确地展示在地图上,使人们能够更好地理解和识别地理位置,并利用地图进行导航。
2.3 气象预报地图投影在气象预报中也扮演了重要角色。
通过将地球表面的气象数据投影到平面图上,气象学家们可以更好地分析和预测天气现象,为人们提供准确的天气预报。
2.4 城市规划和地理分析地图投影在城市规划和地理分析中也得到了广泛的应用。
通过将地球表面的地理数据转换为平面图,城市规划师和地理分析师可以更好地分析城市的发展趋势、交通规划等,并为城市规划和发展提供决策支持。
3. 常见的地图投影方法地图投影有多种方法,每种方法都有其特点和适用范围。
下面介绍几种常见的地图投影方法:3.1 圆柱投影圆柱投影是最常见的地图投影方法之一。
它将地球表面的经纬线投影到一个圆柱体上,然后再将圆柱体展开成平面图。
该投影方法在赤道周围的地区表现较好,但在离赤道较远的地区会出现形变。
3.2 锥形投影锥形投影是将地球表面的经纬线投影到一个圆锥体上,然后再将圆锥体展开成平面图。
该投影方法在中纬度地区表现较好,但在靠近两极地区会出现形变。
3.3 圆锥柱面投影圆锥柱面投影是将地球表面的经纬线投影到一个圆锥体和一个圆柱体上,然后将两个表面展开成平面图。
比较分析四种投影调查技法什么是投影技法投影技法是一种无结构的非直接的询问形式,可以鼓励被调查者将他们对所关心问题的潜在动机、信仰、态度或感情投射出来。
在投影技法中,并不要求被调查者描述自己的行为,而是要他们解释其他人的行为。
在解释他人的行为时,被调查者就间接地将他们自己的动机、信仰、态度或感情投影到了有关的情景之中。
因此,通过分析被调查者对那些没有结构的、不明确而且模棱两可的“剧本”的反应,他们的态度也就被揭示出来了。
投影技法的应用和心理学中的分类一样,投影技法可分成联想技法、完成技法、结构技法和表现技法。
1)联想技法:在投影技法中,将一种刺激物呈放在被调查者面前,然后询问被调查者最初联想到的事。
在这类技法中最常用的叫词语联想法。
在词语联想中,给出一连串的词语,每给一个词语,都让被调查者回答其最初联想到的词语(叫反应语)。
调研者感爱好的那些词语(叫试验词语或刺激词语)是散布在那一串展示的词语中的,在给出的一连串词语中,也有一些中性的或充数的词语,用于掩盖研究的目的。
例如在对百货商店顾客光顾情况的调研中,试验词语可以选择“位置”、“购物”、“停车场”、“质量”、“价格”之类的词语。
被调查者对每一个词的反应是逐字记录并且计时的,这样反应犹豫者(要花三秒钟以上往返答)也可以识别出来。
调查员记录反应的情况,这样被调查者书写反应语所要求的时间也就得到了控制。
这种技法的潜在假定是,联想可让反应者或被调查者暴露出他们对有关问题的内在感情。
对回答或反应的分析可计算如下几个量:每个反应词语出现的频数;在给出反应词语之前耽搁的时间长度;在合理的时间段内,对某一试验词语,完全无反应的被调查者的数目;根本无反应的被调查者就被判定为是情感卷入造成的反应阻塞。
研究者经常将这些联想分为赞成的、不赞成的和中性的三类。
一个被调查者的反应模式以及反应的细节,可用来决定其对所研究问题的潜在态度或情感。
2)完成技法:在完成技法中,给出不完全的一种刺激情景,要求被调查者来完成。
地图投影的原理及应用实例1. 地图投影的基本概念地图投影是指将三维的地球表面投影到一个平面上,以便于进行测量、绘制和分析地理信息。
地图投影的过程中,由于地球是一个球体,不可避免地会出现一定的形变。
不同的地图投影方法会选择不同的投影面,以及不同的数学模型和变形形式,以最大程度地减小形变。
2. 常见的地图投影方法2.1 圆柱投影法•圆柱投影法是将地球投影到一个圆柱体上,再将圆柱体展开为平面的投影方法。
•常见的圆柱投影方法有墨卡托投影、等面积圆柱投影、等距圆柱投影等。
2.2 锥形投影法•锥形投影法是将地球投影到一个圆锥体上,再将圆锥体展开为平面的投影方法。
•常见的锥形投影方法有兰勃特圆锥投影、兰勃托等角圆锥投影等。
2.3 平面投影法•平面投影法是将地球投影到一个平面上的投影方法。
•常见的平面投影方法有斯体列克平面投影、等角正矩形平面投影等。
3. 地图投影的原理地图投影的原理是将地球上的地理坐标转换为平面上的坐标。
具体的计算方法有很多种,但基本思想是利用数学模型将球面的点映射到平面上的相应点,从而实现地球表面到地图平面的映射。
地球经纬度坐标转换为平面坐标的公式如下:X = R * cos(φ) * cos(λ0 - λ)Y = R * cos(φ) * sin(λ0 - λ)其中,X和Y表示地球上的点在平面上的投影坐标,R表示地球的半径,φ和λ表示地球上的点的纬度和经度,λ0表示中央子午线的经度。
4. 地图投影的应用实例4.1 航空航天地图投影在航空航天领域中起着重要的作用。
航空航天中常用的地图投影方法是墨卡托投影。
墨卡托投影能将地球表面的航线直观地展示出来,便于飞行员进行导航和飞行计划。
4.2 地理信息系统地图投影在地理信息系统(GIS)中的应用非常广泛。
GIS系统中的地图投影方法需要考虑到形变问题,并且需要选择适合不同应用场景的投影方法。
例如,在城市规划中,会使用等面积圆柱投影;在区域分析中,会使用兰勃特圆锥投影等。
投影寻踪方法及应用内容摘要:本文从投影寻踪的研究背景出发,给出了投影寻踪的定义和投影指标,在此基础上得出了投影寻踪聚类模型,随后简单介绍了遗传算法。
最后结合上市公司的股价进行实证分析,并给出结论和建议。
关键词:投影寻踪投影寻踪聚类模型遗传算法一、简介(一)产生背景随着科技的发展,高维数据的统计分析越来越普遍,也越来越重要。
多元分析方法是解决高维数据这类问题的有力工具。
但传统的多元分析方法是建立在总体服从正态分布这个假定基础之上的。
不过实际问题中有许多数据不满足正态假定,需要用稳健的或非参数的方法来解决。
但是,当数据的维数很高时,即使用后两种方法也面临以下困难:第一个困难是随着维数增加,计算量迅速增大。
第二个困难是对于高维数据,即使样本量很大,仍会存在高维空间中分布稀疏的“维数祸根”。
对于核估计,近邻估计之类的非参数法很难使用。
第三个困难是对低维稳健性好的统计方法,用到高维时则稳健性变差。
另一方面,传统的数据分析方法的一个共同点是采用“对数据结构或分布特征作某种假定——按照一定准则寻找最优模拟——对建立的模型进行证实”这样一条证实性数据分析思维方法〔简称CDA法)。
这种方法的一个弱点是当数据的结构或特征与假定不相符时,模型的拟合和预报的精度均差,尤其对高维非正态、非线性数据分析,很难收到好的效果。
其原因是证实性数据分析思维方法过于形式化、数学化,受束缚大。
它难以适应千变万化的客观世界,无法真正找到数据的内在规律,远不能满足高维非正态数据分析的需要。
针对上述困难,近20年来,国际统计界提出采用“直接从审视数据出发—通过计算机分析模拟数据—设计软件程序检验”这样一条探索性数据分析新方法,而PP就是实现这种新思维的一种行之有效的方法。
因此,高维数据尤其是非正态高维数据分析的需要,加上80年代计算机技术的高度发展是PP产生的主要背景。
(二)发展简史PP最早由Kruskal于70年初建议和试验。
他把高维数据投影到低维空间,通过数值计算得到最优投影,发现数据的聚类结构和解决化石分类问题。
1974年Frledman和Tukey加以改正,提出了一种把整体上的散布程度和局部凝聚程度结合起来的新指标进行聚类分析,正式提出了PP概念,并于1976年编制了计算机图像系统PRIM——9。
1979年后,Friedman 等人相继提出了PP回归、PP分类和PP密度估计。
在这以后Huber等人积极探索了PP的理论。
1981年Donoho提出了用Shannan嫡作投影指标比wiggins用标准化峰度更好的方法,接着他又利用PP的基本思想给出了多元位置和散布的一类仿射同变估计。
Diaeonis、Friedman和Jones等还讨论了与PP有关的其他理论问题。
上述工作和结果在1985年Huber的综述论文中作了概括和总结。
我国学者成平和吴健福于1985年证明了PP密度估计的一个收敛性问题,并于1987年给出PP经验分布的极限分布。
陈忠琏和李国英等于1986年用PP方法给出了散布阵和主成分的一类稳健估计。
成平和李国英于1986年还对多元位置和散布的PP型估计性质进行了讨论叫。
陈家弊于1986年证明了密度PP估计的一个极限定理。
宋立新和成平于1996年就PP回归逼近的均方收敛性,回答了Huber1985年的猜想。
这些都是很好的工作。
在PP的应用研究方面,从1985年起,郑祖国、杨力行等人通过几年的潜心研究和探索,成功地完成了投影寻踪回归(PPR)和投影寻踪时序(PPTS)软件包的程序设计,并对大量实例进行了验算。
二、PP及其分类投影寻踪是用来分析和处理高维数据,尤其是来自非正态总体的高维数据的一类统计方法。
其基本思想是:利用计算机技术,把高维数据通过某种组合,投影到低维(1~3维)子空间上,并通过极小化某个投影指标,寻找出能反映原高维数据结构或特征的投影,在低维空间上对数据结构进行分析,以达到研究和分析高维数据的目的。
它的一般方案是:(l)选定一个分布模型作为标准(一般是正态分布),认为它是最不感兴趣的结构;(2)将数据投影到低维空间上,找出数据与标准模型相差最大的投影,这表明在投影中含有标准模型没能反映出来的结构;(3)将上述投影中包含的结构从原数据中剔除,得到改进了的新数据;(4)对新数据重复步骤(2)(3),直到数据与标准模型在任何投影空间都没有明显差别为止。
PP方法的主要特点是:(l)PP方法能够在很大程度上减少维数祸根的影响,这是因为它对数据的分析是在低维子空间上进行的,对1-3维的投影空间来说,高维空间中稀疏的数据点就足够密了,足以发现数据在投影空间中结构特征;(2)PP方法可以排除与数据结构和特征无关,或关系很小的变量的干扰;(3)PP方法为使用一维统计方法解决高维问题开辟了途径,因为PP方法可以将高维数据投影到一维子空间,再对投影后的一维数据进行分析,比较不同一维投影的分析结果,找出好的投影;(4)与其他非参数方法一样,PP方法可以用来解决某些非线性问题。
PP虽然是以数据的线性投影为基础,但它找的是线性投影中的非线性结构,因此它可以用来解决一定程度的非线性问题,如多元非线性回归;(二)PP的分类PP包括手工PP和机械PP两方面内容。
手工PP主要是利用计算机图像显示系统在终端屏幕上显示出高维数据在二维平面上的投影,并通过调节图像输入装置连续地改变投影平面,使屏幕上的图像也相应地变化,显示出高维数据在不同平面上投影的散点图像。
使用者通过观察图像来判断投影是否能反映原数据的某种结构或特征,并通过不断地调整投影平面来寻找这种有意义的投影平面。
最早的图象显示系统是斯坦福大学教授J.H.Friedman 等人1974年编制的,PRIM 一9。
利用这个系统可以看到不超过九维的数据在任何二维平面上的投影图象,以发现数据的聚类和超曲面结构。
这个系统还可以只显示指定的区域内的高维点,把其他点移出屏幕不显示出来。
因此当人们在投影平面上发现了某种聚类结构时,可以把不同类的数据分开,再分别考察每个类中的数据的结构和特征。
使用手工PP 成功的例子是美国的Reaven 和Miller 于1979年关于多尿病病理的研究。
他们将145人的5项指标观察值输入PRIM 一9图像显示系统,对5项指标中的每3项指标,观察145个3维点构成的点云在任何2维平面上的投影图像,最后找到了一个在医学上有意义的图像。
从这张图像上可以看到隐性和显性多尿症患者的数据是完全分开的。
不经过中间正常状态,两者是不能相互转换的。
机械PP 是模仿手工PP ,用数值计算方法在计算机上自动找出高维数据的低维投影,即让计算机按数值法求极大解的最优化问题的方法,自动地找出使指标达到最大的投影。
它要求对一个P 维随机向量X ,寻找一个K (K<p )维投影矩阵A ,使定义在某个K 维分布函数集合k F 上的实值函数Q (投影指标),满足Max Ax Q Ax Ax Ax Q k ==)(),,,(21Λ。
如果原数据确有某种结构或特征,指标又选得恰当,那么在所找到的某些方向上,一定含有数据的结构或特征。
有些传统的多元分析方法可以看成是机械投影寻踪的特例。
例如主成份分析,判别分析等,但是主成分分析方法是用主成分来描述或逼近原始数据,所反映的是数据的全局特征或宏观特征,这样显然就有可能会漏掉主要的局部特征或细节特征。
下面以大家熟知的主成份分析为例具体说明机械投影寻踪方法。
主成份分析的目的是要考察P 维数据n x x x ,,,21Λ,是否真正散布在P 维空间上,还是主要只散布在某个维数小于P 的子空间上。
好比一块铁饼,虽然是三维空间中的形体,由于相对地说厚度明显地小,所以它主要是散布在二维平面上的园形东西,在与这个园形垂直的方向上没有多少布散布。
我们取描述一维数据散布程度的标准差作为投影指标。
实数n y y y ,,,21Λ的标准是∑--=ni n n y y y y y 1221)1/()(),,,(Λσ,其中n y y ni /1∑=。
用投影寻踪了解数据n x x x ,,,21Λ的散布情况,就是找出一个方向b ,使得数据在这个方向上的投影的散布达到最大,即),,(m ax ),,('1'1'11'1n a n x a x a x b x b ΛΛσσ==,1b 就是n x x x ,,,21Λ的样本协差阵S 的最大特征根1λ的特征向量。
把S 的特征根从大到小排列,记作p λλλ,,,21Λ,这样投影寻踪就给出了n x x x ,,,21Λ的第一主成份n x b x b x b '12'11'1,,,Λ,它的标准差1'11'1),,(λσ=n x b x b Λ。
继续作投影寻踪,在与1b 垂直的空间里求单位向量2b ,使),,(m ax ),,('1',1'21'21n b a a n x a x a x b x b ΛΛσσ<==。
可以证明2b 就是相应于2λ的特征根,进而得到n x x x ,,,21Λ的第二主成份n x b x b '21'2,,Λ,及其标准差2λ,如此类推,就可以求出第三、第四主成份等等,直到某个主成份的标淮差接近零为止。
当然,主成份分析只是机械投影寻踪的一个特例。
一般的并不要求后面的投影方向与前面找到的投影方向垂直。
而且,对于主成分分析其样本协方差阵及特征根和特征向量对离群点是非常敏感的,正是由于样本协方差阵的不稳定,造成了传统主成分分析的不稳健。
为了得到稳健性,可以采用稳健的散布度量加以改进另外,实际作主成份分析时也不用求极值的投影寻踪法,而是直接求样协差阵S 的特征根和特征向量。
三、投影指标PP 的出发点是度量投影分布所含信息的多少,而我们知道高维数据集合的线性投影是?几乎正态的,并且正态分布通常为无信息分布的代表。
从而寻求与正态分布差异最大的线性投影分布,即含信息最多的投影分布,成为PP 方法的常用方式之一。
既然如此,那么它是如何实现的呢?为了避免繁杂的细节讨论,突出问题的重点,我们选取简单的度量准则,如方差、偏度、峰度,至于更加复杂的度量准则也有完全类似的描述、解释,这里从略。
(1)方差指标)()(X a Var X a Q T T =设),,,(21n x x x Λ是总体X 的独立同分布的样本,方差指标的样本形式为21))((1)(∑=-=n i Ti T TX a E x a n X a Q 。
如果我们求)(max X a Q T ,得到的∧a 就是样本散布最大的方向。
主成分分析就是取样本方差为投影指标的PP 方法。
(2)Friedman 指标 设有Legendre 多项式R R Q R Q ==)(,1)(10, Λ3,2],)1()12[(121=---=--j Q j RQ j jQ j j j设X 为P 维随机向量,协方差阵∑的正交分解T UDU =∑,U 是标准正交阵,D 是对角阵。