当前位置:文档之家› 加权欧氏距离及其应用

加权欧氏距离及其应用

加权欧氏距离及其应用
加权欧氏距离及其应用

距离计算方法

1.欧氏距离(Euclidean Distance) 欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。(1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离: (2)三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离: (3)两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的欧氏距离: 也可以用表示成向量运算的形式: 2.曼哈顿距离(Manhattan Distance) 从名字就可以猜出这种距离的计算方法了。想象你在曼哈顿要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?显然不是,除非你能穿越大楼。实际驾驶距离就是这个“曼哈顿距离”。而这也是曼哈顿距离名称的来源,曼哈顿距离也称为城市街区距离(City Block distance)。 (1)二维平面两点a(x1,y1)与b(x2,y2)间的曼哈顿距离 (2)两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的曼哈顿距离 5.标准化欧氏距离(Standardized Euclidean distance ) (1)标准欧氏距离的定义

标准化欧氏距离是针对简单欧氏距离的缺点而作的一种改进方案。标准欧氏距离的思路:既然数据各维分量的分布不一样,好吧!那我先将各个分量都“标准化”到均值、方差相等吧。均值和方差标准化到多少呢?这里先复习点统计学知识吧,假设样本集X的均值(mean)为m,标准差(standard deviation)为s,那么X的“标准化变量”表示为:而且标准化变量的数学期望为0,方差为1。因此样本集的标准化过程(standardization)用公式描述就是: 标准化后的值= (标准化前的值-分量的均值) /分量的标准差 经过简单的推导就可以得到两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的标准化欧氏距离的公式: 如果将方差的倒数看成是一个权重,这个公式可以看成是一种加权欧氏距离(Weighted Euclidean distance)。 7.夹角余弦(Cosine) 有没有搞错,又不是学几何,怎么扯到夹角余弦了?各位看官稍安勿躁。几何中夹角余弦可用来衡量两个向量方向的差异,机器学习中借用这一概念来衡量样本向量之间的差异。 (1)在二维空间中向量A(x1,y1)与向量B(x2,y2)的夹角余弦公式: (2)两个n维样本点a(x11,x12,…,x1n)和b(x21,x22,…,x2n)的夹角余弦 类似的,对于两个n维样本点a(x11,x12,…,x1n)和b(x21,x22,…,x2n),可以使用类似于夹角余弦的概念来衡量它们间的相似程度。 即:

欧几里得度量

欧几里得度量 欧几里得欧几里得度量。欧几里得度量是一个通常采用的距离定义。 指在m 维空间中两个点之间的真实距离。或者向量的自然长度。在二维和三维空间中的欧氏距离就是两点之间的实际距离。中文名,欧几里得度量。 别称,欧氏距离。表达式,|x| =。 提出者,欧几里得。 应用学科,数学。适用领域范围,m 维空间中两个点之间的真实距 离。相关,欧氏距离变换。 计算公式。 O p = sqrt A2+A2 )|x| = V O p = V A2+A2+A2 维欧氏空间是一个 点集,它的每个点X 或向量x 可以表示为。 其中x[i] 是实数。 称为X的第i个坐标。 两个点A =和B =之间的距离p定义为下面的公式:p =V [刀八2向量x =的自然长度|x|定义为下面的公式:|x| = 。 欧氏距离变换

所谓欧氏距离变换。 是指对于一张二值图像。将前景中的像素的值转化为该点到达最近的背景点的距离。欧氏距离变换在数字图像处理中的应用范围很广泛。 尤其对于图像的骨架提取。 是一个很好的参照。 闵氏距离。 又叫做闵可夫斯基距离,是欧氏空间中的一种测度。被看做是欧氏距离的一种推广。 欧氏距离是闵可夫斯基距离的一种特殊情况。 定义式:p =[刀"PE闵可夫斯基距离公式中。 当p=2 时。 即为欧氏距离;当p=1 时。 即为曼哈顿距离;当P T*时。 即为切比雪夫距离。 欧几里得度量(euclidean metric)(也称欧氏距离)是一个通常采 用的距离定义,指在m 维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。 在二维和三维空间中的欧氏距离就是两点之间的实际距离。计算公式二维空间的公式三维空间的公式n 维空间的公式n 维欧氏空间是一个点集,它的每个点X或向量x可以表示为(x[1],x[2],…, x[n]),其中x[i](i = 1, 2,…,n)是实数,称为X的第i个坐标

空间分析-距离分析

空间分析之距离分析 继续总结下距离分析。如下是ArcGIS 10.x中,距离分析相关的工具: ArcGIS中,主要可以通过如下的几种方式进行距离分析: 1)欧氏距离分析 2)成本加权距离分析 3)用于垂直移动限制和水平移动限制的成本加权距离分析 4)获取最短路径 使用ArcGIS空间分析扩展实现距离分析,最主要的是欧氏距离分析和成本加权距离分析两类工具。 一、欧氏距离工具 欧氏距离工具测量每个像元距离最近源的直线距离(像元中心至像元中心的距离)。 欧氏距离(Euclidean Diatance)——求得每个像元至最近源的距离。 欧氏方向(Euclidean Direction)——求得每个像元至最近源的方向。 欧氏分配(Euclidean Allocation)——求得每个像元的最近的源。 TIPS:

1. 源(Source) 可以是感兴趣的地物的位置,数据方面,既可以是栅格数据,也可以是矢量数据。但注意:如果数据选用了栅格数据,数据中必须仅包含表示源的像元,其他像元需要是Nodata。如果选用矢量,在执行工具之时,内部会将其先转成栅格。 2. 欧氏距离的算法 简单理解为:工具会求得每个像元至每个源的距离,然后取得每个像元至每个源的最短距离以输出。其中,欧氏距离是像元中心与源像元的中心的直线距离。 如果像元与两个或更多源之间的距离相等,则计算都基于像元扫描过程中遇到的第一个源。无法控制该扫描过程。 帮助中有这样的描述:工具在实际执行的过程中,进行两次顺序扫描。这样,工具的执行速度与源像元的数目、分布以及最大距离无关。影响工具执行速度的唯一因素是栅格的大小。计算时间与“分析”窗口中的像元数成线性比例。暂且不知道进行了什么样的两次顺序扫描。 3. 欧氏距离输出栅格结果 投影平面上,像元与最近源之间的最短直线距离。如下图: 4. 欧氏方向输出栅格结果 像元与最近源之间的方位角方向(以度为单位)。使用360 度圆,刻度360 指北,90指东,从刻度1 顺时针增加。值0 供源像元使用。如下图: 5. 欧氏分配输出栅格结果

【数据挖掘】利用欧氏(Euclid)距离进行类别数据的分类计算

利用欧氏(Euclid)距离进行类别数据的分类计算 一、欧氏距离(Euclidean Distance) 欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。 (1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离: (2)三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离: (3)两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的欧氏距离: 也可以用表示成向量运算的形式: 欧式距离是高维空间中两点之间的距离,它计算简单、应用广泛,但是没有考虑变量之间的相关性,当体现单一特征的多个变量参与计算时会影响结果的准确性,同时它对向量中得每个分量的误差都同等对待,一定程度上放大了较大变量误差在距离测度中的作用。 1

两个n维向量A(x11,x12,…,x1n)与B(x21,x22,…,x2n)间的欧氏距离定义为:D(A,B)=[(x11-x21)^2+(x12-x22)^2+…+(x1n-x2n)^2]^0.5 欧式距离的公式是 d=sqrt( ∑(x i1-xi2)^ ) 这里i=1,2..n 欧氏距离:(∑(Xi-Yi)2)1/2,即两项间的差是每个变量值差的平方和再平方根,目的是计算其间的整体距离即不相似性。 欧氏距离虽然很有用,但也有明显的缺点。它将样品的不同属性(即各指标或各变量)之间的差别等同看待,这一点有时不能满足实际要求。例如,在教育研究中,经常遇到对人的分析和判别,个体的不同属性对于区分个体有着不同的重要性。因此,有时需要采用不同的距离函数。 欧氏距离看作信号的相似程度。距离越近就越相似,就越容易相互干扰,误码率就越高。 二、案例分析 1、基本数据 欧氏x1 x2 p1 -1.51 0.86 p2 4.54 0.12 p3 4.42 1.27 p4 -2.18 1.41 1

相似度计算方法

基于距离的计算方法 1. 欧氏距离(Euclidean Distance) 欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。 (1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离: (2)三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离: (3)两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的欧氏距离: 也可以用表示成向量运算的形式: (4)Matlab计算欧氏距离 Matlab计算距离主要使用pdist函数。若X是一个M×N的矩阵,则pdist(X)将X矩阵M行的每一行作为一个N维向量,然后计算这M个向量两两间的距离。例子:计算向量(0,0)、(1,0)、(0,2)两两间的欧式距离 X = [0 0 ; 1 0 ; 0 2] D = pdist(X,'euclidean') 结果: D = 1.0000 2.0000 2.2361 2. 曼哈顿距离(Manhattan Distance) 从名字就可以猜出这种距离的计算方法了。想象你在曼哈顿要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?显然不是,除

非你能穿越大楼。实际驾驶距离就是这个“曼哈顿距离”。而这也是曼哈顿距离名称的来源,曼哈顿距离也称为城市街区距离(City Block distance)。 (1)二维平面两点a(x1,y1)与b(x2,y2)间的曼哈顿距离 (2)两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的曼哈顿距离 (3) Matlab计算曼哈顿距离 例子:计算向量(0,0)、(1,0)、(0,2)两两间的曼哈顿距离 X = [0 0 ; 1 0 ; 0 2] D = pdist(X, 'cityblock') 结果: D = 1 2 3 5. 标准化欧氏距离(Standardized Euclidean distance ) (1)标准欧氏距离的定义 标准化欧氏距离是针对简单欧氏距离的缺点而作的一种改进方案。标准欧氏距离的思路:既然数据各维分量的分布不一样,好吧!那我先将各个分量都“标准化”到均值、方差相等吧。均值和方差标准化到多少呢?这里先复习点统计学知识吧,假设样本集X的均值(mean)为m,标准差(standard deviation)为s,那么X的“标准化变量”表示为: 而且标准化变量的数学期望为0,方差为1。因此样本集的标准化过程(standardization)用公式描述就是: 标准化后的值= ( 标准化前的值-分量的均值) /分量的标准差 经过简单的推导就可以得到两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的标准化欧氏距离的公式: 如果将方差的倒数看成是一个权重,这个公式可以看成是一种加权欧氏距离(Weighted Euclidean distance)。

相关主题
文本预览
相关文档 最新文档