基于特征数据的时间序列聚类
• 基于特征的表示方法是把原始时间序列转换到一个 低维的特征空间,然后用传统的聚类方法对特征向 量进行聚类(Yang et al., 2009, Xiaozhe et al., 2007,Keogh et al., 2007, Chen, 2007, Zhang et al., 2006, Wang et al., 2006,Costa Santos et al., 2006,Wang et al., 2005,Bagnall and Janacek, 2005,Domeniconi et al., 2004)。 • 由于基于特征的聚类方法中提取的特征来自序列本 身,且具有特定的含义,所以该聚类方法不仅实现 对序列的降维,又使得聚类结果具有可解释性。这 里,常用的传统的聚类算法有如下几种:划分聚类、 层次聚类和密度聚类等等(Jain, 2010,Chawla and Gionis, 2013, Rodrigues et al., 2008 ,Labini, 2008, Schikuta, 1996, Kriegel et al., 2011) 。
此时, LB_Keogh距离定义为:
• 定理:对于长度为 n 的任何两个时间序列 X 和 Y, 限定弯曲路径窗口为w,即对于 xi和 yj点的比较, 限定为 j-w i j+w,存在如下不等式: LB_Keogh(X,Y) DTW(X,Y)。 • 性质:LB_Keogh 距离不是对称的。即 LB_Keogh(X,Y) LB_Keogh(Y,X)。
• 定理:对于长度为 n 的任何两个时间序列 X 和 Y, 限定弯曲路径窗口为w,即对于 xi和 yj点的比较, 限定为 j-w i j+w,存在如下不等式: LB_ Hust(X,Y) Keogh(X,Y) 。