第二章 损失分布
- 格式:ppt
- 大小:1.14 MB
- 文档页数:47
三元组损失函数特征分布三元组损失函数是一种常用于人脸识别、图像检索等领域的损失函数。
在使用三元组损失函数时,我们需要将数据集中的样本按照某种分类方式进行分组,然后针对每一组内部的数据对进行训练。
在三元组损失函数的训练过程中,我们会对同一组数据中的正样本对和负样本对进行对比,从而获取更好的模型效果。
但是,这种损失函数具有一定的特征分布问题,下面我们就来详细讲解。
一、三元组损失函数的基本原理三元组损失函数的基本原理是使用距离来衡量正样本对和负样本对之间的相似度。
我们通常将数据集中的样本按照分类方式进行分组,然后针对每一组内部的样本对进行比较。
在比较时,我们会选出一个锚定样本,并选择一组正样本和一组负样本,然后计算锚定样本和正样本之间的距离,同时计算锚定样本和负样本之间的距离。
我们希望正样本对的距离更小,负样本对的距离更大,因此会将二者的距离分别进行对比,从而获取更好的模型效果。
二、三元组损失函数的特征分布问题三元组损失函数存在特征分布问题,即在样本数量很大的情况下,由于负样本对的数量远远大于正样本对的数量,因此可能会导致正样本对和负样本对之间的距离无法很好地区分,导致模型效果不好。
三、解决三元组损失函数的特征分布问题的方法为了解决三元组损失函数的特征分布问题,我们可以采取以下措施:1. 排序选择我们可以通过对负样本对进行排序,从而选择一组最为接近的负样本对。
这种方法能够有效地解决负样本数量过多而导致的特征分布问题。
2. 动态筛选我们可以根据训练不同阶段的需要,动态筛选正样本对和负样本对,从而获取更好的模型效果。
3. 数据增强我们可以通过各种数据增强的方式,使得数据具有更加丰富的特征分布,从而有效地解决特征分布问题。
四、总结三元组损失函数具有特征分布问题,会导致模型训练效果不佳。
要解决这个问题,我们可以采取排序选择、动态筛选、或者数据增强等方法,从而获取更好的模型效果。
2-1 分析为什么平方损失函数不适用于分类问题?损失函数是一个非负实数,用来量化模型预测和真实标签之间的差异。
我们一般会用损失函数来进行参数的优化,当构建了不连续离散导数为0的函数时,这对模型不能很好地评估。
直观上,对特定的分类问题,平方差的损失有上限(所有标签都错,损失值是一个有效值),但交叉熵则可以用整个非负域来反映优化程度的程度。
从本质上看,平方差的意义和交叉熵的意义不一样。
概率理解上,平方损失函数意味着模型的输出是以预测值为均值的高斯分布,损失函数是在这个预测分布下真实值的似然度,softmax 损失意味着真实标签的似然度。
在二分类问题中y = { + 1 , − 1 }在C 分类问题中y = { 1 , 2 , 3 , ⋅ ⋅ ⋅ , C }。
可以看出分类问题输出的结果为离散的值。
分类问题中的标签,是没有连续的概念的。
每个标签之间的距离也是没有实际意义的,所以预测值和标签两个向量之间的平方差这个值不能反应分类这个问题的优化程度。
比如分类 1,2,3, 真实分类是1, 而被分类到2和3错误程度应该是一样的,但是明显当我们预测到2的时候是损失函数的值为1/2而预测到3的时候损失函数为2,这里再相同的结果下却给出了不同的值,这对我们优化参数产生了误导。
至于分类问题我们一般采取交叉熵损失函数(Cross-Entropy Loss Function )来进行评估。
2-2 在线性回归中,如果我们给每个样本()()(,)n n x y 赋予一个权重()n r ,经验风险函数为()()()211()()2N n n T n n R w r y w x ==−∑,计算其最优参数*w ,并分析权重()n r 的作用.答:其实就是求一下最优参数*w ,即导数为0,具体如下:首先,取权重的对角矩阵:()(),,,n P diag r x y w =均以向量(矩阵)表示,则原式为:21()||||2T R P Y X Ω=−Ω ,进行求导:()0T R XP Y X ∂=−−Ω=∂Ω,解得:*1()T XPX XPY −Ω=,相比于没有P 时的Ω:1()T withoutP XX XY −Ω=,可以简单理解为()n r 的存在为每个样本增加了权重,权重大的对最优值ω的影响也更大。