center loss

Center Loss

简单的来说，我们在做分类的时候，不光需要学得separable的特征，更想要这些特征是discriminative的，这就意味着我们需要在loss上做更多的约束。

仅仅使用softmax作为监督信号的输出处理就只能做到seperable而不是discriminative，如下图:

融合Softmax Loss与Center loss

Softmax Loss（保证类之间的feature距离最大）与Center Loss（保证类内的feature距离最小，更接近于类中心）

m是mini-batch、n是class。在Lc公式中有一个缺陷，就是 $C_{y_{i}}$ 是i这个样本对应的类别yi所属于的类中心C∈ Rd，d代表d维。

理想情况下，Cyi需要随着学到的feature变化而实时更新，也就是要在每一次迭代中用整个数据集的feature来算每个类的中心。

但这显然不现实，做以下两个修改：

1、由整个训练集更新center改为mini-batch更改center

2、避免错误分类的样本的干扰，使用scalar α 来控制center的学习率

因此求算梯度的公式如下：

即：当yi = j，也就是mini-batch中某一个sample是对应要更新的那一个类的center的时候就累加起来除以某类的个数+1。

最终loss联立起来如上图，λ用于平衡softmax loss与center loss，越大则区分度越大，如下图效果：

即在特征层输出（classification前最后一层）引入center loss：

综上：

fully connected没有weight share
对于neuron的连接（点对点的链接）都是fully connected（MLP——多层感知器）
Convolution中当filter size等于input size时，就是fully connected，此时的output size为1 * 1 * N
当1 *1不等于input size时，1 * 1一样具备weights share的能力。