近日,东北林业大学信息与计算机工程学院郭继峰老师团队在中科院一区Top(升级版)期刊IEEE Transactions on Circuits and Systems for Video Technology(JCR Q1,CCF-B,IF=4.685)上在线发表了题为“Median stable clustering and global distance classification for cross-domain person re-identification”的研究论文。
该研究提出的优化方法与经典基于triplet loss的跨域行人重识别(ReID)方法存在本质区别,利用距离分类器在全局范围内对正负样本对的距离进行优化,且能够充分利用聚类信息。最终模型性能超越了目前大多数的主流方法。
在聚类过程中,为减小摄像机差异带来的影响,在计算两个样本的特征距离时加入了摄像机惩罚因子;为进一步降低离群点的影响,为每对样本距离赋予不同的权重;为使簇内样本数相对均匀,提出一种基于假设质心的样本数正则项。最终聚类结果中的错误伪标签的数量显著减少。
(a) Clustering results of HCT |
(b) Clustering results of MSC |
图 1:对Market-1501中的部分聚类结果进行T-SNE可视化
此外,为弥补triplet loss的不足,该研究提出一种基于距离分类器的全局距离分类方法。不同于以往为任务设计特定优化函数的思想,该研究使用可训练的神经网络作为优化目标,即将特征提取器将距离分类器的准确度当作优化目标。该方法能够有效减少正负样本对的距离分布之间的重合。为ReID的技术发展与理论探索提供新的思路。
(a) HCT on Market-1501 |
(b) GDC on Market-1501 |
(c) HCT on DukeMTMC-reID |
(d) GDC on DukeMTMC-reID |
图2: 在两个目标数据集的测试集上的正样本对(蓝色)和负样本对(红色)的距离直方图
信息与计算机工程学院19级计算机科学与技术硕士研究生庞志奇为论文第一作者,导师郭继峰高级实验师为论文通讯作者。该研究得到黑龙江省自然科学基金和中央高校基础科研项目的资助。
论文下载网址:https://ieeexplore.ieee.org/document/9509511