澎思在行人重识别技术取得突破,解决行人识别干扰问题

文章正文
发布时间:2024-09-12 09:11

近日,澎思科技(Pensees)在基于视频的行人再识别数据集(PRID-2011,iLIDS-VID,MARS)中取得突破。

据了解,澎思科技算法在最大的视频数据集MARS上的首位命中率指标88.8%,在iLIDS-VID和PRID-2011等数据集上首位命中率分别为88.0%和95.5%。

具体来说,主要包括三个方面:

1、受遮挡、姿态变化、视角变化等因素的影响,视频序列中行人的特征是不连续的。用全局特征来度量每一帧图片的权重往往会损失掉许多重要的信息。采用分割重组策略将特定局部特征重组成多个视频序列进行学习,进而极大减少局部特征损失对最终特征的影响。

2、提出双向图注意力机制模块。将图卷积神经网络和SENet结合,在整个序列上进行通道域的模式选择学习。同时通过双向网络进行空间域的注意力区域学习。由于图卷积网络的特性,每一帧图片的注意力特征都是与其他帧相互学习结合的结果,从而提高特征的代表性。

3、利用帧间相似度进行序列融合。通过数学计算的方式就可以达到融合的目的。这样,数据的类内相似度得到了提高。在结合三元损失函数进行训练后,类间相似度得到了降低,进而提高重识别效果。

澎思科技角介绍,基于视频的行人再识别(ReID)技术更贴近智慧城市建设的诸多应用场景,能有效解决行人信息有限、特征不足及其他干扰因素等问题,相比单帧图片的行人再识别具备更长远的落地应用空间。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。