UNIUBI AI

茫茫人海，你能否一眼看到想找的那个人？

《哈利·波特与阿兹卡班的囚徒》中，捣蛋鬼乔治、弗雷德两人曾将一张神奇的活点地图交给哈利波特使用。透过地图，哈利他可以清楚地看到邓布利多教授正在书房里踱步，费尔奇的猫——洛丽丝夫人正在三楼徘徊，而爱捉弄人的幽灵皮皮鬼正在奖品室里跳来跳去。一图在手，哈利就能够掌握所有人每时每刻的位置和动向，识别到每个人的所在并实时追踪他们的行为轨迹。

（图片源自优酷视频《哈利·波特与阿兹卡班的囚徒》）

倘若我们也能拥有这样一张地图，就能轻而易举地在茫茫人海中找到想找的人。

事实上，在科技飞速发展的今天，已实现摄像头突破视觉局限，追踪某一特定人的行动轨迹。我们将这计算机视觉技术称为行人重识别技术（Person Re-identification），简称ReID。近年来，ReID技术的研究进行得如火如荼，在不断突破发展的同时被作为人像识别技术的重要补充广泛应用于安防领域和各类智慧城市建设中。

那么，ReID技术是如何实现对不同场景下是否是同一个人的判断追踪呢？

电视剧《长安十二时辰》里出现过一种非常重要的建筑——望楼。望楼作为城中的监察通讯系统，遍布在长安城各处，起着维护城中治安的重要作用。望楼之上驻扎着执旗武侯，他们目力精准，时刻关注城中情况，追踪贼人踪迹。他们经过反复的训练，实现用约定暗语配合翻板以及擂鼓传递信息，情报瞬息可传遍整个长安城，可以视作古早版的“城市天眼”。

李必曾对张小敬说：“今日你在长安何处，我随时可知，想逃，是不可能的。”

（图片源自优酷视频《长安十二时辰》）

通过这一画面，我们大胆试想一下，倘若有通缉要犯被盯梢的武侯发现，武侯通过观察此人的姿态、衣着打扮，抓捕的同时，用约定暗语传达贼人的表征信息，三百米以外的各个望楼接收到该信息并展开针对性搜寻比对，以此实时获取贼人的行动轨迹，罪犯自然是插翅难逃。ReID技术也正是通过对比穿着、体态、发型等特征，实现对跨场景行人的再识别与检索，望楼就相当于某一环境下不同场景捕捉信息的摄像头，而行人特征，就是ReID的暗语密码。

当我们想要定位到某一特定人员时，只需输入该人员的照片，通过检索当前区域内不同位置的摄像头下的当前帧，找到该人员出现区域的摄像头，最后确定摄像头位置实现定位。如果我们想知道该人员的行动轨迹，首先需要取一张图片作为查询依据，再通过图片比对实现轨迹搜寻。值得一提的是，这一图片比对并不是将图片直接比较，而是先对每张图片提取特征，通过对应特征，计算图片的相似度。

当我们判断结果是否为本人时，需要先确定一个阈值。假设阈值为0.8，在进行图片与库特征比对后，我们得到了N个相似度。通常来说，数值大于0.8是本人，而反之则不是。但事实上在对比过程中，也会出现相似度大的反而不是本人的误差情况。造成这一误差其中一个最重要的原因就是模型的好坏，我们通常用mAP和Rank-1两个指标来进行衡量。

如何设计出更高明的“暗语密码”，实现在不同角度、不同光线环境下的精确识别检测，是研究ReID技术过程中的重难点。目前在ReID算法中，主要通过表征学习、度量学习方案，以及局部特征学习这三种方法来提升ReID技术Rank-1和mAP的指标。宇泛团队在国家工程实验室的ReID竞赛中，便采用了一种去显著特征数据增强和CircleSoftmax、IBN结构结合的解决方案，增强了模型的表征能力。在数据增强的同时针对体征信息部分遮挡的行人，采用了人体检测+人体固定区域随机裁剪的方法，提高了对这类人群的识别能力，最后以Rank-1：0.80235，mAP：0.69775的成绩摘得竞赛榜首。

ReID技术的发展，得益于数据集的大规模化，它弥补了在人群密集、摄像头分辨率低等情况下所导致的人像识别模糊或无法识别的问题，实现了跨场景追踪目标人物轨迹，并逐渐渗透进智能安防、智能寻人、自动驾驶等智慧应用当中，为社会的发展，生活质量水平的提高作出了重大贡献。

当然，现今的ReID技术在各个方面仍面临着不小的挑战，望楼的武侯面对通缉要犯的乔装变换容易丢失目标，而ReID算法面对行人的“72变”也显得捉襟见肘。只有不断攻克新的难题，才能实现ReID技术在“AI赋能”舞台大展拳脚，到那时，活点地图大概也会从魔法世界走进现实生活了吧。