胡大鹏博士解析：跨镜追踪（Re-ID）技术的出现、、发展及应用 - 新闻资讯 - 鼎诚-AI生产力平台-多模态预训练大模型提供商

首页
算法商城
全部行业算法

金融服务

智慧车站

城市治理

道路交通

交通小目标

安全应急
金融服务
值班人数与规定不... 保安长时间离岗未按规定交接班值班人员玩手机人员靠近风险聚众检测人员徘徊检测面部异常长时间滞留检测攀爬分析

智慧车站
电梯扶梯异常监测客流统计逆行监测人流密度客流突变告警区域入侵滞留监测通道人脸提取可疑物品遗留监测异常奔跑

城市治理
悬挂横幅标语检测道路抛洒物检测沿街晾挂检测焚烧垃圾树叶检测积存垃圾渣土检测垃圾箱溢满检测道路破损检测打包垃圾检测暴露垃圾检测垃圾桶未盖检测

道路交通
路口流量车道排队长度车道级车流量车道通行状态车道平均车速流量溢出车头间距车头时距车道空间占有率车道时间占有率

交通小目标
骑行目标信息识别行人信息识别非机动车闯入机动... 非机动车逆行非机动车上高速非机动车横穿马路非机动车闯红灯非机动车未戴头盔摩托车逆行摩托车闯红灯

安全应急
安全帽佩戴检测工作服检测烟火检测烟雾检测吸烟检测车辆占道使用手机打电话人员离岗物品占道消防设施监控

全部行业算法 >

值班人数与规定不...

保安长时间离岗

未按规定交接班

值班人员玩手机

人员靠近风险

聚众检测

人员徘徊检测

面部异常

长时间滞留检测

攀爬分析

物品遗留

非法粘贴

持刀检测

大楼顶层异常行为

人员倒地风险

自助区内出现危险...

消防通道堵塞

烟雾检测

火焰检测

运钞车停靠位置被...

久候客户提醒

特殊客户关怀

区域拥挤提醒

客流分析

轨迹分析

全部行业算法 >

电梯扶梯异常监测

客流统计

逆行监测

人流密度

客流突变告警

区域入侵

滞留监测

通道人脸提取

可疑物品遗留监测

异常奔跑

戴口罩检测

持刀械

排队长度检测

安检智能判图

安检人员专注度

全部行业算法 >

悬挂横幅标语检测

道路抛洒物检测

沿街晾挂检测

焚烧垃圾树叶检测

积存垃圾渣土检测

垃圾箱溢满检测

道路破损检测

打包垃圾检测

暴露垃圾检测

垃圾桶未盖检测

乱堆物堆料检测

违规搭伞检测

违规户外广告检测

非法小广告检测

占用消防通道检测

无照经营游商检测

店外经营检测

占道经营检测

机动车乱停放检测

非机动车乱停放检...

占用无障碍通道检...

三轮车拉客检测

井盖异常检测

雨水篦子破损检测

设备交接箱未关闭...

道路交通设施破损

护树设施破损检测

施工占道检测

道路积水检测

道路积雪检测

烟火烟雾检测

人群聚集检测

船只检测

漂浮物检测

秸秆焚烧检测

非法采砂检测

河湖堤坝异常检测

非法垂钓检测

森林砍伐检测

动物检测

高空抛物检测

电动车入电梯检测

人员入侵检测

人员徘徊检测

人员攀爬检测

人员摔倒检测

人员离岗检测

人员未戴口罩检测

人员打架检测

人员抽烟检测

全部行业算法 >

路口流量

车道排队长度

车道级车流量

车道通行状态

车道平均车速

流量溢出

车头间距

车头时距

车道空间占有率

车道时间占有率

通行缓慢

道路拥堵

排队溢出

车道占有率高

事故检测

车辆抛锚

路障检测

路面施工

信号灯故障

能见度检测

火焰检测

路面坑洞

标识物破损

车辆属性识别

未礼让行人

机动车闯红灯

占用应急车道

违法变道

占用公交车道

违法停车

机动车逆行

大弯小转

不按导向车道行驶

左转不让直行

右转不让直行

未系安全带

驾车打电话

违法倒车

不按规定车道行驶

车辆闯禁

机动车占用非机动...

占用导流区

路口滞留

路肩行驶

全部行业算法 >

骑行目标信息识别

行人信息识别

非机动车闯入机动...

非机动车逆行

非机动车上高速

非机动车横穿马路

非机动车闯红灯

非机动车未戴头盔

摩托车逆行

摩托车闯红灯

摩托车未戴头盔

非机动车载人

行人闯入机动车道

行人闯红灯

行人横穿马路

全部行业算法 >

安全帽佩戴检测

工作服检测

烟火检测

烟雾检测

吸烟检测

车辆占道

使用手机打电话

人员离岗

物品占道

消防设施监控

人员睡岗

卸油口异常开启监...

灭火器不在固定位...

静电释放时间不足...

卸油作业人员离岗

受限区域闯入

区域人数超限/区域...
核心产品
★ 鸿羽大模型网关鸿云训推一体鸿图推理平台鸿维训练平台
行业方案
金融服务智慧车站城市治理安全应急道路交通智慧警务 AI教育实训
新闻资讯
关于我们
加入我们

首页
算法商城

金融服务

值班人数与规定不符保安长时间离岗未按规定交接班值班人员玩手机人员靠近风险聚众检测人员徘徊检测面部异常长时间滞留检测攀爬分析

智慧车站

电梯扶梯异常监测客流统计逆行监测人流密度客流突变告警区域入侵滞留监测通道人脸提取可疑物品遗留监测异常奔跑

城市治理

悬挂横幅标语检测道路抛洒物检测沿街晾挂检测焚烧垃圾树叶检测积存垃圾渣土检测垃圾箱溢满检测道路破损检测打包垃圾检测暴露垃圾检测垃圾桶未盖检测

道路交通

路口流量车道排队长度车道级车流量车道通行状态车道平均车速流量溢出车头间距车头时距车道空间占有率车道时间占有率

交通小目标

骑行目标信息识别行人信息识别非机动车闯入机动车道非机动车逆行非机动车上高速非机动车横穿马路非机动车闯红灯非机动车未戴头盔摩托车逆行摩托车闯红灯

安全应急

安全帽佩戴检测工作服检测烟火检测烟雾检测吸烟检测车辆占道使用手机打电话人员离岗物品占道消防设施监控
核心产品

鸿羽

产品概述功能演示平台架构核心功能产品优势应用场景面向客户

大模型网关

产品概述功能演示平台架构核心功能产品优势应用场景面向客户

鸿云训推一体

产品概述功能演示平台架构核心功能产品优势应用场景面向客户

鸿图推理平台

产品概述功能演示平台架构核心功能产品优势应用场景面向客户

鸿维训练平台

产品概述功能演示平台架构核心功能产品优势应用场景面向客户
行业方案

金融服务

业务痛点解决方案方案价值行业案例

智慧车站

业务痛点解决方案方案价值行业案例

城市治理

业务痛点解决方案方案价值行业案例

安全应急

业务痛点解决方案方案价值行业案例

道路交通

业务痛点解决方案方案价值行业案例

智慧警务

业务痛点解决方案方案价值行业案例

AI教育实训

业务痛点解决方案方案价值行业案例
新闻资讯
关于我们
加入我们

首页 > 新闻资讯

胡大鹏博士解析：跨镜追踪（Re-ID）技术的出现、、发展及应用

2018-10-30

2017年11月，，，，旷视研究团队发表文章，，称其在行人再识别（ReID）技术开发方面取得重大进展，，，通过一种新方法的运用，，，，使机器在ReID上首次超越人类表现。。。。

2018年4月，，，，云从科技也宣布在这一领域取得突破，，，，称其在Market-1501, CUHK03, DukeMTMC-reID这三个最权威的衡量ReID技术的数据集上，，相关核心指标均刷新了相关记录，，在Market-1501上的首位命中率（Rank-1 Accuracy）达到96.6%，，，打破了阿里iDST在2018年1月创造的世界纪录。。

2018年10月，，，，鼎诚行人再识别技术（）的精准度已经突破97.1%，，，刷新了业内已知的最高纪录！！作为一家以Re-ID视频结构化技术和应用为核心的计算机视觉科技公司，，，在Market 1501、、、DukeMTMC-reID、、、、CUHK03这三个衡量Re-ID技术最通用的数据集测试中，，，，获得了巨大突破。。。

在Market 1501上的首位命中率（Rank-1 Accuracy）已经达到97.1%，，超越人眼识别能力（94%），，领先头部厂家，，并刷新了今年4月公布的96.6%的世界纪录。。同时在CUHK03，，Duke MTMC-reID两个数据集上也刷新了之前业内最高纪录，，达到了行业state of the art的技术水平，，，，特别是在CUHK03数据集上，，Rank 1指标提高了10.7%。。。

我们不难发现，，近年来业界领先的AI公司，，，均在大力投入进行ReID技术开发研究，，，其根本原因，，在于ReID技术的潜在商业价值已得到行业巨头们的广泛认可。。。。那么，，ReID究竟是一种怎样的技术，，，，它经历了怎样的发展，，，又将如何在商业应用上大展身手呢？？

对此，，，，苏州鼎诚视觉科技股份有限公司CTO胡大鹏博士，，，，在香港人工智能中心撰写了如下文章，，对ReID技术的出现、、发展、、、、难点、、方向，，，，和人脸识别、、、、视频结构化、、、、计算机视觉学的关系，，，以及鼎诚公司在ReID技术层面的研究方向、、、、成果等，，，进行了深入浅出、、、、生动直观的阐述。。。。

胡大鹏，，，香港科技大学计算机科学博士。。。。历任微软亚研院博士后研究员、、香港中文大学研究员、、、、香港科技大学助理教授。。曾任ASTRI（香港应用科学研究院）首席研究员，，，，在机器视觉技术产业转化和应用开发方面有着丰富经验。。。。

胡大鹏鼎诚CTO

胡大鹏鼎诚CTO

ReID的出现：为“跨镜找人”而生

ReID 由以往没有太多人留意到现在开始有产品上的应用，，，经历了一段非常漫长的时间。。。。由于最早期完全依赖于传统计算机视觉或机器学习的技术，，，所以基本上没有明显的突破。。ReID 本身是一个非常难的问题，，，，它是要从不同的视频之中，，把同一个人识别出来。。。不同视频的光照条件、、、、感兴趣区域的分辨率、、、、角度的不同、、、遮挡普遍发生、、、穿着相近衣服的人等等，，，都会造成识别的困难。。。。

ReID与人脸识别：产品化道路更曲折

首先，，，，ReID 跟人脸识别，，，有着一个最大的不同。。人脸的特征一般是有比较、、、、有唯一性，，，而 ReID 在这一块是完全无法比拟的。。。。特征的唯一性愈高，，单靠这个特征去查找或定义一个人就会愈准确，，也愈容易。。。所以，，，，即使以往没有深度学习技术，，人脸识别仍是可以做到一个很高水平的状态。。当然，，，，引入了深度学习之后，，人脸识别这一块甚至超越人类。。。。

胡大鹏博士解析：ReID技术的出现、、、、发展及应用

但 ReID 则是一个完全不同的问题，，，，因为它的特征唯一性不高，，，同时有很多环境及外在因素影响着。。。。先不讨论行人的衣服换了怎么办，，，即使行人没换衣服，，，，当你走进金融商业区，，，满街都是西装上班族，，，，即使你不懂什么是特征向量，，我相信你用肉眼也无法在远处从一群人之中把一个人精准找出来。。。

跨镜追踪ReID 就是在面对着这样的一个问题：监控摄像头挂在远处，，，看到一大堆行人自由移动，，，，多个摄像头架在不同的地方看着不同的区域，，区域之间一般没有重叠，，而ReID的目标，，，，就是要把同一个行人在不同的摄像头内，，，，重识别出来。。。

这样的任务，，在深度学习成为主流之前，，，，接近不可能。。。。所以，，在学术圈之中，，，，论文成果都是倾向于 proof-of-concept 而无法产品化。。直到深度学习出现之后，，，所能提取的特征唯一性大大地提高了，，，，才有了产品化的可能。。

ReID 视频结构化计算机视觉学

市场需求的出现，，，对ReID 的发展产生了最为重要的推动作用。。。。当目标检测、、分类、、、跟踪等技术都达到一定水平之后，，，，结构化这个课题，，，，在这三年间高度火热。。结构化其实并不是一件新事物，，，在几十年前，，，计算机视觉学的学者本来就是有这个愿景。。。。他们希望透过计算机视觉学的技术，，，把图片/视频内的东西完全分析并利用人工智能来理解场景内容。。当中，，，分析的部分，，，，就是结构化的广义说法。。。计算机视觉学的存在，，，，本来就是为了这件事情，，，，只是，，，因为每一个单一问题在以前看来都是极其困难的，，所以才产生了不同的专门科目去针对性解决单一问题。。。

胡大鹏博士解析：ReID技术的出现、、、发展及应用

直至深度学习的出现，，，，把很多以前无法做好的问题都做好了，，计算机视觉学才不知不觉的回归到其原点来：整个视频的主要内容都能分解并被结构化起来。。。不过，，，，当我们面对着如此之多的数据，，另外的一些问题也产生了。。。首先，，数据量本身已经太大，，，，而重复量更大，，，资料之间即使有关连性，，，，也无法自动配上。。。。其次，，，，当需要查找资料时，，发现根本无从着手。。。要解决这些问题，，，，其中一个有效的方法就是：ReID。。。

ReID: 让监控获得“大局观”

ReID 全写是 Re-identification，，顾名思义，，就是把物件重新辨认或识别出来。。对于监控领域来说，，，刚才提到的两个问题，，，引申出来在实际应用上，，，就是希望把不同视频内的物体关联起来，，并可以透过有效的方法把物体找出来。。解决前者，，，一、、、、能减少物件重复性；二、、、能改善跟踪；三、、、能分析物体在区域内的行动路径；四、、、能分析个体之间的互动关系。。解决后者，，能够在海量的数据之中有效地把某人提取出来。。这些都是监控行业多年以来的需求，，，能做到这样，，，，整个监控操作才完整，，，，才能看到大局。。。

ReID现状：不完美之下，，以应用创新

然而，，到目前为止，，，跨镜追踪ReID技术仍然是不完美的，，，，它最终的目的是要能达到 1-to-1 匹配的状态。。。。可是，，实际上是有误差的，，，，而且，，，，这个误差比起人脸识别技术上的要大得多，，，，主要原因，，，便是前述的唯一性问题。。。另一个则是速度上的问题，，，，要在产品上应用，，，，快是必须的。。。在不完美之下，，，把技术应用到产品上，，就要花很多功夫做应用创新。。

与其他顶尖的同行一样，，，，鼎诚成立了自己的研究院（香港AI研究院），，并投入了大量资源进行研究，，，在实际产品上，，，各方面的数据与同行各占优势。。。。因为历史因素，，鼎诚的团队作业其实更为紧密，，即使在单一算法上有不完美的地方，，也能在整体全局之下产生优化。。。例如，，，检测、、、跟踪、、特征提取等等环节，，，是互相紧扣而全局优化的。。

胡大鹏博士解析：ReID技术的出现、、、发展及应用

典型的研究团队，，，其小组们都是各自做好自已的算法，，，在某一数据内刷出最高准确度。。。但这样的话，，，，当算法拼在一起时，，效能很多时候并不如理想。。。鼎诚的观点始终是，，，单一算法需要做好的同时，，，，我们也同样重视产品的最终形态，，，，毕竟，，，这才是用户真正能接触到的部分，，，也决定了产品的实用性。。算法团队成员之间的认真沟通、、、、算法团队与工程团队之间紧密合作、、、、算法与算法之间的磨合、、算法与工程之间的磨合，，，加起来，，才会是鼎诚的产品。。。。

因为算法都是互相协同的，，鼎诚的跨镜追踪（Re-ID）技术可以在、、、、图侦综合实战平台、、、、、、等系统上真正用起来。。鼎诚的所有技术，，包括了 ReID 技术，，，都是自己原创研发，，，技术上我们参考了现时最新的技术并从中再突破，，而方向则是清晰无误地要以落地为优先。。

胡大鹏博士解析：ReID技术的出现、、、、发展及应用

ReID之生成：两种基本算法

说起“行人再识别”，，，也即Person Re-identification，，最大的难点在于，，行人是非刚体。。。。意思是，，，，人不像汽车那样，，从任何角度任何时间上看都是同一个型态。。当人在走路时，，，手和脚都在摆动，，，，还往往伴随有其他动作。。

面对这个问题，，，，一般方法是把人的身体划分成不同部分，，，以不同的方法把这些部分检测出来，，并进行局部特征提取。。。可是，，任凭你怎样细化划分，，，该部分也会有某程度上的非刚体特性，，这样仍是会对算法造成干扰。。

另一种比较准确的方法是考虑对齐，，就是说，，，把两张将要比对的图片，，以某种方法先对齐好，，例如相同的头部位置和脚部位置，，，，并在匹配时只考虑有用的部分。。当然，，，说起来是这么简单，，，实际算法要做到这回事是一件进阶的事情，，，，因为这部分一般会内嵌到神经网络。。。。

除此之外，，，业界一般会附加一些网络设计技巧再提高特征提取的准确度，，，例如使用多分支多任务网络，，，而最后再用 re-ranking来进一步提升准确度。。。。

鼎诚ReID算法创新：基于注意力架构的深度神经网络方案

鼎诚所用的方法，，，概念上相近，，，都是尽可能考虑最重要的部分进行特征提取及比对。。。。然而，，，我们提出基于注意力架构模型的深度神经网络方案来实现行人ReID。。。。与传统的全局表征或设定好的局部分割不同，，我们设计的主躯干网络不要求躯干位置的标注，，，，模型能够从浅层视觉到高层语义的不同空间内自动捕捉关键区域，，，，挖掘多尺度的注意力特征，，自动实现行人肢体（如面部，，，上身及下身）的特征融合，，对于姿态改变以及空间变化有着很好的鲁棒性，，，有效的完成行人搜索工作。。

胡大鹏博士解析：ReID技术的出现、、、、发展及应用

在鼎诚在实际的产品则试时，，，发现即使不使用 re-ranking，，，，对于 Market-1501 数据库，，top-1 准确度也能达到 90%。。。。虽然跟旷视的 94% 还是有差距，，，，但不使用 re-ranking 也能达到这个水平，，，代表我们速度上会快很多，，，也同时减少计算资源的使用。。。。原因是 re-ranking（例如现今常用的 k-recipical 方法）即使再简单，，，，也需要消耗内存把某范围内的数据暂存，，，，并进行分析和对比。。。。而有不少算法是非常依赖 re-ranking 来达到高准确度。。。缺少了这个依赖，，这使得我们的算法在实际产品内产生优势。。

ReID的下一步：分析之后，，，，是理解

鼎诚AI研究院在未来会进一步投入资源去研究行人行为及车辆行为。。正如之前所述，，，，计算机视觉学的最原始想法就是分析和理解场景。。。分析，，，，我们已经做得很不错，，可是，，结构化数据所代表的高阶义意及意思是什么？？业界还未有很明确的方向，，，，更不论是产品。。

我们希望，，透过行为分析，，，把理解这一块开一个窗口，，，使得结构化数据能再向前推进，，，，令系统更有智慧。。。。未来，，，，并不单是人类去操作系统，，，，而是系统有了理解能力之后，，跟人类协作，，，，为人类谋方便和幸福。。。。

上一篇：AI防“疫”攻坚：新冠病毒感染人员溯源寻迹系统

下一篇：2018安博会回顾丨鼎诚，，，，IDs构建AI感知芯视界