您当前的位置: 首页 > 诗词周边

赢识科技在ReID算法上取得突破,刷新业内最好成绩

2019-11-15 17:51:30
赢识科技在ReID算法上取得突破,刷新业内最好成绩

5月13日,赢识科技(WINSENSE)在ReID算法上取得突破,在不使用任何时序信息及外部数据,不进行重排的情况下,在三大主流ReID数据集(Market-1501,DukeMTMC-reID, CUHK03)上,算法关键指标mAP和Rank-1均取得了业内最好成绩。

行人再识别(Person Re-identification,简称ReID)技术是继人脸识别后的一个重要研究方向,其研究对象以人体为主,主要用来进行行人识别与检索,跨摄像头的行人跟踪,行人动作分析等,在智能零售、智慧园区、智能安防等场景有很高的应用价值,受到包括微软、阿里、腾讯、云从、中科院等众多研究机构的关注。

此次,赢识科技在算法上的突破主要得益于以下几个方面:首先,通过采用注意力机制,并结合更加细粒度的基于金字塔的水平分块策略,来获取更加具有分辨力的局部区域特征;在此基础上结合在线难样本挖掘技术,通过对参与度量学习和分类学习的特征进行不同处理,进一步提升特征分辨力;最后,通过对特征的约束,提升特征的泛化能力。基于上述技术,取得了技术指标的全面提升,在三大数据集上取得业内最好的成绩,相关技术已落地到多个线下商业场景。

技术难点

数据规模

目前人脸公开的数据规模达到了十万级ID,私有数据规模在千万ID以上,而ReID公开数据规模明显更小。上述三个主流的ReID数据库,图片规模仅为万级,ID仅为千级。由于暂无标准参考集,且行人着装变化频繁,数据获取成本和标注成本很大。

图像稳定性

由于ReID研究的对象是人体,因此图像容易受到多种因素的影响,如:姿态、遮挡、摄像头成像质量、配饰、着装变化等,给算法带来了极大的挑战。

技术进展

针对数据规模小的问题,除了采集更大规模的真实数据集以外,随着对抗网络技术(GAN)的兴起,基于合成的方法可以更便捷的获取大量的训练数据。最新成果表明,采用CGAN可生成具有不同姿态的行人图像,以提升模型的泛化性能。采用StyleTransfer可实现跨场景数据的生成以提升特定场景下模型的性能。

针对图像不稳定的问题,如何得到更具有分辨力的特征表达,是研究的重点。早期的方法,主要是基于全局信息进行特征描述。近年来,基于局部特征的方法成为主流。采用局部特征匹配,并结合人体姿态和人体部件等辅助信息,可以缓解人体遮挡、姿态变化等问题。另外,通过难样本挖掘,可以进一步提升特征的表达能力。相较于单张图片,基于视频序列的ReID技术也受到很大的关注。视频序列可以结合图像帧间运动信息,来进一步提升准确性。

应用场景

人脸识别技术已被广泛用于各类身份识别场景,但在大范围监控视野下,高质量人脸图像获取成本过高,而人体图像更易获取,使得ReID技术成为人脸识别的重要补充,人体+人脸一体化身份识别和多场景关联正得到越来越多的关注。

数字化门店

在数字化智慧门店场景中,由于空间较小,可以较容易的获取到用户人脸图像,确定顾客身份。但仅靠人脸难以完整地识别顾客的大范围行为,如:停留时间、运动轨迹等。而ReID技术,可帮助完善顾客的行为数据,为后续的分析与决策提供更多的信息。典型应用场景举例:

感知单店/跨店多次到访消费者,形成完整的消费者数字资产

感知消费者的兴趣商品/区域,秒级推送消息,形成销售线索

回溯消费者的线下消费旅程,串联商圈、门店和各种智能终端

顾客轨迹及热点区域统计示例

数字化商圈/购物中心

在大型商圈、购物中心场景中,消费者行为数字化对沉淀线下场景数字资产,构建以数据驱动的精细化运营系统尤为重要。但由于场景范围大、客流密集遮挡、摄像头部署位置等原因,采用结合ReID的消费者感知技术,可以更好的帮助运营者实时识别消费者特征、动线以及全场客流状态。典型应用场景举例:

为到场的全部消费者建立专属档案和连接,进行全域营销数字化管理

充分利用场内各种互动终端,为灵活设定的消费者人群提供个性化内容和互动体验

融合消费者全域数据,形成消费者画像、店铺画像、经营状况等全方位的商业洞察

商圈/购物中心场景行人再辨识应用示例

智能安防/智慧园区

随着监控摄像头的普及,ReID技术可以高效的从海量的数据中,还原出一个人的全部轨迹,对于人员管理、访客管理、员工事件管理等多方面都可以极大的提升工作效率。

关于赢识科技

赢识科技成立于2018年7月,致力于通过人工智能技术为线下商业提供全面的数字化解决方案,帮助客户打造以消费者为中心的商业大脑,构建基于数据驱动的智能商业决策系统。团队核心成员来自于阿里达摩院、阿里云、天猫新零售、中科院、美团等企业,在机器智能、数据平台、分布式系统、智能操作系统等领域有10年以上研发经验。目前已推出面向线下商业场景的智能服务平台和针对不同业态的解决方案。

1.智能感知和分析决策服务

通过业界领先的AI技术,构建了跨场景、跨时间、多维度、超大规模身份识别与聚类,图像和商品识别、动作识别、数据挖掘和内容推荐等核心技术和服务。可精准识别消费者身份、动作行为和意图,建立多维度用户画像,为线下商业精细化运营和智能决策提供数据基础。

2.数字化商圈/门店解决方案

面向商圈/园区、购物中心、门店等线下商业场景,结合不同细分行业特点,提供端 云一体、软硬结合的全面数字化解决方案。在场景化服务、精细化运营、数字化营销等方面帮助线下实体商业提升消费者体验、降低成本、提高效率。

3.开放平台

通过灵活的开放平台方式,支持行业合作伙伴、集成服务商快速规模化落地。支持多系统平台对接,配置简单,几步即可完成线下商业场景的数字化、智能化服务部署。目前已支持合作伙伴在精准客流、智能货架、互动魔镜、线下门店数字化等领域推出多款产品。

生物谷药业
生物谷药业
生物谷药业
生物谷
生物谷药业
推荐阅读
图文聚焦