近期,国际计算机视觉大会(ICCV)官方网站陆续公布了ICCV2021计算机视觉挑战赛成绩,来自蚂蚁保险科技的选手摘得“遮挡视频实例分割”挑战赛的第一名。名列前茅的还有美国卡耐基梅隆大学和德国亚琛工业大学等先进研究机构。
ICCV由IEEE(电气与电子工程师协会)主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称为计算机视觉方向的三大顶级会议。
ICCV2021遮挡视频实例分割挑战赛,既Occluded Video Instance Segmentation(简称OVIS)竞赛。OVIS主要特点是视频里存在大量多种多样物体之间的遮挡,要求算法能检测、分割、跟踪视频里所有的物体。
实例分割是计算机视觉中的基础问题之一。目前,静态图像中的实例分割业界已经进行了很多的研究,但是对(遮挡)视频的实例分割的研究相对较少。而真实世界中的摄像头所接收的,无论是自动驾驶背景下车辆实时感知的周围场景,网络媒体中的长短视频,还是智能理赔流程中的凭证识别,大多数都是视频流信息而非纯图像信息。因而研究视频理解的模型有着十分重要的意义。基于视频级别的实例分割技术相比图像级别,其优点在于可以充分利用物体跨帧的连续性和时态上下文线索,但同时也对计算资源提出更高要求。
视频实例分割是2019年由业内学者提出的新任务,自提出起便得到了Facebook、字节跳动、腾讯等国内外公司的关注,目前该领域还处于发展初级阶段。
该技术在视频流中的理赔凭证理解、电商险理赔商品识别,视频面访,宠物身份识别等保险场景中起到作用。蚂蚁保险推出的智能理赔服务可以利用该技术处理上述复杂场景。
目前,视频实例分割技术已经应用于蚂蚁保险的智能理赔场景中,大大提升理赔效率和准确率。例如,利用该技术可以更便捷的识别视频流中的理赔凭证,从一摞纸中把最上面的凭证主体切割提取出来(图1)。
此外,以宠物险为例,除了利用鼻纹识别技术识别宠物之外,如下面视频中的四张图(图2)所示,算法模型可以将相互遮挡的三只猫体准确分割,从而进行就更精准的动物身份识别。
同时,该技术未来在企业贷款的凭证上传,自动驾驶的场景理解,短视频或直播中的人物背景分离等应用场景也会有广泛的应用价值。
图1:理赔凭证切割
图2:遮挡宠物分割