阿里斩获16项CVPR冠军 三项研究帮助盲人“看见”世界
  • 文路
  • 2021年06月28日 15:08
  • 0

6月28日,计算机视觉领域顶级会议CVPR 2021竞赛结果已全部揭晓,阿里巴巴视觉算法团队成绩领跑全球,共斩获16项世界冠军,覆盖图像及视频内容理解、遥感影像分析、视觉问答等场景,多项研究可帮助盲人感知物理世界、识别农业领域灾害等。

阿里斩获16项CVPR冠军 三项研究帮助盲人“看见”世界

CVPR是AI领域最顶级的学术会议之一,会议每年都会吸引全球顶级高校及Google、微软、Facebook等科技企业参加,近几年,该会议的主题逐渐从单纯的学术交流延伸至学术与应用结合的探索,而中国企业也迎来了高光时刻,在论文数量级竞赛冠军数上均有不俗表现。

据悉,阿里巴巴达摩院视觉实验室、手淘算法等团队此次参与了多项高难度视觉任务竞赛,最终在16项竞赛中击败国内外科技公司及高校,斩获16项世界冠军。

阿里斩获16项CVPR冠军 三项研究帮助盲人“看见”世界

AI基于视频生成前后连贯的句子描述

在ActivityNet Dense Video Captioning竞赛中,参赛团队算法需要基于一段视频生成前后连贯的句子描述,以帮助盲人理解视频内容。在该竞赛中,达摩院创新性采用SOTA视频网络及多模态特征融合,同时解决了事件序列描述的问题,可高效AI理解视频内容,最终以METEOR score 10.33的成绩获得第一名。在另外两项竞赛中,达摩院AI算法还准确识别了盲人拍摄的低清晰度照片,帮助盲人看清图片内容。

阿里斩获16项CVPR冠军 三项研究帮助盲人“看见”世界

达摩院AI Earth精准识别农作物生长过程中的干旱、洪涝等农业灾害

视觉技术在农业场景的探索是近两年的热门话题,在本届CVPR中,达摩院包揽了AGRICULTURE-VISION CHALLENGE监督和半监督两大赛道冠军。竞赛需要参赛团队基于遥感航拍影像来识别农业灾害,例如农作物生长过程中的干旱、洪涝等农业灾害类型。达摩院AI Earth采用了对抗学习、颜色语义引导、域归一化和双表征网络等方法,有效解决弱纹理、样本不平衡、颜色敏感、跨域等难题。未来,该算法可应用于精准农业、农业资产盘点、农业灾害定损等领域。

视频行为理解是一直都被认为是一项非常具有挑战性的任务,达摩院针对该问题研发了技术框架EMC2,解决了视频背景复杂、视频人物相互遮挡及视频分辨率不足等干扰问题,最终在ActivityNet、AVA-Kinetics、Epic-Kitchens、HACS等视频理解竞赛中获得5项冠军。据介绍,该技术体系已在视频搜索、版权保护、视频交互等场景使用。

阿里斩获16项CVPR冠军 三项研究帮助盲人“看见”世界

基于达摩院EMC2技术体系的算法斩获5项冠军

达摩院参赛团队表示,“计算机视觉领域的研究热点每年都在变化,AI算法需要面临的任务场景也越来越复杂,单纯的算法创新很难在实际问题中有好的表现,我们的算法融合了多项创新技术,并且在视频会议、农业、电商等领域大规模使用。”

据介绍,达摩院在CVPR期间还主办了第二届大规模商品图像识别竞赛,最终共有623支队伍报名注册,冠军模型识别准确率超去年10%。

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0