CVPR(国际计算机视觉与模式识别会议)是由 IEEE 主办的一年一度的世界顶级计算机视觉学术性会议。近日,创新奇智团队参加的CVPR - FGVC10(细粒度视觉分类)研讨会PlantTraits挑战赛比赛结果揭晓。创新奇智在多个参赛队伍中脱颖而出,成功斩获世界冠军。
在本次比赛中,创新奇智团队表现出色,在PlantTraits赛道样本数据量极少的情况下,利用迁移学习技术以及提出一种创新性的架构设计,取得了突破性进展,为视觉识别任务的性能提升做出了新的贡献。
CVPR是计算机视觉领域全球三大会议之一。大赛受到了国内外学术界和产业界的广泛关注,自3月份开赛以来,共有来自全世界多个国家和地区超过1500个团队报名参赛。本届CVPR-FGVC10研讨会由丹麦哥本哈根大学、美国加州理工学院、英国爱丁堡大学、美国麻省理工学院、英国伦敦大学学院、捷克共和国皮尔森西波西米亚大学、北京大学、Meta(Facebook)、Google等知名高校及机构联合主办。
PlantTraits 2023挑战赛及赛题介绍
PlantTraits 2023是隶属于CVPR 2023 FGVC细粒度挑战赛的分支,是国际人工智能和计算机视觉领域的旗舰学术赛事,由德国莱比锡大学地球系统研究遥感中心(RSC4Earth, Leipzig University, Germany)主办。
PlantTraits 2023挑战赛旨在探索从有限的植物性状数据中预测全球范围内的植物性状,以及整个生态系统将如何对气候变化做出反应。赛事要求利用植物的图像并结合植物生长环境与植物形状之间的关系预测出植物性状。赛题给定植物图像数据、植物生长环境信息以及植物性状的均值与方差进行模型训练,要求参赛者使用深度学习的回归模型从植物照片中预测植物属性,比如长度、发芽率等30余项属性。主办方将根据各参赛队伍提交的植物性状文件计算出平均R2进行排名。
创新奇智夺冠算法介绍
直接对植物性状进行回归是十分复杂的,通过分析发现,对于相同类别的植物,其性状的分布范围会更小,而可以预测出植物的类别又是至关重要的。因此不同于以往的回归任务,创新奇智团队首先利用分类任务确定植物的类别,再依据后处理得到植物性状,从而极大提升模型性能。该任务的一大难点在于数据量极少,单一类别植物至多只有6张图像与之对应。
为了解决上述问题,创新奇智团队选取ConvNeXtV2模型作为骨干网络(backbone)。考虑到该任务为植物细粒度回归任务,因此首先采用迁移学习(Transfer Learning)方法,在iNaturelist数据集上对该模型进行预训练,有效提升了该模型在植物特征提取方面的能力。同时,为了有效地利用植物生长环境等数据,团队对这些meta数据进行了归一化。在通过ConvNeXtV2网络提取出图像特征和将归一化后的meta数据拼接到图像特征之后,然后再通过多层感知机(MLP)对特征进行充分融合,输出植物的类别概率值。在整个处理过程中,团队使用不同的概率进行数据添加和模型参数的丢弃以获得多个模型的推理结果,并将输出的相应类别的概率值取平均以获得这些模型的最终分类结果。最终根据植物的类别确定出植物性状分布的范围后,再利用其均值进行后处理替换便得到植物30余项属性的数值。
其中,ConvNeXt V2是一种新的卷积神经网络模型,通过结合自监督学习框架并进一步加入新的架构改进,在各种视觉识别任务上取得了不错的性能提升。 iNaturalist数据集是一种物种分类和检测数据集,其中包括来自5,000多种不同植物和动物物种的859,000张图像。该数据集真实反映了现实自然界中不同生物类别数量的严重不平衡性,并且已得到多名民间科学家的验证。
通过以上模型设计和训练策略,创新奇智团队在竞赛中取得了第一名的好成绩。向全球同行充分展现了自身在AI理论研究上的深厚积累和持续创新能力。未来,创新奇智将继续在广阔的人工智能领域进行创新和探索,为今后将AI技术更广泛地落地应用于人工智能制造、人工智能金融等领域奠定了坚实的理论基础和技术储备。
创新奇智CTO张发恩担任本次参赛队伍教练,他指出:“样本数据量极少是本次PlantTraits竞赛的最大挑战。创新奇智团队在少样本学习领域深研多年,取得了一系列的创新成果,研发的多项少样本学习算法堪属世界首创。少样本学习旨在从已有类别的数据中学习先验知识,然后利用极少的标注数据完成对新类别的识别,打破了样本数据量的制约,在传统制造业等样本普遍缺失的领域具有实用价值,有助于推动AI落地。”