如今,多模态、预训练排序等新兴技术在金融领域的深入应用,为行业发展注入了新动能。度小满深知前沿科技对推动金融行业创新变革的重要性,一直深耕技术创新,在多个前沿技术领域都获得了深厚的技术积累。最近,度小满金融数据智能应用部AI-Lab的两篇论文分别入选了ACM MM和CIKM国际顶级会议。
据了解,度小满的两篇论文分别就多模态和预训练排序等多个热门话题提出了新颖的算法,并在相关任务上达到了国际顶尖水平,获得了审稿人的一致好评并最终录用。这标志着度小满在自然语言处理和计算机视觉等人工智能前沿领域的研究得到了国际同行的认可。
新模型可有效提升度小满在视觉风控方面的技术能力
两篇论文中,度小满论述“具有实体对齐网格的位置增强Transformer”的论文被ACM MM录用。ACM MM(ACM International Conference on Multimedia)是计算机科学领域中多媒体领域的顶级国际会议,涵盖了多个媒体领域的前沿研究与进展,包括图像,文字,音频,传感器等,被中国计算机学会(CCF)列为A类会议。
许多图像除了实际的物体和背景等信息外,通常还包含着很有价值的文本信息,这对于理解图像场景是十分重要的。因此该论文主要研究基于文本的视觉问答任务,这项任务要求机器可以理解图像场景并阅读图像中的文本来回答相应的问题。然而之前的大多数工作往往需要设计复杂的图结构和利用人工指定的特征来构建图像中视觉实体和文本之间的位置关系。为了直观有效地解决这些问题,度小满科研人员提出了具有实体对齐网格的位置增强Transformer。
该模型能够整合目标检测、OCR以及基于Transformer的文本表示等多种方法的优势,增强算法对于图像中场景信息的理解,更精准的融合图像与文本多模态的信息,进一步助力证件识别、人脸与活体检测等业务场景,提升度小满在视觉风控方面的技术能力。
度小满对预训练排序深入研究为金融数据管理提供依据
度小满另一篇阐述“基于BERT的动态多粒度排序模型”的论文被CIKM录用。CIKM(The Conference on Information and Knowledge Management )是由ACM主办的信息检索和数据挖掘等领域的国际顶级会议,由国际计算机学会ACM SIGIR分会主办,每年召开一次。
近年来,预训练的语言模型广泛应用于文本的检索排序任务中。然而,在真实场景中,用户的行为往往受到选择或曝光偏差的影响,这可能会导致错误的标签进而引入额外噪声。而对于不同候选文档,以往的训练优化目标通常使用单一粒度和静态权重。这使得排序模型的性能更容易受到上述问题的影响。
因此,在该论文中,度小满科研人员重点研究了基于BERT的文档重排序任务,开创性地提出了动态多粒度学习方法。该种方法能够让不同文档的权重根据预测概率动态变化,从而减弱不正确的文档标签带来的负面影响。此外,该方法还同时考虑了文档粒度和实例粒度来平衡候选文档的相对关系和绝对分数。在相关基准数据集上的实验进一步验证了度小满模型的有效性。
度小满两篇论文入选国际顶级会议,再次展现了度小满雄厚的技术实力。多年来,度小满始终致力于以先进科技破解金融服务难题,推动科技与金融的深度融合发展。在度小满等金融科技企业的共同努力下,未来日益成熟的金融科技,相信也将推动金融行业迈向全新发展阶段。