Krafton 推出全新 AI 品牌“Raon” 首批四款 AI 模型全部开源
  • 子莹
  • 2026年04月09日 10:26
  • 0

近日,Krafton 公司宣布推出旗下全新人工智能(AI)模型品牌“Raon”,标志着其在人工智能(AI)领域的深入布局,旨在助力研究者与开发者自由创新。此次发布也进一步彰显了Krafton以技术驱动构建AI生态的战略图景。

Krafton 推出全新 AI 品牌“Raon” 首批四款 AI 模型全部开源

“Raon”这一名称灵感源自韩语中的“喜悦”(라온)一词,体现了 Krafton 致力于通过 AI 技术创造游戏内在乐趣的理念。本次发布的模型品牌展现了 Krafton在基础模型开发上全流程技术能力——从数据收集、模型训练到性能评估,皆可独立完成。未来,公司计划进一步围绕 “Raon” AI 模型品牌加强其全球 AI 技术竞争力。

Kraton 同时还宣布在全球最大 AI 模型平台 Hugging Face 上同步开源四款模型,包括语音驱动大型语言模型(LLM) Raon-Speech、实时双向语音对话模型 Raon-SpeechChat、文本转语音(TTS)模型 Raon-OpenTTS 和视觉编码器 Raon-VisionEncoder。

Raon-Speech 是一款具备语音理解与生成能力的语音语言模型,参数规模为 90 亿(9B)。据 Krafton 介绍,在涵盖语音转文本、文本转语音、基于语音的问答等 7 项核心任务和 40 项基准测试的综合评估中,该模型在参数规模小于 100 亿的开源语音语言模型中,其英语与韩语性能均位列全球第一。

Raon-SpeechChat 是一款采用实时双向通信技术的语音语言模型,允许用户在与模型对话的过程中自由打断对方。它是韩国首款发布的实时双向语音模型。在 3 种双向通信模型评估基准中,它在反语音、插词处理和响应延迟等 13 个主要任务中的平均排名,都达到世界领先水平。

Raon-OpenTTS 是一个仅使用公共语音数据训练的文本转语音模型,而这些公共语音数据此前很难被直接使用。在一项对比模型语音与人类语音自然性的盲测中,其所展现的领先性能水平,不亚于使用私人数据训练的 TTS 模型。

Raon-VisionEncoder 是一款视觉编码器,能够将图像转换为 AI 能够理解的信息。当视觉编码器与语言模型结合时,视觉信息可以被处理,并且可以从零开始自我训练,无需使用任何预训练模型。在某些视觉识别任务中,它记录的结果超过了业内同类型旗舰级视觉编码器模型。在其他任务中,它的性能甚至超过了相关旗舰级模型 90% 以上,证明了其强有力竞争力。

Krafton 首席 AI 官(CAIO)Kangwook Lee 表示:“Raon 模型系列的发布是 Krafton AI 技术能力积累过程中的重要里程碑。我们期待将大规模训练数据和核心模型开源分享,让研究人员和开发者自由使用,助力多模态技术的发展以及韩国 AI 生态系统的发展。”

未来 Krafton 将持续推动 AI 模型和智能体技术的发展,引领技术创新。

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0