Krafton 推出全新 AI 品牌“Raon” 首批四款 AI 模型全部开源-快科技-科技改变生活

近日，Krafton 公司宣布推出旗下全新人工智能（AI）模型品牌“Raon”，标志着其在人工智能（AI）领域的深入布局，旨在助力研究者与开发者自由创新。此次发布也进一步彰显了Krafton以技术驱动构建AI生态的战略图景。

“Raon”这一名称灵感源自韩语中的“喜悦”（라온）一词，体现了 Krafton 致力于通过 AI 技术创造游戏内在乐趣的理念。本次发布的模型品牌展现了 Krafton在基础模型开发上全流程技术能力——从数据收集、模型训练到性能评估，皆可独立完成。未来，公司计划进一步围绕 “Raon” AI 模型品牌加强其全球 AI 技术竞争力。

Kraton 同时还宣布在全球最大 AI 模型平台 Hugging Face 上同步开源四款模型，包括语音驱动大型语言模型（LLM） Raon-Speech、实时双向语音对话模型 Raon-SpeechChat、文本转语音（TTS）模型 Raon-OpenTTS 和视觉编码器 Raon-VisionEncoder。

Raon-Speech 是一款具备语音理解与生成能力的语音语言模型，参数规模为 90 亿（9B）。据 Krafton 介绍，在涵盖语音转文本、文本转语音、基于语音的问答等 7 项核心任务和 40 项基准测试的综合评估中，该模型在参数规模小于 100 亿的开源语音语言模型中，其英语与韩语性能均位列全球第一。

Raon-SpeechChat 是一款采用实时双向通信技术的语音语言模型，允许用户在与模型对话的过程中自由打断对方。它是韩国首款发布的实时双向语音模型。在 3 种双向通信模型评估基准中，它在反语音、插词处理和响应延迟等 13 个主要任务中的平均排名，都达到世界领先水平。

Raon-OpenTTS 是一个仅使用公共语音数据训练的文本转语音模型，而这些公共语音数据此前很难被直接使用。在一项对比模型语音与人类语音自然性的盲测中，其所展现的领先性能水平，不亚于使用私人数据训练的 TTS 模型。

Raon-VisionEncoder 是一款视觉编码器，能够将图像转换为 AI 能够理解的信息。当视觉编码器与语言模型结合时，视觉信息可以被处理，并且可以从零开始自我训练，无需使用任何预训练模型。在某些视觉识别任务中，它记录的结果超过了业内同类型旗舰级视觉编码器模型。在其他任务中，它的性能甚至超过了相关旗舰级模型 90% 以上，证明了其强有力竞争力。

Krafton 首席 AI 官（CAIO）Kangwook Lee 表示：“Raon 模型系列的发布是 Krafton AI 技术能力积累过程中的重要里程碑。我们期待将大规模训练数据和核心模型开源分享，让研究人员和开发者自由使用，助力多模态技术的发展以及韩国 AI 生态系统的发展。”

未来 Krafton 将持续推动 AI 模型和智能体技术的发展，引领技术创新。

相关报道

最热文章排行查看排行详情

邮件订阅

分享到