近日,逐际动力与阿里云联合打造的具身智能标准化工程底座 FluxVLA Engine 正式上架阿里云 PAI 平台,并以开源方式向全球开发者开放。此外,逐际动力的多款机器人基于阿里云全栈AI打造,也已接入千问 Omni 模型,实现物理世界的全模态实时交互。
随着具身智能进入规模化发展阶段,行业竞争正在从单个模型能力,延伸到支撑模型持续训练、快速迭代和稳定部署的工程基础设施。长期以来,VLA(视觉-语言-动作)和WAM(世界动作模型)模型工程化面临训练、仿真与真机之间数据规范不统一,模型架构与训练框架高度耦合,以及 Sim2Real 迁移落差等问题。对开发者而言,这意味着大量时间被消耗在底层工程适配上,而不是模型创新本身。
针对这些问题,逐际动力打造了标准化 VLA/WAM 工程底座——FluxVLA Engine 。通过统一配置体系、标准化接口和模块化架构,FluxVLA Engine 将数据处理、模型训练、仿真评测和真机部署纳入同一套工程规范,并兼容主流模型、仿真平台和机器人硬件。过去模型配置需要数天时间,现在仅需半小时左右,极大降低了开发门槛。
在阿里云PAI平台上,逐际动力的双臂机器人平台 TRON 2 与 FluxVLA Engine 深度协同。近期,FluxVLA Engine成为首个支持人形机器人全身移动操作与真机部署的开源 VLA/WAM 代码库。开发者不仅可以基于 FluxVLA Engine 完成机械臂、人形上半身的VLA和WAM模型训练,更能够实现人形机器人全身移动操作能力的训练、仿真验证及真实机器人部署。
除了工程平台上的合作,逐际动力开发的不同形态机器人也引入了阿里云全栈AI技术。
具身智能的VLA(视觉-语言-动作)模型和负责运控的“小脑”模型的训练需要海量多模态数据,对训练吞吐、存储等底层基础设施能力提出了较高的需求。
目前,逐际动力的训练数据规模已达1.5PB,训练高峰瞬时吞吐可达上百TB。基于阿里云PAI平台和CPFS并行存储,逐际动力打造模型训练平台,有效支撑了其跨场景、跨模态的大规模数据训练需求。此外,依托阿里云ACK容器服务和边缘计算能力,逐际动力将多类强化学习环境统一封装为云上仿真平台,让机器人的"小脑"可以在云端做大规模并行训练,再无缝迁移到真机。这套解决方案帮助逐际动力将过去以周为单位的环境调试,压缩至小时级。
在本体交互上,LimX Luna、LimX Oli和TRON 2通过接入千问Omni,获得了全模态实时互动能力。Qwen-Omni支持文本、图像、音频、视频等多模态实时输入输出,覆盖19种语言、多种音色,并具备工具调用能力。接入之后,机器人不仅能"看懂、听懂、说出来",还能根据现场场景调用外部工具完成任务。
逐际动力联合创始人谌骅表示:“逐际动力与阿里云展开合作,目标是为了让具身模型从训练到部署没有难度,通过在千行百业打造垂直大模型生产系统,让大家都可以参与到具身智能革命中来。” 未来,双方将继续围绕模型训练、仿真平台、大模型等展开全栈AI合作,进一步完善 FluxVLA Engine 的能力,降低具身智能研发门槛,推动相关技术走向产业落地应用。

