快科技6月1日消息,据“京东云”官方公众号发文,MiniMax M3正式上线,京东云JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并同步开放服务。
依托京东云自研推理框架,JoyBuilder采用了PD分离部署、KV Cache缓存、投机采样等先进推理优化技术,显著提升了模型推理吞吐量与响应效率。
MiniMax M3在编程、智能体等专业任务上达到了前沿水平。其采用全新的MiniMax稀疏注意力架构(MSA),最高支持100万token的超长上下文。作为一款原生多模态模型,MiniMax M3不仅支持图片与视频输入,还能直接操作电脑桌面。
目前,京东云JoyBuilder已聚合海量通用及行业优质大模型,通过统一标准化接口提供一站式AI能力服务。
企业无需自建算力、复杂架构或组建专业团队,即可快速完成大模型接入与应用落地。
高性能推理服务:依托京东云自研推理引擎,实现毫秒级响应与高并发处理能力,为企业级应用提供稳定、高效的大模型服务支撑。
开放多元的模型生态:聚合百余种主流开源大模型,提供统一模型服务入口和标准化调用接口,满足不同业务场景下的模型选择与应用需求。
全链路可观测运维体系:通过统一监控与可视化管理平台,实现模型服务运行状态、资源消耗及调用情况的实时监测,提升运维效率与服务稳定性。
即日起,用户登录京东云官网,在JoyBuilder模型开发平台页,即可调用最新的MiniMax M3,探索1M超长上下文记忆的全新体验。


