6月6日,京东云城市大会成都站期间,京东云正式发布了混合多云智能运维平台。
通过引入AI大模型能力,叠加多年积累的运维数据,智能运维平台实现了端到端的全链路应用监控,可快速梳理业务链路的根因定位,锁定故障节点,给出处理建议,从而极大提升运维效率。
京东云相关负责人介绍,智能运维平台已大规模应用于京东内部场景,支持618、11.11等高并发和复杂业务场景,QPS达千万级流量时,可用率仍可高达99.99%,为业务应用稳定运行提供保障。
AI大模型加持,为京东618、11.11提供全链路运维保障
京东618承载了最极端的流量,是全球最复杂的业务场景之一。
618活动不仅涉及的系统多,而且业务链条长,为了保障大促活动的正常进行,需要对业务系统各项性能和可用性指标进行全链路实时监控,当业务发生错误或者性能遇到瓶颈等问题时,需要能够迅速发现并定位根因,提升运维排障效率。
源于多年京东业务场景实践,京东云自研的混合多云智能运维平台,通过接入AI大模型能力,提供从移动App、网页H5应用、小程序,到网关、后端服务和中间件的全链路监控服务,具备分布式的应用性能分析与故障自检告警能力,通过将专家语料库和AI大模型算法融合生成式故障诊断方案,在复杂的业务架构下也能实时掌握全栈性能情况,快速定位故障,提高故障恢复速度。
在京东内部场景,智能运维平台服务端已接入了数千个后端应用, 帮助开发运维人员实时发现服务运行过程中的问题,定位根因,并快速解决,实现1分钟发现,5分钟定位,10分钟解决,提升服务稳定性。
四大领先优势,让运维工作更简单、更高效
历经多年京东内部场景打磨,智能运维平台构建了四大领先优势能力。
在全链路追踪方面,涵盖了移动端、前端、服务端性能监控,将三端链路自动串联分析,可观测每一次服务调用链路及性能指标,实现端到端的性能监控和问题定位。
在智能告警方面,根据不同应用灵活配置不同指标的基线和阈值,提供多种渠道的告警收敛与告警合并等能力。
在智能容量预估方面,无需线上压测,可根据线上生产数据科学拟合出容量水位数据,提供扩缩容建议。
在零代码侵入方面,基于java字节码增强技术,无需修改业务代码开箱即用,同时根据调用情况汇聚调用关系,立体化展示调用拓扑及每个节点的实时性能。
除了服务于京东内部场景,京东云混合多云智能运维平台也广泛服务于外部众多客户。
某农商银行在京东云金融级 PaaS平台支持下,实现技术架构转型,支持互联网信贷、交易银行业务快速发展。其中,京东云混合多云智能运维平台以极简的接入体验,秒级监控功能和海量的处理能力,轻松保障了行内应用的稳定调用。
面向未来,京东云混合多云智能运维平台将持续打磨AI能力,在AI智能故障报警、AI智能故障分析、AI智能故障处理,AI故障处理建议等方面继续深耕,提供更加简单、高效的运维服务。