我国AI药物筛选获重大突破：千亿级分子库实现秒级检索-快科技-科技改变生活

快科技5月25日消息，据媒体报道，国家超级计算天津中心首席科学家孟祥飞与清华大学智能产业研究院兰艳艳教授共同领衔的AI生物医药团队，正式发布了面向超大规模药物发现的人工智能虚拟筛选平台——GalaxyVS。

该平台依托新一代天河超算系统，在全球范围内首次实现了对近千亿级可合成化合物空间的秒级虚拟筛选，将传统需数月甚至数年的药物早期筛选过程压缩至数十秒。

长期以来，创新药物研发面临“双十”困境——耗时超十年、投入超十亿美元。其中，从海量化合物中筛选出能靶向特定蛋白的活性分子尤为关键。

传统实验筛选成本高、周期长，常规分子对接方法计算效率有限且假阳性率较高。随着可合成化合物库迈入千亿乃至万亿级规模，现有虚拟筛选技术在算法、算力、存储和工程化能力上均面临严峻挑战。

项目团队核心成员、国家超级计算天津中心李培顺博士介绍，GalaxyVS以清华大学智能产业研究院团队前期发表于《科学》杂志的DrugCLIP模型为基础，将蛋白口袋与小分子映射到统一向量空间，把传统依赖逐一对接的蛋白—配体匹配问题，转化为可大规模并行执行的高维向量快速检索问题，从而从根本突破了传统分子对接在速度和规模上的限制。

在算力层面，GalaxyVS充分发挥了新一代天河超算的大规模并行能力。团队基于YH-Torch智能计算框架，对DrugCLIP模型进行国产异构算力适配与深度优化，替换传统CUDA/GPU依赖，使近千亿级分子编码从算法设想真正落地为可稳定运行的超算工程。

在检索环节，系统引入磁盘原生图索引框架，并结合定制化内存预加载机制，有效解耦共享存储瓶颈与计算执行过程，为超大规模虚拟筛选提供了关键吞吐能力。

实测数据显示，系统利用千级DSP节点完成全模式生物物种约400万个靶点口袋的高效编码，并在2万多个计算节点上开展超大规模分子检索。

单次检索千亿分子库可在数十秒内完成，平均单个靶点口袋检索用时不到1秒。系统日吞吐量约达16万亿次分子对接，比当前国际最先进的超算纪录高出六个数量级。

未来，GalaxyVS有望进一步拓展至跨物种蛋白—配体互作图谱构建、大规模开放数据集建设以及AI驱动药物发现基础设施构建，推动药物研发从经验试错走向数据驱动、从局部筛选走向全局探索、从单一模型走向系统工程。

相关报道

最热文章排行查看排行详情

邮件订阅

分享到