所内动态
神威筛星辰:突破万亿级虚拟筛选瓶颈
导读 ⭐
Introduction
如何具象化一个天文量级的数字?银河系中约 4000 亿颗恒星,便是最直观的参照。当 “亿” 成为计量基准,人类得以触摸宇宙尺度的宏大。SWDOCKP² 计算框架与“神威”超级计算机深度耦合,实现了虚拟筛选性能的量级式跃升 — 其筛选规模从早期的十万、百万、千万级别,跨越至宇宙尺度,日筛 1.9万亿配体,这一数值相当于 5 个银河系的恒星总量!
北京生命科学研究所/清华大学生物医学交叉研究院黄牛课题组联合山东大学、清华大学和国家超级计算无锡中心协同攻关,成功构建新一代性能可移植虚拟筛选框架 SWDOCKP²,在国产最新一代“神威”超级计算机“神威·海洋之光”上,实现每日 1.9 万亿个蛋白质–配体分子对接的理论计算速度,将基于结构的虚拟筛选能力推向接近整个人类蛋白质组的覆盖规模。相关研究成果已在高性能计算领域顶级学术会议——第 37 届超级计算国际会议(SC25: The International Conference for High Performance Computing, Networking, Storage and Analysis)上报告,并获得广泛关注。
新药研发痛点:超大规模虚拟筛选的计算困境
现代小分子药物研发流程复杂,需历经靶点发现与验证、先导化合物发现与优化、临床前研究及多阶段临床试验等关键环节。整个研发周期长达十余年,投入动辄数十亿美元。随着结构生物学与计算科学的飞速发展,结合“计算机预筛”与“湿实验验证” 的基于结构药物分子设计与虚拟筛选技术,已开始成为创新药物研发的核心工具。
与此同时,“按需合成”(make-on-demand)虚拟化合物库规模呈爆发式增长,从十年前的百万规模飙升至十亿甚至百亿级别 — 这既极大拓展了可探索的化学空间,也带来了前所未有的计算压力。据去年发表的文章估算【Mol Inform. 2024; 43(1): e202300207】,在现有主流软硬件条件下,即便是国际先进的虚拟筛选平台,对370亿规模的小分子化合物库进行对接筛选,也需依赖大规模高性能计算集群持续运行数周,计算与存储资源消耗巨大,折算成本高达数千万元人民币,仅能被极少数具备顶级算力与充足经费的机构所采用。这一现状已成为制约大规模虚拟筛选广泛应用的瓶颈。
SWDOCK:为“神威”定制的虚拟筛选引擎
面对超大规模虚拟筛选的技术难题,联合团队主动攻坚:充分发挥超级计算机的极致并行能力,采用基于物理原理的 “暴力筛选” 策略,正面突破计算瓶颈。团队以虚拟筛选经典软件 UCSF DOCK3.7 为基础,针对 “神威” 超级计算机架构进行深度移植、重构与优化,开发全新虚拟筛选软件 SWDOCK,能够在合理的时间内高效处理数十亿乃至上百亿小分子,加速先导化合物发现流程。该成果于 2022 年在高性能计算领域顶级期刊《IEEE Transactions on Parallel and Distributed Systems》(TPDS)发表。实测数据显示,基于 SW26010 的单核组,相较于 Intel Core i9-10900K CPU 单核,实现了 13 倍加速比。借助 “神威・海洋之光”15% 的算力(98,304 个核组、16,384 个节点),SWDOCK 仅用 663 秒便完成 5.4 亿配体分子的虚拟筛选,理论对接速度达每日 700 亿配体,跻身国际同类工作领先水平。
SWDOCKP²:多维度创新,突破万亿级筛选瓶颈
尽管 SWDOCK 已实现重大突破,但人类蛋白质组规模的虚拟筛选仍存在亟待解决的难题。一方面,UniProt 与 PDB 等数据库已收录超过 2 万个人体蛋白质的序列和结构信息,AlphaFold 等工具进一步拓展了蛋白质结构资源;而另一方面,化合物库规模指数级增长。而据Pharos 平台统计显示,仅 3.4% 的人类蛋白靶点拥有获批小分子药物,大量潜在治疗靶点亟待挖掘。
为此,联合团队持续攻关,推出虚拟筛选软件升级版本 SWDOCKP²。2025 年 11 月,在美国圣路易斯召开的 SC25 会议上,团队以论文《Trillion Ligands per Day: Performance-Portable Virtual Screening via Compound Database Optimization and Multi-Target Docking》作专题报告,系统介绍性能可移植的跨平台虚拟筛选框架SWDOCKP²。该框架可调度“神威·海洋之光”超算 3,900 万个计算核心,同时对接 8 个蛋白质靶标结构,实现每日 1.9 万亿个蛋白质–配体对的理论筛选速度,较此前领先水平提升一个数量级。
通过整合小分子预采样构象系综数据库、高性能优化的 SWDOCK 与 SWDOCKP² 软件,以及 “神威・海洋之光” 的庞大算力,联合团队不仅实现了筛选性能的跨越式提升,更具备了构建规模高达 10¹³ 个蛋白质——配体复合物预测构象数据集的能力 — 该数据集将成为同类公开资源中规模最大的数据库。基于此数据集训练的人工智能模型,有望突破药物研发中数据稀缺的核心瓶颈,推动 AI 驱动的配体预测、结构生成等前沿应用发展。
SWDOCKP² 核心创新集中在三大维度:
1. 多靶标并行:能量网格融合结合三线性 SIMD 插值算法优化
针对蛋白质组规模筛选中 “多同源蛋白、多功能构象” 的并行对接需求,SWDOCKP² 创新提出 “多靶标并行处理 ” 策略。通过“能量打分网格对齐融合”即将多个受体的能量打分网格在空间上对齐,融合为 “4D 网格”,深度挖掘 SIMD 并行能力,大幅提升数据局部性与 DMA 通信效率。相较于逐个靶点独立对接,该方案显著降低 I/O 与构象匹配的计算开销,同时严格保持对接结果一致性;优化三线性 SIMD 插值算法,在保障精度的前提下进一步提升计算效率,目前已支持最多 8 个受体结构或构象的同步对接。
2. 构象系综重构使能“早淘汰” 机制
在配体小分子侧,团队对化合物构象系综数据库进行精细化重构。通过对构象基础单元(confs)的排序与归并,将对接打分阶段的迭代量降低近一半。同时,引入 “早淘汰” 机制,在对接过程中实时识别并剔除存在明显空间冲突的高能量构象,避免无意义的高开销冗余计算;提出构象打分缓存方案,将高频访问的 confs 打分预存于本地设备存储器(LDM),进一步加速对接流程。受体与配体双重优化,有效压缩冗余计算并提升计算效率,为万亿级筛选奠定坚实基础。
3. 跨平台兼容:从神威走向通用 CPU
SWDOCK 最初专为神威异构架构深度优化,但药物设计与计算化学领域大量研究依赖通用对称多处理器(SMP)平台(如 x86 服务器)。为打破平台壁垒,团队在 SWDOCKP² 中引入基于 OpenMP 的 AthreadS 兼容层。通过 pthread 启动CPE 集群线程,其上运行 OpenMP 线程模拟 CPE ;利用线程栈与线程本地存储模拟 LDM,以编译器内置数据复制函数替代 DMA 指令,在通用处理器上模拟神威平台的编程模式。该设计使得针对神威架构优化的应用可快速移植至通用 CPU 平台,大幅提升代码性能可移植性,为开源学术社区贡献核心技术支撑。
团队与合作:交叉融合驱动创新
本研究由山东大学软件学院段晓辉研究员、清华大学计算机系/北京生命科学研究所联合培养博士后沈成、北京生命科学研究所/清华大学生物医学交叉研究院博士生陈高伟共同作为第一作者。段晓辉研究员、清华大学杨广文教授、山东大学刘卫国教授以及北京生命科学研究所/清华大学生物医学交叉研究院黄牛研究员为共同通讯作者,团队还包括多位高校学者、博士后及研究生。项目获北京市科委、清华大学、山东大学和国家超级计算无锡中心联合资助。
2025年,相关工作已由段晓辉研究员在中国计算机学会全国高性能计算学术大会(CCF HPC China 2025)作大会特邀报告,并入围“CCF HPC China 2025 超算年度最佳应用”;由沈成博士在SC25会议、“探索计算化学、生物物理与生物科学的前沿交叉”研讨会以及第三届高性能计算青年论坛暨科学智能大模型研讨会上作报告。历次报告均收获与会专家的热烈讨论与高度认可。
值得关注的是,国家超级计算无锡中心已初步向国内外科研学术机构及药物研发企业开放以SWDOCKP² 虚拟筛选为核心的药物发现计算平台,旨在打破算力资源与技术壁垒,汇聚全球创新力量,加速潜在治疗靶点的挖掘与先导化合物的筛选进程,助力攻克各类疑难疾病,推动全球创新药物研发进入高效、普惠的新阶段,为人类健康事业贡献中国智慧与技术力量。
参考文献
/references/
(1) Xu, K.; Zhang, J.; Duan, X.; Wan, X.; Huang, N.; Schmidt, B.; Liu, W.; Yang, G. Redesigning and Optimizing UCSF DOCK3.7 on Sunway TaihuLight. IEEE Transactions on Parallel and Distributed Systems 2022, 33 (12), 4458–4471. https://doi.org/10.1109/TPDS.2022.3194916.
(2) Duan, X.; Shen, C.; Chen, G.; Wu, S.; Wang, Y.; Chen, Y.; Chang, Q.; Xia, Q.; Yin, Z.; Gan, L.; Shan, Y.; Yang, G.; Liu, W.; Huang, N. Trillion Ligands per Day: Performance-Portable Virtual Screening via Compound Database Optimization and Multi-Target Docking. In Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis; ACM: St. Louis MO USA, 2025; pp 2172–2185. https://doi.org/10.1145/3712285.3759833.
论文链接
https://dl.acm.org/doi/10.1145/3712285.3759833



