NVIDIA Clara™ Discovery 集 GPU 加速及优化的框架、工具、应用和预训练模型于一体,用于计算药物研发。Clara Discovery 专为支持跨学科工作流而构建,可帮助科学家和研究人员更快地将药物投放市场,并为疾病机制研究提供新的可能性。
GPU 助力的深度学习算法和 Transformer 模型将加速药物研发的每个阶段。从训练能够理解化学空间的大型语言模型 (LLM),到分子动力学模拟、蛋白质结构预测以及生成药物设计,新型深度学习技术正在改变科学家探索不断扩展的化学领域的方式。
Credit: Mahendra awale, CC BY-SA 3.0 https://creativecommons.org/licenses/by-sa/3.0 , via Wikimedia Commons
在 GTC 大会上,我们宣布推出 BioNemo,这是一款基于 NVIDIA NeMo Megatron 构建的应用框架和云服务,用于在超级计算规模下训练和部署大型生物分子 Transformer AI 模型。BioNeMo 随附预训练的大型语言模型,专为蛋白质、DNA 和简化分子线性输入规范 (SMILES) 的语言而设计。
MegaMoIBART 是大型化学语言模型的训练框架,能够以高有效性和独特性实现 AI 超级计算规模的分子生成。
药物研发涵盖许多工作流,包括探索化学领域、预测蛋白质结构、扫描候选药物以及模拟分子。借助 NVIDIA NGC™ 目录中提供的功能强大的 Clara Discovery 工具,推动在这些领域取得突破。
基于 Transformer 的大型语言模型正在为实时探索化学领域创造新的可能性。BioNeMo 是一种特定领域的框架,用于在超级计算规模下训练和部署基于 NeMo Megatron 的生物分子 LLM。该框架包含 Transformer 模型 MegaMolBART、ESM-1b 和 ProtT5。
MegaMolBART 是一种基于 14 亿个分子(SMILES 字符串)训练的生成式化学模型,可用于药物研发中的各种化学信息学应用,例如反应预测、分子优化和小分子的重新生成。
ProtT5 和 ESM-1b 表明,无监督式预训练可用于生成包含属性的习得嵌入,以预测蛋白质结构、功能、细胞位置、水溶性、膜结合性、保守区和可变区等。
RELION 等基于深度学习的方法将推动实现低温电子显微镜 (Cryo-EM) 的高吞吐量自动化,以便测定蛋白质结构。RELION 采用经验贝叶斯方法进行低温电子显微镜分析,以优化一个或多个 3D 重建及 2D 类别平均值。
为理解蛋白质结构的原子细节,可以使用 MELD 等工具通过稀疏数据、模糊数据或噪声数据来推理结构。MELD 利用基于物理性质的贝叶斯框架中的数据来改善蛋白质结构的测定。
图片来源:Rommie Amaro 与加利福尼亚大学圣迭戈分校
通过 AI 和加速计算,可针对刚性蛋白质靶标对数百万种候选药物进行筛选。AutoDock 是一系列不断增长的用于计算对接和虚拟筛选的方法,用于基于结构的药物研发和对生物分子结构基本机制的探索。
GPU 助力的分子动力学框架可以模拟细胞的基本机制,计算候选药物与其预期蛋白质靶标的结合强度。机器学习势表明有望实现量子力级的精度、能量和力量,将从根本上改变分子模拟。
Clara Discovery 包含用于分子模拟的各种工具和框架,包括 GROMACS、NAMD、Tinker-HP、VMD、TorchANI 和 DeePMD-Kit。
Clara Discovery 经过优化,可基于 NVIDIA DGX™ A100(非常先进的 AI 系统,可提供 5 petaFLOPS 的性能)运行。DGX A100 专为各种大规模加速计算工作负载而打造,可帮助研究人员更快地解决问题,并为 IT 提供统一的、易于部署的基础设施,以支持新一代药物研发。
查看 HPC 应用性能
访问制药 POD 白皮书
了解 Schrodinger 的高级计算平台
CPU 与 GPU 的对比:NVIDIA Clara Parabricks、Relion、Autodock-GPU、NVIDIA RAPIDS、Amber、NAMD、VMD、Gromacs、NVIDIA Clara Imaging、BERT Training