AI 助力的端到端药物研发工作流。
BioNeMo 是一款基于 NVIDIA NeMo Megatron 构建的 AI 赋能药物研发云服务和框架,用于在超级计算规模下训练和部署大型生物分子 Transformer AI 模型。服务包括预训练 LLM、对蛋白质、DNA、RNA 和化学的通用文件格式的原生支持,还提供可供 SMILES(用于分子结构)和 FASTA(用于氨基酸和核苷酸序列)使用的数据加载器。BioNeMo 框架也可供下载,以便您可以在自己的基础架构上运行。
NeMo LLM
BioNeMo 附带大量预训练 LLM。MegaMolBART 是一种使用 14 亿个分子(SMILES 字符串)进行训练的生成化学模型,可用于多种化学信息学应用。
ProtT5 和 ESM1-85M 是基于 Transformer 的蛋白质语言模型,可用于为蛋白质结构和属性预测等任务生成已学习的嵌入。
BioNeMo 服务中将提供 OpenFold,这是一种用于预测新型蛋白质序列 3D 结构的深度学习模型。
BioNeMo 允许开发者使用数十万亿参数来部署 LLM。当今的蛋白质语言模型包含数十亿个参数,这些参数需要超级计算基础架构在广阔的化学空间上进行推理。云端动态资源扩展使 LLM 推理工作流能够自动扩展,从而满足计算需求。
借助 BioNeMo,您可以开始为 UniRef50 和 ZINC 数据库轻松使用预训练模型、自动下载器和预处理器。借助无监督式结构化学习者,各种模型、嵌入和输出得以结合,将多模态数据组合在一起。无监督式预训练还消除了对已标记数据的需求,从而快速生成已学习的嵌入,预测蛋白质结构、功能、细胞位置、水溶性、膜结合性、保存区域和可变区域等。
注册以抢先体验 BioNeMo 服务