Video Player is loading.
Current Time 0:00
Duration 20:59
Loaded: 0%
Stream Type LIVE
Remaining Time 20:59
 
1x
    • Chapters
    • descriptions off, selected
    • subtitles off, selected
    • default, selected

    NVIDIA 面向大语言模型的全栈 AI 解决方案

    , 解决方案架构与工程总监, NVIDIA
    本演讲将深入探讨如何创建为大语言模型(LLM)设计的稳定、健壮且高效的数据中心架构。我们将利用 NVIDIA LLM 训练框架、Transformer Engine 上的 FP8 训练以及多精度训练(MPT)的能力,揭开 NVIDIA 针对 LLM 的全栈软件和硬件整体流水线的神秘面纱。此外,我们还将讨论 NVIDIA 训练和推理解决方案的最佳实践,包括 NVIDIA TensorRT、TensorRT-LLM、Triton Inference Server 等,所有这些都是 NVIDIA AI Enterprise 套件的 AI 组件。这些内容将让您全面了解如何在 NVIDIA 加速的基础设施中优化 LLM 性能。
    活动: GTC 24
    日期: March 2024
    行业: 所有行业
    NVIDIA 技术: Base Command,BlueField DPU,Cloud / Data Center GPU,Ethernet Networking,Grace CPU,Hopper
    级别: 初级技术
    NVIDIA 技术: Infiniband Networking,NeMo,NVLink / NVSwitch,TensorRT,Triton
    话题: Large Language Models (LLMs)
    语言: 简体中文
    所在地: