能源

壳牌利用 NVIDIA NeMo 训练定制 AI 聊天机器人,实现运营水平的全面提升

目标

壳牌国际勘探与生产公司 (壳牌) 是能源行业的全球领导者,该公司利用 NVIDIA NeMo™ 赋能,开发具有化学领域专业知识的定制 AI 聊天机器人。这一创新解决方案能够简化搜索流程、改进决策制定以及支持生产环境中的研发,从而有潜力显著提升员工的生产力。

客户

壳牌

用例

生成式 AI/LLM

驾驭特定领域语境

壳牌管理着大量复杂的科学数据,这些数据构成了业务运营的基础。快速获取准确的信息对于壳牌的研发部门来说至关重要。

除了数据管理,该公司还致力于增强技术人员的日常活动和决策制定,确保团队能够高效获取正确信息,从而提升生产力和运营效率。

为实现这一目标,壳牌利用 NVIDIA AI 开发了能够理解壳牌内部研究的定制模型,最初侧重于化学领域,同时提供精确、上下文感知的响应。

Shell

关键要点

  • 壳牌的定制 LLM 经 NVIDIA NeMo 训练后,在定制基准测试中的准确性比未调优的基础模型提高了 30%。
  • 与其他开源框架相比,壳牌利用 NeMo 的并行技术将 AI 模型训练时间缩短了 20%。
  • 壳牌有意探索该系统的多模态功能,使其 AI 聊天机器人实现与图像和视频的交互。

利用 NVIDIA NeMo 从企业数据中整理和训练定制 LLM

为了提高针对能源行业定制的领域特定 LLM 的准确性,壳牌专注于整理高质量的训练数据作为其 AI 解决方案的基础。开发过程始于对大量化学文档数据集的整理和预处理。最初,壳牌可以访问数十年来收集的 30 万份技术文档。这些文档涵盖各个技术领域,并使用 NVIDIA NeMo Curator 整理出 154,000 份高质量文档。

整理过程涉及多个步骤,包括精准和模糊去重,以删除重复或近似重复的内容。壳牌还应用了质量筛选,删除信息不足或格式不佳的文档,并使用了语言检测来排除非英语内容。此外,还使用了领域分类来选择用于构建领域特定基准的文档。

对数据集整理完毕后,壳牌没有止步于检索增强生成 (RAG),而是使用 NVIDIA NeMo 框架执行领域自适应预训练 (DAPT) 和监督式微调 (SFT),以增强模型的领域特定知识和准确性。DAPT 使模型能够真正理解化学行业的独特背景和术语。同时,SFT 根据符合壳牌需求的标记数据对模型进行训练,进一步优化了模型的性能。与其他开源框架相比,壳牌利用 NeMo 提供的并行技术,将模型训练时间 (数百万 GPU 小时) 缩短了 20%。

利用领域自适应的 AI 转变企业工作流以提升生产力

从企业知识源中检索准确信息对于 RAG 来说可能是一个挑战,因为标准语言模型经常会误解用户查询,将其匹配到广泛的通用信息,而不是领域特定的见解。调整 LLM 以使其适应行业特定的语言有助于弥合这一差距,并提高答案的准确性和对话质量。这种对精确性的需求促使壳牌开发了市场产品中不具备的用于定制 LLM 的内部功能,促成了该公司与 NVIDIA 的合作。

借助壳牌开发的 AI 赋能聊天机器人,技术人员可以快速访问详细的化学文档和数据,从而减少完成这些任务所需的时间并降低出错风险。通过简化知识检索,AI 聊天机器人可以增强在研发领域的洞察获取和决策能力,从而支持创新并保障运营效率。

除了增强的信息检索,定制 LLM 还可用于技术文档分析,帮助简化跨部门的工作流。

壳牌通过现实世界中的交互不断优化模型,将其 AI 生态系统定位为一个自适应智能层,使企业知识管理转变为动态且可访问的资源。

以成功为基础:壳牌 AI 聊天机器人未来的增强功能

展望未来,壳牌计划通过扩展训练数据集并开发更具多样性和挑战性的评估任务,进一步提升领域自适应的 LLM 的能力。除了增强文本到文本模型外,目标是释放 AI 聊天机器人的多模态能力。这将使聊天机器人能够处理各类数据,包括图像和视频。

增加多模态功能预计将提供更全面、上下文更丰富的信息,这对于复杂的决策制定过程尤为重要。

预计这些增强功能将进一步提升生产力和运营效率,巩固壳牌利用领先市场的先进 AI 技术为其运营带来优势的承诺。

使用 NVIDIA NeMo 构建、定制和部署多模态生成式和代理式 AI 应用。