什么是多智能体系统?

多智能体系统(也称为智能体团队)是一组协同工作以解决复杂问题的专业 AI 智能体的集合。每个智能体在执行不同任务时都扮演着特定角色,共同致力于实现一个共同目标。

多智能体系统如何工作?

代理式 AIAI 的下一个进化阶段,引入了规划、推理、上下文记忆等关键特性,并能够使用工具来自主促进复杂工作流程,只需最少的人工输入。这种也被称为 AI 智能体的技术依靠高级推理能力来成功应对复杂的商业场景。

多智能体系统通过让多个 AI 智能体协作来实现共同目标。每个 AI 智能体都具有一定程度的自主性、专门的能力和对系统的局部视图。更值得注意的是,这些系统专门设计用于处理复杂任务,同时平衡多个依赖关系。

 

用户输入请求时 AI 智能体团队如何运作。

自主智能体操作可以集成到涉及人工接触点、决策树和并行工作流的相互交织的工作流中。

例如,在端到端软件开发中,开发者、技术支持和技术文档撰写人员必须在满足服务级别协议 (SLA) 的同时,支持客户解决生产级应用相关的问题和请求。为了最大限度地提高生产力,可以设计一个智能体团队来:

  • 使用自然语言处理技术来回应漏洞报告请求,并向用户提出澄清性问题,以减少审查大量漏洞所需投入的资源
  • 通过相似性匹配引用和分析过去的漏洞,并自动生成一个新的漏洞工单供人工审核,以简化优先级分配的流程
  • 通过生成代码建议、协调代码审查和重现测试用例来提供工程协助,供人工验证和集成

多智能体系统可以通过添加 AI 护栏来防止意外结果。这与现代工作场所中开发团队的典型运作方式非常相似。

💡要点:多智能体系统通过执行高阶规划、推理和编排来工作。AI 智能体团队进行自然语言对话,处理复杂任务,并支持人类团队进行决策制定和完成任务。

使用多智能体系统有什么好处?

虽然单个 AI 智能体能够执行众多不同任务,但通过交流信息并采取适当行动以达成共同目标,AI 智能体团队所能取得的成果要大得多。

如漏洞管理示例所示,多智能体系统对以下类型的组织影响最大:

  • 面临高要求、不断增长的工作负载,如管理端到端软件工作流程、提供全球电信运营客户服务和管理患者医疗健康
  • 面临快速变化的环境,如金融服务、零售分销和供应链中的市场波动
  • 必须监控和分配控制智能,如自动驾驶汽车安全和智慧城市中的智能交通系统
  • 需要基本容错能力,如协调灾难响应和管理电力供应网络

通过利用多个 AI 智能体的综合知识和决策制定能力,组织可以更有效地解决复杂问题,同时保持准确性和安全性。这对于必须解决对传统集中式系统来说过于复杂的问题的组织来说尤其如此。

💡要点:多智能体系统由许多针对专门或特定任务定制的智能体组成,从而带来更高的整体效率和性能。这些 AI 智能体还可以定制和微调以适应不断变化的需求。多智能体系统具有可扩展性和透明性,因为系统不需要完全改造或重新训练—可以替换或更新单个智能体。

AI 智能体编排在多智能体系统中的作用是什么?

AI 智能体编排是使通常独立运行的多个智能体或工具能够协同工作以实现共同目标的过程。这种协调有利于多智能体系统高效管理和执行更复杂的任务。

编排 AI 智能体团队有几种方式:

编排类型 说明 优势 挑战 用例示例

集中式

单一监督者智能体协调任务、数据流和决策制定。

控制清晰

管理简化

决策一致

可能出现瓶颈

对动态系统适应性较差

客户关系管理 (CRM)

去中心化

每个智能体自主运行,与其他智能体共享信息。

高度灵活性

适应动态环境

需要复杂的通信协议

复杂度较高

无人机蜂群用于实时送货

联合式

多个智能体系统使用共享协议跨企业组织进行协作。

促进跨系统协作

利用系统优势

高度依赖互操作性和共享标准

企业间的供应链协作

分层式

分层结构中的高级别智能体对低级别智能体进行监督。

平衡灵活性和监督

适合复杂系统

跨层协调可能复杂

可能存在依赖延迟

采用分层控制的工业自动化

可以将编排视为多智能体系统控制框架。编排为在多智能体系统中实现可扩展性、高效率和适应性奠定了基础。通过让多个智能体高效协作并共享资源,编排可为以下方面提供支持:

  • 动态解决问题:根据不断变化的条件或意外挑战做出调整
  • 改善资源利用:优化智能体访问和使用工具与数据的方式
  • 增强系统可靠性:减少冲突并确保一致的结果
  • 系统访问控制:限制智能体可以执行的操作以减少错误和滥用风险
  • 保护信息:确保只有授权的智能体和用户才能访问或处理敏感数据

智能体编排对物流、自主系统、网络安全和企业自动化等行业至关重要,在这些行业中,无缝的多智能体协作是成功的关键。

构建多智能体系统的建议有哪些?

在设计多智能体系统时,遥测、日志记录和评估等因素对提高响应准确性和改善业务成果至关重要。

  • 互操作性和智能体通信,使智能体可以使用最适合任务的智能体框架编写,但仍能作为团队协同工作
  • 监控和性能优化,包括系统配置以微调实时数据收集和处理,以及用于报告系统健康指标的遥测
  • 用于调试、可追溯性和审计的评估和可观察性

AI 智能体框架为专用开发平台或库,旨在简化 AI 智能体的构建、部署和管理流程。为了补充流行的智能体框架,NVIDIA 的 AI 软件解决方案是开源的。

通过抽象创建代理式 AI 系统的复杂性,开发者可以专注于微调其应用和更新智能体行为。减少在技术实施上花费的时间,使开发者能够专注于满足业务需求的改进。

代理式 RAG 如何增强您的多智能体系统?

数据驱动现代企业应用,但数据的规模和数量使其使用变得过于昂贵和耗时。因此,大多数生成式 AI 应用利用的数据集相对于存储和生成的专有知识量来说较小。

要在 AI 时代蓬勃发展,工作团队必须与企业知识相连接,这需要使用大量数据。这一点无法依靠传统的计算和数据处理技术来实现。

每个企业都需要代理式检索增强生成 (RAG)。实施代理式 RAG 可以将智能体团队连接到企业知识。能够感知、推理和行动的多智能体系统将把这些知识转化为解决问题的行动。

为了让 AI 智能体能够访问大量不同的数据,它们需要一个加速的 AI 查询引擎,该引擎可以高效处理、存储和检索数据以增强生成式 AI 模型输入。RAG 现在已经普遍使用。

与仅揭示作者身份和时间戳等表面细节的传统元数据分析不同,AI 可以摄取和解释数据的完整内容。这使得能够更深入地理解信息本身的上下文、含义和模式。

代理式 RAG 功能 

代理式 RAG 必须能够:

  1. 访问跨结构化、半结构化和非结构化数据及元数据源的知识,包括文本、PDF、图像、视频和专业数据类型
  2. 高效处理 PB 级规模,使所有知识能够快速用于生成的 AI 赋能的应用和智能体
  3. 提供高准确度、高性能的多源知识检索和重新排序,以高效增强生成式 AI 模型的输入
  4. 存储和利用生产中 AI 赋能的应用和智能体的学习成果,自动增加企业知识并创建 AI 数据飞轮

如何开始使用代理式 AI?

开放源代码和专有智能体框架在构建主动式工作流时很有帮助,但它们可能无法无缝协作。NVIDIA AgentIQ 是一个开放源代码库,用于连接、评估和加速复杂的代理式 AI 系统。它包括技术基础模组,可以简化全栈、企业级代理式系统的开发和测量,这些系统通过一系列可重用工具将 AI 连接到数据。

NVIDIA AI Blueprint 为开发针对特定用例的智能体提供了起点(包括 RAG)。这些 blueprint 包含示例应用、参考代码、示例数据、工具和文档。企业可以使用这些 blueprint 构建和运营自定义 AI 应用,创建数据驱动的 AI 飞轮。

NVIDIA AI Enterprise 帮助您构建代理式系统的组件包括:

  • NVIDIA NeMo™一组微服务,帮助代理式 AI 开发者轻松大规模策划数据、使用流行的微调技术定制智能体、在标准和自定义基准上评估它们,并为适当和有根据的输出提供防护措施。
  • NVIDIA NeMo Retriever : 用于数据摄取、提取、嵌入、检索和重新排序的微服务集合,将自定义模型连接到各种业务数据并提供高度准确的响应。NeMo Retriever 嵌入模型在检索准确性方面在 MTEB 排行榜上多次获胜。
  • NVIDIA NIM™ : 一组针对领先开源生成式 AI 模型优化的推理微服务,开箱即可提供高达 3 倍的效率改进。

后续步骤

探索 NVIDIA AI 基础模组,用于 AI 智能体

开始构建 AI 智能体,借助 NVIDIA NeMo 打造自定义生成式 AI,利用 NVIDIA NIM 快速完成企业就绪部署,并借助 NVIDIA Blueprint 通过可自定义参考工作流来加速开发。

探索 NVIDIA 全新 AI-Q Blueprint 以连接 AI 智能体

了解如何使用 "AI-Q"(一款 NVIDIA Blueprint)来构建、优化和加速协同工作的 AI 智能体团队,使用世界级检索技术解锁企业知识。

注册参加 NVIDIA AgentIQ 开发者竞赛

加入来自全球的开发者,使用 NVIDIA AgentIQ 连接 AI 智能体团队并构建和评估代理式 AI 系统。参赛即有机会赢取由 NVIDIA CEO 黄仁勋签名的 NVIDIA DGX™ Spark 超级计算机。