自主 AI 智能体

自主智能体是一种先进的 AI 系统,它基于一个目标进行推理、规划并执行多步骤任务。该系统内置安全、隐私和策略控制机制,使其在开发与部署过程中更加安全。

什么是 AI 智能体?

自主 AI 智能体是新型数字劳动力——既为我们服务,也与我们协作。它们代表了人工智能的下一次演进,从简单的自动化流程,过渡到能够在既定的安全和治理边界内,管理复杂工作流的自主系统。这些智能体不仅可以自动执行耗时的重复性任务,而且可以充当智能个人助手,帮助个人和企业组织提高运营效率。

与遵循简单“请求-响应”的传统生成式 AI 模型不同,自主智能体是由 AI 模型构成的系统,它能够协调并与其他智能体协作,同时利用各类工具,如大语言模型 (LLM)、检索增强生成 (RAG)、向量数据库、API、框架以及 Python 等高级编程语言。 

这些智能体依赖于安全的基础设施层,例如沙盒、身份控制机制和策略引擎,来管理工具访问权限并在工作过程中保护敏感数据——所有这一切都只需极少的人工输入,并在用户和企业的策略所设定的权限范围内自主运行。

例如,一个负责搭建网站的自主智能体,能够自主处理各项任务,如布局设计、编写 HTML 和 CSS 代码、连接后端进程、生成内容以及进行调试。

代理式 AI 工作流的工作原理

AI 智能体包含哪些组件?

要了解 AI 智能体的工作原理,分析其核心组件至关重要。这些组件协同工作,使智能体能够有效且安全地进行推理、规划和执行任务。

  • LLM:作为 AI 智能体的“大脑”,LLM 负责协调决策制定过程。LLM 通过任务进行推理、制定行动计划,选择合适的工具,并管理对必要数据的访问权限,从而实现目标。智能体核心是定义和协调其总体目标和目的的地方。在企业环境中,该核心在预设的护栏和政策约束下运作,以确保智能体的行为符合业务及安全要求。
  • 记忆模组:智能体依靠记忆来维护上下文,并可以根据正在进行的任务或历史任务进行调整。
  • 规划模组:利用规划模组,AI 智能体可将复杂任务分解为可操作的步骤。
    • 无反馈:使用“思维链”或“思维树”等结构化技术,将任务分解为可管理的步骤。
    • 有反馈:整合 ReAct、Reflexion 或人机回圈反馈等迭代改进方法,以优化策略和结果。
  • 工具:AI 智能体不仅可以作为工具本身,还可以通过与 API、数据库和 RAG 流水线等外部系统集成来扩展自身能力。
    • API:API:以编程方式访问实时数据或执行操作。
    • 数据库和 RAG 工作流:检索相关信息,确保知识库准确无误。
  • 模型系统:NVIDIA Nemotron开源模型和 NVIDIA COSMOS世界基础模型使开发者能够针对自身应用场景定制模型,而前沿模型在各种任务中都可提供先进的性能。这些模型协同工作,使得智能体能够实现高精确度、可控成本,并更好地管理数据安全与隐私。

AI 智能体的工作原理是什么?

自主式 AI 智能体能够无缝整合其核心组件,以处理复杂任务,同时严格遵守其运行环境所定义的安全、隐私及政策约束。下面的示例说明了这些组件如何协同工作,以响应特定用户请求。

提示词示例分析我们的最新季度销售数据,然后提供一个图表。

第 1 步用户或机器提出请求

用户,甚至是其他智能体或系统,通过请求对销售数据进行分析和可视化表示来启动智能体的工作流程。智能体处理此输入请求,并将其分解为可操作的步骤。在将请求分解为可执行的步骤时,智能体还会核查它们被允许访问的数据和工具。

 

第 2 步推理模型:解释任务

推理模型会评估现有数据和工具需求以进行理解,然后规划符合策略的操作,例如智能体可以查询或修改哪些系统。

部分步骤可能包括:

  • 提取:检索目标数据(例如,从数据库中提取销售数据)。
  • 分析:运用逻辑和算法,总结有意义的趋势。
  • 可视化:利用工具生成专业图表,以呈现最终的分析洞察。
  • 保护和执行:在每个步骤中都应用安全、隐私及治理规则,确保智能体仅针对授权数据执行经批准的操作。

 

第 3 步记忆模组:提供上下文

记忆模组确保保留上下文,以便高效执行任务。

  • 短期记忆:跟踪当前工作流的上下文(例如上个季度请求的类似任务),以简化流程。
  • 长期记忆:保留历史数据,如数据库位置或首选分析方法,以便更深入地理解上下文。

 

第 4 步工具集成:执行任务

智能体核心通过编排外部工具来完成每个步骤。

  • API:检索原始销售数据。
  • 机器学习算法:分析数据以了解趋势和模式。
  • 代码解译器:根据分析结果生成图表。

 

第 5 步推理和反思:改进结果

在整个过程中,智能体会运用推理来优化工作流并提高准确性。这包括:

  • 评估每项操作的有效性。
  • 确保高效利用工具和资源。
  • 从用户反馈中学习,以改进未来任务。

例如,如果生成的图表需要改进,智能体会调整方法,以便在后续工作流中提供更好的结果。

为什么推理至关重要

推理层是代理式 AI 的一个决定性特征,可帮助智能体思考如何实现目标。通过将 LLM 功能与 API、编排软件和上下文记忆等工具相结合,推理可助力智能体准确高效地应对复杂环境。由于具有这种适应性,AI 智能体成为一类至关重要的工具,可帮助自动执行和优化复杂工作流。

为什么护栏对于自主 AI 智能体至关重要

智能体能力越强,就越难获得信任。由于自主 AI 智能体运行时间长,且能访问在线和本地数据,因此需要强大的安全与隐私护栏。这些措施包括沙盒环境、策略引擎,以及用于网络和数据访问管理的隐私路由器,同时还包括在基础设施层面——而不仅仅是在智能体代码内部——执行策略。这些防护措施共同帮助组织安全地构建和部署用于生产环境的自主智能体。

AI 智能体框架有哪些不同类型?

AI 智能体可以直接使用 Python 编写,用于执行简单工作流和实验的智能体尤其如此。迁移到更复杂的工作流或生产环境时,遥测、日志记录和评估变得至关重要,此时智能体框架将发挥重大作用。AI 智能体框架为专用开发平台或库,简化 AI 智能体的构建、部署和管理流程。这些框架消除了构建智能体系统的过程中存在的大部分底层复杂问题,使开发者能够专注于特定的应用和智能体行为,而非实施的技术细节。

在选择 AI 智能体框架时,必须考虑诸多因素,例如:

  • 多智能体协作:项目是否需要多个智能体协同工作?
  • 项目复杂性:框架适合简单的任务还是复杂的工作流?
  • 数据处理:框架是否支持必要的数据集成和检索?
  • 定制需求:定制智能体行为需要多大的灵活性?
  • LLM 侧重点:框架是否会优先与大语言模型进行协作?

鉴于这些要求,一系列框架应运而生,可满足不同用例和复杂程度的需求。

有多种方法可用于实施 AI 智能体,例如,引入自己的 Python、LangChain 和 Llama 堆栈。这些框架可以利用 NVIDIA Nemotron 等开放模型,以及前沿模型来增强智能体的能力。

有哪些类型的 AI 智能体?

AI 智能体可以根据复杂程度、决策制定过程以及对环境的适应程度来分类。下面列出了主要的 AI 智能体类型,涵盖了简单的系统到高度智能化的自适应框架:

智能体的类型 主要特征 用例示例
简单反射型 根据当前感知和预定义规则执行操作
没有记忆或适应能力

恒温器根据传感器输入调节温度

基于模型的反射型 保留短期记忆或由规则指导的环境操作模型 导航系统根据交通状况更新路线
目标型 根据当前感知和预定义规则执行操作
没有记忆或适应能力
送货机器人优化前往目的地的路线
分层式 多层系统通过更高级别的智能体来管理专用智能体 工厂自动化系统与监督者和专业机器人协同工作
学习型 通过反馈和经验进行学习和调整
使用学习组件
AI 推荐系统随着时间推移而改进建议
多智能体系统 (MAS) 与其他智能体协作实现共同目标
在协调系统中运行
无人机队群协作投递包裹
效用型 通过最大限度地增加每次操作的效用或奖励来优化结果 动态定价算法根据市场条件调整费率

什么是 AI 智能体编排?

编排类型 说明 优势 挑战 用例示例
集中式 单一监督者智能体协调任务、数据流和决策制定 控制逻辑清晰
简化管理
一致决策
潜在瓶颈
对动态系统的适应性较差
客户关系管理 (CRM)
去中心化 每个智能体自主运行,与其他智能体共享信息 高度灵活
可适应动态环境
需要复杂的通信协议
复杂程度更高
无人机蜂群用于实时送货
联合式 多个智能体系统使用共享协议跨企业组织进行协作 便于跨系统协作
充分利用系统优势
高度依赖互操作性和共享标准 企业间的供应链协作
分层式 分层结构中的高级别智能体对低级别智能体进行监督 兼顾灵活性与监督能力
复杂系统的理想选择
跨层协调可能较为复杂
可能存在依赖性延迟
采用分层控制的工业自动化

AI 智能体编排指以下过程:使通常独立运行的多个智能体或工具协同工作以实现共同目标。这种协调有利于系统高效管理和执行更复杂的任务。

可以将编排视为多智能体系统控制框架。编排为在多智能体系统中实现可扩展性、高效率和适应性奠定了基础。通过让多个智能体高效协作并共享资源,编排可为以下方面提供支持:

  • 动态解决问题:根据不断变化的条件或意外挑战做出调整。
  • 提高资源利用率:优化智能体访问和使用工具以及数据的方式。
  • 增强系统可靠性:减少冲突,确保结果一致。

由于具有这些优势,编排对物流、自主系统、网络安全和企业自动化等行业至关重要。在这些行业,无缝多智能体协作是成功的关键要素。

AI 智能体与 AI 助手有什么区别?

特性 AI 助手 AI 智能体
目的 根据用户命令简化任务 自主完成复杂的多步骤目标驱动型任务
任务复杂程度 低到中 中到高
交互性 反应式 主动式
自主性 低:
依赖人工指导
高:
独立
基于规划和推理
学习能力 低:
最小 (如果有)
高:
从交互中学习,随着时间推移进行调整
集成度 高:
但仅限于特定应用
广泛性:
包含 API、数据库和工具

AI 智能体和 AI 助手在功能、自主程度以及可处理任务的复杂程度上存在巨大差异。

AI 助手是传统 AI 聊天机器人的进化版本。它们利用自然语言处理 (NLP) 理解文本或语音形式的用户查询,然后根据直接人工指令执行任务。这些系统 (如 Apple 的 Siri、Amazon 的 Alexa 或 Google Assistant) 在处理预定义任务或响应特定命令方面表现出色。

AI 智能体是一种更先进的 AI,其功能远超 AI 助手。它们利用规划、推理和上下文记忆来自主处理复杂的开放式任务。AI 智能体可以执行迭代工作流,使用一系列工具,并根据反馈和之前的交互情况做出调整。

AI 智能体有哪些用例?

总的来说,AI 智能体的潜在用例不可胜数。部署 AI 智能体依赖想象力和专业知识,涵盖了生成和分发内容等简单用例,以及编排企业软件和数据库功能等复杂用例。

任务执行

任务执行智能体 (也可称为“API 智能体”或“执行智能体”) 可以使用一组预定义执行功能来完成用户请求的任务。

示例:“为我写一篇社交媒体帖子来推销我们的最新产品,务必提到它正在特价销售,现在推出了绿色款。”

构建您的首个用于创作数字内容的 AI 智能体

工作流优化

针对特定应用场景的 AI 智能体可以帮助人类优化工具的高效运用。例如,Co-Pilot 行车助理系统可帮助用户了解某款应用的所有功能,如何自动执行这些功能,或者为用户提出如何以最佳方式使用该工具的建议。

示例:利用智能体蜂群和 OODA 循环策略优化数据中心性能。

数据分析

数据分析可由用于提取和理解数据的多智能体系统执行。可以将数据分析视为一种“提取并执行”策略,其中一组智能体共同协作,从短期或长期记忆甚至 PDF 中收集数据,然后另一组执行智能体通过调用 API 来触发数据分析工具。

示例:“今年公司有多少个季度产生了正向现金流?”

客户服务

AI 智能体可提供全天候支持,同时理解文本和语音形式的自然语言查询,通过代表客户采取行动来解决复杂问题。

示例:呼叫中心接线员或聊天机器人可以自动执行工作流任务,例如连接 CRM 等内部系统,检查看客户请求是否符合退款条件,或者输入启动退货所需的数据。

协助软件开发

AI 智能体可以充当软件开发者的编码助手,帮助提供编码建议,指出错误并提供一键修复,提供拉取请求汇总并生成代码。

示例:当今最热门的 AI 智能体之一 GitHub Copilot 可以作为开发者的助手,生成代码,提出编码建议,管理文档并修复错误。

供应链管理

多智能体系统 (或智能体“蜂群”) 可以通过实时分析数据、根据需求监控和调整库存水平来帮助优化供应链,甚至可通过密切关注市场波动情况来帮助采购原材料。

示例:分层式智能体系统可以由多层智能体组成,它们负责供应链的不同方面,并向根据数据做出决策的编排智能体上报相关情况。

如何开始使用 AI 智能体?

NVIDIA 提供了各种工具和软件,可帮助轻松开发并大规模部署代理式 AI。

  1. NVIDIA Blueprint 为开发者构建使用一个或多个 AI 智能体的 AI 应用提供了切入点。它们包含使用 NVIDIA AI 和 NVIDIA Omniverse™ 库、SDK 和微服务构建的示例应用,为自定义 AI 解决方案奠定了基础。每个 Blueprint 都包含用于构建工作流的参考代码、工具、部署和定制文档,以及概述了 API 定义和微服务互操作性的参考架构。

  2. 开发者可以访问 NVIDIA API 目录中的最新 AI 模型,以构建和部署自己的代理式 AI 应用。

  3. NVIDIA OpenShell 是一个开源运行环境,用于安全开发和部署自主、长时间运行的智能体。 它无需修改任何代码,即可在开发沙箱中运行任何 AI 智能体。智能体初始为零权限,推理过程默认保持私密,且每一步操作都在基础设施层面受到策略强制约束。

 

后续步骤

NVIDIA Blueprint

开始使用 NVIDIA Blueprint,探索面向代理式和生成式 AI 用例的参考工作流。

数字人

数字人是 AI 智能体的外在形象。深入了解该技术如何推动医疗健康和游戏等行业转型。

NVIDIA 开发者计划

免费访问代理式 AI 基础模组 NVIDIA NIM™,进行应用开发、研究与测试,并获取技术学习资源。