3、智能体架构_聚客AI学院大模型应用开发微调项目实践课程学习平台

阅读( 869 )

构建大语言模型智能体（LLM Agent）时，LLM充当着控制中心或“大脑”的角色，负责管理完成任务或响应用户请求所需的一系列操作。智能体Agent通过调用大模型的能力完成任务，并需要依赖于规划、记忆以及工具使用等关键模块。

通常，一个大语言模型智能体框架包含以下核心部分：

用户请求：表达用户的问题或请求

智能体/大脑：作为协调者的智能体核心

规划：助于智能体为未来行动做规划

记忆：管理智能体的历史行为和经验，分为长期记忆和短期记忆。

工具使用：调用工具与外部环境交互

通过这些组成部分的协同工作，大模型智能体能够处理从简单到复杂的各种请求，不仅能够提供直接的答案，还能解决需要深度分析和多步骤操作的问题。这种智能体的能力，使其在处理复杂信息查询、数据分析和可视化表示等方面具有巨大潜力。

下图展示了更详细的智能体架构。

对于没有接触过智能体的人，上述框架可能有点抽象，下面我们以一个例子来说明智能体的架构，假如我们想让AI完成以下任务：

用户：明天上午要去A地出差，下午与X开会，帮我订好机票、酒店和会议日程。

对于人类助理来说，这是很简单的事情，但以目前大模型的能力，还难以解决这个问题。而从技术角度来说，可以开发一个基于大模型的智能体来解决这类问题，这个智能体主要包含以下部分：

1. 规划：通过调用大模型的能力将任务分解，先分为出差行程安排和会议预约两个子任务。

1.1 出差行程安排继续分解为：

1.1.1 从用户所在地到所在城市机场：

a. 其中用户所在地通过感知环境信息获得（可以通过用户初始设置或过往历史存放在记忆组件里面）

b. 决定出行时间

c. 决定出行方式：如乘坐出租车，预约

1.1.2 从用户所在城市机场到A地机场：

a. 决定出行时间

b. 决定出行方式，预约

1.1.3 从A地机场到A地某酒店：

a. 预订A地某酒店

1. 决定入住时间

b. 决定从A地机场到达酒店方式：如乘坐出租车，预约

1.2 会议预约继续分解为：

1.2.1 查看用户和X的日程，找到二者都空闲的时间段

1.2.2 确定会议时间，预约会议

2. 记忆：

2.1 用户所在地应存放在长期记忆中。

2.2 根据规划的分解，后面的步骤会依赖前面步骤的结果，那么需要把前面步骤的执行结果存放在短期记忆中。

3. 工具使用：

3.1 通过调用网约车平台接口预约出租车（需要用户授权，授权信息也可以存储在长期记忆中）

3.2 通过调用航班信息查询接口获取航班信息，调用航班预订接口订机票（需要用户授权，授权信息也可以存储在长期记忆中）

3.3 通过调用OTA平台接口完成酒店预订（需要用户授权，授权信息也可以存储在长期记忆中）

3.4 通过调用支付接口完成支付（需要用户授权，授权信息也可以存储在长期记忆中） 3.5 通过调用日历接口完成日程查询和会议预订

以上是假想的一个智能体应用场景，目前市面上应该还没有这种产品出现。从技术角度来说，这是可行的。