阅读( 587 )

构建大语言模型智能体(LLM Agent)时,LLM充当着控制中 心或大脑的角色,负责管理完成任务或响应用户请求所需的一系 列操作。智能体Agent通过调用大模型的能力完成任务,并需要依 赖于规划、记忆以及工具使用等关键模块。

image.png

通常,一个大语言模型智能体框架包含以下核心部分: 

用户请求: 表达用户的问题或请求 

智能体/大脑: 作为协调者的智能体核心 

规划: 助于智能体为未来行动做规划 

记忆: 管理智能体的历史行为和经验,分为长期记忆和短期记忆。 

工具使用: 调用工具与外部环境交互 

通过这些组成部分的协同工作,大模型智能体能够处理从简单 到复杂的各种请求,不仅能够提供直接的答案,还能解决需要深度 分析和多步骤操作的问题。这种智能体的能力,使其在处理复杂信 息查询、数据分析和可视化表示等方面具有巨大潜力。


下图展示了更详细的智能体架构。

image.png

对于没有接触过智能体的人,上述框架可能有点抽象,下面我们以 一个例子来说明智能体的架构,假如我们想让AI完成以下任务:

用户:明天上午要去A地出差,下午与X开会,帮我订好机票、酒店和会 议日程。

对于人类助理来说,这是很简单的事情,但以目前大模型的能 力,还难以解决这个问题。而从技术角度来说,可以开发一个基于 大模型的智能体来解决这类问题,这个智能体主要包含以下部分:

1. 规划:通过调用大模型的能力将任务分解,先分为出差行程安排和 会议预约两个子任务。

1.1 出差行程安排继续分解为:       

1.1.1 从用户所在地到所在城市机场:           

a. 其中用户所在地通过感知环境信息获得(可以通过 用户初始设置或过往历史存放在记忆组件里面)           

b. 决定出行时间           

c. 决定出行方式:如乘坐出租车,预约       

1.1.2 从用户所在城市机场到A地机场:           

a. 决定出行时间         

b. 决定出行方式,预约       

1.1.3 A地机场到A地某酒店:           

a. 预订A地某酒店             

1. 决定入住时间         

b. 决定从A地机场到达酒店方式:如乘坐出租车,预约     

1.2 会议预约继续分解为:       

1.2.1 查看用户和X的日程,找到二者都空闲的时间段     

1.2.2 确定会议时间,预约会议 

2. 记忆:     

2.1 用户所在地应存放在长期记忆中。   

2.2 根据规划的分解,后面的步骤会依赖前面步骤的结果,那么 需要把前面步骤的执行结果存放在短期记忆中。 

3. 工具使用:     

3.1 通过调用网约车平台接口预约出租车(需要用户授权,授权 信息也可以存储在长期记忆中)   

3.2 通过调用航班信息查询接口获取航班信息,调用航班预订接 口订机票(需要用户授权,授权信息也可以存储在长期记忆中)     

3.3 通过调用OTA平台接口完成酒店预订(需要用户授权,授权信 息也可以存储在长期记忆中)    

3.4 通过调用支付接口完成支付(需要用户授权,授权信息也可 以存储在长期记忆中)     3.5 通过调用日历接口完成日程查询和会议预订

以上是假想的一个智能体应用场景,目前市面上应该还没有这 种产品出现。从技术角度来说,这是可行的。

×