关于智能体处理二进制文件的问题

假设有这样一个场景，流程分为以下步骤：

1. 用户上传二进制文件file1，并提出关于file1的问题。此时，大模型调用工具方法tool1，将file1作为参数传入，待工具返回结果后，再向用户给出回复。

2. 用户上传二进制文件file2，并提出关于file2的问题。大模型调用工具方法tool2，将file2作为参数传入，获取工具返回结果后回复用户。

3. 用户再次提问，且使用代词指代之前上传的file1或file2。大模型调用工具方法tool3，将用户此次所指的file1或file2作为参数传入，得到工具返回结果后回复用户。

同时又存在一个技术限制：如果需要新引入库，则新引入的库不能与langchain、Langgraph冲突（因智能体现有运行环境中已包含这两个框架）。

请问这种场景该如何处理？上下文应如何管理？如何让大模型记住这些二进制文件，且能将二进制文件作为参数传给工具方法？在避免冲突的前提下，需要引入哪些框架？

此外，若该场景无法100%完美实现，有哪些退而求其次的权衡策略？

感谢老师们的指教！

2025年10月31日 | 189人阅读

回答 | 共 1 个

按点赞量排序

聚客AI-Li

一个项目里用一个框架就够了（langchian和langgraph算一个系列的，不会冲突），明知道框架不兼容还要强行用多个的，那就自己解决依赖冲突问题。你的问题在kevin老师的项目课里有讲，讲react agent那个，请多看一下老师的讲课内容

2025年11月01日

游客