假设有这样一个场景,流程分为以下步骤:
1. 用户上传二进制文件file1,并提出关于file1的问题。此时,大模型调用工具方法tool1,将file1作为参数传入,待工具返回结果后,再向用户给出回复。
2. 用户上传二进制文件file2,并提出关于file2的问题。大模型调用工具方法tool2,将file2作为参数传入,获取工具返回结果后回复用户。
3. 用户再次提问,且使用代词指代之前上传的file1或file2。大模型调用工具方法tool3,将用户此次所指的file1或file2作为参数传入,得到工具返回结果后回复用户。
同时又存在一个技术限制:如果需要新引入库,则新引入的库不能与langchain、Langgraph冲突(因智能体现有运行环境中已包含这两个框架)。
请问这种场景该如何处理?上下文应如何管理?如何让大模型记住这些二进制文件,且能将二进制文件作为参数传给工具方法?在避免冲突的前提下,需要引入哪些框架?
此外,若该场景无法100%完美实现,有哪些退而求其次的权衡策略?
感谢老师们的指教!