我目前维护着一个包含海量数据的业务知识库,知识库数据采用关系型数据库二维表进行存储。表结构包含数十个字段,每个字段代表不同维度的业务信息,知识库表数据量数千万,而且会持续更新。
现在我需要基于该知识库开展业务数据分析工作。常规场景下,如果业务数据与知识库记录完全匹配,分析判断比较容易。但实际应用中,部分业务数据与现有记录并非完全匹配。针对这类场景,我希望借助大模型的能力,通过挖掘知识库数据特征与规律,进而对业务数据进行合理推测。
请问在这种业务需求下:
1. 是否适合采用RAG(检索增强生成)技术方案?
2. 若适用,该如何结合大模型构建完整的分析流程?
3. 是否还有其他更优的技术实现路径?
谢谢老师们指教!