阅读( 214 )

大模型训练中如何应对“灾难性遗忘”问题?

可以讨论连续学习中的策略,如经验回放、正则化方法、参数隔离等。

×