解释 prefix LM 和 causal LM 的区别,并给出实际应用案例。
本题涉及语言模型的两种不同模式,前者可用于双向上下文预测,后者仅基于过去的信息进行预测, 例如 GPT 系列就是典型的 causal LM。
教程内容BUG提交
提交