17、如何评估大模型的生成质量？_聚客AI学院大模型应用开发微调项目实践课程学习平台

阅读( 293 )

17、如何评估大模型的生成质量？

答案：生成质量可以通过多种指标评估，包括 Perplexity（对于语言模型）、BLEU、ROUGE、METEOR 等用于机器翻译或文本摘要的指标，以及更主观的评估如人类评价。最近，像 BERTScore 这样的基于语义相似度的指标也变得流行。