阅读( 141 )

17、如何评估大模型的生成质量?

答案:生成质量可以通过多种指标评估,包括 Perplexity(对于语言模型)、BLEU、ROUGE、METEOR 等用于机器翻译或文本摘要的指标,以及更主观的评估如人类评价。最近,像 BERTScore 这样的基 于语义相似度的指标也变得流行。

×