文本生成相关的评测指标
一、文本生成相关任务
- 翻译
- 对话生成
- 自动文摘
- image2caption
二、文本生成评测指标
- BLEU
- Rouge : https://www.jianshu.com/p/0afb93fda403
- NIST
- METEOR
- TER
2.1 BLUE
2.2 Rouge
2.3 PPL困惑度
ppl是用在自然语言处理领域(NLP)中,衡量语言模型好坏的指标。它主要是根据每个词来估计一句话出现的概率,并用句子长度作normalize,公式为:

https://blog.csdn.net/shawroad88/article/details/105639148
reference
https://zhuanlan.zhihu.com/p/150057895
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
