文本生成相关的评测指标

一、文本生成相关任务

  • 翻译
  • 对话生成
  • 自动文摘
  • image2caption

二、文本生成评测指标

  • BLEU
  • Rouge : https://www.jianshu.com/p/0afb93fda403
  • NIST
  • METEOR
  • TER

2.1 BLUE

2.2 Rouge

2.3 PPL困惑度

ppl是用在自然语言处理领域(NLP)中,衡量语言模型好坏的指标。它主要是根据每个词来估计一句话出现的概率,并用句子长度作normalize,公式为:
在这里插入图片描述

https://blog.csdn.net/shawroad88/article/details/105639148

reference

https://zhuanlan.zhihu.com/p/150057895


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部