思维链提示 (Chain-of-thought,CoT)

😄 思维链提示,可用于训练阶段,构造高质量数据集(输入&思维链+输出),让模型学习逐步推理的能力;也可用于推理阶段,给模型提示,激发模型的推理能力,使模型得出更准确且有理有据的答案。

文章目录

  • ⭐ CoT微调:
  • ⭐ CoT提示:

⭐ CoT微调:

  • 使用 CoT 微调的模型使用带有逐步推理的人工标注的指令数据集。也就是让模型微调训练学会 think step by step。
    在这里插入图片描述

⭐ CoT提示:

  • 教chatgpt如何思考,如何一步步推理得出答案;给模型输入一个示例,并且示例中写明推理过程,这种推理的解释会引导模型在同类问题上得出更准确的结果。
  • 其实就是在传统few-shot基础上加上了思维链(即推理过程),输入&思维链+输出。
  • 通过CoT提示可将大模型这种能力激发出来。就比如下图,没有CoT提示的输入模型输出了错误结果,而采用了CoT提示,模型被引导输出了推理的过程并得到了正确的结果。
    在这里插入图片描述






引用:

  • Google Research, Brain Team: 《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》
  • HuggingFace


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部