深入理解Transformer:从语言模型到机器翻译的实际应用场景

文章目录

  • 深入理解 Transformer:从语言模型到机器翻译的实际应用场景
  • 1. 引言
  • 2. 技术原理及概念
    • 2.1. 基本概念解释
    • 2.2. 技术原理介绍:算法原理,操作步骤,数学公式等
      • 2.2.1. Transformer的架构
        • 一、编码器
          • 1. 多头自注意力层
            • 1.1. 查询、键、值的计算过程
            • 1.2. 头的计算过程
          • 2. 前馈神经网络层
        • 二、解码器
          • 1. 多头自注意力层
          • 2. 编码器-解码器注意力层
          • 3. 前馈神经网络层
        • 三、计算例子
          • 0. 将输入序列转化为向量表示
          • 1. 多头自注意力层


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部