ChatGPT底层架构Transformer技术及源码实现(一)

ChatGPT底层架构Transformer技术及源码实现
Language Model底层的数学原理之最大似然估计MLE及最大后验概率MAP内部机制详解

Gavin大咖微信:NLP_Matrix_Space

传统人工智能算法的真相(The Truth Under Traditional AI Algorithms),传统人工智能算法是相对于贝叶斯(Bayesian)的视角来讲的,从教学的角度,Bayesian Transformer是星空智能对话机器人在全球首家提出来的,用这种方式帮助大家更好的去掌握Transformer。
如图3-1所示,是线性回归的一个的例子,使用一个回归模型进行最大程度的拟合,数据拟合的目标是回归模型与所有的不同的数据点的距离或者误差最小。
在这里插入图片描述

图3- 11 传统人工智能算法线性回归模型
在这里插入图片描述

输入数据x产出是y,y的上面有一个波浪号表示模型的预测值,中间经过了两层线性变换,两层线性变换中间会有非线性变换,这些都是深度学习的基本内容,模型的目标是寻找参数w,使得输入的x通过神经网络模型得出y ̃值要尽量的接近标签y,要尽可能的接近于实际的值,从训练的角度,这都是数据处理的基本支持。
在这里插入图片描述


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部