TAGGED IN
Transformer
共有 8 篇文章
Transformer神经网络:GPT等AI大模型的基石
上文介绍了生成对抗网络(GAN)的基础概念,今天我们来介绍Transformer神经网络。Transformer神经网络模型仅基于注意机制(AttentionM
马斯克的Grok-1为什么不采用经典Transformer?
2024年3月17日马斯克旗下的xAI公司开源了其大语言模型Grok-1的源代码。Grok-1并未像GPT模型那样,采用AI新贵Transformer,而是用了
还在卷长文本?谷歌最新论文直接把文本干到…无限长了
当人们还在比拼上下文窗口的时候,谷歌发布了这样一篇论文《LeaveNoContextBehind:EfficientInfiniteContextTransfo