LLM

大语言模型:LLM的基本原理解读

最近在做一些基于LLM(Large Language Models)的项目,计划系统化的梳理一个LLM系列文章,整个大纲,大概包括以下内容:1、大语言模型:LLM的基本原理解读2、如何将LLM应用到实

训练LLMs的过程就像写教科书

看到推上Karpathy的比喻真的有趣且非常贴切。他把大语言模型(LLMs)的训练过程比作学生学习的过程,而训练数据就像一本教科书。为了让模型更像有智慧的学生,我们需要给它提供三种不同类型的信息,分别