大模型

一篇文章系统看懂大模型

过去一年多,说实话现在关于大模型的介绍和说明的文章已经非常多了,大部分人其实也已经有了一些基础的认知,但是我自己的感受是,这些信息实在是太碎片化了,称不上系统化的认知,并且市面上暂时也没有看到能够一口

智能体爆发前夜,大厂们都在抢什么?

2024年已经过半,国产大模型的竞争也进入了白热化。如果说大模型的上半场是在卷基础能力,那么中期的竞速赛中,AI Agent(智能体)的竞争已经被提上了重中之重的议程。无他,智能体就是应用落地最重要的

飞书、钉钉、企业微信的大模型“三国杀”

曾经在一次内部的周年会上,字节跳动CEO梁汝波曾表示对飞书和火山引擎的研发投入不低于抖音和TikTok。言下之意,飞书在字节内部的重要性比肩抖音。业务的重要性从时间上也看得出来,要知道,天眼查APP显

训练LLMs的过程就像写教科书

看到推上Karpathy的比喻真的有趣且非常贴切。他把大语言模型(LLMs)的训练过程比作学生学习的过程,而训练数据就像一本教科书。为了让模型更像有智慧的学生,我们需要给它提供三种不同类型的信息,分别

异军突起的小模型,有多大想象空间?

模型层进入“平台期”的当下,小模型的出现,无疑为市场打开了新的可能。大模型之战进入到今日,许多开发者都面临着一个共同的挑战:如何在保证高性能的同时,降低资源和算

大模型在数字化营销中的应用与实践

一、什么是大模型大模型是指那些具有大量参数和层次的深度学习模型,它们可以从大规模的数据中学习复杂的特征和规律,从而在各种任务上达到超越人类的性能。大模型的出现,