LLM的范式转移:RL带来新的 Scaling Law 从几周前 Sam Altman 在 X 上发布草莓照片开始,整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道,Strawberry 就是之前的 Q-star,其 产品经理 2024年09月09日
LLM 进化分岔口:多模态、成本、代码推理 头部模型的新一代模型的是市场观测、理解 LLM 走向的风向标。即将发布的 OpenAI GPT-Next 和 Anthropic Claude 3.5 Opus 无疑是 AGI 下半场最关键的事件。本 AIGC 2024年09月09日
深度|Andrej Karpathy 最新思考:小模型有巨大潜力,大模型用来处理多任务,AI 模型未来聚焦于处理重要信息的能力 这是前特斯拉 AI 总监& OpenAI 创始成员 Andrej Karpathy 近日与硅谷知名投资人 Sara Guo 和 Elad Gil 的最新对话。Karpathy 强调,Transform AIGC 2024年09月09日
AI「长脑子」了?LLM惊现「人类脑叶」结构并有数学代码分区,MIT大牛新作震惊学界! LLM居然长「脑子」了?就在刚刚,MIT传奇大牛Max Tegmark团队的新作,再次炸翻AI圈。论文地址:https://arxiv.org/abs/2410.19750他们发现,LLM学习的概念中 AIGC 2024年11月04日
大语言模型:LLM的基本原理解读 最近在做一些基于LLM(Large Language Models)的项目,计划系统化的梳理一个LLM系列文章,整个大纲,大概包括以下内容:1、大语言模型:LLM的基本原理解读2、如何将LLM应用到实 产品经理 2024年11月04日
训练LLMs的过程就像写教科书 看到推上Karpathy的比喻真的有趣且非常贴切。他把大语言模型(LLMs)的训练过程比作学生学习的过程,而训练数据就像一本教科书。为了让模型更像有智慧的学生,我们需要给它提供三种不同类型的信息,分别 产品经理 2025年02月18日
“(LLM产品)评估”背后,再深一层和两层的关键能力,到底是什么 “当前模型受限于评估而非智能,评估将成PM核心技能……”1、业内大多数AI评测报告(的思路),本质上来说,都是相对“纯技术视角”的,主要是为了对大众PR、融资等等。2、深入一些的,是最近半年,由于大模 产品经理 2025年02月18日
对话Deepseek R1 :随着LLM能力的跃升,类似coze等Agent编排工具是否还有应用价值? 一、现状对比:Prompt驱动 vs 传统Agent框架1. 传统Agent设计的核心痛点开发成本高昂:需预先定义任务拆解逻辑、设计各环节的衔接规则(如有限状态机)、处理异常分支。灵活性受限:面对未预 产品经理 2025年02月18日
Nature|LLM正在重塑教育,所有学生都需要学习AI,RAG是解决幻觉的关键 LLM已经在重塑人类教育事业了!Nature今天刊文,探讨了教育行业的不同参与者,如何抓住LLM这个变革性的工具带来的机会,重新改造这项自人类文明诞生以来就存 AI人工智能 2023年12月01日
范式的转变:一个AI产品经理对类ChatGPT产品形态的思考 最近大家都很兴奋,ChatGPT的出现带火了知识博主,增加了变现机会。很多人都在讨论LLM和AI infra,如何写诗如何画画,真正讨论应用的很少,讨论行业应用 AI人工智能 2023年08月09日