个人观点

训练LLMs的过程就像写教科书

看到推上Karpathy的比喻真的有趣且非常贴切。他把大语言模型(LLMs)的训练过程比作学生学习的过程,而训练数据就像一本教科书。为了让模型更像有智慧的学生,我们需要给它提供三种不同类型的信息,分别

外媒:Deepseek八项不容忽视的问题

近日,纽约大学名誉教授Gary Marcus在《Fortune》杂志发表了一篇引人深思的文章,深入分析了国内最新推出的AI聊天机器人DeepSeek。作为人工智能领域的权威声音,Marcus对Deep

DeepSeek和ChatGPT在文本业务应用的探索

自2019年OpenAI推出GPT-2以来,AI文本生成能力实现了飞跃式提升,推动图片、音乐、文本等内容创作领域进入智能化阶段。2022年底,ChatGPT的问世标志着AIGC(AI生成内容)正式步入

一个初级AI产品对技术的思考(中)

目前我观察到的普通小白以最快速度可以获取到的最快的了解AI相关知识的途径如,有代码基础、数学好的、有精力的可以看看B站大学、Coursera之类的网站从底层理论知识开始学起,不具备相关条件的或非技术人

管理者如何合理看待”开人“?

熬到过年了,今天想聊一聊”开人”这件事。大部分的公司是到了年中、年底,进行一波调整。有的是,例行的末位淘汰;也有的是,业务调整、业务收缩等进行的裁员。政策好定,但定完后,就要执行了。如果你是“刽子手”

商业的本质:需求、价值与交易

商业分析的对象是商业,想得道商业分析,就要懂商业本身。这样平平无奇的一段话,却包含了巨大的威力。不同行业,其商业理解不一致,同时底层又是相通的。Costco 联合创始人辛尼格对零售业的总结 —— “它

都2025年了,你为什么还在做微信公众号?

互联网行业的内容产品是有“生命周期”的,早期的主流是论坛、BBS、博客,再到微博,再到微信公众号,如今是短视频和直播。拥有近13年历史的微信公众号已经有些颓败迹象,最初一批做微信公众号的自媒体人或转型

关于AI,总结2024,展望2025

今天想和大家聊一聊2024年AI领域的发展。如果单纯从产品层面来看,今年似乎没有特别令人惊艳的突破。别说是梦想中的AGI了,就连能称得上现象级的AI应用,似乎都不太多。今天,我就来聊聊这背后的原因。首