遇冷？大模型在To B领域的突围之路

产品的形而上学 2023-12-07 20:49:22

一、如何正确看待大模型的能力

以chatGPT为代表的大模型技术在上半年席卷全球，沉寂多年的科技游民们又找到了新的应许之地，一个个把朋友圈的All in 区块链/元宇宙改成了all in AI。

尽管openAI的开发者大会成为了新的科技春晚，但不得不承认的是国内大模型和北半球的气温一样，从数据上看最近趋于冷静，大家都觉得这个技术大有可为但是确实又很难看到实质生产力大幅提升的案例。

从笔者的角度看，冷静是正确全面看待新技术的必要前提，我们只有知道大模型能做什么、不能做什么，才能更好的找到适合其应用的场景，毕竟，如果有人告诉你一项技术无所不能的不是骗子就是坏人，不然你就让大模型炒个鱼香肉丝试试。

1. 大模型不能做什么?

相比较大模型能做什么，不能做什么可能才是被忽略的因素，也是在应用上不得不避免的坑：

①鹦鹉学舌

我相信不少人在使用大模型的应用之后，都有一个先惊喜后去昧的过程，大家发现最大的问题在于其本身是一个语言模型，核心原理在根据提出的问题，逐字生成答案，每个新字的生成取决于前面所有的字的组合，根据前面的概率预测下一个最合适的字是什么。

举个例子，正常来说只有在理解函数和几何三角形之后，我们才有可能理解三角函数的知识，但是对于大模型而言，在输出数据训练的过程中只提供三角函数相关的语料，不提供其他的函数和几何的语料，他也可以模仿之前学过的内容，生成出正确的答案。

这种方式有个形容词叫鹦鹉学舌，这就是纯语言模型和我们学习知识不一样的地方，也就是说大模型的智慧涌现中至少逻辑推理能力和人是不同的路径。

鹦鹉学舌就带来大家在用大模型的时候最大的问题，缺少核心观点性的输出，看起来总是很擅长写正确的废话，输出的每个字都对，但是缺少信息量，缺少一锤定音的结论，是平均水平的堆砌，体现出大模型能写诗，但是写不出李白水准的诗。

②幻觉问题

第二个大模型被诟病很多的就是幻觉问题，体现在一本正经的胡说八道，这一点并不是大模型本身的错。

因为很多时候准确和灵活是不可兼得的，就像一个人的性格很难同时体现出既谨慎又热情，大模型的泛化效果好，很多时候体现出一个人的特质，但是我们要知道即便是人，做很多工作的时候也会犯错，要求高度准确的只能是机器和规则，所以大模型目前看起来不适合做专业细分容错性低的工作

③缸中的大脑

第三个就是大模型只是一个语言模型，有点像是一个泡在缸中的大脑，只有神经元的输入输出，但没有躯体，只有建议没有办法独立执行，无法根据环境反馈及时调整行为，或者是根据反馈进行学习和迭代，这一点估计要等具身智能技术成熟后才能克服。

2. 投入产出比是技术应用的关键

在上面的几大问题之后，也并不是说大模型就是在割韭菜，而是说要正确看待大模型的特长和优势，在面对一项全新的技术时，取决于如何锚定这项技术，以及希望通过这项技术解决什么问题？

大模型技术一开始让人觉得惊艳，是和传统AI类产品在对话理解、文本生成上的生产力的对比而产生；但是在实际应用中锚定的对象就不是传统AI了，而是以前做这块工作的人，与人相比，确实在很多方面也只属于勉强及格。

这就出现了当下的大模型应用大量的以应用小助理（ChatBot或者copilot）的形式出现，作用属于锦上添花但不是雪中送炭，还不能真正帮助解决细分领域的问题，但是对于企业而言动辄几百上千万的投入，确实没法算过来这个账。

当下的核心应该是尽量的减少大模型应用的成本，同时找到适合大模型特性的高价值场景，在To C领域已经经过了理性回归的过程，但是在To B领域，大模型怎么用，如何设计商业模式还没有确切的定论。

二、To B 领域大模型商业化分析

To B 领域不同行业、不同客群、不同的业务领域都非常细碎，不同路径的应用方案不具备可比性，因此我们根据客户的大小与应用场景的专业程度进行划分，形成下图的四个象限：（X轴为客户属性，从小客户逐渐到大客户；Y轴为业务属性，分为专业场景和通用场景，最后分成四个象限）

产品经理，产品经理网站

1、第一象限

大客户通用场景，典型客户有大型国有银行、运营商、能源、电力等，在这个象限内，客户往往有很强的科技能力，像工行2022年在科技领域的投入是260亿，有超过3万人的科技团队，此类客户最终大模型倾向自研。

面向这类客户的通用方案其实就是基础能力底座和训练平台等工具链，最终客户在此基础上会自己做应用层的开发。

此领域考验的是厂商的技术能力，华为、讯飞、智谱、BAT等在这一层，本层聚焦在通用大模型的竞争，因为以大型央国企为主，价值上主打自主可控和大国博弈的战略占位。

2、第二象限

小客户通用场景，在这一象限，主要考验的是厂商的产品化能力，因为在不同行业之间差异很大，面向小客户，真正通用的主要也就是办公、人事、财务、客服这种不涉及核心业务的领域。

更适合之前在这些领域有业务积累的厂商，通过大模型延展服务的场景、提升服务的效果，例如微软office copilot和飞书在办公领域的积累，金蝶、用友这样在财务领域的积累，此处最考验各个厂商利用技术实现产品化的能力。

3、第三象限

小客户专业场景，创业公司最有可能在这个领域长出一些小而美的应用，基于大厂出的L0层的通用模型和L1层的行业模型，在此基础上生长出L2层的场景层应用。对于一些非常细分的场景如视频剪辑、包装设计等可能存在产品或者是服务总包的模式。

但是这样的探索也是险象环生，很容易陷入低ROI的魔咒，对于这类客户需要产品本身确实能解决刚需，还需要解决付费意愿的问题，肯定是一条荆棘丛生的路，但是这里可能也是创业者最容易切入的领域。

4. 第四象限

大客户专业场景，在这个领域主要比拼的是解决方案的整合能力，需要对于行业以及核心业务有深入理解，以金融机构为例，有像恒生、宇信、神州信息、中科软、软通动力等IT服务商，这里不同客群不同行业的需求差异很大，所以会有较多的定制工作，利润率较低，甚至有很多合作以人力服务的形式开展，核心需要拼各厂商解决方案的能力。

这些IT服务企业可以结合自身的业务特点，以开源模型打底训练出L1层的领域大模型和L2层的场景应用模型，进而对垂直领域赋能。

三、To B 领域大模型的应用展望

从chatGPT发布开始，笔者一直关注行业应用，从现在观察的结果看，总体各个厂商之间卷底层能力为主，应用开发不足，目前还没有出现一款杀手级的AI原生应用，当然每项技术逐渐成熟都需要周期，我们试图从以下几个维度来分析下大模型最可能以何种路径实现应用层的百花齐放：

1. 价值主张：从“降本增效”到“拓宽工作半径”

从深度学习开始，行业就面临对于AI价值的评估缺少锚点的问题。大部分企业会以降本增效为评估依据，为企业节省10个人，那就按照10个人工资的20%-30%来收钱。

但是这样的价值模型在大模型时代是有巨大的问题的，大模型本身瞄向通用人工智能，通过一个模型来解决多个不同任务，这就意味着任务非标化程度很高，高频高价值的重复劳动基本在小模型时代就已经被逐一解决，处理剩下来非标的任务面临两个难点：

①任务中存在大量的链式工作，下一步的工作任务依赖于上一步的输出结论，需要对于工作的整体做规划和相机决策，然而现阶段的技术很难串联多个断点任务。

举个例子，员工往往是看了一个新闻后觉得有意思，然后去查阅搜索相关市场资料，下载数据之后进行分析，根据分析的结论去进一步寻找其他材料，进行二次加工，最后根据分析的结论再去写个报告。

这个过程中涉及多个业务流程和断点工作，当下的技术解决还存在较大的难点，如果只解决其中一个环节，就出现前面讲的作为小助手有点用但是作用并不大的问题。

②大模型本身的成本就很高，往往存在人没省下来但是系统建设还多花钱的情况。形象举个例子：假如有10个人的团队，每人每天工作10小时，在大模型应用提效10%之后，可能出现的结果是10人每天工作9小时，而不是9人每天工作10小时。

大模型不但不能替代掉1个人，还存在需要新增系统建设的费用，对于员工可能是高兴的，但是对于企业主付费的意愿就低了很多。

从价值上讲，大模型应用的价值锚点不应该是降本增效，尤其不要和中小企业讲降本增效，大企业可能处于政治正确或战略投资的角度推进产品的应用，有更多的耐心，而中小企业只要一算账，投入产出比始终是过不去的坎。

相反，笔者认为大模型应该是让员工做到很多以前做不到的事情，在人省不掉的情况下，可以扩展员工的工作能力半径。

例如之前写文案不具备设计能力，需要和设计人员合作实现营销方案设计，但设计是个低频的却卡脖子的需求，这个时候通过大模型生成图片来增加以前文案的工作能力，一个人干2个事，这套叙事反而是企业主非常欢迎的。

2. 相比理解对话和交互，生成能力更能直观体现大模型的价值

现在很多团队对于大模型的应用主要聚焦在对话交互领域，应用大模型的理解能力，但生成能力往往更容易产生价值感。

举个例子，对话能力的提升往往是从语义理解能力90%提升到95%，这种5个点的提升往往不容易感受到，就像很多年前智能手机刚出来的时候有团队做电池管家，是可以提升5%的电池的使用寿命，但是给用户的感知却不明显。

相反，生成能力是能够直观感受到生产力的，大模型一下子生成大段大段的内容，可以演示出肉眼可见的生产力，而不需要绞尽脑汁的想应用价值怎么体现这一AI行业难题。

3. 多模态一定是未来

信息的生成、传输、应用基本都会遵循从简单到复杂，从抽象到具象的过程。我们回想下微信出来的过程，交互媒介也是先文字、再语音对讲、然后图片表情和视频、最后是小程序等复杂信息的综合体，从各个维度去构建丰富的表达体系，形成护城河。

从大模型的浪潮来看，现在最大的应用还在文字，其次是图片，视频刚刚起步。从应用价值来看，如何设计商业模式，核心是要考虑投入产出比。

而文字的生成投入产出比提升不明显，如果要让生成的文字卖出钱的话，就需要生成的文字具备高价值，无非就两种可能，独占高价值信源或者是生成质量极高，否则就很难在To B的场景卖出价钱，但这两点对于大模型来说都不容易。

反观我们看下图片或者视频，因为制作图片/视频有门槛，生成的成本要远高于文字，如果大模型可以批量的生成一堆适合特定场景的图片和视频，那性价比就会比招1个设计或者外包给设计团队便宜。

笔者认为未来图片、视频在价值体现的想象空间更大，而大模型平台型公司则会因为多模态的接入而逐渐形成自己的护城河。

4. AI Agent—大模型时代的小程序

上一节提到微信，我记得微信很久没有重大更新了，最近的一个大的交互迭代是小程序，小程序是当时所有人认为短期会被高估，但长期会被低估的产品。

随着这几年的应用基本也印证了当时的预测，那我们想想，大模型时代的小程序是什么呢？能不能通过大模型生成一个小程序？

如果大模型本身能对任务进行规划拆分，应用自身的代码生成能力，形成一个个的代码集合，让每个模块解决一个具体问题，通过任务拆解后分布执行，能够形成完整的任务闭环，这才是To B行业大家期待的样子。

形象的场景就是：现在你问他怎么点外卖，他只能跟你不疼不痒的讲外卖怎么点，假装给你点了外卖提供情绪价值；AI agent成熟后则可以规划几个步骤。

首先登录你的外卖账号，然后生成一段代码，对接到外卖平台的接口，然后下订单，最终订单到了再通过接口反馈通知到你，完成服务闭环，这才是决定这一波大模型在To B领域高度商业高度的关键。

从ChatBot到Copliot，再到Agent，随着量变的发生，总有一天技术会达到应用投入产出比的临界点，之后就会进入质变环节，而前面这段黎明前黑暗的路不会太短，只有决心、毅力以及每一次遇到问题解决问题的具体积累，才是这些厂商All in AI之后的资产，而不是明年再把All in AI改成All in量子或者All in 生物科技什么的。

考验企业家智慧的是在未产生商业爆发的前夜，如何保证自己不下牌桌，如何熬到最后看到技术真正的解放生产力、发展生产力的那一天。

本文作者 @产品的形而上学。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：产品设计 ToB领域产品科技大模型

上一篇 > 电商搜索是如何保证搜索结果不偏离搜索意图的？
下一篇 > 数字化系统不好用的4个真相

AI 创作｜何以为诗？一个关于 AI 诗人的图灵测试

OpenAI神秘搞事，GPT-4.5默默上线？推理碾压GPT-4网友震惊，奥特曼笑而不语

我们离AGI还有多远？

深度分析：从智障到智能体，无用阶级要到来了吗？

论RAG技术对智能数字人对话的革新与优化方案

AI大模型爆红，抖音上架“星绘”，360上架“360AI浏览器”

Agent和大模型的区别

“越长”就越强？为何通义千问卷不动Kimi

LLM上下文窗口突破200万！无需架构变化复杂微调，轻松扩展8倍

为什么微信迟迟未接入大模型

被马斯克抵制却受互联网大厂热捧，AI营销是怎样“卷”起来的

为什么说这些倒腾AI的方式会把自己“搞死”

大模型应开源还是闭源？周鸿祎怼上了李彦宏

开源模型越来越落后？Meta甩出全新Llama 3应战

大模型何去何从？

线上教育大模型应用场景一：出题

AI Agent是每个人的助手

阿里云们的2024：打不完价格战，卷不动大模型

大模型加持后，数字人“更像人”了吗？

挑战一篇文章讲清楚ChatGPT相关概念！小学生也能看懂！

AI入门第一课：把模型跑起来

基于大模型的AI产品设计新方式——双故事线策略探索

AI健康应用体验分析–讯飞晓医/夸克

“更大的焦虑，更大的想象力”：音视频厂商如何闯入AI时代？

最强调优攻略：如何从四种调优技术中做出最佳选择？

（一文看懂）强化学习与人工反馈（RLHF）调优大模型

Kimi“颠儿了”以后：国产大模型危机感来了

ChatGPT vs. Microsoft Copilot vs. Gemini，到底哪个好？

企业如何使用模型微调（SFT）定制化调优大模型？

Perplexity要搞竞价排名了，大模型的尽头……就还是广告？

比人类便宜20倍！谷歌DeepMind推出「超人」AI系统

怎么才能写出AI看得懂的提示词？（以Kimi Chat为例）