作者: Ben Basche 编译: 深潮 TechFlow深潮导读: 「淘金热里,卖铲子」曾是创业圈的金科玉律。但在 AI 时代,这条逻辑失效了——因为矿工自己开了五金店。OpenAI、Anthropic、Google 正在系统性吞噬中间件层、编程助手、浏览器自动化等创业赛道。作者 Ben Basche 认为,真正能活下来的 AI 公司不是卖工具的,而是把 AI 当原材料用在垂直领域的「首饰匠」——深入特定行业、掌握本地知识、拥有不可复制的上下文。全文如下:有句话在第一次互联网泡沫前后成了创业圈的福音:「淘金热里,卖铲子和镐头。」意思是,真正赚钱的不是挖矿的人,而是给矿工供货的人。发财的是 Levi Strauss,不是那些淘金者。这是个好框架。在一段时间内确实好用。但在 AI 领域,它是错的。如果你的公司建立在这个逻辑之上,你可能需要好好看看过去十二个月发生了什么。实验室就是整个技术栈以下是实际发生的事情——先是悄无声息,然后突然全面爆发。OpenAI 发布了 Operator,一个能浏览网页、填表单、端到端执行任务的计算机代理。接着发布 Responses API 和 Agents SDK,让开发者无需第三方框架就能获得原生的工具调用、记忆和编排能力。然后是 Codex,一个能自主编写、测试和迭代软件的云端编程代理。再加上 Deep Research。这些产品中的任何一个,放在两年前都足以支撑一家拿到融资的创业公司。Anthropic 发布了 Claude Code、Computer Use、带持久记忆的 Projects,以及 MCP(Model Context Protocol)——几乎一夜之间成为连接 AI 与外部工具和数据的主流标准。然后他们把 MCP 捐给了 Linux 基金会,确保它是基础设施而不是产品。接着又推出了 Claude in Excel、Claude in Chrome、Cowork。Google 发布 Gemini 2.0,原生内置工具调用和多模态感知能力,嵌入 Vertex AI 作为企业级代理控制平面,开箱即用地提供组织级策略和编排。这些动作中的每一个,都在吃掉某个创业公司曾经拥有的领地。「卖铲子」的逻辑有一个隐含假设:实验室会待在自己的赛道上。做基础模型,提供 API,把工具层、编排层和应用层留给生态。这个假设已经死了。中间件大屠杀看看中间件层具体发生了什么。LangChain 是 2023 年 AI 热潮中最典型的「卖铲子」押注。一个用于串联 LLM 调用、连接工具、管理记忆的编排框架。几千个团队基于它构建产品,GitHub star 超过 10 万。到 2024 年,各种团队开始写博客解释为什么要把它从生产环境中拆掉。不是因为它差,而是因为底层模型已经聪明到不需要它了。LangChain 构建的抽象层解决的是昨天的问题。与此同时,OpenAI 发布了自己的 Agents SDK。微软出了 AutoGen 和 Semantic Kernel。实验室和它们的母公司没有收购 LangChain。它们只是在自己的平台里原生地构建了 LangChain 做的事。同样的剧本在每一层上演。代理框架、提示词管理工具、RAG 管道、评估框架、可观测性工具。所有这些都在被运行底层模型的厂商吸收进原生产品。残酷之处在于:当 OpenAI 或 Anthropic 把编排能力直接内置到 API 中时,它们不需要在功能上赢。它们只需要「够用」且「已经在那了」。开发者默认走阻力最小的路。那个有着巧妙中间件的创业公司,必须做到大幅领先,还要在模型不断进化的过程中维持这个优势,同时跟拥有无限资本且掌控底层基础设施的对手竞争。那不是一门生意,那是一个有倒计时的科研项目。矿工自己开了五金店,铲子就没法卖了「卖铲子」这个类比在 AI 领域失效,根本原因是一个关键的结构性差异。1849 年,Levi Strauss 和那些五金商人自己不挖金矿。矿工和供应商是利益分离的独立角色。在 AI 领域,实验室既在挖矿,又在卖铲子,还在修路,还在印地图。它们有充分的动机拥有整个技术栈,因为每多控制一层就多一个锁定点、一个利润扩张机会、一条分发护城河。Anthropic 把 MCP 捐给 Linux 基金会,那不是慈善。那是确保一个它们设计的标准成为通用基础设施,就像以太网成为通用标准一样。标准是科技行业最强大的护城河,因为它们无形且永久。所以,如果你的创业公司的价值主张是「我们夹在开发者和模型之间,让做 X 这件事更容易」,你需要面对一个事实:你夹在中间的那个实体已经注意到你了,有资源复制你,而且有结构性理由这么做。那什么才管用?回到淘金热的比喻。铲子卖不了了,你该卖什么?卖首饰。或者更好的说法是:把金子当工业原料用,做成矿工自己没兴趣做的东西。在 1849 年的真实淘金热中,能熬过繁荣期的企业不是卖通用工具的。它们是那些把黄金当原材料,用深厚的专业知识做成特定产品的人。珠宝匠、牙医、后来的电气工程师。这些人对某个具体应用场景的理解深到通才根本做不到。AI 版本就是在垂直领域构建应用——那些需要实验室不具备也难以获取的真实世界上下文的领域。想想 OpenAI、Anthropic 和 Google 在结构上不擅长什么:它们不深入了解你所在行业的工作流。它们和你的客户没有关系。它们无法低成本获取那些让模型在特定场景中真正好用的私有数据。它们永远不会去深入研究南非个体工匠为什么那样开发票,或者肯尼亚移动支付集成为什么并不简单,或者美国医疗预授权为什么是一个特定的、棘手的、深度嵌入的运营问题。实验室在建水平基础设施。机会在垂直领域——需要地理、监管、文化、行业特定的本地知识才能真正跑通的领域。这就是为什么新兴市场的金融科技、针对特定司法管辖区的法律 AI、受监管行业的合规工具、以及利基专业领域的工作流自动化,都比「做一个更好的 LangChain」更具防御性。护城河不在模型。护城河在上下文。黄金的工业用法这个思路还有第二个版本值得说清楚:像工业使用黄金一样使用 AI。不是把它当价值储藏或者展示品,而是把它当作组件,嵌入能创造持久经济价值的东西中。黄金的导电性几乎无与伦比。所以每块电路板里都有它。没人谈论它,没人在这个语境下炒作它。它安静地充当一个更大系统中的关键输入。现在正在构建的最持久的 AI 公司,都是把模型当组件——一个解决真实问题的产品的输入——而不是把模型本身当产品。AI 是电路板里的黄金,不是展柜里的黄金。实际操作是这样的:你选一个有真实痛点、真实工作流复杂度、真实难获取数据的领域,然后构建一个产品,底层恰好用了模型来让它好得多。AI 是实现细节,产品才是那个替代了痛苦手动流程的东西。这和「我们在 GPT-4 上面套了一层壳」正好相反。壳是展柜,电路板是看不见的。最近被干掉的赛道为了说得更明确,以下是自 2024 年底以来实验室正在系统性吞噬的部分创业类别:代理编排框架。 现在是 OpenAI Agents SDK、Anthropic 工具链、Google Vertex Agent Builder 的原生功能。AI 编程助手。 OpenAI 的 Codex 现在能做完整仓库级别的自主编程。Claude Code 也能做。GitHub Copilot 是微软的原生方案。纯做编程助手的独立赛道已经被大幅压缩。浏览器和计算机自动化。 OpenAI 的 Operator、Anthropic 的 Computer Use、Google 的 Gemini Astra。三家前沿实验室现在都有这个方向的产品。所有用 LLM 做 RPA 的创业公司都在打防守战。RAG 管道和向量搜索工具。 基本被商品化了。大多数模型 API 内置了原生检索能力。框架层面的差异化已经消失。通用 AI 助手和效率工具。 被 Claude、ChatGPT 和 Gemini 直接吃掉。提示词管理和评估工具。 越来越多地成为原生功能。LangSmith 还有一点空间,但那是和时间赛跑。模式非常一致:实验室发现某个类别获得了可观的开发者关注,判断它和自己的核心产品紧密相邻,然后发布一个版本。不一定更好,但集成、默认更便宜、而且分发能力是创业公司无法匹敌的。你现在该怎么办如果你现在在做 AI 创业,要问的问题不是「这个有没有需求」。需求到处都是。要问的是:这个东西会不会被一家银行里有 100 亿美元以上的实验室用一个产品发布就干掉?如果答案是「会」甚至「可能会」,那就不是一门生意,那是一个功能。持久的打法具备以下特征:深度垂直特异性(实验室能做通用的,但做不了你的那种通用)、无法通过爬公开网络就能复制的私有数据或关系、让「直接调 API」不够用的监管和合规复杂性、以及在信任和本地上下文比原始能力更重要的社区中拥有分发渠道。淘金热是真的。遍地是金子。但矿工现在也在开店了,而且用的是无限资本。卖首饰。把黄金当工业原料用。做一些矿工自己没兴趣做的东西——因为它太小众、太本地化、太深度嵌入在它们永远不会拥有的领域知识中。这就是我认为的正确打法。
Thank you for reading this post, don't forget to subscribe!