Skip to content

WT快讯

WeTrying | 币圈快讯早知道

Menu
  • 首页
  • 工具包
Menu

Anthropic 数据:AI Agent 近半调用集中在软件工程,这 16 个垂域仍是蓝海

Posted on 2026-02-24 15:53

作者:Garry’s List编译:深潮 TechFlow深潮导读:Anthropic 最新发布了迄今最全面的 AI Agent 真实使用研究,核心数据是:软件工程占据近 50% 的 Agent 工具调用量,而医疗、法律、教育等 16 个垂直领域加起来还不到剩余的一半,每个领域份额均低于 5%。这不是市场饱和的信号,而是 300 个垂直 AI 独角兽的地图——更有价值的是文章引用的一个反直觉发现:模型已经能独立工作近 5 小时,但用户实际只让它工作 42 分钟,这个”信任赤字”本身就是下一个产品机会。全文如下:软件工程占所有 AI Agent 工具调用量的近 50%。医疗、法律、金融等 16 个垂直领域几乎未被触及,每个领域均低于 5%。这意味着有 300 个垂直 AI 独角兽等待被建造出来。如果我今天要创业,我会盯着上面那张柱状图的红色区域,直到我看见自己的未来。Box 创始人 Aaron Levie 表示:这张图很好地提醒了我们,AI Agent 领域现在有多大的机会。水平方向当然会有大量 Agent 机会,但同样有很多工作流需要深厚的领域专业知识,才能真正帮助用户自动化其所在垂直领域的独特流程。模板是:构建接入专有数据的 Agent 软件,以有效衔接用户与 Agent 协作的方式处理工作流,同时具备深度领域专属的上下文工程能力,以及推动客户侧变更管理的能力。目前许多领域仍存在巨大空白。软件工程占据了所有 AI Agent 活动的半壁江山。另一半分散在 16 个垂直领域,没有一个超过 9%。医疗占 1%,法律占 0.9%,教育占 1.8%。这些不是饱和市场,而是几乎还不存在的市场。Anthropic 刚刚发布了迄今最全面的 AI Agent 真实使用研究。核心发现是:软件工程占其 API 上 49.7%的 Agent 工具调用量。被埋在后面的核心结论是:其他一切都是蓝海。部署滞后有一个数据应该让创业者兴奋不已:模型的能力已经远超用户愿意信任它的边界。METR 的能力评估显示,Claude 可以解决需要人类近五小时才能完成的任务。但在实际使用中,第 99.9 百分位的会话时长只有约 42 分钟。这个差距——AI 能做什么与我们允许它做什么之间的差距——是一个巨大的机会。图:信任是一种会不断积累的技能。新用户会自动批准 20% 的会话。到 750 次会话时,这一比例会超过 40%。图片:Anthropic 来源: x.com这并不矛盾,而是监督策略的转变。初学者在操作发生前逐步审批,老用户则是先授权、在出问题时再介入——他们已经从预先审批转向了主动监控。以下是一个在安全层面值得关注的发现:在复杂任务上,Claude Code 主动请求澄清的频率超过人类主动干预频率的两倍。Agent 会暂停确认,而不是一路冲到底。这是特性,不是缺陷。”这项研究的核心启示是:Agent 在实践中行使的自主权,是由模型、用户和产品共同构建的。Claude 在不确定时会暂停提问,以此限制自身的独立性。用户在与模型协作的过程中建立信任,并相应地调整自己的监督策略。”Levie 的垂直 AI 打法Aaron Levie 指出了等待被解锁的巨大财富与价值:构建接入专有数据的 Agent 软件,让它真正解决真实的人和问题,把上下文塞满以最大化智能输出,以及——这是大多数创业者忽略的部分——推动客户侧的变更管理。最后这一点正是垂直 AI 如此难以被复制的原因。任何人都能搭一个 API 封装,但很少有人能真正驾驭医疗账单、法律发现或建筑许可证审批中特有的工作流、监管约束和组织阻力。SaaS 在过去几十年里每十年增长十倍。过去 20 年超过 40%的风险投资资金流向了 SaaS 公司。这个行业诞生了 170 多只 SaaS 独角兽。逻辑很简单:这些独角兽中的每一只,都有一个垂直 AI 版本在等待出现。而 AI 版本可能会大十倍,因为它取代的不只是软件,还有操作人员。共同构建的本质Anthropic 的核心发现值得任何参与 AI 政策制定的人认真关注。自主权不是模型的固有属性,而是由模型、用户和产品共同构建的。部署前的评估无法捕捉这一点,你必须在真实使用中去衡量。Anthropic 官方表示:软件工程约占我们 API 上 Agent 工具调用量的 50%,但我们也看到其他行业正在涌现。随着风险与自主权的边界持续扩展,部署后的监控变得至关重要。我们鼓励其他模型开发者扩展这项研究。安全层面的数字令人放心:73%的工具调用有人类在回路中参与,只有 0.8%的操作是不可逆的。最高风险的部署场景——如 API 密钥泄露或自主加密交易——大多是安全评估,而非真实生产环境。”规定具体交互模式的监管要求——例如要求人类批准每一个操作——只会制造摩擦,而不一定带来安全收益。”强制要求”批准每一个操作”的政策,会杀死生产力收益,却不会增加安全性。更好的目标是确保人类能够监控和介入,而不是规定具体的审批工作流。独角兽藏在哪里地图已经画好。软件工程已经有人在做了。医疗、法律、金融、教育、客服、物流——16 个垂直领域,每个市场份额均为个位数——都在等待有人把领域专业知识真正嵌入 Agent。此前诞生了 300 只 SaaS 独角兽,接下来 300 只垂直 AI 独角兽即将出现。那些选定垂直领域、把领域专业知识嵌入 Agent、并想明白如何驱动变更管理的创始人,将拥有下一个十年的企业软件市场。模型已经能工作五小时,用户只让它工作 42 分钟。这就是信号:我们仍然处于极早期,还有大量东西可以建造,而且在无数个还没有见过哪怕一分钟智能发挥作用的地方。

相关

近期文章

  • 为什么 85% 的代币发行,最终都变成昂贵的「葬礼」?
  • 【TEAMZ Summit 2026】Title 与 Gold 赞助火速售罄,Platinum 最后 1 席、Silver 剩 3 席
  • 以太坊基金会宣布已开始质押其国库资金,计划共质押约 7 万枚 ETH
  • ETH 跌破 1900 + Vitalik 抛售,华尔街十大银行却在同步加仓 Bitmine 股票
  • 币安将上线 ADA/U、DOGE/U、PEPE/U和TAO/USD1 现货交易对

归档

  • 2026 年 2 月
  • 2026 年 1 月
  • 2025 年 12 月
  • 2025 年 11 月
  • 2025 年 10 月
  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月

分类

  • 1kx (1)
  • 21Shares (1)
  • a16z (1)
  • Aave (3)
  • ai16z (1)
  • Alameda Research (1)
  • Alpaca (1)
  • Arbitrum (1)
  • Ark Invest (1)
  • Arkham (1)
  • Avail (1)
  • Azuki (1)
  • Base (1)
  • Berachain (1)
  • Bitget (8)
  • BlackRock (3)
  • Brian Armstrong (1)
  • BTC (4)
  • Bybit (2)
  • Canary (1)
  • Cathie Wood (1)
  • Coinbase (3)
  • Coinbase Prime (2)
  • Coinbase Ventures (3)
  • CoinDesk (2)
  • CoinGecko (1)
  • Cointelegraph (1)
  • COMP (1)
  • Compound (1)
  • DAO (1)
  • DATA (2)
  • DeAI (1)
  • DePIN (1)
  • DEX (3)
  • EARN (1)
  • Eliza (1)
  • ETF (4)
  • ETH (4)
  • Ethos Network (1)
  • Fartcoin (2)
  • FDUSD (1)
  • FLock.io (1)
  • FLUID (1)
  • FUEL (1)
  • Gas (2)
  • GPU (1)
  • Grayscale (1)
  • IEO (1)
  • Inception (1)
  • IOG (1)
  • Jupiter (1)
  • Kairos (1)
  • Kaito (1)
  • Launchpool (1)
  • Layer2 (1)
  • Liquidity (1)
  • Magicblock (1)
  • Mango Markets (1)
  • Mechanism Capital (1)
  • Meebits (1)
  • Meme (3)
  • Netflix (1)
  • NVIDIA (1)
  • Ondo (1)
  • OpenAI (2)
  • Paradigm (1)
  • Polygon (3)
  • Pudgy Penguins (1)
  • pump.fun (1)
  • Raydium (2)
  • Robert Leshner (1)
  • Robinhood (1)
  • Sam Altman (1)
  • SEC (4)
  • Securitize (1)
  • SideKick (1)
  • SNX (1)
  • SOL (1)
  • Solana (3)
  • Stani Kulechov (1)
  • StarkWare (1)
  • STO (1)
  • Stripe (1)
  • SunDog (1)
  • SunPump (1)
  • Synthetix (1)
  • TechFlow (36,087)
  • The Block (2)
  • Tron (2)
  • TRX (1)
  • Upbit (1)
  • USDC (3)
  • WBTC (2)
  • Web3 (4)
  • WLD (1)
  • WOO X (1)
  • Xai (1)
  • Zora (1)
  • 交易所动态 (8)
  • 人工智能 (1)
  • 以太坊 (4)
  • 以太坊基金会 (1)
  • 信托 (1)
  • 借贷 (2)
  • 公链 (1)
  • 基础设施 (1)
  • 大额投融资 (1)
  • 存储 (2)
  • 孙宇晨 (2)
  • 安全 (2)
  • 富达 (1)
  • 工具 (2)
  • 币安 (7)
  • 快讯 (37,230)
  • 托管 (1)
  • 指数 (1)
  • 支付 (1)
  • 数据 (6)
  • 数据追踪 (4)
  • 智能合约 (1)
  • 未分类 (311)
  • 模块化 (1)
  • 欧洲 (1)
  • 欧盟 (1)
  • 比特币 (7)
  • 永续合约 (1)
  • 治理 (1)
  • 波场 (1)
  • 游戏 (3)
  • 火币 (1)
  • 灰度 (1)
  • 特朗普 (5)
  • 社交 (2)
  • 稳定币 (3)
  • 空投 (6)
  • 纳斯达克 (1)
  • 美国 (6)
  • 美国证券交易委员会 (3)
  • 英伟达 (2)
  • 英国 (1)
  • 萨尔瓦多 (1)
  • 融资 (3)
  • 行情异动 (7)
  • 贝莱德 (1)
  • 质押 (4)
  • 赵长鹏 (1)
  • 跨链 (3)
  • 跨链桥 (1)
  • 迪拜 (1)
  • 重要消息 (45)
  • 金库 (1)
  • 钱包 (4)
  • 阿根廷 (1)
  • 阿里云 (1)
  • 隐私 (2)
  • 项目重要进展 (9)
  • Bluesky
  • Mail
©2026 WT快讯 | Design: Newspaperly WordPress Theme