01 / 14

封面

👆 上下滑动阅读 · 左右滑动翻页 · 键盘方向键同理

🎙️

Code with Claude 2026
开场主题演讲从「指数曲线」到 Claude Code 演示

2026 年 5 月 6 日，Anthropic 在旧金山举办第二届 Code with Claude 开发者大会。这是 47 分钟的开场 keynote（主题演讲）——由 CPO Ami Vora 开场、Diane 讲模型层、Angela / Caitlyn 讲平台层、Cat / Boris Cherny 讲 Claude Code——4 位主讲人串联出 Anthropic 2026 年的产品全景。

17×

Claude API 年同比调用量

20h

普通开发者每周用 Claude Code 时长

过去 12 个月发布的 frontier 模型

47′

本场 keynote 时长（分钟）

YouTube · Code with Claude 2026 开发者大会 · 2026 年 5 月 6 日

含 75 个术语注释 · 点击虚线词条查看背景

蓝色虚线 = 技术名词

绿色虚线 = 公司 / 产品 / 人物

橙色虚线 = 概念 / 方法论

紫色虚线 = AI 模型

先把全场说清楚

EPISODE 0 · 三大要点

三句话结论整场 47 分钟，Anthropic 想说三件事：(1) the exponential（指数曲线） 没有放缓，反而越走越快；(2) 开发者要为下一代 Claude 设计，不是为今天的；(3) 默认范式正在反转——从「你 prompt Claude Code」变成「Claude 用 Routines 自动 prompt Claude Code」。

没有新模型发布——Ami 直接说「今天不是揭幕新模型的日子」，今天是产品层升级，让你能把已有能力翻译给世界。
三层故事的串联：Diane 的能力曲线 + Angela / Caitlyn 的「自我评分自我提升的 agentic 代理」 + Cat / Boris 的 Routines。Boris 在收尾时点题：能力已经在这里了，剩下的鸿沟是我们多快把它投入使用。
三个具体福利：Claude Code 的 5 小时 rate limit 翻倍；Opus API 限额大幅提升；通过和 SpaceX 合作的 Colossus 1 数据中心扩容。

Ami Vora 的开场：从编译键的那一瞬间说起

EPISODE 1 · 我为什么会在这里

Ami Vora（Anthropic CPO）

当我想起为什么会站在这里，我会回到第一次写程序、它真的跑起来的那一瞬间。我不是从小写代码长大的。我在阿巴拉契亚山脚下长大，从没自己组装过电脑，连电子游戏都没玩过。我大学第一次试着搭建复杂东西，是在计算机科学课。那时候我们得排队登入服务器——因为那是唯一足够强、能跑我们 Ray Tracer（光线追踪程序）的机器。

但有件事我永远记得——按下 compile（编译）那一刻，等程序跑出来的那个感觉：喜悦、发现、一丝放心，还有兴奋——我做出了一件世界上从来没有过的东西。那种感觉，就是让我留下来的原因。

"I feel like Claude has given me superpowers."
「我感觉 Claude 给了我超能力」—— 这是我最爱听到的用户反馈。

— Ami Vora

开场客户案例 · Stripe Scott McVicker（Stripe 开发者基础设施负责人）的团队有 50,000 行 Scala 代码需要迁移到 Java，才能升级 JDK。

初始估算：10 个工程师周。
用 Claude 后：4 天完成。

不只是效率指标：Binti 的 20 天

EPISODE 2 · 速度不只是效率

Ami 在 Stripe 之后讲了第二个例子，但她特意停了一下说——「有时候速度不只是关于效率，而是关于另一端在等的人」。

编辑注

Felicia Kakuru 是 Binti 的联合创始人 CEO。Binti 的软件被儿童福利系统的社工（caseworker）使用——处理纸面材料、家访、licensing（执照审批）流程。

这一年，她团队用 Anthropic 的 Claude API 把 licensing 一个 foster family（寄养家庭）的流程缩短了 20 天。

20 days.
It's not just an efficiency metric.
That's a kid connecting with a family.
「20 天。这不只是效率指标。这是一个孩子能更早进入一个家。」

— Ami Vora 在台上说完这句，停了 2 秒

这是整场开场最重的一个静默。Anthropic 在为「AI 不只是工具」这件事埋下论证——而它的论证是从工业到社会基础设施的故事路径。

指数曲线：四个时间锚点的跃迁史

EPISODE 3 · THE EXPONENTIAL · 指数

Anthropic 的核心叙事在 Anthropic，他们把这条曲线叫做 the exponential（指数）。Ami 用四个时间锚点画给你看：

2 年前

能写一封不错的邮件

那时候 frontier 模型（前沿模型）能写一封像样的电子邮件，大家就已经很满意了。

1 年前 · Code with Claude 2025

Opus 4.0：agent 跑一小时的远期目标

去年此时站在同一个舞台上，Opus 4.0 是主角。「agent（代理）能跑一小时不需要人介入」还是一个 stretch goal（远期目标）——值得专门强调的目标。

6 个月前

agents 跑通宵

那时已经能 end-to-end overnight（端到端通宵）跑完——人早上醒来看到完成的工作。

上个月 · 2026.04

Mythos 找到了 27 年的 OpenBSD 漏洞

Mythos 读完了 OpenBSD 整个源代码，发现了一个 27 年的 OpenBSD vulnerability（OpenBSD 漏洞）——这个 bug 躲过了每个人类 reviewer（评审者）、每个 fuzzer（模糊测试器）、每个 static analyzer（静态分析器）近 30 年。

The jumps keep getting bigger and the intervals keep getting shorter.
「跳跃越来越大，间隔越来越短」

— Ami Vora 总结指数曲线

但是——模型能力在指数级提升，多数组织接入 AI 还是线性路径。这就是「the gap」（鸿沟）。

rate limit 翻倍 + 一个意外的合作伙伴

EPISODE 4 · 新算力公告

本场最实在的福利 Ami 在 Stripe / Binti 之后给出了 3 个具体的能力扩容：

Claude Code · 5h rate limit

翻倍 · 2×

覆盖 Pro / Max / Team / 基于席位的 Enterprise（企业版）plan

Claude API · Opus

大幅提升

具体倍数未公布，方向是「considerably（显著）」raise

编辑注 · 算力来源

让 rate limit 翻倍的算力来自哪里？Ami 当场公布——Anthropic 和 SpaceX 合作，租下了 Colossus 1 数据中心的 全部算力。

这笔算力 Anthropic 不投给企业大客户，而是 直接投给个人开发者和小团队——这是 Ami 在台上特别强调的一句。

「随着时间推移，我们会继续探索一切让你最大化 Claude 价值的方式——包括现有的算力努力，以及更大胆的下注」（更大胆的下注还在路上）

Diane 上场：18 个 Claude 版本的进化史

EPISODE 5 · 模型层 · 18 个版本

Diane（Anthropic Research PM）

我是 Diane，2023 年加入 Anthropic。从 Claude 2.0 起的每一个模型我都参与了。

对那些数过的人——这是 18 个 Claude 版本，跨 Haiku / Sonnet / Opus / Mythos 全谱系，交付给开发者和用户。

Opus 3

JSON 严格遵守 vs 长代码质量的两难

两个本质矛盾的目标——既要严格输出 JSON，又要长代码生成最优。我们当时努力解了这个 trade-off（取舍）。

Sonnet 3.5 / 3.6 new

Computer use（电脑操作）教会 Claude 安全操作电脑

这一代起，Claude 能自己用 computer——但要做到安全（不乱点、不破坏环境）是要专门 train（训练）的能力。

Sonnet 3.7

「略过头（over-eager）」倾向的暴露与驾驭

这一代 Claude 略微"too over-eager"——爱抢着做。我们找到了正确的 UI 暴露方式，让开发者能从这种性格里榨出最大价值。

Claude 4.0 · 2025.05

Thinking dial（思考拨盘）处理 test-time compute

让模型在推理时可以分配不同强度的思考资源。这是 frontier capability（前沿能力）的关键技术。

Opus 4-7 · 2026.05（当前）

能识别自己 planning 阶段的逻辑错误并回溯

Amp 把 smart mode 整个搬到 Opus 4-7（最高分 + 简化 scaffolding）；Rakuten 解决了 3 倍数量的生产工程问题；Intuit 看到模型自己识别逻辑错误并回溯重做。

「过去 12 个月，我们交付了 8 个 frontier 模型。」Diane 强调——每一代都让你的 starting line（起跑线）向前移动。

Diane 的三大方向 + 一句话送给开发者

EPISODE 6 · 接下来 + 怎么做

三个明确方向 Diane 不卖关子——直接说接下来 frontier 模型在攻三件事：

更高的判断力 + 代码品味——可以信任 Claude 做复杂的自主工程工作
感觉无限的 context window（上下文窗口）+ 高质量 memory——长时间任务，效果还更好
Multi-agent orchestration——一组 agent 协作完成单个 instance（实例）永远不可能完成的目标

task horizon（任务时长）的跃迁 Diane 的衡量指标——「模型在没有人介入的情况下持续提升产出质量的工作时长」。
去年这时候：minutes（分钟）级别。
现在：hours（小时），很多开发者每天都见。
明天：proactive（主动）、always-on（永远在线），知道自己该做什么不丢主线。

Model upgrades are a business opportunity. The teams that are getting the most out of Claude are the ones who make upgrade cheap.
「模型升级是商业机会。从 Claude 上获益最多的团队，是让升级变便宜的那些团队。」

— Diane，给所有在场开发者的总结

编辑注 · 三个落地建议

Diane 给开发者的具体动作：
(1) 维护并创造更难的 eval（评测集）——这样模型变强时你能立刻发现；
(2) 建造你今天觉得做不出的雄心 prototype（原型）——「something magical might suddenly start passing（某些神奇的事情可能突然就 work 了）」；
(3) 用自动化 eval + 简单 scaffolding 让 model upgrade 变便宜。

她特意说——以前 scaffolding 是为了「撑起」模型，现在 scaffolding 是为了 amplify（放大）模型。

Angela & Caitlyn 上场：Advisor Strategy 拆解

EPISODE 7 · 平台层 · 顾问策略

Angela 和 Caitlyn

模型能力在指数级提升，但 business（商业）还在 linear（线性）运行。差距是什么造成的？我们诊断两个核心问题：

(1) 拿到期望 outcome（结果）仍然太难——要做大量的 prompt（提示）优化、工具构造、agentic harness 工程；
(2) 既要 ship fast（快速发布）又要 ship scalably（规模化稳定）极难——prototype（原型）容易，scale 到 production（生产环境）难。

Advisor Strategy（顾问策略） · 一招同时降本提质在 messages API 的 tools array（工具数组）里加一行配置，就能让架构分成两层：执行用小模型（Sonnet 或 Haiku）便宜跑，遇到难题时主动调用大模型（Opus）做顾问（advisor）。

单跑 Sonnet

基线

质量：基准
成本：基准

Sonnet 执行 + Opus 顾问

质量↑ + 成本↓

质量超过 Sonnet 单跑
成本比 Sonnet 单跑还低（因为 Opus 帮 Sonnet 一次到位）

「Eve Legal 告诉我们：他们用 advisor strategy 拿到了 frontier 模型的质量，但成本只有 1/5。」

— Caitlyn 引用客户反馈

这个特别适合 freemium（免费增值）产品——你想给用户好体验，但又要控制 token（令牌）成本。或者高 volume workload（高量工作流）——ROI（投资回报率）要看得清。

Managed Agents 升级：Multi-agent / Outcomes / Dreaming

EPISODE 8 · 三个新原语

Managed Agents（托管代理）是什么 Anthropic 提供的 agentic harness（代理壳层）——配套 production-grade（生产级）基础设施。开箱即用：memory（记忆，自动调好）、并行架构、observability（可观测性）。Notion 用它在产品里直接 fire long-running 复杂自主任务。

「memory 是属于你的——你可以随时导出、用到任何地方。」

本次大会给 Managed Agents 加了 3 个新能力——

特性 1

Multi-agent orchestration（多代理编排）

创建 fleet of agents（一队代理）解决复杂任务。每个 sub-agent（子代理）有独立 thread（线程）和独立 context window——「我们做了实验，这样比单 agent 共享 context 表现更好」。

特性 2

Outcomes（结果导向）

用一个简单的 markdown 文件描述「什么是成功」。Claude 自己 iterate（迭代）直到达成——背后是一个 grader agent（评分代理）在每轮评估。可以设最大迭代次数防止跑飞。

特性 3

Dreaming（做梦 · 自学习）

在 dashboard（仪表盘）点 Dream 按钮——Claude 回看所有过去 session，自己挑出 lessons（教训）、技能盲区，写入 memory store。下次启动时自动 reference。本质是 self-improvement loop（自我改进闭环）。

Lumara 月球着陆演示：从 4/6 到完美

EPISODE 9 · 现场演示 · 月球着陆

为什么是月球着陆？ Angela 和 Caitlyn 受了今天前面公告的启发——既然 Anthropic 都跟 SpaceX 合作了，那他们也来做一个 fictional startup（虚构创业公司）叫 Lumara，专做「用 agentic 软件让 drone（无人机）在月球上自主着陆挖矿」。

SET UP · 搭起来

3 个 agent 拆分职责

commander（指挥官）统筹整个 mission + detector（探测员）找适合着陆的矿点 + navigator（导航员）导航 + 安全着陆。commander 启动 sub-agent 各自独立 thread。

OUTCOMES · 写明标准

用 markdown 写明成功标准

drone 要软着陆 / 着陆在 clear ground（净空地形） / 留有足够燃料返航。这就是 outcomes 的 rubric（评分标准）——发送 event 给 session 让 grader 看着。

FIRST RUN · 第一次跑

6 个候选着陆点 · 一次成功 4/6

第一次跑——4/6 成功。站位 3 和站位 4 出问题。要 hill climb（爬坡优化）。

DREAMING · 做梦升级

点 Dream 按钮过夜跑

让 dreaming agent 回看所有过去 session，提炼 lessons 写入 memory。Caitlyn 演示：dream 最重要的产物是一个 descent playbook（着陆战术手册）——把过去经验抽象成下次 session 启动时直接 reference 的策略。

SECOND RUN · 升级后再跑

系统升级后表现明显改善

早上回到 Lumara dashboard 重跑 simulation（模拟）——结果显著好转。这就是「agents that grade and improve themselves（自评分、自改进的 agent）」。

Cat & Boris 的 Claude Code 革命：从 prompt 到 prompt 的 prompt

EPISODE 10 · Claude Code 新原语

Cat 演讲段

我们听开发者反馈最多的痛点：(1) PR 总是要人 babysit（盯着）——CI flaky（不稳定）、code review 评论、merge conflict（合并冲突）；(2) 收到新 ticket / 新 bug report 要手动启动 Claude Code；(3) 安全团队跟不上 ship 速度。

所以我们做了 3 个新原语 + 1 个新产品——

PRIMITIVE 1 · 原语 1

Autofix（自动修复）

监听 PR 所有事件，自动 push fix 让 PR 永远绿。CI flaky / code review 评论 / merge conflict 全包。

PRIMITIVE 2 · 原语 2

Routines（例程）

配置一次后，监听 webhook / API event / 定时计划，自动启动 Claude Code。

PRIMITIVE 3 · 原语 3

Cloud Security（安全扫描）

夜间扫码库找漏洞，自动 kick off Claude Code 处理。

DESKTOP APP · 桌面应用

看见所有并行 session

running / 等输入 / 已 merge 的 PR 都在一个界面。「async coding 才是常态」。

Boris Cherny（head of Claude Code）

演示的是一个叫 Acme Pay 的虚构支付公司——给商家 dashboard 加 refund（退款）功能。包含 idempotency（幂等性，重复 webhook 不要双倍退款）、多币种、audit logging（审计日志）。

Claude 写完后自己拉起 dashboard 试 refund——没有 success toast。这是真实 edge case（边界情况）。Claude 追踪到是 optimistic update（乐观更新）的 race condition（竞态条件），修了，再次在浏览器里验证后才声明 done。

整个 session 不是单跑——同时还有多个 session 在并行，可以在 Cloud desktop app 里看到所有的状态。

"For me personally, a lot of my code nowadays is written by routines. I'm not the one doing the prompting. I'm the one creating a routine that does the prompting. Think of it like a higher-order function. Routines are a higher-order prompt."
「就我个人而言，现在我的代码大部分是被 routines 写的。我不是在做 prompt，我是在创建一个去做 prompt 的 routine。把它想成高阶函数——routines 就是 higher-order prompt（高阶提示）。」

— Boris Cherny

规模化案例：Shopify / Mercado Libre 整组织级 AI 转型

EPISODE 11 · 企业级落地

关键转变 Cat 重点讲这两个案例的原因——它们都展示了一件事：Claude Code 不再只是工程师的工具，而是整个组织在用。设计、产品、数据科学全都用，VPs 和 manager 又开始亲自下代码了。

23K

Mercado Libre 全部工程师都在用 Claude Code

500K+

Claude review 过的 PR 数量（有人类监督）

9000+

已 modernize（现代化改造）的 app 数量

90%

Oscar Mullen 给的 Q3 自主编码目标

Shopify 案例

Andrew McNamara（Director of Applied AI · 应用 AI 总监）的原话："The speed is just crazy."（速度简直疯狂。）Claude Code 完全改变了他们造内部工具的方式。

Shopify 把 Claude Code 推到整个公司——工程团队 + 设计 + 产品 + 数据科学，并把它直接 build 进自家平台、给商家提供工具。

"A lot of managers and VPs we talked to are getting their hands dirty in the code base again. Cloud Code is putting coding back in the hands of people who've spent the last decades on roadmaps and reviews."
「我们聊过的很多 manager 和 VP 都开始重新动手写代码了。Claude Code 把编程送回了那些过去十年只看路线图和做评审的人手里。」

— Cat 总结她最爱的细节

收尾：「我让 Claude prompt Claude Code」

EPISODE 12 · 新默认

整场 47 分钟 keynote 的命题，Boris 在收尾两段话里点明了——

"The default isn't 'I'm gonna prompt Claude Code.' The default is now: 'I will have Claude prompt Claude Code.'"
「默认不再是『我去 prompt Claude Code』。默认现在是『我让 Claude 去 prompt Claude Code』。」

— Boris Cherny 的范式宣言

"Diane's capability curve, Angela and Caitlyn's agents that grade and improve themselves, what Kat and I just showed you—these are three layers of one story. The capability is already here. The gap left is how fast we put it to work."
「Diane 的能力曲线，Angela 和 Caitlyn 的自评分自改进 agent，我和 Cat 刚才演示的——这些是一个故事的三层。能力已经在这里了。剩下的鸿沟，是我们多快把它投入使用。」

— Boris 收尾的最后一段

今天能拿走什么：

1. Claude Code 5h rate limit 翻倍（Pro / Max / Team / Enterprise）
2. Opus API 限额大幅提升
3. Routines + Autofix + Cloud Security 今天可用
4. Multi-agent orchestration + Outcomes + Dreaming（Managed Agents 三件套）
5. Advisor Strategy：Sonnet 执行 + Opus 顾问，5× 更便宜

为下一代 Claude 设计，不为今天的

原视频：Code with Claude 2026 · Opening Keynote · YouTube
主讲：Ami Vora（Anthropic CPO）/ Diane（Research PM）/ Angela & Caitlyn（Claude Platform）/ Cat & Boris Cherny（Claude Code）
日期：2026 年 5 月 6 日 · 美国旧金山
本文注释字典：75 个术语 · 4 类标记

封面

Code with Claude 2026开场主题演讲从「指数曲线」到 Claude Code 演示