01 / 14

封面

👆 上下滑动阅读 · 左右滑动翻页 · 键盘方向键同理

🇬🇧

Code with Claude London 2026
开场主题演讲从 Boris 的 TI-83 计算器到 Claude prompt Claude Code

2026 年 5 月 19 日，Anthropic 在伦敦举办 Code with Claude 首次海外开发者大会——「这是我们第一次把 Code with Claude 带出旧金山」。这是 46 分钟的开场 keynote（主题演讲），由 Boris Cherny（Claude Code 创造者）开场、Lisa Crofoot 讲模型层、Angela / Katelyn 讲平台层、Cat / Boris 收尾——5 位主讲人串联 Anthropic 2026 全产品。

17×

Claude API 年同比调用量

20h

普通开发者每周用 Claude Code 时长

过去 12 个月发布的 frontier 模型

46′

本场 keynote 时长（分钟）

YouTube · Code with Claude London 2026 开发者大会 · 2026 年 5 月 19 日（伦敦现场）· 视频次日发布

含 82 个术语注释 · 点击虚线词条查看背景

蓝色虚线 = 技术名词

绿色虚线 = 公司 / 产品 / 人物

橙色虚线 = 概念 / 方法论

紫色虚线 = AI 模型

先把全场说清楚

EPISODE 0 · 三大要点

三句话结论整场 46 分钟，Anthropic 想在伦敦说三件事：(1) the exponential（指数曲线） 没有放缓，越走越快；(2) 开发者要为下一代 Claude 设计，不是为今天的；(3) 默认范式正在反转——从「你 prompt Claude Code」变成「Claude 用 Routines 自动 prompt Claude Code」。

没有新模型发布——但有 Opus 4-7 已就绪，Mythos preview 公开。今天是产品层+企业级基础设施升级。
三层故事的串联：Lisa 的能力曲线 + Angela / Katelyn 的「自评分自改进的 agentic 代理」 + Cat / Boris 的 Routines。Boris 收尾点题：能力已经在这里了，剩下的鸿沟是我们多快把它投入使用。
London 站特别公告：Managed Agents 新增 self-hosted sandbox（让 agent 在你自己的服务器上跑）和 MCP Tunnel（agent 安全接入内网 MCP server），破解企业「不能让数据出墙」的合规死结。

注：本场（2026-05-19 伦敦）与 2026 年 5 月 6 日 SF 站高度同步——演讲人/福利公告/客户案例几乎一致。差异在于：开场由 Boris 而非 Ami；新增 Counter 演示（取代 SF 的 Lumara 月球着陆）；首次强调 self-hosted sandbox + MCP Tunnel 这对企业基础设施新原语。

Boris 开场：13 岁的 TI-83 计算器

EPISODE 1 · 我是怎么开始写代码的

Boris Cherny（Anthropic · head of Claude Code）

早上好，伦敦。这是第一次我们把 Code with Claude 带出旧金山，非常激动跟大家在这里。

开始之前——我能先自拍一张吗？……好，搞定了。

今天我想从一件事讲起：我是怎么开始写代码的。我是在 TI-83 calculator（一种科学计算器）上学的编程。我发现可以给计算器写程序，帮自己过数学考试、做对作业。后来我把这套教给了全班同学——「你的计算器其实是个能编程的小电脑」。这是我人生第一次感受到「代码能放大一个人能做的事」。

"It's the calculator feeling, except the calculator can write a distributed system."
「这就是那种『计算器跑通了』的感觉——只是现在这个计算器能写分布式系统。」

— Boris，开场把"童年编程"接到"Claude 时代"

"The distance between I have an idea and it runs just kept getting longer. What's happening now is that distance is collapsing again."
「『我有一个想法』到『它跑起来』之间的距离一直在变长——但现在这个距离正在重新缩短。」

— Boris，给 keynote 定调的核心命题

这句话是整场 keynote 的论题童年 TI-83 上"想法→跑起来"几乎是秒级；工业级软件让这段距离变成月级、季度级；Claude / Claude Code 时代——这个距离再次回到分钟、小时级。

后续整场 46 分钟的所有内容，无论是 Lisa 的 17 个版本演进、Angela/Katelyn 的 Managed Agents、还是 Cat 的 Routines / Autofix——都是在把这段距离继续往零处缩。

为什么从这里说起 Boris 在 London 站开场没有先讲产品，而是讲写代码的"那种感觉"——按下 compile（编译）等程序跑出来、看到结果时的喜悦、发现、放心、和兴奋。

他要传达的核心：Claude 让"那种感觉"回来了，而且放大到任何人——经理、VP、设计师，多年没动代码的人，因为 Claude 在他们手里又开始 ship 了。

Spotify 千仓迁移 + Binti 的 20 天

EPISODE 2 · 客户案例 · 速度的两种意义

Boris 紧跟开场给了两个客户案例——一个讲工业效率，一个讲社会影响。

案例 1 · Spotify（音乐流媒体巨头）

Spotify 用 Claude Code 迁移成千上万个代码仓库。他们构建了背景 agent，读纯英文写的迁移说明，跨 agent fleet 并行跑，每月合并 1000+ PR 到生产。

结果：迁移时间缩短超过 90%——团队从"被代码债务拖死"里解放出来。

案例 2 · Binti（儿童福利软件）

Felicia Curcuru 是 Binti 的联合创始人 CEO。Binti 的软件被儿童福利系统的社工（caseworker）使用——处理纸面材料、家访、licensing（执照审批）流程。

这一年，她团队用 Anthropic 的 Claude API 把 licensing 一个 foster family（寄养家庭）的流程缩短了 20 天。

"20 days. It's not just an efficiency metric. That's a kid connecting with a family."
「20 天。这不只是效率指标。这是一个孩子能更早进入一个家。」

— Boris 讲完这句，停了 2 秒

Boris 用这两个案例的对比，定义了演讲的命题方向——AI 不只是工业效率工具，也是社会基础设施。

17× / 20h + SpaceX Colossus 1 算力

EPISODE 3 · 数据指标 + 算力公告

指数曲线还在加速 Boris 用 3 个数字证明 the exponential 没放缓——

17×

Claude API 一年同比调用量增长

20h

普通开发者每周用 Claude Code 的时长

200%

某 wall-to-wall 部署的企业，PR 数量增长

「有些人已经活在 frontier（前沿）上」，Boris 说，「能力已经在这里——剩下的鸿沟，是业务模式还停留在线性」。

本场最实在的福利 London 也宣布了 3 个具体的能力扩容：

Claude Code · 5h rate limit

翻倍 · 2×

覆盖 Pro / Max / Team / Enterprise plan

Claude API · Opus

大幅提升

「considerably」raise

编辑注 · 算力来源

让 rate limit 翻倍的算力来自哪里？Anthropic 和 SpaceX 合作，租下了 Colossus 1 数据中心的全部算力。这笔算力 Anthropic 不投给企业大客户，而是直接投给个人开发者和小团队。

Lisa Crofoot 上场：17 个 Claude 版本的进化史

EPISODE 4 · 模型层 · 17 个版本

Lisa Crofoot（Anthropic Research PM）

我是 Lisa，2023 年加入 Anthropic。自那以来，我们交付了 17 个不同版本的 Claude给开发者和用户——跨 Haiku / Sonnet / Opus / Mythos 全谱系。

过去 12 个月，我们 ship 了 8 个 frontier 模型。每一代都让你的 starting line（起跑线）向前移动。

Opus 3

JSON 严格遵守 vs 长代码质量的两难

两个本质矛盾的目标——既要严格输出 JSON，又要长代码生成最优。我们解了这个 trade-off（取舍）。

Sonnet 3.5 / 3.6

Computer use（电脑操作）教会 Claude 安全操作电脑

这一代起，Claude 能自己用 computer——但要做到安全（不乱点、不破坏环境）是要专门 train 的能力。

Sonnet 3.7

「略过头（over-eager）」倾向的驾驭

这一代 Claude 略微"too over-eager"——爱抢着做。我们找到了正确的 UI 暴露方式让开发者从这种性格里榨出最大价值。

Claude 4.0 · 2025.05

Thinking dial（思考拨盘）处理 test-time compute

让模型在推理时可以分配不同强度的思考资源。这是 frontier capability 的关键技术。

Opus 4-7 · 2026.05（当前）

能端到端 own outcomes，应用 judgment（判断力）

Amp 把 smart mode 整个搬到 Opus 4-7（最高分 + 简化 scaffolding）；Rakuten 解决了 3 倍数量的生产工程问题；Intuit 看到模型识别自己 planning 阶段的逻辑错误并回溯。

"Users view Claude as a valued thought partner, since it's willing to challenge their beliefs and push back when they're wrong."
「用户把 Claude 看作有价值的思考伙伴——因为它愿意挑战你的想法、在你错的时候推回去。」

— Lisa Crofoot 引用用户原话

Mythos preview：找到 27 年没人发现的 OpenBSD 漏洞

EPISODE 5 · 模型能力的指数证据

Mythos preview 是 Lisa 的压轴展示 Mythos 读完了 OpenBSD 整个源代码树，发现了一个 27 年没人发现的 OpenBSD vulnerability（OpenBSD 漏洞）——这个 bug 躲过了每个人类 reviewer（评审者）、每个 fuzzer（模糊测试器）、每个 static analyzer（静态分析器）近 30 年。

2 年前

能写一封不错的邮件

那时候 frontier 模型能写一封像样的电子邮件，大家就已经很满意了。

1 年前 · CWC 2025

Opus 4.0：agent 跑一小时的远期目标

「agent 能跑一小时不需要人介入」还是一个 stretch goal。

6 个月前

agents 跑通宵

已经能 end-to-end overnight 跑完——人早上醒来看完成的工作。

上个月 · 2026.04

Mythos 找到 27 年的 OpenBSD 漏洞

读完整个源码树，定位到一个跨 30 年的安全漏洞。这是模型能力的非线性跃迁——之前所有自动化工具都失败了。

"The jumps keep getting bigger and the intervals keep getting shorter."
「跳跃越来越大，间隔越来越短」

— Lisa 总结指数曲线

但是——模型能力在指数级提升，多数组织接入 AI 还是线性路径。这就是「the gap」（鸿沟）。

Lisa 的三大方向 + 给开发者的话

EPISODE 6 · 接下来 + 怎么做

三个明确方向 Lisa 直接说接下来 frontier 模型在攻三件事：

更高的判断力 + 代码品味——可以信任 Claude 做复杂的自主工程工作
感觉无限的 context window（上下文窗口）+ 高质量 memory——长时间任务，效果还更好
Multi-agent orchestration（多代理编排）——一组 agent 协作完成单个 instance 永远不可能完成的目标

task horizon（任务时长）的跃迁 Lisa 的衡量指标——「模型在没有人介入的情况下持续提升产出质量的工作时长」。
去年这时候：minutes（分钟）级别。
现在：hours（小时），多数开发者每天都见。
明天：proactive（主动）、always-on（永远在线），知道自己该做什么不丢主线。

编辑注 · Lisa 给开发者的 3 个动作

(1) 维护并创造更难的 eval（评测集）——这样模型变强时你能立刻发现；
(2) 建造你今天觉得做不出的雄心 prototype（原型）——「something magical might suddenly start passing（某些神奇的事情可能突然就 work 了）」；
(3) 用自动化 eval + 简单 scaffolding 让 model upgrade 变便宜。

她特意强调——以前 scaffolding 是为了「撑起」模型，现在 scaffolding 是为了 amplify（放大）模型。

"You're the first to feel that you're the first to experiment, the first to build new products, and the first to find markets that nobody else sees yet."
「你们是第一个感受到这件事的人。第一个去实验、第一个去做新产品、第一个去发现还没人看到的市场。」

— Lisa 收尾，给伦敦开发者

Angela & Katelyn 上场：Advisor Strategy 拆解

EPISODE 7 · 平台层 · 顾问策略

Angela 和 Katelyn（Claude Platform 团队）

像 Boris 提到的——模型能力在指数级提升，但 business（商业）还在 linear（线性）运行。差距是什么造成的？我们诊断两个核心问题：

(1) 拿到期望 outcome（结果）仍然太难——要做大量的 prompt 优化、工具构造、agentic harness 工程；
(2) 既要 ship fast（快速发布）又要 ship scalably（规模化稳定）极难——prototype 容易，scale 到 production 难。

Advisor Strategy（顾问策略） · 一招同时降本提质在 messages API 的 tools array（工具数组）里加一行配置，就能让架构分成两层：执行用小模型（Sonnet 或 Haiku）便宜跑，遇到难题时主动调用大模型（Opus）做顾问（advisor）。

单跑 Sonnet

基线

质量：基准
成本：基准

Sonnet 执行 + Opus 顾问

质量↑ + 成本↓

质量超过 Sonnet 单跑
成本比 Sonnet 单跑还低

「Eve Legal 告诉我们：用 advisor strategy 拿到了 frontier 模型的质量，但成本只有 1/5。」

— Katelyn 引用客户反馈

这个特别适合 freemium（免费增值）产品——你想给用户好体验，但又要控制 token（令牌）成本。或者高 volume workload（高量工作流）——ROI（投资回报率）要看得清。

Managed Agents 三件套：Multi-agent / Outcomes / Dreaming

EPISODE 8 · 三个新原语 + Asana 案例

Managed Agents（托管代理）是什么 Anthropic 提供的 agentic harness（代理壳层）——配套 production-grade 基础设施。开箱即用：memory（自动调好）、并行架构、observability。Asana 已经用它在产品里构建 AI teammates（AI 队友），让人在 Asana 项目里直接和 agent 协作。

「memory 是属于你的——你可以随时导出、用到任何地方。」

本次 London 大会给 Managed Agents 加了 3 个新能力——

特性 1

Multi-agent orchestration（多代理编排）

创建 fleet of agents（一队代理）解决复杂任务。每个 sub-agent 有独立 thread（线程）和独立 context window——「我们做了实验，这样比单 agent 共享 context 表现更好」。

特性 2

Outcomes（结果导向）

用一个简单的 markdown 文件描述「什么是成功」。Claude 自己 iterate 直到达成——背后是 grader agent 在每轮评估。可以设最大迭代次数防止跑飞。

特性 3

Dreaming（做梦 · 自学习）

在 dashboard 点 Dream 按钮——Claude 回看所有过去 session，自己挑出 lessons、技能盲区，写入 memory store。下次启动时自动 reference。本质是 self-improvement loop（自我改进闭环）。

Counter 演示：MCP Tunnel + 自托管 Sandbox

EPISODE 9 · London 站现场演示 · 企业级基础设施

Counter（虚构 AI 原生公司）演示 Katelyn 现场搭建一个虚构创业公司 Counter——为小商家提供数字店面软件。Counter 想成为 AI 原生（AI-native）企业。最常见的任务：跑 growth experiment（增长实验）来优化商家入驻流程。

她在 Managed Agents 上搭了一个 GrowthBot agent，并展示它如何主动监控 A/B 测试、发现赢家、清理旧变体、提议下一步优化。

SETUP · 配置

3 个 MCP server + Claude API key

GrowthBot 接 3 个 MCP server：Slack（公网）/ 数据仓库（防火墙后）/ feature flag service（防火墙后）。后两个 URL 都以 tunnel.anthropic.com 结尾——这是 MCP Tunnel 在工作。

RUN · 自动跑

A/B 测试有了赢家

GrowthBot 收到 A/B 实验事件，自动分析数据——variant C 显著胜出。它不等人发问，先去 Slack 告知团队，再询问"要不要清理旧 variants？"

EXECUTE · self-hosted sandbox 落地

在 Vercel 自己的服务器执行

人回复"yes"后——agent 在 Vercel 客户自家的沙箱里 checkout git branch、写代码、删旧 variant、push 改动。代码全程没离开客户的 Vercel。Anthropic 只拿到了"成功完成"的事件。

PROACTIVE · 主动延伸

发现 46% drop-off 漏斗问题

收尾时 agent 主动说："顺便我注意到入驻流程第 3 步有 46% drop-off——要不要我下一轮也优化这里？"——这是 agent proactivity（主动性）的实例。

"You can just let it run while you work on something else."
「你可以就让它跑着，自己去做别的事。」

— Katelyn 总结 Counter demo

London 站新增的 self-hosted sandbox + MCP Tunnel 解决了企业最大的 agent 障碍——代码和数据不能出墙。Anthropic 把"沙箱"和"内网接入"都做成 first-class 基础设施。

Cat：Claude Code 4 个新原语 + Desktop App

EPISODE 10 · Claude Code 新原语

Cat（Claude Code 产品负责人）

我们听开发者反馈最多的痛点：(1) PR 总是要人 babysit（盯着）——CI flaky、code review 评论、merge conflict；(2) 收到新 ticket / 新 bug report 要手动启动 Claude Code；(3) 安全团队跟不上 ship 速度。

所以我们做了 4 个新东西——

原语 1

Autofix（自动修复）

监听 PR 所有事件，自动 push fix 让 PR 永远绿。CI flaky / code review 评论 / merge conflict 全包。

原语 2

Routines（例程）

配置一次后，监听 webhook / API event / 定时计划，自动启动 Claude Code。

原语 3

Cloud Security（安全扫描）

夜间扫码库找漏洞，自动 kick off Claude Code 处理。Anthropic 内部所有团队每天都用。

新产品

Desktop App + Remote Control

全屏 GUI 看所有并行 session；手机 (iOS/Android) 可远程启动 Claude Code。「async coding 才是常态」。

Code Review 产品另一个伴随发布：Claude Code Review——部署一支 agent 团队遍历所有代码变更、捕捉关键 bug。所有 Anthropic 内部团队都在使用，已成内部标准流程。

"We think of ourselves more like mountaineers—just climbing alongside you in terrain that none of us has mapped before, figuring things out as we go."
「我们把自己看作登山者——和你们一起在没人画过地图的地形里往上爬，边走边摸索。」

— Cat，对 Claude Code 团队使命的隐喻

Boris 演示：Acme Pay 退款功能 + Routines + Autofix

EPISODE 11 · 现场 Claude Code demo

Boris Cherny（head of Claude Code）

我已经讲过的一切对我来说仍然感到魔幻。但理论说多了——让我演示给你看。

场景：虚构支付公司 Acme Pay——给商家 dashboard 加 refund（退款）功能。需要 idempotency（幂等性，重复 webhook 不要双倍退款）、多币种处理（Acme 跨地区）、audit log（为合规团队留痕）。

PROMPT

一句话需求 → Claude Code Desktop

Boris 在 Desktop App 里描述需求。Claude 开始完整实现，包括 idempotency 和多币种处理。

VERIFY · 自我验证

Claude 自己打开浏览器试退款

写完后 Claude 开 Acme Pay 商家 dashboard，手动触发一笔退款——结果没有 success toast 弹出。这是个 edge case。

DEBUG · 自我修复

追踪到 race condition

Claude 自己定位到——modal 在 success toast 之前关闭了。根因是 optimistic update（乐观更新）的竞态条件。Claude 修代码，再次在浏览器验证后才声明 done。

PARALLEL · 并行

Desktop App 看见所有 Claude Code session

这个 refund session 不是单跑——Desktop 同时显示多个 Claude Code session，状态分 running / 等输入 / PR merged。你可以在 4-5 个项目之间切换。

ROUTINE · 自动触发

这个 session 是被 routine 触发的

Boris 揭晓——「这个 refund session 本身就是被 routine 启动的」。routine 监听 GitHub issue 关键词，在夜间自动 kick off Claude Code。早上他打开 Desktop 已经看到 PR 接近 ready。

AUTOFIX · 自动 fix CI

网络超时 → 自动重试 → 修根因

PR CI 报 network timeout——Autofix 自动诊断、决定先重试 + 修根本原因。PR 全程没用 Boris 出手。

"For me personally, a lot of my code nowadays is written by routines. I'm not the one doing the prompting. I'm the one creating a routine that does the prompting. Think of it like a higher-order function. Routines are a higher-order prompt."
「就我个人而言，现在我的代码大部分是被 routines 写的。我不是在做 prompt——我是在创建一个去做 prompt 的 routine。把它想成高阶函数——routines 就是 higher-order prompt（高阶提示）。」

— Boris Cherny

收尾：Shopify · Mercado Libre · 「我让 Claude prompt Claude Code」

EPISODE 12 · 企业级落地 + 新默认

关键转变 Cat 重点讲这两个案例——Claude Code 不再只是工程师的工具，而是整个组织在用。设计、产品、数据科学全都用，VPs 和 manager 又开始亲自下代码了。

23K

Mercado Libre 全部工程师都在用 Claude Code

500K+

Claude review 过的 PR 数量（有人类监督）

9000+

已 modernize 的 app 数量

90%

Oscar Mowen 给的 Q3 自主编码目标

Shopify 案例

Andrew McNamara（Director of Applied AI · 应用 AI 总监）的原话："The speed is just crazy."（速度简直疯狂。）Claude Code 完全改变了 Shopify 造内部工具的方式。

Shopify 把 Claude Code 推到整个公司——工程团队 + 设计 + 产品 + 数据科学，并把它直接 build 进自家平台、给商家提供工具。

"A lot of managers and VPs we talked to are getting their hands dirty in the code base again."
「我们聊过的很多 manager 和 VP 都开始重新动手写代码了。」

— Cat 总结她最爱的细节

整场 46 分钟 keynote 的命题，Boris 在收尾两段话里点明——

"The default isn't 'I'm gonna prompt Claude Code.' The default is now: 'I will have Claude prompt Claude Code.'"
「默认不再是『我去 prompt Claude Code』。默认现在是『我让 Claude 去 prompt Claude Code』。」

— Boris Cherny · 范式宣言

"Lisa's capability curve, Angela and Katelyn's agents that grade and improve themselves, what Cat and I just showed you—these are three layers of one story. The capability is already here. The gap left is how fast we put it to work."
「Lisa 的能力曲线，Angela 和 Katelyn 的自评分自改进 agent，我和 Cat 刚才演示的——这些是一个故事的三层。能力已经在这里了。剩下的鸿沟，是我们多快把它投入使用。」

— Boris 收尾

今天 London 能拿走什么：

1. Claude Code 5h rate limit 翻倍（Pro / Max / Team / Enterprise）
2. Opus API 限额大幅提升（SpaceX Colossus 1 算力）
3. Routines + Autofix + Cloud Security 今天可用
4. Managed Agents 三件套：Multi-agent + Outcomes + Dreaming
5. Advisor Strategy：Sonnet 执行 + Opus 顾问，5× 更便宜
6. London 特别公告：self-hosted sandbox（Vercel / Cloudflare / Modal / Daytona）+ MCP Tunnel（tunnel.anthropic.com）破解企业基础设施死结

为下一代 Claude 设计，不为今天的

原视频：Code with Claude London 2026 · Opening Keynote · YouTube
主讲：Boris Cherny（Anthropic · head of Claude Code）/ Lisa Crofoot（Research PM）/ Angela & Katelyn（Claude Platform）/ Cat（Claude Code）
日期：2026 年 5 月 19 日 · 英国伦敦（首次海外）
本文注释字典：82 个术语 · 4 类标记

封面

Code with Claude London 2026开场主题演讲从 Boris 的 TI-83 计算器到 Claude prompt Claude Code