知名 Coding Agent 产品 AMP 砍掉了自己的 VS Code 编辑器扩展,60 天后自动停用。
AMP 是从 Sourcegraph 孵化出来的 AI 编程 Agent,2025 年 12 月独立为一家公司,团队 19 人,全员写代码。CEO Quinn Slack 和联合创始人 Thorsten Ball 在播客 Raising an Agent 第 10 集里宣布了这个决定。这期播客还讨论了 GPT-5.2 Codex 催生的新编程模式、为什么要为 Agent 牺牲人类开发体验、Skills 为什么比 MCP 更持久、OpenClaw 的爆红、以及软件行业正在以什么速度在变。
要点速览
AMP 将在约 60 天内砍掉 VS Code 编辑器扩展,认为“一个人对着侧边栏跟 Agent 来回聊”的模式已经到头了
GPT-5.2 Codex 和 Opus 4.5 可以达到同等质量的结果,但工作方式完全不同,AMP 为此创建了“Deep Mode”这个全新交互模式
在为 Agent 优化代码库的过程中,AMP 团队做了一个明确取舍:愿意让人类开发体验退步
Skills 作为一种抽象概念,在团队中比 MCP、自定义命令、自定义子 Agent 都更持久,已经成为 Agent 使用代码库的核心入口
手动管理上下文窗口的时代可能正在结束,GPT-5.2 Codex 的“先研究再动手”行为让自动压缩变得更可行了
【1】Deep Mode:不是换个模型,是换种工作方式
AMP 上周发布了 Deep Mode,这是 AMP 的第三种模式。Smart Mode 用 Opus 4.5,Rush Mode 用快速模型(目前是 Haiku),而 Deep Mode 用的是 GPT-5.2 Codex Medium。
【注:GPT-5.2 Codex 于 2026 年 1 月 14 日由 OpenAI 发布,是 GPT-5.2 针对编程场景的特化版本,支持上下文压缩(context compaction)和长时任务执行。】
Thorsten 问 Quinn:“我们内部试新模型时,是怎么发现它需要不同的使用方式的?”
Quinn 说他第一次试 GPT-5.2 Codex 的时候,感觉不对。这个模型不像 Opus 那样抢着执行、抢着回来问你。它有时候太“懒”了,你让它配置个 shell 文件什么的,它可能先研究半天,或者直接跟你说“你自己跑这几个命令就行”。
但他第二次带着“需要调整预期”的心态再试的时候,发现了不同的东西。
“你不再盯着助手了。之前我们说的那些'你应该怎么提示词、怎么做反馈循环',很多都不适用了。但结果不会骗人。”
Quinn 认为 Opus 和 Codex 可以达到同等质量的结果,但路径完全不同。Opus“手快嘴快”,想立刻跑命令、立刻回来找你。Codex 则是你把任务发出去,切到别的标签页干别的事,45 分钟或 60 分钟后回来看结果。
这就是为什么他们不是把 GPT-5.2 Codex 放进一个模型下拉菜单就完了,而是创建了一个全新的模式。Quinn 说 Deep Mode 里他们甚至没有放“用户反馈提问”工具,因为你根本不应该盯着它工作。
"如果我可以做到的话,我希望切换模式的时候 App 看起来完全不同。Smart Mode 是一种字体,切到 Deep Mode 就换一种字体,提示词长度至少得 100 个词。感觉应该像发短信和写信的区别。"
他承认这很难做到。AI 产品的一个核心挑战是:界面全是文本框,而文本框很难传达“你现在应该换一种心态”这件事。
Thorsten 补了一句:很多人比较模型时的错误,是用旧模型的习惯去试新模型。用 Opus 的提示词去驱动 Codex,当然会觉得不好用。模式的设计就是想帮用户跳出这个惯性。
Quinn 承认他在这事上改过口:
“去年在这个播客上我说 AI 编程是专业工具,你得像握电钻一样掌控它,要管好提示词、做好反馈循环。我不是说这完全过时了,但 GPT-5.2 Codex 让你看到一个不同的可能:写好提示词,放手让它去,它会带回让人惊讶的结果。”
他认为这是一个趋势。如果下一代 Codex 在可靠性上再提升 10%,那为什么一次只跑一个任务?为什么要在侧边栏里盯着它?
“你想批量启动这些任务,优化它们的长时间运行,然后等它们完成了再去检查。模型终于在追上'你可以放一群这东西出去干活'这个想法了。”
【2】Skills:比 MCP 更持久的抽象
Thorsten 问团队在代码库里做了什么变化来配合 Deep Mode。
Quinn 说他们过去几个月一直在“为 Agent 优化开发工具链”,其中最管用的就是写更多的 Skills。
一个简单例子:他给 AMP 写了一个 Skill,教它如何发布 Web 服务器和客户端。有了这个 Skill 之后,遇到 bug 他可以直接问“帮我查一下为什么这个没部署上去”或者“现在线上版本是什么”,Agent 加载 Skill 就知道该怎么做了。
"你积累的 Skills 越多,它对你代码库的导航能力就越强,你就越不需要手动写提示词。Skills 是解决'我想给 Agent 一点额外帮助做这个常见操作'的方案,而且它比其他方案都更扎实。MCP、自定义命令、自定义子 Agent 这些东西,没有一个像 Skills 这样真正扎下根来了。"
Thorsten 举了个例子。AMP 的命令行界面(TUI)需要按两次 Ctrl+C 才能退出,Agent 每次都搞错。于是他把这个知识写进 Skill,之后 Agent 就能正确处理了。这种东西一点一点积累下来,效果是复合的。
GCloud 的例子更能说明问题。Thorsten 说他从来不喜欢 GCloud 命令行,感觉难用,以前都用 Prometheus、Grafana 这些 Web 工具来看日志。但现在他直接把错误信息丢给 Agent,说“用 GCloud 查一下日志”,Agent 就能刷过一堆 GCloud 命令把答案找出来。
“这让我想到一个问题:如果你构建了一个 Web 仪表盘,然后我给我的 Agent 写了一个 Skill 说'这是用 GCloud 的方法',它就能做最复杂的日志分析查询。那我为什么还要去 Web 界面呢?”
Quinn 展示了一个即将发布的功能:查看你的团队过去一天使用了哪些 Skills 以及频率。通过这个视图他们发现,有人在大量使用 BigQuery Skill,有人在用代码审查 Skill。
Thorsten 说,BigQuery Skill 可能是说服别人“别再把数据粘贴到 ChatGPT 里”的最好论据,你直接问 AMP“有多少用户用了这个功能”,它就自己找到表名、写 SQL、查出结果。
【注:BigQuery 是 Google Cloud 的大规模数据仓库服务,常用 SQL 查询。这里的要点是:Agent 有了 Skill 就能自主操作这些企业级工具,不需要人类去切换界面。】
Thorsten 还提到一个工作流:做完一个任务后,让 Agent 把整个过程中学到的东西总结成一个新的 Skill。AMP 内置了一个"创建 Skill"的 Skill,Agent 能自己决定 Skill 应该放在哪里、怎么写。
【3】Agent 优先:当人类开发体验成为代价
Skills 只是开始。更根本的问题是:你愿意为 Agent 牺牲多少人类体验?
AMP 团队把所有测试统一到了一个命令 pnpm test,带缓存结果,反复跑不浪费时间。
Thorsten 自嘲说:“这听起来像 Bazel 对吧?一定是用了 Bazel 这种大型构建工具?”
【注:Bazel 是 Google 开源的构建工具,以支持大规模项目的可复现构建著称,但配置复杂。】
Quinn 说:
“Agent 并不需要那些复杂的构建工具和可复现构建。它们很擅长用'笨'工具。pnpm test 就是告诉它'永远跑这个命令',命令自己会给出输出,够了。我们 19 个人在 AMP 上写代码,不需要 Bazel 那套。”
但另一个取舍更实际。为了给 Agent 提供更快的 Svelte 类型检查,团队成员 Tim Culverhouse 用 Zig 语言重写了 svelte-check,项目叫 Zveltch check,已经开源。结果这个改动让 VS Code 里的 SvelteKit 开发体验出了问题。
团队面临一个选择:保人类的开发体验,还是保 Agent 的开发体验?
有一半人用 VS Code,另一半用 Neovim。用 Neovim 的人直接说“我不关心 VS Code 的开发体验”。他们确实短暂回滚了,但 Thorsten 说了一段很直接的话:
“我不想再留在 VS Code 里带着用了七年的扩展,如果这意味着它会拖慢我们为 Agent 优化代码库的速度。”
他描述了一个自我强化的循环:你为 Agent 优化代码库→Agent 变强→人类的编辑器体验相对变差→你更不想待在编辑器里→你就能做更多并行化→代码库进一步为 Agent 优化……
Quinn 总结了多年来开发工具领域的一条信条:“开发工具坏了就要马上修,最好的公司有最好的开发工具。”但他说,这条信条里的“最好”一直指的是对人类最好。
“现在我们会说,这对人来说不太好用,但没关系,因为 Agent 要调用这个命令很多次。Agent 读 lock 文件比我读得好,这真的挺有意思的。”
【4】砍掉编辑器扩展:“侧边栏已死”
Thorsten 宣布了这期播客的核心消息:
“我觉得你一个人在侧边栏里跟 Agent 一对一来回聊天的时代,要结束了。你在编辑器里看代码,底部或侧面有个 Agent,它看你打开了哪些文件,然后你们乒乓球式地来回,这不是未来了。”
他给出了三个理由。
第一,侧边栏限制了并行化能力。 如果你在编辑器里盯着一个 Agent 工作,你没法同时跑多个任务。而并行化是接下来几个月从 Agent 身上获得最大收益的方式。
第二,人类是拐杖。 在编辑器侧边栏模式下,人类成了反馈循环的一部分。你可能没意识到,但你就是让 Agent 不得不停下来等的瓶颈。AMP 希望你把这个角色交给自动化:测试命令、构建命令、Skills。
第三,这关系到 AMP 的用户群构成。 AMP 的定位是为“最前沿的 1% 开发者”服务。如果不做这种激进的改变,两个月后 AMP 的用户群就不再是前沿人群了,而是“跟不上变化的人”。一旦用户群向后者倾斜,改变就更难了。
“对于想走在最前沿的 1% 开发者来说,他们现在只需要在编辑器里完成最后 20% 的工作。我们认为可以把这个比例降到 10% 甚至 1%。”
Quinn 补充说,编辑器扩展会在大约 60 天后自动停用。他们现在不确切知道替代方案会是什么。"我们在尝试很多东西,我们觉得有一个更高层次的方案能行,但我们有信心的是:无论如何都需要替换它,我们要破釜沉舟。"
他建议用户在过渡期内切换到 AMP CLI,并反馈哪些 VS Code 里的功能在 CLI 里缺失了。
有人会问:不能保留但不维护吗?Quinn 的回答是:
“我们做不到。不可能同时分心做这个,又做那些你们所有人都觉得重要 100 倍的事情。”
Thorsten 补充说,AMP 团队内部已经越来越少有人用 VS Code 扩展了。如果团队自己不用,他们就没法第一时间发现问题、快速修复,这个产品就会腐化。
Quinn 最后说了一句:"如果我们去再招 10 个人来维护我们已经砍掉的所有东西,那我们就不再是一个小团队了。那是错误的方向。"
【5】软件正在溶解
"想象一下,从个人电脑到互联网再到移动端的转型,在一年之内发生。你刚开始做光盘刻录软件,四个月后就有了互联网——为什么还要刻光盘?又过了六个月出了 App Store——为什么还让人打开浏览器?这些事情现在正在同时发生。"
Thorsten 举了两个例子。
第一个是几个月前的事。Jeffrey Lit 在酒店健身房,拍了设备的照片发给 Claude,说“帮我做个个性化训练计划”。Claude 直接生成了一个 HTML 页面,可以勾选组数和次数。这已经是一个正在“涌现”的软件界面了,虽然不完全可复现。
但第二个例子更极端。Ryan Florence 在自己家健身房里用 ChatGPT 的语音模式:
【注:Ryan Florence 是 Remix.js(现在叫 React Router)的联合创始人,React 社区的核心人物。】
他对着手机说“带我做一组训练”。ChatGPT 说“先做一组,准备好了告诉我”。他做完了说“做完了”。ChatGPT 说“休息 60 秒”。然后“准备好了”,继续下一组。Thorsten 的感受是:“一切都消失了,只剩下声音。这还是软件吗?代码在哪?代码没了。”
他又分享了一个个人经历。他想用 OpenClaw 给自己和妻子搭一个购物清单管理的 AI 助手。然后他想:为什么还需要 Todoist?购物清单通常就 10 到 15 项,AI 助手用一个文本文件当记忆就够了。但又想,如果需要用不同的视角查看这些数据呢?
他没有给出答案,只是说:"所有这些东西都在融解。"
“过去 20 到 30 年的创业剧本是:找到一个市场、找到客户、融资、扩大规模。但现在你要卖的那个市场每三到六周就变一次。唯一不被淘汰的方式是不断重新发明自己。”
【6】OpenClaw:小团队、强观点、不怕风险
【注:OpenClaw 是奥地利工程师 Peter Steinberger 创建的开源 AI 助手项目,通过 WhatsApp、Telegram 等消息平台作为界面,在本地运行 AI Agent。2026 年 1 月底爆红,GitHub stars 从 9000 涨到超过 10 万+。底层 Agent 框架叫 Pi,由 Mario Zechner 开发。】
Quinn 认为 OpenClaw 的成功有一个结构性原因:它不可能出自一家大公司。
“它非常有风险,使用它是不负责任的。任何一家公司如果要发布它,承担的法律责任(liability)太高了。”
Peter Steinberger 和 Mario Zechner 都是有强烈观点、高度独立的开发者。他们不是 VC 投资的公司,没有销售团队,没有季度目标,没有人说"不加这个功能我就没法做成这笔单子"。Quinn 认为,正是这种没有妥协的结构让产品能保持锋利。
他说 AMP 想尽可能靠近这种极端,这就需要做“砍掉 VS Code 扩展”这种硬决定。
但 Thorsten 也指出,OpenClaw 不是终局。他相信 Peter Steinberger 和 Mario Zechner 自己也不会说“三年后你还会用 OpenClaw”。
【7】Cursor 的困境与编辑器时代的终结
Quinn 说:"一年前我在 Sourcecraft 大会上说过,编辑器的日子屈指可数了。"
一年后,连增长最快的 AI 编程创业公司 Cursor 都开始被人说“VS Code 在拖你后腿”。
Thorsten 梳理了一个迭代链:GitHub Copilot 曾经是王者→Cursor 让 Copilot 看起来过时了→Claude Code、AMP 和 Agent 模式让 Cursor 看起来过时了→现在人们在说"编辑器本身是不是过时了"。
与此同时,Pi 和 OpenClaw 只有 Telegram 界面和后台运行的 Agent,连编辑器都没有。
Quinn 说:
“一旦你看到趋势朝某个方向走,它的速度会比过去任何时候都快,也比你预想的快得多。很多人在 AI 变革链条上的某一站做得很好,然后他们就停在那里了。我能理解——他们得到了很多赞美,第一天是在跟早期采纳者说话,两个月后是在跟百倍的受众说话,但那些人已经不是早期采纳者了,早期采纳者已经去了下一站。”
他说 AMP 的做法是保持“偏执”,不断向前,不做“第十个或第二十个做同样事情的编程 Agent”。
【8】手动上下文管理的终结
Thorsten 推翻了自己另一个长期观点。
“我可能会反悔,但我现在觉得手动管理上下文的时代也在走向终结。过去一年我一直在教大家:你得学会管理上下文窗口,什么时候放进去、什么时候开新会话、怎么回引旧会话。这确实有效。但现在 GPT-5.2 Codex 不做这些也能给出很好的结果。”
Quinn 解释了为什么。之前的自动压缩(auto compaction)方案确实会丢失信号,Thorsten 一度认为它"不靠谱"。但 GPT-5.2 Codex 有一个行为倾向:在做任何事之前先"研究一下"。这意味着即使上下文被压缩了、丢了一些信息,Codex 不会像 Opus 那样立刻冲上去执行,而是会先重新收集信息。
Thorsten 还提了一个对比:OpenAI 的 ChatGPT 大约两年前就开始对用户隐藏上下文窗口的概念了。整个公司都在为“用户不知道也不需要知道上下文窗口”这个目标优化。他自己虽然知道上下文窗口是什么,但在 ChatGPT 里也一直用一个长会话跑好几周。
但 Quinn 提醒说,这不等于“一个会话干所有事”。每个会话仍然需要有清晰的目标和预期结果。 做两件完全不相关的事,还是应该开两个会话。
他们在探索一个新概念:会话之上更高级的组织方式。也许是一组会话,绑定到某个代码仓库和分支?也许有一个主题?具体形态还不清楚,但砍掉编辑器扩展、不支持 17 个不同模型这些决定,反而给了他们更多空间去探索这些新东西。
Quinn 还暗示了一个可能的方向:Opus 4.5 在 Smart Mode 下或许会变成“Interactive Mode”,只有当你需要“拿着手术刀精确操作”的时候才用。
【9】“AMP 是一件艺术装置”
Thorsten 感谢了 AMP 的用户,说这段旅程“颠簸、刺激、不轻松”。
Quinn 说:
“AMP 在很多方面更像一件艺术装置,而不是一家软件公司。”
他描述了 AMP 的运作方式:前几天他跟 Thorsten 开玩笑说“如果 AMP 本身也自毁了呢?就是说 AMP 没了,这是新的 AMP”。他们笑着说这个,但有趣的是,付费客户也喜欢这种态度。
1 月份 AMP 砍了四个功能:to-dos、forking、tab 补全、自定义命令。Quinn 本来犹豫要不要发公告,觉得“又是一个功能被砍了,用户不会在意吧”。结果用户的反应是正面的。付费客户说“好,我早就不用这个了”或者“谢谢你们替我做了这个决定”。
有人在评论里说“我更喜欢 Claude Code 的做法”。Thorsten 问他们用的是 AMP 还是 Claude Code,回答是 Claude Code。他说,如果我们在某个功能上做到跟 Claude Code 一样都没能赢得这些人,那把功能做得更像 Claude Code 就更不可能赢了,我们得做不同的事。
Quinn 认为一个很关键的认知是:
"我们深信,AMP 今天的所有使用量、所有收入、所有客户,每三个月我们都必须完全重新赢得。产品会看起来不同,你会用它做不同的事情,你会为不同的东西付费,我们得搞清楚那是什么。"
如果搞不清楚,三个月后 AMP 要么有一个过时的产品,要么在“落后者市场”里短暂赚一年钱然后消亡。他们不想走那条路。
他说 AMP 能做这些“疯狂的事”有一个独特原因:19 个联合创始人全部从 Sourcegraph 带来,彼此合作多年,互相信任。没有去外面招人并承诺“公司会很稳定”。所有人都清楚自己签的是什么。
“几周后我们要去新加坡集合,可能会说'直接删掉源代码里的这整个目录,从头重写'。我们能做到这种事。”
Thorsten 回应了一个可能的质疑:既然一切都在变,为什么不等看清了再动?
他说很多大公司就是这么想的,“这太疯狂了,我们等尘埃落定再说”。但他的判断是,你等的时候你离骰子落地的地方越来越远。你必须一直盯着骰子飞向哪里,跟着它走,发布产品让现实来检验你,从客户反馈中学习。
“发布就是研究。我们不会因为'不确定这个功能能不能活过三个月'就不发布。”
【最后】
AMP 团队在这期播客里做了三件不寻常的事:公开推翻自己一年前的判断,宣布砍掉一个主要产品形态,以及明确表态愿意让人类开发体验为 Agent 让步。
这些决定背后的逻辑是一致的:当模型的能力往“自主运行 45 分钟不需要人类介入”的方向走,你在编辑器侧边栏里盯着它工作就变成了浪费。为前沿 1% 的开发者服务,意味着产品必须走在他们前面。
悬而未决的问题是:砍掉编辑器扩展后,什么会取代它?“会话组”“交互模式”这些概念最终会长什么样?以及,当 Anthropic 和 OpenAI 自己也在朝着 Agent 方向推进产品时,一个 19 人团队的护城河到底在哪里?
来源:Raising an Agent Episode 10,AMP 官方播客
链接:https://www.youtube.com/watch?v=4rx36wc9ugw

