Back to Articles
Feb 6, 20262 weeks ago

AMP Kills Its Own Editor Extension: The Sidebar is Dead, AI Programming Enters the "Factory Era"

宝玉@dotey

AI Summary

This article delves into a pivotal shift in AI-assisted programming, chronicled through the radical decisions of the team behind AMP, a leading Coding Agent. The piece centers on their announcement to sunset their own VS Code editor extension, arguing that the era of a developer sitting in a sidebar, chatting one-on-one with an AI in a ping-pong fashion, is fundamentally over. This move symbolizes a broader transition as new models like GPT-5.2 Codex enable a more autonomous, "set-and-forget" style of work, pushing the industry toward a parallelized, "factory" model of software development. The discussion reveals several profound insights driving this change. First, the team introduces "Deep Mode," a new interaction paradigm built specifically for GPT-5.2 Codex, which works by deeply researching a task for 45 minutes or more without human intervention, contrasting sharply with faster, more interactive models. Second, they highlight the rising importance of "Skills"—persistent abstractions that teach an Agent how to navigate a specific codebase or tool—as a more enduring solution than other customization methods. Most provocatively, the AMP team openly discusses prioritizing the Agent's development experience over the human's, making deliberate sacrifices in their own editor tooling to optimize for AI efficiency. This leads to their core thesis: to serve the most advanced 1% of developers, they must move beyond the constrained sidebar and embrace a future where multiple Agents run in parallel, managed from a higher-level interface. The article frames this within a dizzying context of industry change, where software itself seems to be dissolving into conversational and agentic interfaces, as seen with projects like OpenClaw. The AMP team operates with a unique philosophy, viewing their product as a mutable "art installation" that must be reinvented every few months to stay ahead. For anyone interested in the cutting edge of developer tools, AI Agents, and the future of software creation, this conversation offers a raw, forward-looking, and essential perspective on the painful but necessary evolution happening right now. To understand the full depth of their reasoning and the concrete examples of this shift in action, the full article is an indispensable read.

知名 Coding Agent 产品 AMP 砍掉了自己的 VS Code 编辑器扩展,60 天后自动停用。

AMP 是从 Sourcegraph 孵化出来的 AI 编程 Agent,2025 年 12 月独立为一家公司,团队 19 人,全员写代码。CEO Quinn Slack 和联合创始人 Thorsten Ball 在播客 Raising an Agent 第 10 集里宣布了这个决定。这期播客还讨论了 GPT-5.2 Codex 催生的新编程模式、为什么要为 Agent 牺牲人类开发体验、Skills 为什么比 MCP 更持久、OpenClaw 的爆红、以及软件行业正在以什么速度在变。

要点速览

AMP 将在约 60 天内砍掉 VS Code 编辑器扩展,认为“一个人对着侧边栏跟 Agent 来回聊”的模式已经到头了

GPT-5.2 Codex 和 Opus 4.5 可以达到同等质量的结果,但工作方式完全不同,AMP 为此创建了“Deep Mode”这个全新交互模式

在为 Agent 优化代码库的过程中,AMP 团队做了一个明确取舍:愿意让人类开发体验退步

Skills 作为一种抽象概念,在团队中比 MCP、自定义命令、自定义子 Agent 都更持久,已经成为 Agent 使用代码库的核心入口

手动管理上下文窗口的时代可能正在结束,GPT-5.2 Codex 的“先研究再动手”行为让自动压缩变得更可行了

【1】Deep Mode:不是换个模型,是换种工作方式

AMP 上周发布了 Deep Mode,这是 AMP 的第三种模式。Smart Mode 用 Opus 4.5,Rush Mode 用快速模型(目前是 Haiku),而 Deep Mode 用的是 GPT-5.2 Codex Medium。

【注:GPT-5.2 Codex 于 2026 年 1 月 14 日由 OpenAI 发布,是 GPT-5.2 针对编程场景的特化版本,支持上下文压缩(context compaction)和长时任务执行。】

Thorsten 问 Quinn:“我们内部试新模型时,是怎么发现它需要不同的使用方式的?”

Quinn 说他第一次试 GPT-5.2 Codex 的时候,感觉不对。这个模型不像 Opus 那样抢着执行、抢着回来问你。它有时候太“懒”了,你让它配置个 shell 文件什么的,它可能先研究半天,或者直接跟你说“你自己跑这几个命令就行”。

但他第二次带着“需要调整预期”的心态再试的时候,发现了不同的东西。

“你不再盯着助手了。之前我们说的那些'你应该怎么提示词、怎么做反馈循环',很多都不适用了。但结果不会骗人。”

Quinn 认为 Opus 和 Codex 可以达到同等质量的结果,但路径完全不同。Opus“手快嘴快”,想立刻跑命令、立刻回来找你。Codex 则是你把任务发出去,切到别的标签页干别的事,45 分钟或 60 分钟后回来看结果。

这就是为什么他们不是把 GPT-5.2 Codex 放进一个模型下拉菜单就完了,而是创建了一个全新的模式。Quinn 说 Deep Mode 里他们甚至没有放“用户反馈提问”工具,因为你根本不应该盯着它工作。

"如果我可以做到的话,我希望切换模式的时候 App 看起来完全不同。Smart Mode 是一种字体,切到 Deep Mode 就换一种字体,提示词长度至少得 100 个词。感觉应该像发短信和写信的区别。"

他承认这很难做到。AI 产品的一个核心挑战是:界面全是文本框,而文本框很难传达“你现在应该换一种心态”这件事。

Thorsten 补了一句:很多人比较模型时的错误,是用旧模型的习惯去试新模型。用 Opus 的提示词去驱动 Codex,当然会觉得不好用。模式的设计就是想帮用户跳出这个惯性。

Quinn 承认他在这事上改过口:

“去年在这个播客上我说 AI 编程是专业工具,你得像握电钻一样掌控它,要管好提示词、做好反馈循环。我不是说这完全过时了,但 GPT-5.2 Codex 让你看到一个不同的可能:写好提示词,放手让它去,它会带回让人惊讶的结果。”

他认为这是一个趋势。如果下一代 Codex 在可靠性上再提升 10%,那为什么一次只跑一个任务?为什么要在侧边栏里盯着它?

“你想批量启动这些任务,优化它们的长时间运行,然后等它们完成了再去检查。模型终于在追上'你可以放一群这东西出去干活'这个想法了。”

【2】Skills:比 MCP 更持久的抽象

Thorsten 问团队在代码库里做了什么变化来配合 Deep Mode。

Quinn 说他们过去几个月一直在“为 Agent 优化开发工具链”,其中最管用的就是写更多的 Skills。

一个简单例子:他给 AMP 写了一个 Skill,教它如何发布 Web 服务器和客户端。有了这个 Skill 之后,遇到 bug 他可以直接问“帮我查一下为什么这个没部署上去”或者“现在线上版本是什么”,Agent 加载 Skill 就知道该怎么做了。

"你积累的 Skills 越多,它对你代码库的导航能力就越强,你就越不需要手动写提示词。Skills 是解决'我想给 Agent 一点额外帮助做这个常见操作'的方案,而且它比其他方案都更扎实。MCP、自定义命令、自定义子 Agent 这些东西,没有一个像 Skills 这样真正扎下根来了。"

Thorsten 举了个例子。AMP 的命令行界面(TUI)需要按两次 Ctrl+C 才能退出,Agent 每次都搞错。于是他把这个知识写进 Skill,之后 Agent 就能正确处理了。这种东西一点一点积累下来,效果是复合的。

GCloud 的例子更能说明问题。Thorsten 说他从来不喜欢 GCloud 命令行,感觉难用,以前都用 Prometheus、Grafana 这些 Web 工具来看日志。但现在他直接把错误信息丢给 Agent,说“用 GCloud 查一下日志”,Agent 就能刷过一堆 GCloud 命令把答案找出来。

“这让我想到一个问题:如果你构建了一个 Web 仪表盘,然后我给我的 Agent 写了一个 Skill 说'这是用 GCloud 的方法',它就能做最复杂的日志分析查询。那我为什么还要去 Web 界面呢?”

Quinn 展示了一个即将发布的功能:查看你的团队过去一天使用了哪些 Skills 以及频率。通过这个视图他们发现,有人在大量使用 BigQuery Skill,有人在用代码审查 Skill。

Thorsten 说,BigQuery Skill 可能是说服别人“别再把数据粘贴到 ChatGPT 里”的最好论据,你直接问 AMP“有多少用户用了这个功能”,它就自己找到表名、写 SQL、查出结果。

【注:BigQuery 是 Google Cloud 的大规模数据仓库服务,常用 SQL 查询。这里的要点是:Agent 有了 Skill 就能自主操作这些企业级工具,不需要人类去切换界面。】

Thorsten 还提到一个工作流:做完一个任务后,让 Agent 把整个过程中学到的东西总结成一个新的 Skill。AMP 内置了一个"创建 Skill"的 Skill,Agent 能自己决定 Skill 应该放在哪里、怎么写。

【3】Agent 优先:当人类开发体验成为代价

Skills 只是开始。更根本的问题是:你愿意为 Agent 牺牲多少人类体验?

AMP 团队把所有测试统一到了一个命令 pnpm test,带缓存结果,反复跑不浪费时间。

Thorsten 自嘲说:“这听起来像 Bazel 对吧?一定是用了 Bazel 这种大型构建工具?”

【注:Bazel 是 Google 开源的构建工具,以支持大规模项目的可复现构建著称,但配置复杂。】

Quinn 说:

“Agent 并不需要那些复杂的构建工具和可复现构建。它们很擅长用'笨'工具。pnpm test 就是告诉它'永远跑这个命令',命令自己会给出输出,够了。我们 19 个人在 AMP 上写代码,不需要 Bazel 那套。”

但另一个取舍更实际。为了给 Agent 提供更快的 Svelte 类型检查,团队成员 Tim Culverhouse 用 Zig 语言重写了 svelte-check,项目叫 Zveltch check,已经开源。结果这个改动让 VS Code 里的 SvelteKit 开发体验出了问题。

团队面临一个选择:保人类的开发体验,还是保 Agent 的开发体验?

有一半人用 VS Code,另一半用 Neovim。用 Neovim 的人直接说“我不关心 VS Code 的开发体验”。他们确实短暂回滚了,但 Thorsten 说了一段很直接的话:

“我不想再留在 VS Code 里带着用了七年的扩展,如果这意味着它会拖慢我们为 Agent 优化代码库的速度。”

他描述了一个自我强化的循环:你为 Agent 优化代码库→Agent 变强→人类的编辑器体验相对变差→你更不想待在编辑器里→你就能做更多并行化→代码库进一步为 Agent 优化……

Quinn 总结了多年来开发工具领域的一条信条:“开发工具坏了就要马上修,最好的公司有最好的开发工具。”但他说,这条信条里的“最好”一直指的是对人类最好。

“现在我们会说,这对人来说不太好用,但没关系,因为 Agent 要调用这个命令很多次。Agent 读 lock 文件比我读得好,这真的挺有意思的。”

【4】砍掉编辑器扩展:“侧边栏已死”

Thorsten 宣布了这期播客的核心消息:

“我觉得你一个人在侧边栏里跟 Agent 一对一来回聊天的时代,要结束了。你在编辑器里看代码,底部或侧面有个 Agent,它看你打开了哪些文件,然后你们乒乓球式地来回,这不是未来了。”

他给出了三个理由。

第一,侧边栏限制了并行化能力。 如果你在编辑器里盯着一个 Agent 工作,你没法同时跑多个任务。而并行化是接下来几个月从 Agent 身上获得最大收益的方式。

第二,人类是拐杖。 在编辑器侧边栏模式下,人类成了反馈循环的一部分。你可能没意识到,但你就是让 Agent 不得不停下来等的瓶颈。AMP 希望你把这个角色交给自动化:测试命令、构建命令、Skills。

第三,这关系到 AMP 的用户群构成。 AMP 的定位是为“最前沿的 1% 开发者”服务。如果不做这种激进的改变,两个月后 AMP 的用户群就不再是前沿人群了,而是“跟不上变化的人”。一旦用户群向后者倾斜,改变就更难了。

“对于想走在最前沿的 1% 开发者来说,他们现在只需要在编辑器里完成最后 20% 的工作。我们认为可以把这个比例降到 10% 甚至 1%。”

Quinn 补充说,编辑器扩展会在大约 60 天后自动停用。他们现在不确切知道替代方案会是什么。"我们在尝试很多东西,我们觉得有一个更高层次的方案能行,但我们有信心的是:无论如何都需要替换它,我们要破釜沉舟。"

他建议用户在过渡期内切换到 AMP CLI,并反馈哪些 VS Code 里的功能在 CLI 里缺失了。

有人会问:不能保留但不维护吗?Quinn 的回答是:

“我们做不到。不可能同时分心做这个,又做那些你们所有人都觉得重要 100 倍的事情。”

Thorsten 补充说,AMP 团队内部已经越来越少有人用 VS Code 扩展了。如果团队自己不用,他们就没法第一时间发现问题、快速修复,这个产品就会腐化。

Quinn 最后说了一句:"如果我们去再招 10 个人来维护我们已经砍掉的所有东西,那我们就不再是一个小团队了。那是错误的方向。"

【5】软件正在溶解

"想象一下,从个人电脑到互联网再到移动端的转型,在一年之内发生。你刚开始做光盘刻录软件,四个月后就有了互联网——为什么还要刻光盘?又过了六个月出了 App Store——为什么还让人打开浏览器?这些事情现在正在同时发生。"

Thorsten 举了两个例子。

第一个是几个月前的事。Jeffrey Lit 在酒店健身房,拍了设备的照片发给 Claude,说“帮我做个个性化训练计划”。Claude 直接生成了一个 HTML 页面,可以勾选组数和次数。这已经是一个正在“涌现”的软件界面了,虽然不完全可复现。

但第二个例子更极端。Ryan Florence 在自己家健身房里用 ChatGPT 的语音模式:

【注:Ryan Florence 是 Remix.js(现在叫 React Router)的联合创始人,React 社区的核心人物。】

他对着手机说“带我做一组训练”。ChatGPT 说“先做一组,准备好了告诉我”。他做完了说“做完了”。ChatGPT 说“休息 60 秒”。然后“准备好了”,继续下一组。Thorsten 的感受是:“一切都消失了,只剩下声音。这还是软件吗?代码在哪?代码没了。”

他又分享了一个个人经历。他想用 OpenClaw 给自己和妻子搭一个购物清单管理的 AI 助手。然后他想:为什么还需要 Todoist?购物清单通常就 10 到 15 项,AI 助手用一个文本文件当记忆就够了。但又想,如果需要用不同的视角查看这些数据呢?

他没有给出答案,只是说:"所有这些东西都在融解。"

“过去 20 到 30 年的创业剧本是:找到一个市场、找到客户、融资、扩大规模。但现在你要卖的那个市场每三到六周就变一次。唯一不被淘汰的方式是不断重新发明自己。”

【6】OpenClaw:小团队、强观点、不怕风险

【注:OpenClaw 是奥地利工程师 Peter Steinberger 创建的开源 AI 助手项目,通过 WhatsApp、Telegram 等消息平台作为界面,在本地运行 AI Agent。2026 年 1 月底爆红,GitHub stars 从 9000 涨到超过 10 万+。底层 Agent 框架叫 Pi,由 Mario Zechner 开发。】

Quinn 认为 OpenClaw 的成功有一个结构性原因:它不可能出自一家大公司。

“它非常有风险,使用它是不负责任的。任何一家公司如果要发布它,承担的法律责任(liability)太高了。”

Peter Steinberger 和 Mario Zechner 都是有强烈观点、高度独立的开发者。他们不是 VC 投资的公司,没有销售团队,没有季度目标,没有人说"不加这个功能我就没法做成这笔单子"。Quinn 认为,正是这种没有妥协的结构让产品能保持锋利。

他说 AMP 想尽可能靠近这种极端,这就需要做“砍掉 VS Code 扩展”这种硬决定。

但 Thorsten 也指出,OpenClaw 不是终局。他相信 Peter Steinberger 和 Mario Zechner 自己也不会说“三年后你还会用 OpenClaw”。

【7】Cursor 的困境与编辑器时代的终结

Quinn 说:"一年前我在 Sourcecraft 大会上说过,编辑器的日子屈指可数了。"

一年后,连增长最快的 AI 编程创业公司 Cursor 都开始被人说“VS Code 在拖你后腿”。

Thorsten 梳理了一个迭代链:GitHub Copilot 曾经是王者→Cursor 让 Copilot 看起来过时了→Claude Code、AMP 和 Agent 模式让 Cursor 看起来过时了→现在人们在说"编辑器本身是不是过时了"。

与此同时,Pi 和 OpenClaw 只有 Telegram 界面和后台运行的 Agent,连编辑器都没有。

Quinn 说:

“一旦你看到趋势朝某个方向走,它的速度会比过去任何时候都快,也比你预想的快得多。很多人在 AI 变革链条上的某一站做得很好,然后他们就停在那里了。我能理解——他们得到了很多赞美,第一天是在跟早期采纳者说话,两个月后是在跟百倍的受众说话,但那些人已经不是早期采纳者了,早期采纳者已经去了下一站。”

他说 AMP 的做法是保持“偏执”,不断向前,不做“第十个或第二十个做同样事情的编程 Agent”。

【8】手动上下文管理的终结

Thorsten 推翻了自己另一个长期观点。

“我可能会反悔,但我现在觉得手动管理上下文的时代也在走向终结。过去一年我一直在教大家:你得学会管理上下文窗口,什么时候放进去、什么时候开新会话、怎么回引旧会话。这确实有效。但现在 GPT-5.2 Codex 不做这些也能给出很好的结果。”

Quinn 解释了为什么。之前的自动压缩(auto compaction)方案确实会丢失信号,Thorsten 一度认为它"不靠谱"。但 GPT-5.2 Codex 有一个行为倾向:在做任何事之前先"研究一下"。这意味着即使上下文被压缩了、丢了一些信息,Codex 不会像 Opus 那样立刻冲上去执行,而是会先重新收集信息。

Thorsten 还提了一个对比:OpenAI 的 ChatGPT 大约两年前就开始对用户隐藏上下文窗口的概念了。整个公司都在为“用户不知道也不需要知道上下文窗口”这个目标优化。他自己虽然知道上下文窗口是什么,但在 ChatGPT 里也一直用一个长会话跑好几周。

但 Quinn 提醒说,这不等于“一个会话干所有事”。每个会话仍然需要有清晰的目标和预期结果。 做两件完全不相关的事,还是应该开两个会话。

他们在探索一个新概念:会话之上更高级的组织方式。也许是一组会话,绑定到某个代码仓库和分支?也许有一个主题?具体形态还不清楚,但砍掉编辑器扩展、不支持 17 个不同模型这些决定,反而给了他们更多空间去探索这些新东西。

Quinn 还暗示了一个可能的方向:Opus 4.5 在 Smart Mode 下或许会变成“Interactive Mode”,只有当你需要“拿着手术刀精确操作”的时候才用。

【9】“AMP 是一件艺术装置”

Thorsten 感谢了 AMP 的用户,说这段旅程“颠簸、刺激、不轻松”。

Quinn 说:

“AMP 在很多方面更像一件艺术装置,而不是一家软件公司。”

他描述了 AMP 的运作方式:前几天他跟 Thorsten 开玩笑说“如果 AMP 本身也自毁了呢?就是说 AMP 没了,这是新的 AMP”。他们笑着说这个,但有趣的是,付费客户也喜欢这种态度。

1 月份 AMP 砍了四个功能:to-dos、forking、tab 补全、自定义命令。Quinn 本来犹豫要不要发公告,觉得“又是一个功能被砍了,用户不会在意吧”。结果用户的反应是正面的。付费客户说“好,我早就不用这个了”或者“谢谢你们替我做了这个决定”。

有人在评论里说“我更喜欢 Claude Code 的做法”。Thorsten 问他们用的是 AMP 还是 Claude Code,回答是 Claude Code。他说,如果我们在某个功能上做到跟 Claude Code 一样都没能赢得这些人,那把功能做得更像 Claude Code 就更不可能赢了,我们得做不同的事。

Quinn 认为一个很关键的认知是:

"我们深信,AMP 今天的所有使用量、所有收入、所有客户,每三个月我们都必须完全重新赢得。产品会看起来不同,你会用它做不同的事情,你会为不同的东西付费,我们得搞清楚那是什么。"

如果搞不清楚,三个月后 AMP 要么有一个过时的产品,要么在“落后者市场”里短暂赚一年钱然后消亡。他们不想走那条路。

他说 AMP 能做这些“疯狂的事”有一个独特原因:19 个联合创始人全部从 Sourcegraph 带来,彼此合作多年,互相信任。没有去外面招人并承诺“公司会很稳定”。所有人都清楚自己签的是什么。

“几周后我们要去新加坡集合,可能会说'直接删掉源代码里的这整个目录,从头重写'。我们能做到这种事。”

Thorsten 回应了一个可能的质疑:既然一切都在变,为什么不等看清了再动?

他说很多大公司就是这么想的,“这太疯狂了,我们等尘埃落定再说”。但他的判断是,你等的时候你离骰子落地的地方越来越远。你必须一直盯着骰子飞向哪里,跟着它走,发布产品让现实来检验你,从客户反馈中学习。

“发布就是研究。我们不会因为'不确定这个功能能不能活过三个月'就不发布。”

【最后】

AMP 团队在这期播客里做了三件不寻常的事:公开推翻自己一年前的判断,宣布砍掉一个主要产品形态,以及明确表态愿意让人类开发体验为 Agent 让步。

这些决定背后的逻辑是一致的:当模型的能力往“自主运行 45 分钟不需要人类介入”的方向走,你在编辑器侧边栏里盯着它工作就变成了浪费。为前沿 1% 的开发者服务,意味着产品必须走在他们前面。

悬而未决的问题是:砍掉编辑器扩展后,什么会取代它?“会话组”“交互模式”这些概念最终会长什么样?以及,当 Anthropic 和 OpenAI 自己也在朝着 Agent 方向推进产品时,一个 19 人团队的护城河到底在哪里?

来源:Raising an Agent Episode 10,AMP 官方播客

链接:https://www.youtube.com/watch?v=4rx36wc9ugw