一个意料之中的信号
昨天上午,智谱 GLM-5 的 Coding Plan 涨价 30%。
这个事情引起了很大的讨论,我也非常理解,毕竟价格是最敏感的话题。
当时我的第一反应是:终于还是涨了。
虽然很反共识,但我一直预期 Token 会涨价,这个信号是对我预期的一个确认。
模型越强,Token 越稀缺,价格越贵。
智谱在商业化上确实显得不够成熟,他们最大的失误就是低估了模型能力进步带来的指数级增长,一开始给的 plan 太大方,现在模型更大了,算力不够,要么砍用量,要么涨价,没有商业模式支撑的服务无法健康长久。
昨晚一个朋友因为没买到 Coding Plan,来借我的 API key。
这时候我才意识到,这次涨价之后,依然是限购状态。
涨价+限购,一代人有一代人的茅台?
涨价背后的真相
要理解这次涨价,只需要看清一个结构性矛盾:供给是线性的,需求是指数的。
先看供给侧。
Google 2026 年的资本开支相比2025年,差不多翻倍。
这已经是全球最有钱的科技公司之一,倾尽全力在砸算力基础设施了。
你不可能让台积电明天就多造出十倍的芯片。
供给侧的增长曲线,是一条缓慢爬升的直线。
再看需求侧。
需求不是一重指数,是三重指数叠加。
第一重指数:Coding 模型能力提升解锁新场景。特别是从 Vibe Coding 到严肃的 Agentic Engineering 这一跃升。每一次能力提升,都打开一片10倍的 Token 消耗场景。
第二重指数:Agent 数量本身在爆发式增长。在未来一个人背后可能有 10 个、100 个 Agent 在 7×24 小时不间断地调用模型。人会睡觉,Agent 不会。人一天工作 8 小时,Agent 一天工作 24 小时。Agent 的数量乘以 Agent 的工作时长,这个数字的增长速度远超任何人类用户的增长。
第三重指数:Seedance 2.0,Nano Banana Pro 这样的多模态模型的 Token 消耗量远超纯文本。视频生成、图像理解、代码工程,每一个场景的单次消耗都是纯文本对话的几十倍甚至上百倍。当这些场景被模型能力解锁之后,Token 的消耗量会出现断崖式的跃升。
三重指数叠加在一起,面对的是一条线性增长的供给曲线。
供给翻 2 倍,需求翻 10 倍甚至 100 倍。
这种结构性的失衡,在可预见的未来一年内,只会增强不会逆转。
所以涨价不是智谱的选择,是物理定律的选择。
有人天真地说,不用担心,大厂会打价格战的。
你见过卖金铺打价格战吗?
稀缺的东西,不存在价格战。
GLM-5 凭什么值这个价
涨价 30% 需要底气,这种底气凭什么?
看三件事就够了。
第一,Coding 能力逼近 Claude Opus 4.5。
GLM-5 几个 Coding 能力的跑分上,已经追上了 Sonnet 4.5,开始朝着 Opus 4.5 逼近。在多个权威指标上都是开源模型的 SOTA。跟自己比,从 GLM-4.7 到 GLM-5,内部评估的编程任务平均增幅超过 20%。
除了指标的提升外,GLM-5 不只是"写代码更好了",而是从写代码进化到了写工程。它能自主完成后端重构、深度调试、长程规划与执行,已经在朝着资深架构师的方向迈进。
第二,Agent 能力是真正的长程任务执行。
在 BrowseComp、MCP-Atlas、τ²-Bench 三个 Agent 评测基准上,GLM-5 均为开源第一。在 Vending Bench 2 的模拟经营测试中,GLM-5 经营一年期的自动售货机业务,最终账户余额达到 4432 美元,接近 Opus 4.5。
有些榜是可以刷的,但模拟经营榜,代表模型真的能"做事"。长程任务中的目标一致性、资源管理、多步骤依赖处理,是 Agentic Engineering 时代的核心能力。
第三,模型参数翻倍,推理成本也提高了。
GLM-5 的参数规模从 355B(激活 32B)扩展到 744B(激活 40B),预训练数据从 23T 提升到 28.5T,以 MIT License 完全开源。在顶级模型中,这种开放程度极为罕见。同时值得注意的是,GLM-5 已经完成了与华为昇腾、寒武纪、摩尔线程等国产算力平台的深度适配。在全球算力稀缺的大背景下,这件事的战略意义非同小可。
总之,用户付的钱多了 30%,但拿到的能力涨了远不止 30%。
人是为更好的结果买单,所以涨价完全没毛病。
实测体感
GLM-5 是第一个国内敢去对标 Claude Opus 的模型
我个人测试,目前的水平肯定是达不到 Opus 4.6 水平的
但我发现 GLM-5的思维方式和 Opus 4.6 非常像,思考深度非常深,有时候我看着这两个模型的思考国产,都会非常惊叹太聪明太全面了。
但遗憾的是 GLM-5 还不具备 Opus 4.6 的独立思考能力,会和 ChatGPT 一样顺着我的意思说。
这是我用 GLM-5 写的一个体感小游戏,叫《抓马》
能写出直接可玩的游戏,还是非常强悍的。
我和老婆玩了好几盘,胳膊都有点累,所以录视频的时候已经没有表情了。。
买 Token 就投资自己
上篇文章我说,互联网已死,Agent 永生。
意思不是说互联网真的死了,互联网又不是活体动物,不会死。
而是说互联网已经如死水一潭,我们不要在死水里找机会了。
Agent 是三个指数叠加的增量,最值得关注。
人最重要的事情就是要关注重点,屏蔽噪音。
既然最重要的是 Agent ,它的燃料又是 Token。
那就要舍得花钱,舍得买 Token。
舍得给自己的 Agent 加满油,它才能跑在最前面。



