The Truth Behind the GLM-5 Price Hike: The Scarcity of Computing Power Has Only Just Begun

一个意料之中的信号

昨天上午，智谱 GLM-5 的 Coding Plan 涨价 30%。

这个事情引起了很大的讨论，我也非常理解，毕竟价格是最敏感的话题。

当时我的第一反应是：终于还是涨了。

虽然很反共识，但我一直预期 Token 会涨价，这个信号是对我预期的一个确认。

模型越强，Token 越稀缺，价格越贵。

智谱在商业化上确实显得不够成熟，他们最大的失误就是低估了模型能力进步带来的指数级增长，一开始给的 plan 太大方，现在模型更大了，算力不够，要么砍用量，要么涨价，没有商业模式支撑的服务无法健康长久。

昨晚一个朋友因为没买到 Coding Plan，来借我的 API key。

这时候我才意识到，这次涨价之后，依然是限购状态。

涨价+限购，一代人有一代人的茅台？

涨价背后的真相

要理解这次涨价，只需要看清一个结构性矛盾：供给是线性的，需求是指数的。

先看供给侧。

Google 2026 年的资本开支相比2025年，差不多翻倍。

这已经是全球最有钱的科技公司之一，倾尽全力在砸算力基础设施了。

你不可能让台积电明天就多造出十倍的芯片。

供给侧的增长曲线，是一条缓慢爬升的直线。

再看需求侧。

需求不是一重指数，是三重指数叠加。

第一重指数：Coding 模型能力提升解锁新场景。特别是从 Vibe Coding 到严肃的 Agentic Engineering 这一跃升。每一次能力提升，都打开一片10倍的 Token 消耗场景。

第二重指数：Agent 数量本身在爆发式增长。在未来一个人背后可能有 10 个、100 个 Agent 在 7×24 小时不间断地调用模型。人会睡觉，Agent 不会。人一天工作 8 小时，Agent 一天工作 24 小时。Agent 的数量乘以 Agent 的工作时长，这个数字的增长速度远超任何人类用户的增长。

第三重指数：Seedance 2.0，Nano Banana Pro 这样的多模态模型的 Token 消耗量远超纯文本。视频生成、图像理解、代码工程，每一个场景的单次消耗都是纯文本对话的几十倍甚至上百倍。当这些场景被模型能力解锁之后，Token 的消耗量会出现断崖式的跃升。

三重指数叠加在一起，面对的是一条线性增长的供给曲线。

供给翻 2 倍，需求翻 10 倍甚至 100 倍。

这种结构性的失衡，在可预见的未来一年内，只会增强不会逆转。

所以涨价不是智谱的选择，是物理定律的选择。

有人天真地说，不用担心，大厂会打价格战的。

你见过卖金铺打价格战吗？

稀缺的东西，不存在价格战。

GLM-5 凭什么值这个价

涨价 30% 需要底气，这种底气凭什么？

看三件事就够了。

第一，Coding 能力逼近 Claude Opus 4.5。

GLM-5 几个 Coding 能力的跑分上，已经追上了 Sonnet 4.5，开始朝着 Opus 4.5 逼近。在多个权威指标上都是开源模型的 SOTA。跟自己比，从 GLM-4.7 到 GLM-5，内部评估的编程任务平均增幅超过 20%。

除了指标的提升外，GLM-5 不只是"写代码更好了"，而是从写代码进化到了写工程。它能自主完成后端重构、深度调试、长程规划与执行，已经在朝着资深架构师的方向迈进。

第二，Agent 能力是真正的长程任务执行。

在 BrowseComp、MCP-Atlas、τ²-Bench 三个 Agent 评测基准上，GLM-5 均为开源第一。在 Vending Bench 2 的模拟经营测试中，GLM-5 经营一年期的自动售货机业务，最终账户余额达到 4432 美元，接近 Opus 4.5。

有些榜是可以刷的，但模拟经营榜，代表模型真的能"做事"。长程任务中的目标一致性、资源管理、多步骤依赖处理，是 Agentic Engineering 时代的核心能力。

第三，模型参数翻倍，推理成本也提高了。

GLM-5 的参数规模从 355B（激活 32B）扩展到 744B（激活 40B），预训练数据从 23T 提升到 28.5T，以 MIT License 完全开源。在顶级模型中，这种开放程度极为罕见。同时值得注意的是，GLM-5 已经完成了与华为昇腾、寒武纪、摩尔线程等国产算力平台的深度适配。在全球算力稀缺的大背景下，这件事的战略意义非同小可。

总之，用户付的钱多了 30%，但拿到的能力涨了远不止 30%。

人是为更好的结果买单，所以涨价完全没毛病。

实测体感

GLM-5 是第一个国内敢去对标 Claude Opus 的模型

我个人测试，目前的水平肯定是达不到 Opus 4.6 水平的

但我发现 GLM-5的思维方式和 Opus 4.6 非常像，思考深度非常深，有时候我看着这两个模型的思考国产，都会非常惊叹太聪明太全面了。

但遗憾的是 GLM-5 还不具备 Opus 4.6 的独立思考能力，会和 ChatGPT 一样顺着我的意思说。

这是我用 GLM-5 写的一个体感小游戏，叫《抓马》

能写出直接可玩的游戏，还是非常强悍的。

我和老婆玩了好几盘，胳膊都有点累，所以录视频的时候已经没有表情了。。

买 Token 就投资自己

上篇文章我说，互联网已死，Agent 永生。

意思不是说互联网真的死了，互联网又不是活体动物，不会死。

而是说互联网已经如死水一潭，我们不要在死水里找机会了。

Agent 是三个指数叠加的增量，最值得关注。

人最重要的事情就是要关注重点，屏蔽噪音。

既然最重要的是 Agent ，它的燃料又是 Token。

那就要舍得花钱，舍得买 Token。

舍得给自己的 Agent 加满油，它才能跑在最前面。

The Truth Behind the GLM-5 Price Hike: The Scarcity of Computing Power Has Only Just Begun

AI Summary

More Articles

THE INVISIBLE ARMY: INSIDE THE 2026 DEMOCRATIC GROUND GAME THAT REPUBLICANS DON'T EVEN KNOW EXISTS

Everything You Need to Know About Claude Cowork - A Complete Course in One Article

War Reveals the Truth: Russian and Chinese Weapons Are Outmatched

Five Years Ago I Started an Internet Experiment