Back to Articles
Feb 13, 20263 days ago

The Truth Behind the GLM-5 Price Hike: The Scarcity of Computing Power Has Only Just Begun

OA
Orange AI@oran_ge

AI Summary

This article delves into the recent 30% price increase for the GLM-5 Coding Plan, framing it not as a simple business decision but as an inevitable symptom of a fundamental structural clash. It argues that we are witnessing the beginning of a severe and lasting scarcity in computing power, driven by an exponential surge in demand that linear infrastructure growth cannot hope to match. The piece compellingly breaks down this demand into three overlapping exponential curves: the unlocking of new use cases by more capable models, the explosive proliferation of AI agents that work around the clock, and the massive token consumption of advanced multimodal applications. The analysis provides the necessary context to understand GLM-5's justification for the hike, pointing to its benchmark performance that rivals top global models, its evolution into a true engineering partner, and its strategic open-source and domestic hardware adaptation. The author shares personal testing impressions, acknowledging both the model's impressive depth and its current limitations, while emphasizing that users are paying for significantly enhanced capability. Ultimately, the article shifts perspective, suggesting that in the emerging "Agentic" era, tokens are the essential fuel for progress and investing in them is an investment in one's own competitive edge. To fully grasp the scale of the coming transformation and its implications for developers and businesses, the complete analysis is essential reading.

一个意料之中的信号

昨天上午,智谱 GLM-5 的 Coding Plan 涨价 30%。

这个事情引起了很大的讨论,我也非常理解,毕竟价格是最敏感的话题。

当时我的第一反应是:终于还是涨了。

虽然很反共识,但我一直预期 Token 会涨价,这个信号是对我预期的一个确认。

模型越强,Token 越稀缺,价格越贵。

智谱在商业化上确实显得不够成熟,他们最大的失误就是低估了模型能力进步带来的指数级增长,一开始给的 plan 太大方,现在模型更大了,算力不够,要么砍用量,要么涨价,没有商业模式支撑的服务无法健康长久。

昨晚一个朋友因为没买到 Coding Plan,来借我的 API key。

这时候我才意识到,这次涨价之后,依然是限购状态。

涨价+限购,一代人有一代人的茅台?

涨价背后的真相

要理解这次涨价,只需要看清一个结构性矛盾:供给是线性的,需求是指数的。

先看供给侧。

Google 2026 年的资本开支相比2025年,差不多翻倍。

这已经是全球最有钱的科技公司之一,倾尽全力在砸算力基础设施了。

你不可能让台积电明天就多造出十倍的芯片。

供给侧的增长曲线,是一条缓慢爬升的直线。

再看需求侧。

需求不是一重指数,是三重指数叠加。

第一重指数:Coding 模型能力提升解锁新场景。特别是从 Vibe Coding 到严肃的 Agentic Engineering 这一跃升。每一次能力提升,都打开一片10倍的 Token 消耗场景。

第二重指数:Agent 数量本身在爆发式增长。在未来一个人背后可能有 10 个、100 个 Agent 在 7×24 小时不间断地调用模型。人会睡觉,Agent 不会。人一天工作 8 小时,Agent 一天工作 24 小时。Agent 的数量乘以 Agent 的工作时长,这个数字的增长速度远超任何人类用户的增长。

第三重指数:Seedance 2.0,Nano Banana Pro 这样的多模态模型的 Token 消耗量远超纯文本。视频生成、图像理解、代码工程,每一个场景的单次消耗都是纯文本对话的几十倍甚至上百倍。当这些场景被模型能力解锁之后,Token 的消耗量会出现断崖式的跃升。

三重指数叠加在一起,面对的是一条线性增长的供给曲线。

供给翻 2 倍,需求翻 10 倍甚至 100 倍。

这种结构性的失衡,在可预见的未来一年内,只会增强不会逆转。

所以涨价不是智谱的选择,是物理定律的选择。

有人天真地说,不用担心,大厂会打价格战的。

你见过卖金铺打价格战吗?

稀缺的东西,不存在价格战。

GLM-5 凭什么值这个价

涨价 30% 需要底气,这种底气凭什么?

看三件事就够了。

第一,Coding 能力逼近 Claude Opus 4.5。

GLM-5 几个 Coding 能力的跑分上,已经追上了 Sonnet 4.5,开始朝着 Opus 4.5 逼近。在多个权威指标上都是开源模型的 SOTA。跟自己比,从 GLM-4.7 到 GLM-5,内部评估的编程任务平均增幅超过 20%。

除了指标的提升外,GLM-5 不只是"写代码更好了",而是从写代码进化到了写工程。它能自主完成后端重构、深度调试、长程规划与执行,已经在朝着资深架构师的方向迈进。

第二,Agent 能力是真正的长程任务执行。

在 BrowseComp、MCP-Atlas、τ²-Bench 三个 Agent 评测基准上,GLM-5 均为开源第一。在 Vending Bench 2 的模拟经营测试中,GLM-5 经营一年期的自动售货机业务,最终账户余额达到 4432 美元,接近 Opus 4.5。

有些榜是可以刷的,但模拟经营榜,代表模型真的能"做事"。长程任务中的目标一致性、资源管理、多步骤依赖处理,是 Agentic Engineering 时代的核心能力。

第三,模型参数翻倍,推理成本也提高了。

GLM-5 的参数规模从 355B(激活 32B)扩展到 744B(激活 40B),预训练数据从 23T 提升到 28.5T,以 MIT License 完全开源。在顶级模型中,这种开放程度极为罕见。同时值得注意的是,GLM-5 已经完成了与华为昇腾、寒武纪、摩尔线程等国产算力平台的深度适配。在全球算力稀缺的大背景下,这件事的战略意义非同小可。

总之,用户付的钱多了 30%,但拿到的能力涨了远不止 30%。

人是为更好的结果买单,所以涨价完全没毛病。

实测体感

GLM-5 是第一个国内敢去对标 Claude Opus 的模型

我个人测试,目前的水平肯定是达不到 Opus 4.6 水平的

但我发现 GLM-5的思维方式和 Opus 4.6 非常像,思考深度非常深,有时候我看着这两个模型的思考国产,都会非常惊叹太聪明太全面了。

但遗憾的是 GLM-5 还不具备 Opus 4.6 的独立思考能力,会和 ChatGPT 一样顺着我的意思说。

这是我用 GLM-5 写的一个体感小游戏,叫《抓马》

能写出直接可玩的游戏,还是非常强悍的。

我和老婆玩了好几盘,胳膊都有点累,所以录视频的时候已经没有表情了。。

买 Token 就投资自己

上篇文章我说,互联网已死,Agent 永生。

意思不是说互联网真的死了,互联网又不是活体动物,不会死。

而是说互联网已经如死水一潭,我们不要在死水里找机会了。

Agent 是三个指数叠加的增量,最值得关注。

人最重要的事情就是要关注重点,屏蔽噪音。

既然最重要的是 Agent ,它的燃料又是 Token。

那就要舍得花钱,舍得买 Token。

舍得给自己的 Agent 加满油,它才能跑在最前面。

By
OAOrange AI