算力通胀时代，我为什么囤了MiniMax年卡

这是2026年4月9日的一次真实决策过程。

起因：两个现象

今晚和我的AI助手（龙虾）聊了两个现象：

中国国内云计算算力涨价
抢了多天智谱GLM Coding Plan都抢不到

这两个看似无关的现象，背后是同一个逻辑：算力从”资源”变成了”硬通货”。

现象拆解

云厂商涨价

阿里云、百度云、腾讯云3月集体涨价，AI算力涨幅最高34%。

原因：

Token消耗暴涨：2026年2月日均180万亿Token，比去年翻了几十倍
硬件缺货：H200交付周期排到2027年，有钱也买不到
供需彻底翻转：从”求你来用”变成”你求着用”

腾讯混元甚至涨了460%——公测优惠期结束，直接恢复原价。

智谱Coding Plan抢不到

1月23日开始限售，每日销售量降到20%。每天10点抢，我抢了好几天没抢到。

原因：GLM-5上线后用户激增，高峰期算力不够用，开始限流。

本质：不是饥饿营销，是真的没算力了。

我的消耗量

我每天Token消耗约2000万，一个月6亿，一年73亿。

这个量级意味着：

套餐额度根本不够用
只能靠API按量付费
高峰期容易被限流

而百度千帆（我之前用的）：

下午高峰期经常卡死
3月涨价后性价比下降
明天到期，不打算续费

平台对比

模型能力排名

根据lmsys排行榜：

排名	模型	Score	价格（$/M）
#6	GPT-5.4	1457	~$2.50/$15
#9	GLM-5	1441	$1/$3.20
#14	Kimi K2.5 thinking	1429	$0.60/$3
#15	MiniMax M2.7	1428	$0.30/$1.20

MiniMax排名#15，Score 1428，与Kimi仅差1分，但价格更便宜。

年卡对比

平台	年费	主要权益
MiniMax Max-极速版	¥1,990	M2.7高速（100 TPS）+ 45000次/周 + 多模态
Kimi Allegretto	¥1,908	Agent集群 + 256K上下文 + Kimi Claw云端
智谱GLM	抢不到	-

按量成本对比

我的消耗量（每天2000万Token）：

平台	年成本
MiniMax年卡	¥1,990（锁定）
MiniMax M2.7按量	¥26,460
DeepSeek V3按量	¥2,412
百度千帆按量	¥6,000+

决策逻辑

1. 为什么选MiniMax？

性价比：

年卡¥1,990，比按量便宜13倍
高速模型（100 TPS）免费权益
锁定未来一年价格

能力：

排名#15，Score 1428
MoE架构，不容易算力紧张
多模态支持（图像理解、联网搜索）

保障：

年卡用户优先调度权
高峰期不被限流

2. 为什么不选Kimi？

虽然年卡便宜¥82，但：

Score仅高1分（1429 vs 1428）
我已有自己的OpenClaw，不需要云端
多模态功能MiniMax也有

3. 为什么不选GLM？

排名更高（#9 vs #15）
价格更便宜（$0.39/$1.75 vs $0.30/$1.20）
但抢不到年卡

如果GLM能抢到，优先GLM。但现实是：抢不到。

4. 为什么不选DeepSeek？

最便宜（$0.14/$0.28）
但没有年卡，不锁定价格
作为备选，不是主力

最终方案

主力：MiniMax年卡

年费：¥1,990
模型：M2.7-highspeed（100 TPS）
额度：4500次/5小时，45000次/周
权益：高速模型 + 图像理解 + 联网搜索

复杂任务：GPT-5.4按量

排名：#6，Score 1457
价格：~$2.50/$15
用途：复杂推理、大型架构

备选：DeepSeek V3按量

价格：$0.14/$0.28
用途：高峰期备用

弃用：百度千帆

经常卡死
价格贵
不再续费

总成本

项目	年费
MiniMax年卡	¥1,990
GPT-5.4按量	已有
DeepSeek备选	~¥200
总计	¥2,200/年

对比之前：百度千帆 ¥6,000+/年，还卡死

节省：¥3,800+/年

给开发者的建议

1. 算力紧缺至少持续到2026年底

IDC预测：到2030年，全球活跃AI智能体22亿个，Token消耗增长3亿倍。

算力不是短期紧缺，是长期结构性短缺。

2. 能囤就囤

年卡锁定当前价格
套餐用户有优先调度权
不要等降价，只会更贵

3. 多平台分散风险

不要把所有算力押在一个平台：

场景	模型
日常编程	MiniMax（快速、便宜）
复杂任务	GPT-5.4（能力强）
高峰期备选	DeepSeek（最便宜）

4. 你的消耗量决定策略

轻度用户（<100万Token/月）：套餐够用
中度用户（100-500万Token/月）：套餐+按量混合
重度用户（>500万Token/月）：年卡锁定 + 按量补充

结论

算力分层已经开始。

高价值场景（企业推理、Agent集群）优先保障，低价值场景（个人Coding、尝鲜）限流、涨价、排队。

抢不到Coding Plan，不是运气差，是算力分层已经开始。

能囤算力资源的，就锁住。别等降价，只会更贵。

写于2026年4月9日晚，北京。用百度千帆最后几小时的额度。

文档信息

本文作者：王翊仰
本文链接：https://www.wangyiyang.cc/2026/04/09/minimax-annual-card-decision/
版权声明：自由转载-非商用-非衍生-保持署名（创意共享3.0许可证）

翊行代码