这是2026年4月9日的一次真实决策过程。
起因:两个现象
今晚和我的AI助手(龙虾)聊了两个现象:
- 中国国内云计算算力涨价
- 抢了多天智谱GLM Coding Plan都抢不到
这两个看似无关的现象,背后是同一个逻辑:算力从”资源”变成了”硬通货”。
现象拆解
云厂商涨价
阿里云、百度云、腾讯云3月集体涨价,AI算力涨幅最高34%。
原因:
- Token消耗暴涨:2026年2月日均180万亿Token,比去年翻了几十倍
- 硬件缺货:H200交付周期排到2027年,有钱也买不到
- 供需彻底翻转:从”求你来用”变成”你求着用”
腾讯混元甚至涨了460%——公测优惠期结束,直接恢复原价。
智谱Coding Plan抢不到
1月23日开始限售,每日销售量降到20%。每天10点抢,我抢了好几天没抢到。
原因:GLM-5上线后用户激增,高峰期算力不够用,开始限流。
本质:不是饥饿营销,是真的没算力了。
我的消耗量
我每天Token消耗约2000万,一个月6亿,一年73亿。
这个量级意味着:
- 套餐额度根本不够用
- 只能靠API按量付费
- 高峰期容易被限流
而百度千帆(我之前用的):
- 下午高峰期经常卡死
- 3月涨价后性价比下降
- 明天到期,不打算续费
平台对比
模型能力排名
根据lmsys排行榜:
| 排名 | 模型 | Score | 价格($/M) |
|---|---|---|---|
| #6 | GPT-5.4 | 1457 | ~$2.50/$15 |
| #9 | GLM-5 | 1441 | $1/$3.20 |
| #14 | Kimi K2.5 thinking | 1429 | $0.60/$3 |
| #15 | MiniMax M2.7 | 1428 | $0.30/$1.20 |
MiniMax排名#15,Score 1428,与Kimi仅差1分,但价格更便宜。
年卡对比
| 平台 | 年费 | 主要权益 |
|---|---|---|
| MiniMax Max-极速版 | ¥1,990 | M2.7高速(100 TPS)+ 45000次/周 + 多模态 |
| Kimi Allegretto | ¥1,908 | Agent集群 + 256K上下文 + Kimi Claw云端 |
| 智谱GLM | 抢不到 | - |
按量成本对比
我的消耗量(每天2000万Token):
| 平台 | 年成本 |
|---|---|
| MiniMax年卡 | ¥1,990(锁定) |
| MiniMax M2.7按量 | ¥26,460 |
| DeepSeek V3按量 | ¥2,412 |
| 百度千帆按量 | ¥6,000+ |
决策逻辑
1. 为什么选MiniMax?
性价比:
- 年卡¥1,990,比按量便宜13倍
- 高速模型(100 TPS)免费权益
- 锁定未来一年价格
能力:
- 排名#15,Score 1428
- MoE架构,不容易算力紧张
- 多模态支持(图像理解、联网搜索)
保障:
- 年卡用户优先调度权
- 高峰期不被限流
2. 为什么不选Kimi?
虽然年卡便宜¥82,但:
- Score仅高1分(1429 vs 1428)
- 我已有自己的OpenClaw,不需要云端
- 多模态功能MiniMax也有
3. 为什么不选GLM?
- 排名更高(#9 vs #15)
- 价格更便宜($0.39/$1.75 vs $0.30/$1.20)
- 但抢不到年卡
如果GLM能抢到,优先GLM。但现实是:抢不到。
4. 为什么不选DeepSeek?
- 最便宜($0.14/$0.28)
- 但没有年卡,不锁定价格
- 作为备选,不是主力
最终方案
主力:MiniMax年卡
- 年费:¥1,990
- 模型:M2.7-highspeed(100 TPS)
- 额度:4500次/5小时,45000次/周
- 权益:高速模型 + 图像理解 + 联网搜索
复杂任务:GPT-5.4按量
- 排名:#6,Score 1457
- 价格:~$2.50/$15
- 用途:复杂推理、大型架构
备选:DeepSeek V3按量
- 价格:$0.14/$0.28
- 用途:高峰期备用
弃用:百度千帆
- 经常卡死
- 价格贵
- 不再续费
总成本
| 项目 | 年费 |
|---|---|
| MiniMax年卡 | ¥1,990 |
| GPT-5.4按量 | 已有 |
| DeepSeek备选 | ~¥200 |
| 总计 | ¥2,200/年 |
对比之前:百度千帆 ¥6,000+/年,还卡死
节省:¥3,800+/年
给开发者的建议
1. 算力紧缺至少持续到2026年底
IDC预测:到2030年,全球活跃AI智能体22亿个,Token消耗增长3亿倍。
算力不是短期紧缺,是长期结构性短缺。
2. 能囤就囤
- 年卡锁定当前价格
- 套餐用户有优先调度权
- 不要等降价,只会更贵
3. 多平台分散风险
不要把所有算力押在一个平台:
| 场景 | 模型 |
|---|---|
| 日常编程 | MiniMax(快速、便宜) |
| 复杂任务 | GPT-5.4(能力强) |
| 高峰期备选 | DeepSeek(最便宜) |
4. 你的消耗量决定策略
- 轻度用户(<100万Token/月):套餐够用
- 中度用户(100-500万Token/月):套餐+按量混合
- 重度用户(>500万Token/月):年卡锁定 + 按量补充
结论
算力分层已经开始。
高价值场景(企业推理、Agent集群)优先保障,低价值场景(个人Coding、尝鲜)限流、涨价、排队。
抢不到Coding Plan,不是运气差,是算力分层已经开始。
能囤算力资源的,就锁住。别等降价,只会更贵。
写于2026年4月9日晚,北京。用百度千帆最后几小时的额度。
文档信息
- 本文作者:王翊仰
- 本文链接:https://www.wangyiyang.cc/2026/04/09/minimax-annual-card-decision/
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)