算力通胀时代,我为什么囤了MiniMax年卡

2026/04/09 AI 产品决策 MiniMax 共 1952 字,约 6 分钟

这是2026年4月9日的一次真实决策过程。


起因:两个现象

今晚和我的AI助手(龙虾)聊了两个现象:

  1. 中国国内云计算算力涨价
  2. 抢了多天智谱GLM Coding Plan都抢不到

这两个看似无关的现象,背后是同一个逻辑:算力从”资源”变成了”硬通货”


现象拆解

云厂商涨价

阿里云、百度云、腾讯云3月集体涨价,AI算力涨幅最高34%。

原因:

  • Token消耗暴涨:2026年2月日均180万亿Token,比去年翻了几十倍
  • 硬件缺货:H200交付周期排到2027年,有钱也买不到
  • 供需彻底翻转:从”求你来用”变成”你求着用”

腾讯混元甚至涨了460%——公测优惠期结束,直接恢复原价。

智谱Coding Plan抢不到

1月23日开始限售,每日销售量降到20%。每天10点抢,我抢了好几天没抢到。

原因:GLM-5上线后用户激增,高峰期算力不够用,开始限流。

本质:不是饥饿营销,是真的没算力了。


我的消耗量

我每天Token消耗约2000万,一个月6亿,一年73亿。

这个量级意味着:

  • 套餐额度根本不够用
  • 只能靠API按量付费
  • 高峰期容易被限流

而百度千帆(我之前用的):

  • 下午高峰期经常卡死
  • 3月涨价后性价比下降
  • 明天到期,不打算续费

平台对比

模型能力排名

根据lmsys排行榜:

排名模型Score价格($/M)
#6GPT-5.41457~$2.50/$15
#9GLM-51441$1/$3.20
#14Kimi K2.5 thinking1429$0.60/$3
#15MiniMax M2.71428$0.30/$1.20

MiniMax排名#15,Score 1428,与Kimi仅差1分,但价格更便宜。

年卡对比

平台年费主要权益
MiniMax Max-极速版¥1,990M2.7高速(100 TPS)+ 45000次/周 + 多模态
Kimi Allegretto¥1,908Agent集群 + 256K上下文 + Kimi Claw云端
智谱GLM抢不到-

按量成本对比

我的消耗量(每天2000万Token):

平台年成本
MiniMax年卡¥1,990(锁定)
MiniMax M2.7按量¥26,460
DeepSeek V3按量¥2,412
百度千帆按量¥6,000+

决策逻辑

1. 为什么选MiniMax?

性价比

  • 年卡¥1,990,比按量便宜13倍
  • 高速模型(100 TPS)免费权益
  • 锁定未来一年价格

能力

  • 排名#15,Score 1428
  • MoE架构,不容易算力紧张
  • 多模态支持(图像理解、联网搜索)

保障

  • 年卡用户优先调度权
  • 高峰期不被限流

2. 为什么不选Kimi?

虽然年卡便宜¥82,但:

  • Score仅高1分(1429 vs 1428)
  • 我已有自己的OpenClaw,不需要云端
  • 多模态功能MiniMax也有

3. 为什么不选GLM?

  • 排名更高(#9 vs #15)
  • 价格更便宜($0.39/$1.75 vs $0.30/$1.20)
  • 但抢不到年卡

如果GLM能抢到,优先GLM。但现实是:抢不到。

4. 为什么不选DeepSeek?

  • 最便宜($0.14/$0.28)
  • 但没有年卡,不锁定价格
  • 作为备选,不是主力

最终方案

主力:MiniMax年卡

  • 年费:¥1,990
  • 模型:M2.7-highspeed(100 TPS)
  • 额度:4500次/5小时,45000次/周
  • 权益:高速模型 + 图像理解 + 联网搜索

复杂任务:GPT-5.4按量

  • 排名:#6,Score 1457
  • 价格:~$2.50/$15
  • 用途:复杂推理、大型架构

备选:DeepSeek V3按量

  • 价格:$0.14/$0.28
  • 用途:高峰期备用

弃用:百度千帆

  • 经常卡死
  • 价格贵
  • 不再续费

总成本

项目年费
MiniMax年卡¥1,990
GPT-5.4按量已有
DeepSeek备选~¥200
总计¥2,200/年

对比之前:百度千帆 ¥6,000+/年,还卡死

节省:¥3,800+/年


给开发者的建议

1. 算力紧缺至少持续到2026年底

IDC预测:到2030年,全球活跃AI智能体22亿个,Token消耗增长3亿倍

算力不是短期紧缺,是长期结构性短缺。

2. 能囤就囤

  • 年卡锁定当前价格
  • 套餐用户有优先调度权
  • 不要等降价,只会更贵

3. 多平台分散风险

不要把所有算力押在一个平台:

场景模型
日常编程MiniMax(快速、便宜)
复杂任务GPT-5.4(能力强)
高峰期备选DeepSeek(最便宜)

4. 你的消耗量决定策略

  • 轻度用户(<100万Token/月):套餐够用
  • 中度用户(100-500万Token/月):套餐+按量混合
  • 重度用户(>500万Token/月):年卡锁定 + 按量补充

结论

算力分层已经开始。

高价值场景(企业推理、Agent集群)优先保障,低价值场景(个人Coding、尝鲜)限流、涨价、排队。

抢不到Coding Plan,不是运气差,是算力分层已经开始。

能囤算力资源的,就锁住。别等降价,只会更贵。


写于2026年4月9日晚,北京。用百度千帆最后几小时的额度。

文档信息

Search

    关注公众号

    翊行代码微信公众号

    Table of Contents

    京ICP备2021015985号-1