2026年5月31日 AI早报｜V4-Pro永久…

今日 AI 圈有 5 件值得关注的事。DeepSeek V4-Pro 自今天起彻底告别「限时优惠」标签，2.5 折定价转为永久；Claude 背后的公司估值飙至 9650 亿美元并释放秋季 IPO 信号；阿里云 QwQ-32b 深度思考模型在凌晨正式下线。此外，小米 MiMo-V2.5 以最高 99% 降幅跟进价格战，头部模型企业的编程工具限额累加 50% 持续至 7 月。

📋 目录

旗舰模型永久降价今日生效：2.5 折成常态
头部模型企业估值 9650 亿美元，秋季 IPO 信号释放
阿里云 QwQ-32b 今日凌晨正式下线
终端编程工具限额累加 50%，持续至 7 月
小米 MiMo-V2.5 最高降 99%，价格战全面升级
智能体互联国家标准出台，政策加速落地
数据看板：主流大模型 API 定价对比
我们的解读

旗舰模型永久降价今日生效：2.5 折成常态

今天（5 月 31 日），DeepSeek V4-Pro 的限时 2.5 折优惠正式到期——但它不会恢复原价。该厂商此前宣布，优惠结束后价格直接锁定为原价的四分之一，永久生效。调整后，每百万 tokens 输入（缓存命中）仅需 0.025 元，输入（未命中）3 元，输出 6 元。这个价格在全球同类旗舰中已没有对手。

此前 4 月 26 日，该厂商已将全系 API 输入缓存命中价格降至首发价的十分之一，2.5 折在此基础上再加一重。如今两重优惠叠成「永久套餐」，用一杯咖啡的钱就能跑数十万次模型调用。

企业该关注什么：对于正在做 AI 应用原型验证或批量推理的团队，这个价格意味着算力成本不再成为瓶颈。过去「贵所以不敢多调」的限制基本解除。但高速大批量调用对后端架构的吞吐稳定性要求陡增——如果自建推理管道没做好流控和重试机制，便宜反而会暴露工程短板。做 AI 全栈开发时，模型选型只是其中一环，接入层、缓存层、降级策略同样决定线上体验。

（来源：AIbase）

头部模型企业估值 9650 亿美元，秋季 IPO 信号释放

5 月 28 日，Claude 背后的公司宣布完成最新一轮融资，估值攀升至 9650 亿美元——正式超过其最大竞争对手。据央视财经援引美联社报道，本轮融资仅数周即完成交割。市场预测该公司今年 Q2 营收将达 109 亿美元，环比增幅超 100%，有望迎来首个盈利季度。彭博社此前报道，这家企业与 ChatGPT 开发商最快可能均在 2026 年秋季启动 IPO。（相关阅读：AI巨头IPO倒计时、中国大模型五月融资超70亿美元）

怎么看：估值从实验室级别冲到逼近万亿，说明市场对「模型即服务」的付费意愿已从实验预算转向持续性 IT 开支。对国内企业而言，头部模型厂商的 API 稳定性与 SLA 会在 IPO 前迅速成熟，可以更放心地将其编入核心业务链路；但 IPO 后的定价策略可能从「抢地盘」转向「要利润」，趁窗口期锁定当前价格做技术储备是务实之选。做 AI 应用定制的团队，现在就应该按多模型可替换架构设计，避免被单一供应商锁死。

（来源：中财网）

阿里云 QwQ-32b 今日凌晨正式下线

5 月 31 日 00:00，阿里云 AI 搜索开放平台正式下线 QwQ 深度思考模型（qwq-32b）。所有仍在调用该模型的应用和服务已无法正常返回结果。阿里云推荐用户迁移至 DeepSeek 旗舰系列或 Qwen3-Max。

QwQ-32b 是通义系列中主打推理能力的型号，曾在部分编码和数学推理场景表现亮眼。但阿里云选择在此时下线而非迭代，说明内部对模型线的整合在加速——与其维护多条推理模型，不如将资源集中到表现更稳定的旗舰型号上。

开发者启示：依赖单一云厂商特定模型版本的应用，今天就是一个活生生的风险教材。模型下线不是「会不会」的问题，而是「什么时候」的问题。生产环境应始终维护模型版本配置表 + 自动化切换脚本。做 AI 应用架构时，抽象出一层模型路由中间件（支持按版本号、供应商动态切换），能有效避免因单点下线导致的业务中断。

（来源：阿里云帮助中心）

终端编程工具限额累加 50%，持续至 7 月

5 月中旬，Claude 开发商宣布旗下终端编程工具 Claude Code 的每周使用限额临时提升 50%，持续至 7 月 13 日。更重要的是，这次 50% 的提升可与上周刚生效的「加倍至 5 小时」限额累加，开发者实际可用额度远超常规水平。调整全自动生效，无需任何配置。

落地建议：连续叠加额度红利，说明该厂商正在编程工具赛道加速「圈开发者」。对使用这款终端编程工具的团队来说，从现在到 7 月中旬是低成本验证高强度场景的窗口——比如测试它对大型单体仓库的理解能力、连续多轮重构任务的表现、以及多智能体协作场景的稳定性。趁窗口期建立自己的工程化评估基准（而非仅仅「用着不错」的感性判断），才不至于在优惠结束后陷入被动。

（来源：AIGC官网）

小米 MiMo-V2.5 最高降 99%，价格战全面升级

5 月 27 日，小米宣布旗下 MiMo-V2.5 大模型 API 永久降价，对比原价最高降幅达到 99%。这是继国产旗舰模型之后，又一家国产厂商将大模型 API 定价拉至地板价。此前智谱选择反向提价 83%，但靠 GLM-5.1 在编程场景的硬核表现，调用量反而增长 400%。两条截然不同的商业化路线正在同时上演。

行业警示：降价潮对应用开发者短期是利好，但中期隐藏风险。当模型 API 毛利趋近于零，厂商必然会寻求其他变现路径——比如对高级功能（微调、私有部署、高并发 SLA）单独计费，或通过生态锁定（训练数据、工具链黏性）提高迁移成本。企业在做 AI 应用选型时，不要只对比单价，还要把「三年总持有成本 + 迁移成本」一起算进去。

（来源：21经济网）

智能体互联国家标准出台，政策加速落地

5 月 8 日，中央网信办发布《智能体规范应用与创新发展实施意见》，明确提出加强智能体互联协议（AIP）等关键国家标准的推广应用，并支持医疗、交通、媒体、公共安全等领域制定强制性标准。这是国内首份以「智能体互联」为核心的政策文件，标志着智能体从「单个工具」走向「系统化部署」有了顶层设计框架。（相关阅读：中国智能体监管框架落地）

为什么这事重要：互联协议标准一旦落地，意味着不同厂商的智能体不再是信息孤岛——企业的客服智能体、供应链智能体、运维智能体可以跨系统协同。这对做企业级 AI 系统集成的团队是明确的政策红利。建议提前关注 AIP 协议草案的技术细节，尤其是消息格式、鉴权机制和状态同步三个核心模块。现在把架构设计成「可接入标准协议」的模式，比标准发布后推倒重来要省至少一半工期。

（来源：中央网信办）

数据看板：主流大模型 API 定价对比（2026 年 5 月底）

模型	输入（缓存命中）	输入（未命中）	输出	备注
国产旗舰模型	¥0.025	¥3.00	¥6.00	今起永久生效
GPT-5.4	$2.50	$2.50	$15.00	官方定价
GPT-5.4 mini	$0.75	$0.75	$4.50	官方定价
小米 MiMo-V2.5	对比原价最高降 99%			5/27 永久生效
智谱 GLM-5.1	提价 83%，调用量反增 400%			靠编程场景表现支撑

数据来源：各厂商官网及公开报道，单位：每百万 tokens

我们的解读

今天的几条新闻串在一起，指向同一个趋势：AI 基础设施正在以超出预期的速度「水电煤化」。

国产旗舰模型把 API 永久压到 2.5 折、小米跟进最高降 99%、阿里云直接下线旧模型——这些动作的背后，是整个行业从「模型军备竞赛」向「应用落地竞赛」的急转弯。当调用一次旗舰模型的成本低到可以忽略，真正拉开差距的就不再是「用哪个模型」，而是「怎么把模型嵌入业务链路、怎么设计多智能体协作、怎么保证生产级稳定性」。

这也恰好是我们做 AIcoding 全栈开发每天都在面对的问题。模型便宜了，但把模型变成靠谱的产品——App、Web、小程序、桌面端——需要的工程能力一点没少。过去一年我们经手的项目里，从原型到上线，最耗时的一环从来不是「调模型 API」，而是：多模型路由设计、上下文窗口管理、智能体间状态同步、流式输出的前端渲染、以及用户侧的异常降级体验。

头部模型企业估值逼近万亿、ChatGPT 开发商冲刺 IPO，进一步说明市场在用真金白银投票——AI 不再是「要不要做」，而是「怎么比别人做得快、做得稳」。对于国内中小企业，当下最务实的路径不是自研模型，而是基于现有模型底座，用 AIcoding 模式快速把业务想法产品化。我们在实践中看到，用 AI 全栈开发流程（需求 → AI 辅助架构设计 → 代码生成 → 审查 → 测试 → 部署），典型中型项目周期可以压缩 40%-60%。

价格战终将过去，标准终将落地，但窗口期不会等人。

联系我们

如果您正在评估 AI 应用落地方案，或希望了解 AIcoding 全栈开发如何帮团队缩短交付周期，欢迎预约 30 分钟免费技术咨询 + AIcoding 转型评估。

立即预约 →

2026年5月31日 AI 早报｜V4-Pro永久降价落地、头部模型企业估值逼近万亿、阿里云QwQ今日下线