V4-Pro自今天起告别限时优惠,2.5折定价永久化;Claude开发商估值飙至9650亿美元释放秋季IPO信号;阿里云QwQ-32b凌晨正式下线。小米MiMo-V2.5跟进降价最高99%,价格战全面升级。
今日 AI 圈有 5 件值得关注的事。DeepSeek V4-Pro 自今天起彻底告别「限时优惠」标签,2.5 折定价转为永久;Claude 背后的公司估值飙至 9650 亿美元并释放秋季 IPO 信号;阿里云 QwQ-32b 深度思考模型在凌晨正式下线。此外,小米 MiMo-V2.5 以最高 99% 降幅跟进价格战,头部模型企业的编程工具限额累加 50% 持续至 7 月。
今天(5 月 31 日),DeepSeek V4-Pro 的限时 2.5 折优惠正式到期——但它不会恢复原价。该厂商此前宣布,优惠结束后价格直接锁定为原价的四分之一,永久生效。调整后,每百万 tokens 输入(缓存命中)仅需 0.025 元,输入(未命中)3 元,输出 6 元。这个价格在全球同类旗舰中已没有对手。
此前 4 月 26 日,该厂商已将全系 API 输入缓存命中价格降至首发价的十分之一,2.5 折在此基础上再加一重。如今两重优惠叠成「永久套餐」,用一杯咖啡的钱就能跑数十万次模型调用。
企业该关注什么:对于正在做 AI 应用原型验证或批量推理的团队,这个价格意味着算力成本不再成为瓶颈。过去「贵所以不敢多调」的限制基本解除。但高速大批量调用对后端架构的吞吐稳定性要求陡增——如果自建推理管道没做好流控和重试机制,便宜反而会暴露工程短板。做 AI 全栈开发时,模型选型只是其中一环,接入层、缓存层、降级策略同样决定线上体验。
(来源:AIbase)
5 月 28 日,Claude 背后的公司宣布完成最新一轮融资,估值攀升至 9650 亿美元——正式超过其最大竞争对手。据央视财经援引美联社报道,本轮融资仅数周即完成交割。市场预测该公司今年 Q2 营收将达 109 亿美元,环比增幅超 100%,有望迎来首个盈利季度。彭博社此前报道,这家企业与 ChatGPT 开发商最快可能均在 2026 年秋季启动 IPO。(相关阅读:AI巨头IPO倒计时、中国大模型五月融资超70亿美元)
怎么看:估值从实验室级别冲到逼近万亿,说明市场对「模型即服务」的付费意愿已从实验预算转向持续性 IT 开支。对国内企业而言,头部模型厂商的 API 稳定性与 SLA 会在 IPO 前迅速成熟,可以更放心地将其编入核心业务链路;但 IPO 后的定价策略可能从「抢地盘」转向「要利润」,趁窗口期锁定当前价格做技术储备是务实之选。做 AI 应用定制的团队,现在就应该按多模型可替换架构设计,避免被单一供应商锁死。
(来源:中财网)
5 月 31 日 00:00,阿里云 AI 搜索开放平台正式下线 QwQ 深度思考模型(qwq-32b)。所有仍在调用该模型的应用和服务已无法正常返回结果。阿里云推荐用户迁移至 DeepSeek 旗舰系列或 Qwen3-Max。
QwQ-32b 是通义系列中主打推理能力的型号,曾在部分编码和数学推理场景表现亮眼。但阿里云选择在此时下线而非迭代,说明内部对模型线的整合在加速——与其维护多条推理模型,不如将资源集中到表现更稳定的旗舰型号上。
开发者启示:依赖单一云厂商特定模型版本的应用,今天就是一个活生生的风险教材。模型下线不是「会不会」的问题,而是「什么时候」的问题。生产环境应始终维护模型版本配置表 + 自动化切换脚本。做 AI 应用架构时,抽象出一层模型路由中间件(支持按版本号、供应商动态切换),能有效避免因单点下线导致的业务中断。
(来源:阿里云帮助中心)
5 月中旬,Claude 开发商宣布旗下终端编程工具 Claude Code 的每周使用限额临时提升 50%,持续至 7 月 13 日。更重要的是,这次 50% 的提升可与上周刚生效的「加倍至 5 小时」限额累加,开发者实际可用额度远超常规水平。调整全自动生效,无需任何配置。
落地建议:连续叠加额度红利,说明该厂商正在编程工具赛道加速「圈开发者」。对使用这款终端编程工具的团队来说,从现在到 7 月中旬是低成本验证高强度场景的窗口——比如测试它对大型单体仓库的理解能力、连续多轮重构任务的表现、以及多智能体协作场景的稳定性。趁窗口期建立自己的工程化评估基准(而非仅仅「用着不错」的感性判断),才不至于在优惠结束后陷入被动。
(来源:AIGC官网)
5 月 27 日,小米宣布旗下 MiMo-V2.5 大模型 API 永久降价,对比原价最高降幅达到 99%。这是继国产旗舰模型之后,又一家国产厂商将大模型 API 定价拉至地板价。此前智谱选择反向提价 83%,但靠 GLM-5.1 在编程场景的硬核表现,调用量反而增长 400%。两条截然不同的商业化路线正在同时上演。
行业警示:降价潮对应用开发者短期是利好,但中期隐藏风险。当模型 API 毛利趋近于零,厂商必然会寻求其他变现路径——比如对高级功能(微调、私有部署、高并发 SLA)单独计费,或通过生态锁定(训练数据、工具链黏性)提高迁移成本。企业在做 AI 应用选型时,不要只对比单价,还要把「三年总持有成本 + 迁移成本」一起算进去。
(来源:21经济网)
5 月 8 日,中央网信办发布《智能体规范应用与创新发展实施意见》,明确提出加强智能体互联协议(AIP)等关键国家标准的推广应用,并支持医疗、交通、媒体、公共安全等领域制定强制性标准。这是国内首份以「智能体互联」为核心的政策文件,标志着智能体从「单个工具」走向「系统化部署」有了顶层设计框架。(相关阅读:中国智能体监管框架落地)
为什么这事重要:互联协议标准一旦落地,意味着不同厂商的智能体不再是信息孤岛——企业的客服智能体、供应链智能体、运维智能体可以跨系统协同。这对做企业级 AI 系统集成的团队是明确的政策红利。建议提前关注 AIP 协议草案的技术细节,尤其是消息格式、鉴权机制和状态同步三个核心模块。现在把架构设计成「可接入标准协议」的模式,比标准发布后推倒重来要省至少一半工期。
(来源:中央网信办)
| 模型 | 输入(缓存命中) | 输入(未命中) | 输出 | 备注 |
|---|---|---|---|---|
| 国产旗舰模型 | ¥0.025 | ¥3.00 | ¥6.00 | 今起永久生效 |
| GPT-5.4 | $2.50 | $2.50 | $15.00 | 官方定价 |
| GPT-5.4 mini | $0.75 | $0.75 | $4.50 | 官方定价 |
| 小米 MiMo-V2.5 | 对比原价最高降 99% | 5/27 永久生效 | ||
| 智谱 GLM-5.1 | 提价 83%,调用量反增 400% | 靠编程场景表现支撑 | ||
数据来源:各厂商官网及公开报道,单位:每百万 tokens
今天的几条新闻串在一起,指向同一个趋势:AI 基础设施正在以超出预期的速度「水电煤化」。
国产旗舰模型把 API 永久压到 2.5 折、小米跟进最高降 99%、阿里云直接下线旧模型——这些动作的背后,是整个行业从「模型军备竞赛」向「应用落地竞赛」的急转弯。当调用一次旗舰模型的成本低到可以忽略,真正拉开差距的就不再是「用哪个模型」,而是「怎么把模型嵌入业务链路、怎么设计多智能体协作、怎么保证生产级稳定性」。
这也恰好是我们做 AIcoding 全栈开发每天都在面对的问题。模型便宜了,但把模型变成靠谱的产品——App、Web、小程序、桌面端——需要的工程能力一点没少。过去一年我们经手的项目里,从原型到上线,最耗时的一环从来不是「调模型 API」,而是:多模型路由设计、上下文窗口管理、智能体间状态同步、流式输出的前端渲染、以及用户侧的异常降级体验。
头部模型企业估值逼近万亿、ChatGPT 开发商冲刺 IPO,进一步说明市场在用真金白银投票——AI 不再是「要不要做」,而是「怎么比别人做得快、做得稳」。对于国内中小企业,当下最务实的路径不是自研模型,而是基于现有模型底座,用 AIcoding 模式快速把业务想法产品化。我们在实践中看到,用 AI 全栈开发流程(需求 → AI 辅助架构设计 → 代码生成 → 审查 → 测试 → 部署),典型中型项目周期可以压缩 40%-60%。
价格战终将过去,标准终将落地,但窗口期不会等人。
如果您正在评估 AI 应用落地方案,或希望了解 AIcoding 全栈开发如何帮团队缩短交付周期,欢迎预约 30 分钟免费技术咨询 + AIcoding 转型评估。