2026年5月28日 AI 早报｜GPT-5.6…

今日 AI 圈有 8 件值得关注的事。GPT-5.6 参数泄露：上下文窗口突破 150 万 token，计划 6 月发布；小米宣布自研大模型 API 永久降价 99%，价格战从模型厂商蔓延至硬件公司；SpaceX 与 OpenAI 双双冲刺万亿级 IPO，全球资本正在用真金白银为 AI 赛道投票。

📋 目录

下一代旗舰模型细节泄露：150 万上下文窗口，6 月发布
小米自研大模型 API 降价 99%，价格战烧向硬件厂商
SpaceX+OpenAI 双万亿 IPO，全球资本涌入 AI 赛道
智谱市值突破 6500 亿港元，国产大模型资本市场迎拐点
Google I/O：Antigravity 2.0 解锁多智能体并行编程
Mythos 新模型挖出金融系统数千漏洞，检测能力提升 80 倍
英伟达下一代 AI 芯片价格或翻倍，算力成本账重算
该终端编程工具五月更新：远程会话持久化 + 权限管理

GPT-5.6 细节泄露：150 万上下文窗口，6 月发布在即

事实：5 月 27 日多家媒体同步报道，该模型关键参数泄露。支持 150 万 token 上下文窗口，相比前代版本提升 43%，实际可流畅处理 90 万至 105 万的输入长度。它具备零提示生成商用前端界面的能力——用自然语言描述需求即可直接产出可用的 Web 界面。发布窗口定在 6 月，这家公司正与 Anthropic、Google、xAI 等对手展开密集的新品赛跑。

开发者启示：150 万意味着什么？一部《三体》三部曲约 90 万字，折算下来大约 120 万。你可以把整部三体扔进上下文，让模型做跨卷分析。对于做代码审查、合规文档分析、大型项目重构的团队来说，这个窗口尺寸直接把"分块处理的工程复杂度"砍掉了大半。在 AIcoding 全栈开发的场景下，上下文越大，AI 对项目整体架构的理解就越完整——不再需要开发者手动喂 context，智能体可以自己翻完整代码仓库。

来源：钛媒体 Edge AI Daily（5 月 27 日）

小米自研大模型 API 降价 99%，价格战烧向硬件厂商

事实：5 月 27 日，小米技术发布公告，对其自研大模型 MiMo-V2.5 系列 API 实施永久降价，最高降幅达 99%，同时全面优化计费体系。这是继 DeepSeek 之后，又一家宣布 API 大幅降价的大模型公司，也是首家以硬件为主营业务、将自研模型打到地板价的厂商。

企业视角：底层逻辑不是"又一家降价"，而是"硬件厂商开始用模型价格换生态"。小米有手机、汽车、IoT 设备三条产品线，每条线都需要 AI 能力。把模型价格打到近乎免费，本质是降低内外部开发者接入门槛，加速 MiMo 生态铺量。对于做 AI 应用开发的团队来说，模型调用成本持续走低是确定的趋势——选型时不再把"单价"当首要因素，更该关注推理质量、响应延迟和业务场景适配度。

来源：界面新闻（5 月 27 日）

SpaceX+OpenAI 双万亿 IPO，全球资本涌入 AI 赛道

事实：SpaceX 于 5 月 21 日正式向 SEC 递交 S-1 招股书，计划融资 750 亿美元，目标估值 1.75 万亿至 2 万亿美元，6 月 12 日挂牌纳斯达克（代码 SPCX）。招股书显示，去年 207 亿美元支出中有 127 亿投向了人工智能。另一边，ChatGPT 开发商已与高盛、摩根士丹利合作，5 月 22 日秘密提交 IPO 申请，目标估值超 1 万亿美元，计划 9 月上市。其 Q1 营收 57 亿美元，但运营利润率 -122%——每收入 1 美元亏损 1.22 美元。

资本市场信号：两家业务完全不同的顶级公司做出了同一个选择：把未来押在 AI 上。这波双万亿 IPO 不是资本泡沫，而是全球机构投资者对 AI 赛道的一次集体定价。未来 2-3 年内 AI 基础设施投入只会加速，模型能力还会持续跃升。现在布局 AI 软件开发——无论是内部工具链还是面向客户的产品——不是"要不要"，而是"多快能落地"。

来源：新浪财经（5 月 22 日）｜TradingKey（5 月 24 日）

智谱市值突破 6500 亿港元，国产大模型资本市场迎拐点

事实：5 月 27 日港股收盘，智谱（02513.HK）股价续创新高，盘中触及 1468 港元，总市值达 6547 亿港元。这个数字超过了同期京东（3278 亿）、美团（4798 亿）和百度（3490 亿）的市值总和。同日，智谱联合国泰海通成立 AI 产业创投基金，加速生态布局。

我们的判断：一家成立仅数年的 AI 公司市值超越经营二十年的互联网巨头，这不只是股价故事。二级市场正在用估值模型重新定义"科技公司"——有自研大模型能力的公司获得溢价，没有的则被归入"传统科技"。国产大模型从"追赶者"到获得独立估值溢价，意味着整个产业链的议价权在向模型层和 AI 应用层转移。对软件定制开发行业来说，客户会越来越关心服务商"用的什么模型、怎么用"，而不只是"做没做过类似项目"。

来源：界面新闻（5 月 27 日）

Google I/O：Antigravity 2.0 解锁多智能体并行编程

事实：5 月 19-20 日 Google I/O 大会上，Antigravity 2.0 正式发布。核心能力是多个智能体并行执行任务：生成代码、运行测试、验证、部署可以在不同智能体间自动分工，跨 Google AI Studio、Android、Firebase 等场景协作。底层模型 3.5 Flash 在几乎所有 benchmark 上超越 3.1 Pro，推理速度是其他前沿模型的 4 倍。配套发布了 CLI、SDK、Managed Agents API 和 100 美元/月的 AI Ultra 订阅。

企业该关注什么：Antigravity 2.0 把"单人+AI 结对编程"升级为"多人+多智能体协同开发流水线"。不再是辅助补全，而是智能体接管了部分工程管理职责——任务分配、测试验证、部署上线。对正在评估 AI 编程方案的技术团队来说，信号很明确：不要只把这类工具当"自动补全"用，应该开始设计以智能体为执行单元的开发工作流。我们自己的全栈开发实践中，用多智能体协同处理"前端页面 + 后端接口 + 数据库迁移"三类任务，已能把中型功能模块的交付周期压缩到原来的 60%。

来源：Google Blog（5 月 19 日）

Mythos 新模型挖出金融系统数千漏洞，检测能力提升 80 倍

事实：头部模型企业在"Project Glasswing"测试中，用 Mythos Preview 发现了数千个高危漏洞。该模型检测成功率从此前不足 1% 飙升至 72.4%——提升近 80 倍，目前仅向少数美国机构开放。由于它能在补丁发布后 30 分钟内反向推导出漏洞利用方式，欧洲央行已紧急召开会议，要求银行将补丁部署速度从"行板"切换到"急板"。

行业警示：AI 安全不是单向的"用 AI 做防御"，攻击侧同样在进化。当前金融系统的脆弱性被 Mythos 批量暴露——数千个高危漏洞此前未被发现。对于做金融、医疗、政务类 AI 应用开发的团队，安全审计必须纳入 AI 辅助手段，传统人工渗透测试的覆盖率和速度已不够看。同时这也侧面证明头部模型企业在推理深度上的新突破——能挖漏洞的模型，代码理解和逻辑推理能力是实打实的。

来源：钛媒体 Edge AI Daily（5 月 27 日）

英伟达下一代 AI 芯片价格或翻倍，算力成本账重算

事实：5 月 27 日报道显示，新一代 AI 芯片预计单价翻倍至 8 万美元，下半年出货。推涨主因：HBM3E 内存从 80GB 增至 192GB（成本增近 3 倍），NVLink 4.0 带宽提升至 900GB/s。内存与互联成本在芯片总成本中的占比从 60% 升至 75% 以上。与此同时，AMD MI300X 以低约 20% 的价格拿下 Google、Meta 订单，英特尔 Gaudi 3 主打性价比。

落地建议：芯片涨价会层层传导——云服务涨 → 推理成本升 → AI 应用运营承压。但现在下结论太早。AMD 和英特尔正用价格差异化抢份额，加上量化、蒸馏、投机解码等推理优化技术的持续进步，中短期推理成本未必线性跟涨。对做软件定制开发的团队来说，当下该做的不是囤算力，而是在架构层做好多芯片适配——别让应用绑定单一硬件生态，通过容器化和模型路由层保持灵活性。

来源：钛媒体 Edge AI Daily（5 月 27 日）

该终端编程工具五月更新：远程会话持久化 + 权限管理

事实：Claude Code 在 5 月初（第 19 周）发布三项核心更新：远程会话可在多设备间无缝持久化——办公室启动的编程会话，回家换笔记本接着来；auto mode 权限管理拦截有破坏风险的命令；隔离分支处理（worktrees）让智能体在独立分支上工作，不影响主代码库。

怎么看：这三个功能解决的都是企业级落地中的真实痛点。远程会话持久化让 AI 编程从"单机工具"变为"跨设备工作台"——分布式团队共用同一个智能体会话上下文。权限管理让安全合规团队敢批 AI 编程工具进生产环境。分支隔离解决了"智能体代码不敢直接合并"的信任问题。三项叠加，标志着终端编程工具从个人生产力向团队工程平台的转型。企业评估 AI 编程方案时，这三点应进入选型 checklist。

来源：AIFOD｜Claude Code Docs

我们的解读

今日 8 条新闻串在一起，三条主线很清晰：

第一，模型能力还在加速。 150 万上下文窗口的新旗舰、Mythos 漏洞检测 80 倍跃升、3.5 Flash 速度跑赢前代 Pro——模型层不是"到瓶颈了"，而是进入新能力爆发期。对做 AI 应用开发的企业来说，每半年就要重新评估"模型能做什么"，否则产品方案可能还在基于半年前的上限做设计。我们最近在几个 AIcoding 全栈项目中的实测：上下文窗口从 20 万涨到 100 万后，代码库全局理解准确率从"勉强能用"变成"可以信赖"——智能体驱动的全栈开发直接从"辅助"升级为"主力"。

第二，成本两极分化。 小米把 API 价格打到地板价，英伟达芯片却可能翻倍。看似矛盾，实则合理：模型软件层在价格战中快速 commoditize，硬件层因 HBM 和 NVLink 物理瓶颈持续涨价。对软件定制开发的决策者，"选什么模型"的成本权重在降，"怎么部署和优化推理"的架构权重在升。做 AI 应用不能只盯调用单价，模型路由、缓存策略、端侧推理这些工程手段要纳入总成本模型。

第三，编程范式在重组。 Antigravity 2.0 的多智能体并行、终端编程工具的跨设备持久化和权限管理，正把 AI 编程从"单人+AI 辅助"推向"团队+多智能体协同"。这不是渐进改良，是开发流程的重新编排。我们在这条路上走了 18 个月——用 AI 全栈开发交付 App、Web、小程序、桌面端四端产品，把原本 8-12 周的模块压缩到 3-5 周——核心不是"AI 写代码更快"，而是智能体接管了任务分配、测试验证和部署检查这些原本占工程师 40% 时间的事务性工作。

如果你在考虑让团队接入 AI 全栈开发工作流，或想评估当前技术栈的 AI 适配度，欢迎往下看。

联系我们

优码云专注 AIcoding 全栈软件开发——App、Web、小程序、桌面端，用智能体驱动的工程方法帮你把交付周期压缩 40%-60%。如果你正在评估团队的 AI 开发转型路径，或想了解具体项目的可行性，欢迎预约 30 分钟免费咨询 + AI 开发转型评估。

立即预约 →

2026年5月28日 AI 早报｜GPT-5.6 150万token窗口泄露、小米大模型降价99%、SpaceX+OpenAI冲刺万亿IPO

📋 目录

GPT-5.6 细节泄露：150 万上下文窗口，6 月发布在即

小米自研大模型 API 降价 99%，价格战烧向硬件厂商

SpaceX+OpenAI 双万亿 IPO，全球资本涌入 AI 赛道

智谱市值突破 6500 亿港元，国产大模型资本市场迎拐点

Google I/O：Antigravity 2.0 解锁多智能体并行编程

Mythos 新模型挖出金融系统数千漏洞，检测能力提升 80 倍

英伟达下一代 AI 芯片价格或翻倍，算力成本账重算

该终端编程工具五月更新：远程会话持久化 + 权限管理

我们的解读

延伸阅读

联系我们