今日 AI 圈有 8 件值得关注的事。GPT-5.6 参数泄露显示上下文窗口突破 150 万 token,6 月发布在即;小米自研大模型 API 永久降价 99%,价格战烧向硬件厂商;SpaceX 与 OpenAI 双双冲刺万亿级 IPO,全球资本重仓 AI 赛道。
今日 AI 圈有 8 件值得关注的事。GPT-5.6 参数泄露:上下文窗口突破 150 万 token,计划 6 月发布;小米宣布自研大模型 API 永久降价 99%,价格战从模型厂商蔓延至硬件公司;SpaceX 与 OpenAI 双双冲刺万亿级 IPO,全球资本正在用真金白银为 AI 赛道投票。
事实:5 月 27 日多家媒体同步报道,该模型关键参数泄露。支持 150 万 token 上下文窗口,相比前代版本提升 43%,实际可流畅处理 90 万至 105 万的输入长度。它具备零提示生成商用前端界面的能力——用自然语言描述需求即可直接产出可用的 Web 界面。发布窗口定在 6 月,这家公司正与 Anthropic、Google、xAI 等对手展开密集的新品赛跑。
开发者启示:150 万意味着什么?一部《三体》三部曲约 90 万字,折算下来大约 120 万。你可以把整部三体扔进上下文,让模型做跨卷分析。对于做代码审查、合规文档分析、大型项目重构的团队来说,这个窗口尺寸直接把"分块处理的工程复杂度"砍掉了大半。在 AIcoding 全栈开发的场景下,上下文越大,AI 对项目整体架构的理解就越完整——不再需要开发者手动喂 context,智能体可以自己翻完整代码仓库。
来源:钛媒体 Edge AI Daily(5 月 27 日)
事实:5 月 27 日,小米技术发布公告,对其自研大模型 MiMo-V2.5 系列 API 实施永久降价,最高降幅达 99%,同时全面优化计费体系。这是继 DeepSeek 之后,又一家宣布 API 大幅降价的大模型公司,也是首家以硬件为主营业务、将自研模型打到地板价的厂商。
企业视角:底层逻辑不是"又一家降价",而是"硬件厂商开始用模型价格换生态"。小米有手机、汽车、IoT 设备三条产品线,每条线都需要 AI 能力。把模型价格打到近乎免费,本质是降低内外部开发者接入门槛,加速 MiMo 生态铺量。对于做 AI 应用开发的团队来说,模型调用成本持续走低是确定的趋势——选型时不再把"单价"当首要因素,更该关注推理质量、响应延迟和业务场景适配度。
事实:SpaceX 于 5 月 21 日正式向 SEC 递交 S-1 招股书,计划融资 750 亿美元,目标估值 1.75 万亿至 2 万亿美元,6 月 12 日挂牌纳斯达克(代码 SPCX)。招股书显示,去年 207 亿美元支出中有 127 亿投向了人工智能。另一边,ChatGPT 开发商已与高盛、摩根士丹利合作,5 月 22 日秘密提交 IPO 申请,目标估值超 1 万亿美元,计划 9 月上市。其 Q1 营收 57 亿美元,但运营利润率 -122%——每收入 1 美元亏损 1.22 美元。
资本市场信号:两家业务完全不同的顶级公司做出了同一个选择:把未来押在 AI 上。这波双万亿 IPO 不是资本泡沫,而是全球机构投资者对 AI 赛道的一次集体定价。未来 2-3 年内 AI 基础设施投入只会加速,模型能力还会持续跃升。现在布局 AI 软件开发——无论是内部工具链还是面向客户的产品——不是"要不要",而是"多快能落地"。
来源:新浪财经(5 月 22 日)|TradingKey(5 月 24 日)
事实:5 月 27 日港股收盘,智谱(02513.HK)股价续创新高,盘中触及 1468 港元,总市值达 6547 亿港元。这个数字超过了同期京东(3278 亿)、美团(4798 亿)和百度(3490 亿)的市值总和。同日,智谱联合国泰海通成立 AI 产业创投基金,加速生态布局。
我们的判断:一家成立仅数年的 AI 公司市值超越经营二十年的互联网巨头,这不只是股价故事。二级市场正在用估值模型重新定义"科技公司"——有自研大模型能力的公司获得溢价,没有的则被归入"传统科技"。国产大模型从"追赶者"到获得独立估值溢价,意味着整个产业链的议价权在向模型层和 AI 应用层转移。对软件定制开发行业来说,客户会越来越关心服务商"用的什么模型、怎么用",而不只是"做没做过类似项目"。
事实:5 月 19-20 日 Google I/O 大会上,Antigravity 2.0 正式发布。核心能力是多个智能体并行执行任务:生成代码、运行测试、验证、部署可以在不同智能体间自动分工,跨 Google AI Studio、Android、Firebase 等场景协作。底层模型 3.5 Flash 在几乎所有 benchmark 上超越 3.1 Pro,推理速度是其他前沿模型的 4 倍。配套发布了 CLI、SDK、Managed Agents API 和 100 美元/月的 AI Ultra 订阅。
企业该关注什么:Antigravity 2.0 把"单人+AI 结对编程"升级为"多人+多智能体协同开发流水线"。不再是辅助补全,而是智能体接管了部分工程管理职责——任务分配、测试验证、部署上线。对正在评估 AI 编程方案的技术团队来说,信号很明确:不要只把这类工具当"自动补全"用,应该开始设计以智能体为执行单元的开发工作流。我们自己的全栈开发实践中,用多智能体协同处理"前端页面 + 后端接口 + 数据库迁移"三类任务,已能把中型功能模块的交付周期压缩到原来的 60%。
事实:头部模型企业在"Project Glasswing"测试中,用 Mythos Preview 发现了数千个高危漏洞。该模型检测成功率从此前不足 1% 飙升至 72.4%——提升近 80 倍,目前仅向少数美国机构开放。由于它能在补丁发布后 30 分钟内反向推导出漏洞利用方式,欧洲央行已紧急召开会议,要求银行将补丁部署速度从"行板"切换到"急板"。
行业警示:AI 安全不是单向的"用 AI 做防御",攻击侧同样在进化。当前金融系统的脆弱性被 Mythos 批量暴露——数千个高危漏洞此前未被发现。对于做金融、医疗、政务类 AI 应用开发的团队,安全审计必须纳入 AI 辅助手段,传统人工渗透测试的覆盖率和速度已不够看。同时这也侧面证明头部模型企业在推理深度上的新突破——能挖漏洞的模型,代码理解和逻辑推理能力是实打实的。
来源:钛媒体 Edge AI Daily(5 月 27 日)
事实:5 月 27 日报道显示,新一代 AI 芯片预计单价翻倍至 8 万美元,下半年出货。推涨主因:HBM3E 内存从 80GB 增至 192GB(成本增近 3 倍),NVLink 4.0 带宽提升至 900GB/s。内存与互联成本在芯片总成本中的占比从 60% 升至 75% 以上。与此同时,AMD MI300X 以低约 20% 的价格拿下 Google、Meta 订单,英特尔 Gaudi 3 主打性价比。
落地建议:芯片涨价会层层传导——云服务涨 → 推理成本升 → AI 应用运营承压。但现在下结论太早。AMD 和英特尔正用价格差异化抢份额,加上量化、蒸馏、投机解码等推理优化技术的持续进步,中短期推理成本未必线性跟涨。对做软件定制开发的团队来说,当下该做的不是囤算力,而是在架构层做好多芯片适配——别让应用绑定单一硬件生态,通过容器化和模型路由层保持灵活性。
来源:钛媒体 Edge AI Daily(5 月 27 日)
事实:Claude Code 在 5 月初(第 19 周)发布三项核心更新:远程会话可在多设备间无缝持久化——办公室启动的编程会话,回家换笔记本接着来;auto mode 权限管理拦截有破坏风险的命令;隔离分支处理(worktrees)让智能体在独立分支上工作,不影响主代码库。
怎么看:这三个功能解决的都是企业级落地中的真实痛点。远程会话持久化让 AI 编程从"单机工具"变为"跨设备工作台"——分布式团队共用同一个智能体会话上下文。权限管理让安全合规团队敢批 AI 编程工具进生产环境。分支隔离解决了"智能体代码不敢直接合并"的信任问题。三项叠加,标志着终端编程工具从个人生产力向团队工程平台的转型。企业评估 AI 编程方案时,这三点应进入选型 checklist。
今日 8 条新闻串在一起,三条主线很清晰:
第一,模型能力还在加速。 150 万上下文窗口的新旗舰、Mythos 漏洞检测 80 倍跃升、3.5 Flash 速度跑赢前代 Pro——模型层不是"到瓶颈了",而是进入新能力爆发期。对做 AI 应用开发的企业来说,每半年就要重新评估"模型能做什么",否则产品方案可能还在基于半年前的上限做设计。我们最近在几个 AIcoding 全栈项目中的实测:上下文窗口从 20 万涨到 100 万后,代码库全局理解准确率从"勉强能用"变成"可以信赖"——智能体驱动的全栈开发直接从"辅助"升级为"主力"。
第二,成本两极分化。 小米把 API 价格打到地板价,英伟达芯片却可能翻倍。看似矛盾,实则合理:模型软件层在价格战中快速 commoditize,硬件层因 HBM 和 NVLink 物理瓶颈持续涨价。对软件定制开发的决策者,"选什么模型"的成本权重在降,"怎么部署和优化推理"的架构权重在升。做 AI 应用不能只盯调用单价,模型路由、缓存策略、端侧推理这些工程手段要纳入总成本模型。
第三,编程范式在重组。 Antigravity 2.0 的多智能体并行、终端编程工具的跨设备持久化和权限管理,正把 AI 编程从"单人+AI 辅助"推向"团队+多智能体协同"。这不是渐进改良,是开发流程的重新编排。我们在这条路上走了 18 个月——用 AI 全栈开发交付 App、Web、小程序、桌面端四端产品,把原本 8-12 周的模块压缩到 3-5 周——核心不是"AI 写代码更快",而是智能体接管了任务分配、测试验证和部署检查这些原本占工程师 40% 时间的事务性工作。
如果你在考虑让团队接入 AI 全栈开发工作流,或想评估当前技术栈的 AI 适配度,欢迎往下看。
优码云专注 AIcoding 全栈软件开发——App、Web、小程序、桌面端,用智能体驱动的工程方法帮你把交付周期压缩 40%-60%。如果你正在评估团队的 AI 开发转型路径,或想了解具体项目的可行性,欢迎预约 30 分钟免费咨询 + AI 开发转型评估。