今日 AI 圈 7 件事:Google I/O 发布 Antigravity 2.0 多智能体编排平台,93 个智能体协同搭建复杂系统仅花不到 $1000;IDE 编程工具上线自研模型摆脱外部依赖;阶跃星辰 25 亿美元 Pre-IPO 融资收官;Qwen 登顶 LMSYS 竞技场。
今日 AI 圈有 7 件值得关注的事。搜索巨头的开发者大会交出了「多智能体」答卷——93 个自主模块协同、26 亿 token 从零搭建复杂系统,API 费用不到 1000 美元。编程工具赛道,一款热门 IDE 工具掏出第一颗自研模型,彻底告别对第三方基座的依赖。资本市场同样热闹:一家国产大模型公司拿下 25 亿美元 Pre-IPO,一家 AI 芯片企业创下美股史上最大芯片 IPO 纪录。昨日中国大模型五月融资超 70 亿美元的热度尚未消退,今天的消息继续印证:资本在加速流向「模型+应用」双轮驱动的标的。
5 月 20 日,搜索巨头在年度开发者大会上亮出了今年的核心方向:从「单模型能力」全面转向「智能体编排」。旗舰产品 Antigravity 2.0 是一个多模块编排平台,提供桌面 App、CLI 和 SDK 三层入口,开发者可以同时调度多个专用子模块处理复杂工作流。
一组内部数据很能说明问题:该公司用 93 个自主模块协同,消耗 26 亿 token,从零搭建了一个复杂系统,搭配 3.5 Flash 模型,API 费用不到 1000 美元。与之配套的 Gemini 3.5 Flash 主打高性价比推理,同时发布视频生成模型 Omni 和个人助手 Spark。公司全线产品月处理 token 量已突破 3200 万亿,850 万开发者在使用其模型构建应用。
另一个值得关注的动作是 WebMCP——一项提议中的开放 Web 标准,让浏览器内 AI 模块可以直接调用 JavaScript 函数和 HTML 表单,以结构化方式执行任务。Chrome 149 将率先启动实验性试用。
开发者启示:多模块编排正在从实验室进入工程实践。对于做企业级 AI 应用的团队,现在就应该考虑将系统拆分为可独立调度的子模块,而非依赖单一巨型 prompt。这和我们在 AI 全栈开发中的实践经验一致:把「一个大模型做所有事」换成「多个专用模块各司其职」,可维护性和可靠性会大幅提升。Antigravity 2.0 降低了编排门槛,但真正的壁垒在于模块间的上下文传递与错误回退设计——这是做 AI 应用定制的核心工程问题。
(来源:DoNews / IT之家)
5 月 21 日,热门 IDE 型编程工具发布了第一个自研模型 Composer 2.5。此前该产品底层一直依赖第三方基座——用户付的订阅费中相当一部分实际流向了模型 API 调用。自研模型上线后,这条依赖链被打断。
评测数据显示,Composer 2.5 在复杂终端操作场景得分 69.3%,与当前终端工具旗舰模型几乎持平;跨语言工程能力 79.8%,中大型项目表现稳定。价格方面,每次任务成本不到 1 美元,远低于通过 API 调用同类模型的开销。
企业视角:这一步意味着编程工具的竞争从「谁的模型更强」变成了「谁的端到端体验更顺 + 成本更低」。对于技术决策者,选 AI 编程工具需同时评估三个维度:模型能力、工具集成深度、以及长期使用成本。自研模型可能推动整个品类进入价格下行通道——对预算敏感的中小团队是好消息。如果团队正在评估 AIcoding 方案,建议把「工具切换成本」也纳入考量:现有用户基本零迁移成本,但从其他工具迁入需评估学习曲线。
(来源:CSDN 技术社区)
随着 Google I/O 和各工具更新,AI 编程进入五个主要玩家的阶段。当前 SWE-bench 基准测试中,头部模型厂商的 Opus 4.7 以 80.8% 准确率保持终端工具类第一。但竞争格局正在快速变化:
我们的判断是:2026 年下半年,企业不会只选一款工具。更合理的策略是「组合使用」——日常补全用 IDE 型、重构用终端型、企业合规用插件型。实现这个组合策略的前提,是团队有统一的 AIcoding 工作流规范——这正是我们帮企业做 AI 全栈开发落地时的第一条建议。
(来源:CSDN / 博客园)
5 月 11 日,澎湃新闻等多家媒体确认:腾讯已跟投阶跃星辰新一轮融资,该轮总额近 25 亿美元。公司同步拆除了红筹架构,加速赴港 IPO 准备,有望成为又一家登陆港交所的国产大模型企业。
腾讯与阶跃的绑定已从财务走向业务:4 月双方签署战略合作,将围绕智能座舱内的 AI 助手展开深度共创,连接腾讯系音乐、视频、地图、支付等服务,实现车内场景闭环。这在国产模型公司与互联网巨头的合作中,是落地方向最具体的一个。
怎么看:25 亿美元 Pre-IPO 的体量说明资本市场对「模型能力 + 场景落地」双轮驱动的公司仍愿下重注。但对于企业客户而言,选大模型供应商不能只看融资额——关键看三点:模型迭代速度、API 稳定性 SLA、以及是否有明确的应用层合作伙伴帮您把模型能力转化为业务系统。我们做 AI 软件定制开发的一个实际建议:不要选「融资最多」的,选「和你业务场景最匹配且生态最开放」的。
(来源:澎湃新闻)
根据 5 月 18 日 LMSYS Arena 竞技场快照,阿里通义千问最新推理模型 Qwen3.7-Max 已超越此前领跑的海外模型,登顶国产闭源组榜首。这是该系列模型在榜单上的历史最佳排名。
LMSYS Arena 是目前业内公认最接近「真人盲测」的模型竞技场——用户同时向两个匿名模型提问、投票选出更优回答,排名基于数十万次人类偏好对比得出。登顶意味着在综合对话质量、推理深度、指令遵循等维度上,该模型已达到一线水准。
落地建议:这对国内企业选型是个积极信号——在做 AI 应用开发时,国产模型在中文对话和推理场景中已是可用的主力选项,不必默认「必须用海外模型」。但要注意:竞技场排名反映的是通用对话能力,企业落地时还需额外评估 API 响应延迟、并发吞吐、私有化部署支持等工程指标。我们的经验是,进行 Agent 系统落地时,先把候选模型在 3-5 个真实业务场景中做 A/B 测试,让业务指标做最终决策。
(来源:知乎专栏)
5 月 15 日,AI 芯片厂商 Cerebras 在纳斯达克挂牌,发行 3000 万股,计入超额配售后募资总额达 55.5 亿美元。这一数字超过了 2023 年 Arm 上市的 48.7 亿美元纪录,成为美股史上规模最大的芯片 IPO。
Cerebras 的核心产品是晶圆级芯片 WSE-3,单芯片集成 4 万亿晶体管、90 万个计算核心,专为大模型训练和推理设计。与英伟达 GPU 集群路线不同,这家公司走的是「一颗巨型芯片替代一个机房」的路线。
行业警示:AI 芯片领域的竞争正在从一家独大走向多极格局。对于 AI 应用层开发者,芯片选择直接影响推理成本和延迟。如果你的 AI 应用日调用量超过百万次,推理芯片的选择比模型选择对成本的影响更大。做全栈开发时,建议在架构层预留模型/芯片的切换灵活性,不要把推理管道与特定硬件强绑定。
(来源:科创板日报)
3 月 31 日,ChatGPT 开发商以 8520 亿美元投后估值完成了 1220 亿美元的新一轮融资——创下私营公司史上最大融资纪录。其中某云厂商出资约 500 亿美元,某芯片巨头出资 300 亿美元。这笔资金的核心去向是下一代算力基础设施建设。关于此次融资对行业格局的深远影响,可参阅我们5 月 21 日的深度分析。
5 月 5 日,该公司随即发布了 GPT-5.5 Instant——一个更轻量、响应更快、减少「说教感」的日常对话模型。从产品节奏可以看出:巨额融资 → 算力投资 → 更便宜更快的模型 → 更大的用户基数,这条正循环正在加速。
为什么这事重要:模型推理成本持续下降是 2026 年最重要的行业趋势。当调用一次 GPT-5.5 级别的模型比雇一个实习生还便宜时,「要不要用 AI」就不再是个问题了——问题变成「怎么用 AI 重构业务流程」。我们接触的客户中,已经有人把 AI 应用从「锦上添花」升级为「核心生产系统」。如果你还在观望,现在就是入场的窗口期。做 AI 软件定制开发,我们建议从 ROI 最清晰的一个业务场景切入(如客服、文档处理、代码审查),跑通后再扩展。
(来源:OpenAI 官方博客)
五月的 AI 行业呈现出三条清晰主线,每一条都和中国企业技术决策直接相关。
第一条:多智能体编排正在成为新的工程范式。Google I/O 用 Antigravity 2.0 把「编排」做成了产品——93 个模块协同、千美元级成本搭建复杂系统,这不再是 demo,而是可复现的工程实践。对企业意味着:未来的软件架构不再是单体模型 + 前端,而是多个专用模块通过编排层协同工作。我们的 AIcoding 全栈开发实践已经验证:把需求拆成可独立验证的子任务、分配给不同模块、再用编排层做质量兜底,开发效率可以提升 50% 以上——不仅是代码生成快,更重要的是减少了「一个模块出错导致全局不可用」的风险。
第二条:AI 编程工具进入「工具 + 模型」一体化竞争。IDE 工具自研模型、插件工具全面 Agent 化、编排平台进军编程场景——工具不再只是模型的「壳」,而是完整的端到端体验。这对企业选型的影响是:选择编程工具就是选择技术路线。建议团队做工具选型时不要只看评测分数,而是让工程师在实际项目中跑 2 周,对比真实产出后再决定。
第三条:资本在选赛道,企业该选落地。从阶跃星辰 25 亿美元到 Cerebras 55 亿美元 IPO,再到 ChatGPT 开发商 1220 亿美元,资本正在为「模型 + 芯片 + 应用」三层同时下注。但对于非 AI 原生的企业技术团队,最重要的不是追热点,而是找到一个能跑通、能算清 ROI 的具体场景。我们的建议始终没变:从一个 App、一个 Web 端、或一个小程序的 AI 功能切入,用 Agent 系统跑通端到端闭环,然后再谈扩展。优码云的全栈 AI 软件开发服务,就是帮企业从这个「第一个场景」开始。
如果您的团队正在评估 AI 技术落地路径,我们可以提供 30 分钟免费咨询 + AIcoding 转型评估。从 App、Web、小程序到桌面端,从单点 AI 功能到多智能体系统——我们帮您找到 ROI 最高的切入场景。