今日AI圈有7件值得关注的事:软银宣布在法国投750亿欧元建欧洲最大算力集群;微软Build 2026下周发布自研编程模型正面对决;阶跃星辰开源198B多模态模型面向生产级智能体。三条线索指向同一个方向——算力基建化、编程模型白热化、多模态开源提速。
今日AI圈有7件值得关注的事。软银孙正义再下重注——750亿欧元押注法国AI算力集群,首期3.1吉瓦;微软Build 2026下周召开,自研编程模型的信息已提前泄露,目标是夺回被蚕食的开发者市场份额;阶跃星辰5月29日开源Step 3.7 Flash,198B参数MoE架构、原生多模态、400 tokens/秒生成速度,直指生产级智能体场景。三条线索指向同一个方向:算力基建化、编程模型赛道白热化、国产多模态开源提速。
5月31日凌晨消息,软银集团承诺在法国投资最高750亿欧元(约5918亿元人民币),建设一个总容量达5吉瓦的AI算力集群。首期规划3.1吉瓦,选址法国北部上法兰西大区的敦刻尔克,后续再扩建2吉瓦。软银将与施耐德电气合作,在该园区打造AI基础设施与机器人制造一体化的产业中心。
这项投资的推进速度很快——今年4月法国总统马克龙与孙正义在东京晚餐后即快速落地,下周将在"选择法国"投资峰会上作为重磅成果公布。5吉瓦全部建成后,耗电量相当于5座标准核电站,接近纽约市用电峰值。法国丰富的核能资源和AI设施快速审批通道是吸引软银的关键因素。
为什么这事重要:750亿欧元不是终点——按行业通用算法,每建1吉瓦数据中心需约500亿美元总投入,软银这笔初始资金更多是"锚定投资",后续势必引入更多合作伙伴共同融资。对于需要大规模算力支撑AI应用部署的企业团队来说,欧洲算力供给的扩容意味着未来3-5年推理成本的持续下行是可预期的。从AI全栈开发的角度看,算力成本直接决定AI应用落地的经济可行性——推理越便宜,企业越敢在生产环境中大规模调用模型。
来源:财联社(5月31日)
据The Information 5月28日报道,微软将在下周(6月4日-6日)旧金山Build开发者大会上发布多款自研AI模型,其中最引人注目的是一款编程专用模型,目标直指增强代码助手GitHub Copilot的竞争力。消息人士称,这款编程模型连同语音转写、逻辑推理、语音生成和图像生成四大方向模型将同步亮相,每个方向都提供轻量端侧到云端旗舰的多规格版本。
自研编程模型的背景是市场份额焦虑——GitHub Copilot虽在AI代码辅助领域占据先发位置,但份额正被后来者不断蚕食。另据了解,微软此次发布的模型是在今年早些时候对外展示的自研模型基础上迭代而来,过去一年微软在AI方面投入了大量资金。
开发者启示:编程模型赛道的"去依附"趋势越来越明显。ChatGPT开发商之外,微软、以及此前已自研模型的IDE工具厂商都在建设自己的编程模型能力。这意味着企业在选择AI编程方案时,供应商锁定风险在降低。但另一个现实问题是——模型多了,集成复杂度也高了。对于想把AI编程能力嵌入自身研发流程的团队,与其在多个模型间反复切换试错,不如优先考虑通过AIcoding全栈开发服务一次性打通工具链:从模型选型、IDE适配、CI/CD集成到团队培训,整体交付周期通常可控制在6-8周。
来源:IT之家(5月28日)
5月29日,阶跃星辰发布并开源Step 3.7 Flash模型。该模型采用198B参数稀疏MoE架构——196B语言主干加1.8B视觉编码器,动态激活参数仅11B,支持原生图像输入和256K上下文窗口,最高生成速度达400 tokens/秒。官方定位为"面向生产级智能体的高效率Flash模型"。
与同类Flash模型通常"快但弱"的印象不同,Step 3.7 Flash在保持高吞吐的同时声称性能可媲美参数量大4倍的同类MoE模型。开发者可在Hugging Face直接下载权重。
企业该关注什么:198B参数、11B激活——这个规格意味着单卡或双卡推理成为可能,私有化部署门槛大幅降低。对于有数据合规要求、不能将业务数据送云端的企业,这是一个值得评估的选项。同时,原生多模态(图像理解不走"图转文"的迂回路径)对需要处理混合输入(如合同扫描件+文字描述、产品图+规格表)的AI应用场景尤其关键。这类多模态AI应用从原型到生产落地,涉及的远不止模型部署——前端交互、后端API编排、向量数据库选型、智能体工作流设计——是需要全栈开发能力支撑的系统工程。
来源:CSDN博客(5月29日)
5月21日《华尔街日报》披露,Claude背后的AI公司在最新一轮融资中向投资者展示的数据显示:2026年Q2营收预计达109亿美元,较Q1的48亿美元翻倍有余,对应营业利润约5.59亿美元。这将是该公司首次实现季度盈利,跑赢了竞争对手ChatGPT开发商和另一家由知名企业家创办的AI企业。
增长的核心引擎被指为其终端编程工具——该产品从实验工具快速转化为企业付费的生产系统,直接拉动营收曲线陡峭上扬。
怎么看这件事:109亿美元季度营收、首次盈利——AI行业"烧钱换规模"的叙事正在被推翻。编程工具成为盈利发动机说明一个事实:企业愿意为"直接提升工程师产出"的AI产品付费,且付费意愿极强。这对国内做AI软件定制开发的团队是明确的信号——帮企业把AI嵌入研发流程,不是一个"锦上添花"的选项,而是能直接产生ROI的核心需求。我们在多个客户项目中验证过:将AI编程流程纳入日常开发后,App+Web+小程序端的全栈交付周期平均缩短40%-50%。
来源:新浪财经(5月21日)
SpaceX在5月提交的S-1招股书中披露了一项重磅合作:5月份与Claude开发商签署了云服务协议,对方将在2029年5月前每月支付12.5亿美元,合同总额接近450亿美元,用于从SpaceX位于孟菲斯的Colossus 1数据中心获取超过300兆瓦的计算能力。SpaceX同时正以1.75万亿至2万亿美元为目标估值冲刺史上最大IPO。
我们的判断:每月12.5亿美元的算力账单是什么概念?相当于一家头部AI企业把近半营收重新投回算力采购。这揭示了一条AI产业链的深层逻辑:模型能力每提升一代,所需的训练和推理算力并非线性增长,而是指数级跳升。算力供给正在成为比模型架构更稀缺的战略资源。对应用层企业而言,这意味着两件事:一是云算力成本长期看涨而非看跌,二是"在边缘侧/私有化部署中压榨推理效率"的工程能力将成为核心竞争力。我们看到的趋势是,越来越多企业正在从"全量上云"转向"云端训练+边缘推理"的混合架构,这对全栈开发团队的架构设计能力提出了更高要求。
来源:东方财富(5月21日)
多方消息确认,ChatGPT开发商已于5月下旬秘密向SEC递交IPO招股书草案,由高盛和摩根士丹利牵头承销,目标2026年9月上市,估值瞄准8500亿美元以上。该公司今年3月刚完成1220亿美元融资轮,投后估值8520亿美元。Q1营收约57亿美元,运营利润率仍为负值。相关背景可参考我们此前的5月26日早报中对该事件的持续追踪。
行业警示:8520亿美元估值对应57亿美元季度营收——市销率高达37倍以上。资本市场对AI的定价逻辑已经超出传统科技股的估值框架。这种定价背后隐含的假设是"AI将吃掉所有软件",但现实是企业的AI应用落地速度远慢于资本市场预期。对于打算基于大模型做软件定制开发的企业客户,我们的建议是:不要被资本叙事带节奏。AI开发转型是一个需要6-12个月的渐进过程,先在一个业务线跑通闭环,再横向扩展,比追求"一步到位"的全面AI化更可持续。
来源:DoNews(5月21日)
近期,IDE型编程工具发布了其第三个大版本的重要更新,核心能力包括三项:PR审查——在IDE内完成从创建到合并的全流程代码审查,支持行内审查线程和提交历史浏览;并行构建——识别规划中彼此独立的部分,使用异步子智能体同时执行,替代此前的一次一个任务的串行模式;拆分PR——利用聊天上下文自动将变更拆分为逻辑独立的多个PR。
企业管控方面同步升级:管理员可设置模型粒度的允许/阻止列表、软支出限额配合50%/80%/100%用量智能提醒、以及上下文用量明细分析。现有使用旧版阻止列表的企业客户需在6月1日前迁移至新系统。
落地建议:IDE型编程工具的企业级管控成熟度正在快速追赶终端CLI型方案。对于考虑在团队中推广AI编程工具的技术负责人,6月1日的迁移截止日期意味着需要立刻行动。从我们的实践经验看,企业级AI编程工具落地有三个关键节点:选型评估(2-3天实测对比)、权限与计费策略设计、团队上手工作坊。一套完整的落地流程通常需要2-4周。软件定制开发团队尤其需要关注"并行构建"这类新能力——它能显著压缩多模块并行开发的协调成本。
来源:官方Changelog(5月29日)
| 指标 | 数值 | 对比/备注 |
|---|---|---|
| 软银法国算力投资 | 750亿欧元(≈5918亿人民币) | 首期3.1吉瓦,总规划5吉瓦 |
| 头部模型企业Q2营收 | 109亿美元 | Q1为48亿,环比+127% |
| 头部模型企业Q2营业利润 | 5.59亿美元 | 首次季度盈利 |
| SpaceX-头部AI企业算力长约 | 近450亿美元(36个月) | 月付12.5亿美元 |
| ChatGPT开发商估值 | 8520亿美元 | 3月融资后估值 |
| 国产旗舰模型(Step 3.7 Flash) | 198B总参/11B激活 | 400 tokens/s,256K上下文 |
| ChatGPT开发商Q1营收 | 57亿美元 | 运营利润率仍为负 |
这周AI行业的三条主线——算力基建化、编程模型白热化、多模态开源提速——对中国企业软件开发团队意味着什么?
第一,算力供给侧的军备竞赛还在加速。软银750亿欧元押注欧洲、SpaceX的Colossus 1数据中心签出450亿美元长约,说明头部企业对算力的饥渴远未满足。这对站在应用层的企业是利好消息:算力供给越充裕,模型推理成本越低,AI应用的经济可行性越高。我们预判到2027年,小规模AI应用的月度推理成本有望降至目前的30%-50%。
第二,编程模型正在走出"一家独大"的格局。微软自研编程模型即将亮相,IDE工具厂商自研模型持续迭代,国产旗舰模型(198B MoE)开源——开发者不再被锁定在单一生态。这对做AIcoding全栈开发是巨大利好:模型选型自由度越高,我们为客户定制方案时可选的"性价比最优解"就越多。从我们的交付经验看,不同业务场景(Web端、移动端、小程序、桌面端)对应的最优模型组合可以截然不同——客服系统可能用Flash级模型就够了,而代码生成场景才需要旗舰模型。关于模型选型的系统方法,可参阅我们此前的企业AI应用开发三条路径决策框架。
第三,多模态+智能体的组合正在成为落地标配。阶跃星辰198B模型的原生多模态能力、IDE工具的并行智能体执行——这两个技术方向指向同一个结论:2026下半年的AI应用开发,不再是"调一个API返回文字"那么简单。真正的生产级AI应用需要:多模态输入处理(图、文、表混合)、智能体工作流编排(多步骤自主执行)、企业级管控(权限、用量、成本)。这三个维度的工程复杂度,单靠一个模型API远远不够——需要全栈开发能力把模型、工具链、业务系统串成一条完整的交付链路。
我们目前帮助客户做的AI开发转型,正是解决这三个维度的整合问题:从模型选型→智能体工作流设计→前后端开发→CI/CD集成→团队培训,一站式交付。如果你正在评估团队AI化改造的可行性,6-8周的首期试点通常能拿到足够的数据来做后续决策。完整的转型路线图可参考90天从传统团队到AI协同转型一文。
如果你正在评估团队AI开发转型的可行性,或对文中提到的模型选型、智能体架构设计有具体问题,可以预约一次30分钟的免费技术咨询。我们会根据你的业务场景和现有技术栈,给出一个初步的可行性与ROI评估。