Kimi K2 今日正式下线,官方推荐迁移 K2.6;2026 Q1 全球科技裁员 78557 人,47.9% 归因 AI;Google I/O Gemini Spark 首轮优惠到期;GitHub AI 代码占比飙至 46%;美光 CEO 预警内存短缺至 2028。
今天五条消息背后指向同一个事实:AI 正在从"尝鲜实验"变成企业实际成本表上的硬数字——模型退役要迁移、裁员数据有出处、API 价格窗口关闭、代码仓库结构变了、硬件供给要卡三年。以下逐一拆解。
月之暗面旗下 Kimi K2 系列模型于今日(5 月 25 日)正式退役。官方推荐开发者迁移至 4 月 21 日发布并开源的 K2.6 版本。K2 基于 MoE 架构,1T 总参数量、32B 激活参数,曾在长上下文推理赛道建立差异化优势。K2.6 在此基础上强化了代码能力与 Agent 集群协同——据测试数据,可在单任务中持续编码超 12 小时、完成 4000+ 行代码修改。
值得企业注意的实操点:检查现有 API 调用是否仍指向 kimi-k2-*-preview 端点。K2.6 已全面兼容 OpenAI 和 Anthropic 的 API 格式,从 GPT 或 Claude 生态迁移几乎零成本。月之暗面在 5 月初刚完成 20 亿美元融资、估值超 200 亿美元,旧模型退役背后是这家公司加速收敛产品线的信号——从多版本并行转向单一旗舰模型策略。
怎么看:国内大量 SaaS / 智能客服 / 代码助手产品底层接的是 Kimi 系列。K2 下线不是新闻,因为没做迁移而被线上事故打醒才是新闻。建议今天就把 API endpoint 检查列入运维 checklist。
RationalFX 联合 Nikkei Asia 于 4 月 8 日发布的数据显示,2026 年 1 月 1 日至 4 月 1 日,全球科技行业累计裁员 78557 人,其中 76.7% 集中在美国。37638 个岗位(占比 47.9%)被企业直接或间接归因于 AI 实施与工作流自动化。这一比例相比 2025 年(约 28.5%)同比增幅超过 600%。
几个矛盾案例值得拆开看:
Cognizant 首席 AI 官 Babak Hodjat 在接受采访时指出,部分企业可能借 AI 之名行财务调整之实,真实生产力影响需在未来 6–12 个月才能显现。他同时呼吁企业加强应届毕业生 AI 应用培训。
企业视角:这个数据对 CTO 有两层意义。第一,AI 相关裁员叙事正在从「科技巨头个案」变成「行业结构性趋势」,投资人会追问你团队里哪些岗位可以被工具替代。第二,「以 AI 之名裁员」的叙事正在透支信任——真正用 AI 提效的公司,讲的是人效提升而非人头减少。关于如何在团队中落地 AI 工具组合而非简单减员,可参考我们此前的 AI 编程 ROI 量化模型与场景决策指南。
来源:DoNews;199IT/日经亚洲
5 月 20 日 Google I/O 大会上发布的 Gemini Spark(24/7 个人 AI 代理)及 Antigravity 2.0 开发平台,首轮 Antigravity 激励计划于今日(5 月 25 日)正式到期。Gemini 3.5 Flash——本次大会发布的旗舰模型——百万 Token 输入在缓存命中场景下仅 2.5 分人民币,输出价格为 GPT-4o 同类场景的约 1/8。
这组定价对国内 SaaS、智能客服、代码助手、企业知识库赛道形成了直接成本冲击。国内模型厂商此前以「性价比」作为核心竞争叙事,当 Google 把 Flash 级别的模型压到这个价格时,「便宜」不再是本土模型的护城河。Gemini 应用月活已突破 9 亿,该巨头今年的资本支出预计达到 1800–1900 亿美元(约 2022 年的 6 倍),其中关键部分投向自研 TPU。
落地建议:如果你的产品仍以「模型便宜」作为卖点,今天之后这个叙事需要重写。竞争从模型层上移到应用层——谁在具体场景里做得更深、更可靠、更懂行业,才是壁垒。Antigravity 本身也在推「自然语言搭建智能体」的范式,对国内低代码 Agent 平台构成直接威胁。
GitHub 最新数据显示,AI 生成代码在新建仓库中的占比已从 2024 年的 22% 飙升至 2026 年的 46%,两年翻了一倍。与此同时,近 80% 新注册开发者在入驻 GitHub 第一周内就会使用 Copilot——AI 辅助编程已从「高手工具」变成「开发者默认行为」。对几款主流 AI 编程工具的企业落地对比,详见 Cursor vs Claude Code vs Copilot 企业落地实录。
一个更底层的趋势藏在 Octoverse 报告中:AI 工具正在反向塑造语言选择。TypeScript 同比增长 66% 登顶最常用语言,背后是 AI 辅助下前端全栈化的便利性提升——开发者用自然语言描述交互逻辑,AI 生成 TS 代码,学习门槛降低使得更多人涌入这个生态。
开发者启示:46% 这个数字有两个读法。乐观派认为 AI 消除了重复劳动、加速创新;谨慎派担心代码同质化和安全审计盲区。对于企业团队,核心问题不是「要不要用 AI 写代码」,而是「AI 写的 46% 代码谁来审、谁来担责」——Code Review 流程和 AI 代码安全扫描正在成为新的刚需。
来源:GitHub Octoverse 2025;InfoQ
美光 CEO Sanjay Mehrotra 于 5 月 23 日接受 CNBC 采访时发出明确预警:全球存储芯片短缺将延续至 2026 年之后,真正大规模新产能释放至少要等到 2028 年。目前美光对核心 AI 客户的供应仅能满足 50%–2/3 需求,缺口持续扩大。公司已启动横跨美国三州、总额 2000 亿美元的扩产投资计划,重点投向 AI 加速器所需的高带宽内存(HBM)。
单台 AI 服务器的存储需求是传统服务器的 8–10 倍。Mehrotra 强调,当前的供需失衡属于长期结构性问题,而非传统周期波动——AI 智能体崛起带来的内存需求增速远超产能建设速度。2026 年全球半导体市场规模预计突破 9750 亿美元,存储芯片贡献近三成增量。
行业警示:这个预警直接影响所有做 AI 私有化部署的企业。如果客户计划 2027 年上 50 台 GPU 服务器做模型微调,今天就要开始锁内存订单——不是「提前半年」,是「提前两年」。国产存储(长鑫、长江存储)的替代进程也在加速,但短期内无法填补 HBM 缺口。
问:Kimi K2 下线对我的业务有什么影响?
如果你通过 API 调用了 kimi-k2-*-preview 端点,今天起请求可能返回错误。K2.6 兼容 OpenAI/Anthropic 格式,迁移成本低,但需要在今天内完成端点切换和回归测试。
问:AI 裁员的 47.9% 数据可靠吗?
数据来自 RationalFX 对公开裁员公告的统计,经日经亚洲交叉核验。需要理解的是,「归因于 AI」是企业自述口径,部分企业可能借 AI 之名做财务调整,Cognizant 首席 AI 官也指出了这一点。
问:Gemini 3.5 Flash 的 2.5 分/百万 Token 是真的吗?
这是缓存命中场景下的输入价格,非缓存场景略高。作为对比,GPT-4o 同类场景约为其 8 倍。Google 此轮定价策略的目标是压低 AI 应用的基础成本,推动开发者生态迁移。
问:内存短缺对中小企业的实际影响是什么?
短期看,GPU 服务器采购周期拉长、溢价增加。中期看,如果业务涉及 AI 私有化部署,2026-2028 年的硬件预算需要上修 30%-50% 并提前锁定供应链。
第一,API 迁移节奏决定服务连续性。Kimi K2 退役不是一个孤立事件。国内大模型正在经历第一轮产品线收敛——多版本并行策略不可持续,每家最终会收拢到 1–2 个旗舰模型。依赖第三方模型 API 的企业需要建立模型退役监控机制,而不是等公告出来再被动响应。
第二,团队结构正在被重新定义。47.9% 的裁员归因 AI 这个数字,无论其中有多少水分,都意味着投资人、董事会、客户三方都会开始用「AI 人效比」来衡量技术团队。聪明的 CTO 不会被动等裁员指标落下来,而是主动用 AI 工具重新切分团队职责——让 5 个人做原来 12 个人的事,再把释放出来的人力投向 AI 做不了的高价值工作。
第三,AI 基础设施成本需要三年预判。从 Gemini 的降价到美光的涨价,两条线在同时走:模型推理成本持续下降,但支撑模型的硬件成本持续上升。做 AI 私有化部署的企业,今天做的预算必须覆盖到 2028 年的内存价格周期,而不能按季度做采购计划。
相关阅读:昨日 AI 早报(5月22日)|ChatGPT 开发商秘密递交 IPO 招股书 · 5月21日 AI 早报|OpenAI 启动 IPO 程序、谷歌 I/O 重塑搜索