AI早报｜5月25日：Kimi K2退役、裁员近…

今天五条消息背后指向同一个事实：AI 正在从"尝鲜实验"变成企业实际成本表上的硬数字——模型退役要迁移、裁员数据有出处、API 价格窗口关闭、代码仓库结构变了、硬件供给要卡三年。以下逐一拆解。

一、Kimi K2 今日正式下线，迁移 K2.6 进入倒计时

月之暗面旗下 Kimi K2 系列模型于今日（5 月 25 日）正式退役。官方推荐开发者迁移至 4 月 21 日发布并开源的 K2.6 版本。K2 基于 MoE 架构，1T 总参数量、32B 激活参数，曾在长上下文推理赛道建立差异化优势。K2.6 在此基础上强化了代码能力与 Agent 集群协同——据测试数据，可在单任务中持续编码超 12 小时、完成 4000+ 行代码修改。

值得企业注意的实操点：检查现有 API 调用是否仍指向 kimi-k2-*-preview 端点。K2.6 已全面兼容 OpenAI 和 Anthropic 的 API 格式，从 GPT 或 Claude 生态迁移几乎零成本。月之暗面在 5 月初刚完成 20 亿美元融资、估值超 200 亿美元，旧模型退役背后是这家公司加速收敛产品线的信号——从多版本并行转向单一旗舰模型策略。

怎么看：国内大量 SaaS / 智能客服 / 代码助手产品底层接的是 Kimi 系列。K2 下线不是新闻，因为没做迁移而被线上事故打醒才是新闻。建议今天就把 API endpoint 检查列入运维 checklist。

来源：月之暗面官方公告；钛媒体；财新

二、Q1 全球科技裁员 78557 人，47.9% 被归因于 AI 与自动化

RationalFX 联合 Nikkei Asia 于 4 月 8 日发布的数据显示，2026 年 1 月 1 日至 4 月 1 日，全球科技行业累计裁员 78557 人，其中 76.7% 集中在美国。37638 个岗位（占比 47.9%）被企业直接或间接归因于 AI 实施与工作流自动化。这一比例相比 2025 年（约 28.5%）同比增幅超过 600%。

几个矛盾案例值得拆开看：

甲骨文：3 月 31 日一次性裁撤约 3 万人，占全球员工近五分之一，为 2026 年以来单次规模最大的科技裁员。同一时期，该公司 AI 资本支出同比增加 150%。
Cloudflare：营收同比增长 34% 的情况下仍裁减 20% 员工。
Meta：股价创新高时裁掉约 8000 人。

Cognizant 首席 AI 官 Babak Hodjat 在接受采访时指出，部分企业可能借 AI 之名行财务调整之实，真实生产力影响需在未来 6–12 个月才能显现。他同时呼吁企业加强应届毕业生 AI 应用培训。

企业视角：这个数据对 CTO 有两层意义。第一，AI 相关裁员叙事正在从「科技巨头个案」变成「行业结构性趋势」，投资人会追问你团队里哪些岗位可以被工具替代。第二，「以 AI 之名裁员」的叙事正在透支信任——真正用 AI 提效的公司，讲的是人效提升而非人头减少。关于如何在团队中落地 AI 工具组合而非简单减员，可参考我们此前的 AI 编程 ROI 量化模型与场景决策指南。

来源：DoNews；199IT/日经亚洲

三、Gemini Spark 首轮优惠今日到期，大模型价格战再下一城

5 月 20 日 Google I/O 大会上发布的 Gemini Spark（24/7 个人 AI 代理）及 Antigravity 2.0 开发平台，首轮 Antigravity 激励计划于今日（5 月 25 日）正式到期。Gemini 3.5 Flash——本次大会发布的旗舰模型——百万 Token 输入在缓存命中场景下仅 2.5 分人民币，输出价格为 GPT-4o 同类场景的约 1/8。

这组定价对国内 SaaS、智能客服、代码助手、企业知识库赛道形成了直接成本冲击。国内模型厂商此前以「性价比」作为核心竞争叙事，当 Google 把 Flash 级别的模型压到这个价格时，「便宜」不再是本土模型的护城河。Gemini 应用月活已突破 9 亿，该巨头今年的资本支出预计达到 1800–1900 亿美元（约 2022 年的 6 倍），其中关键部分投向自研 TPU。

落地建议：如果你的产品仍以「模型便宜」作为卖点，今天之后这个叙事需要重写。竞争从模型层上移到应用层——谁在具体场景里做得更深、更可靠、更懂行业，才是壁垒。Antigravity 本身也在推「自然语言搭建智能体」的范式，对国内低代码 Agent 平台构成直接威胁。

来源：新浪财经/智东西；Google Cloud 官方博客

四、AI 生成代码占 GitHub 新建仓库 46%，两年前这个数字是 22%

GitHub 最新数据显示，AI 生成代码在新建仓库中的占比已从 2024 年的 22% 飙升至 2026 年的 46%，两年翻了一倍。与此同时，近 80% 新注册开发者在入驻 GitHub 第一周内就会使用 Copilot——AI 辅助编程已从「高手工具」变成「开发者默认行为」。对几款主流 AI 编程工具的企业落地对比，详见 Cursor vs Claude Code vs Copilot 企业落地实录。

一个更底层的趋势藏在 Octoverse 报告中：AI 工具正在反向塑造语言选择。TypeScript 同比增长 66% 登顶最常用语言，背后是 AI 辅助下前端全栈化的便利性提升——开发者用自然语言描述交互逻辑，AI 生成 TS 代码，学习门槛降低使得更多人涌入这个生态。

开发者启示：46% 这个数字有两个读法。乐观派认为 AI 消除了重复劳动、加速创新；谨慎派担心代码同质化和安全审计盲区。对于企业团队，核心问题不是「要不要用 AI 写代码」，而是「AI 写的 46% 代码谁来审、谁来担责」——Code Review 流程和 AI 代码安全扫描正在成为新的刚需。

来源：GitHub Octoverse 2025；InfoQ

五、美光 CEO 预警：内存短缺持续至 2028，2000 亿美元扩产启动

美光 CEO Sanjay Mehrotra 于 5 月 23 日接受 CNBC 采访时发出明确预警：全球存储芯片短缺将延续至 2026 年之后，真正大规模新产能释放至少要等到 2028 年。目前美光对核心 AI 客户的供应仅能满足 50%–2/3 需求，缺口持续扩大。公司已启动横跨美国三州、总额 2000 亿美元的扩产投资计划，重点投向 AI 加速器所需的高带宽内存（HBM）。

单台 AI 服务器的存储需求是传统服务器的 8–10 倍。Mehrotra 强调，当前的供需失衡属于长期结构性问题，而非传统周期波动——AI 智能体崛起带来的内存需求增速远超产能建设速度。2026 年全球半导体市场规模预计突破 9750 亿美元，存储芯片贡献近三成增量。

行业警示：这个预警直接影响所有做 AI 私有化部署的企业。如果客户计划 2027 年上 50 台 GPU 服务器做模型微调，今天就要开始锁内存订单——不是「提前半年」，是「提前两年」。国产存储（长鑫、长江存储）的替代进程也在加速，但短期内无法填补 HBM 缺口。

来源：IT之家；网易/科讯速报

常见问题

问：Kimi K2 下线对我的业务有什么影响？
如果你通过 API 调用了 kimi-k2-*-preview 端点，今天起请求可能返回错误。K2.6 兼容 OpenAI/Anthropic 格式，迁移成本低，但需要在今天内完成端点切换和回归测试。

问：AI 裁员的 47.9% 数据可靠吗？
数据来自 RationalFX 对公开裁员公告的统计，经日经亚洲交叉核验。需要理解的是，「归因于 AI」是企业自述口径，部分企业可能借 AI 之名做财务调整，Cognizant 首席 AI 官也指出了这一点。

问：Gemini 3.5 Flash 的 2.5 分/百万 Token 是真的吗？
这是缓存命中场景下的输入价格，非缓存场景略高。作为对比，GPT-4o 同类场景约为其 8 倍。Google 此轮定价策略的目标是压低 AI 应用的基础成本，推动开发者生态迁移。

问：内存短缺对中小企业的实际影响是什么？
短期看，GPU 服务器采购周期拉长、溢价增加。中期看，如果业务涉及 AI 私有化部署，2026-2028 年的硬件预算需要上修 30%-50% 并提前锁定供应链。

对中国软件开发企业的三条启示

第一，API 迁移节奏决定服务连续性。Kimi K2 退役不是一个孤立事件。国内大模型正在经历第一轮产品线收敛——多版本并行策略不可持续，每家最终会收拢到 1–2 个旗舰模型。依赖第三方模型 API 的企业需要建立模型退役监控机制，而不是等公告出来再被动响应。

第二，团队结构正在被重新定义。47.9% 的裁员归因 AI 这个数字，无论其中有多少水分，都意味着投资人、董事会、客户三方都会开始用「AI 人效比」来衡量技术团队。聪明的 CTO 不会被动等裁员指标落下来，而是主动用 AI 工具重新切分团队职责——让 5 个人做原来 12 个人的事，再把释放出来的人力投向 AI 做不了的高价值工作。

第三，AI 基础设施成本需要三年预判。从 Gemini 的降价到美光的涨价，两条线在同时走：模型推理成本持续下降，但支撑模型的硬件成本持续上升。做 AI 私有化部署的企业，今天做的预算必须覆盖到 2028 年的内存价格周期，而不能按季度做采购计划。

AI 早报｜2026年5月25日：Kimi K2 退役、全球裁员近半因 AI、Gemini 优惠到期