5 月最后一周,AI 圈密集爆发:GPT-5.6 内部测试代码遭曝光,150 万 Token 上下文和零指令 UI 生成能力让开发者社区炸锅;Gemini 3.5 Flash 面向全球开放;国产大模型永久降价至原价四分之一;华为发表「韬定律」剑指 1.4nm 芯片。
编者按:5 月最后一周,AI 圈密集爆发:OpenAI 下一代模型 GPT-5.6 内部测试代码遭曝光,150 万 Token 上下文窗口和零指令 UI 生成能力让开发者社区炸锅;搜索巨头的 I/O 大会余温未散,Gemini 3.5 Flash 已面向全球数十亿用户开放;国产大模型 V4-Pro 宣布永久降价至原价四分之一——大模型价格战从「促销」转入「常态」。叠加华为在半导体领域提出的「韬定律」,本周技术信号密度极高。
5 月 26 日,多名开发者在 Codex 后台日志中发现未公开的 gpt-5.6 模型调用记录,内部代号 iris-alpha。距 GPT-5.5 发布仅三周,新模型已进入内部测试阶段。实测显示上下文窗口扩展至 150 万 Token,较 GPT-5.5 的 105 万提升约 43%。更让前端工程师震动的是:在未给任何 UI 指令的情况下,该模型自主生成了一款名为「Lumen Notes」的极简笔记应用——像素级网格布局、克制配色、字重分层,被测试者称为「去 Slop 化」级别的审美突破。Polymarket 数据显示,GPT-5.6 在 6 月 30 日前发布概率已升至 85% 以上。
来源:智源社区 / 新智元
5 月 19 日至 20 日的年度 I/O 大会上,搜索巨头密集发布:Gemini 3.5 Flash 即日起面向全球数十亿用户开放,在几乎所有基准测试上优于前代 3.1 Pro,输出速度是对手的 4 倍,价格不到同等级模型的一半。Gemini 3.5 Pro 已在内测中,6 月正式推出。同时发布的还有 Omni 视频生成模型、24/7 运行的 AI 代理 Spark(下周美国上线 Beta),以及搜索产品 25 年来最大改版——从「结果列表」转向「AI 对话式搜索」。Gemini App 月活用户已突破 9 亿。
来源:腾讯云开发者社区、新浪财经
5 月 22 日,DeepSeek 官方宣布 V4-Pro 模型 API 在 5 月 31 日结束 2.5 折优惠后,正式永久定价为原价的 25%。输入缓存命中场景低至 0.025 元/百万 Token。一季度国产大模型融资金额同比暴增,AI 领域整体融资超 1100 亿元。全球 AI 大模型周调用量已连续五周上涨,V4-Flash 版本登顶调用量榜首。降价不再是拉新手段,而是模型推理成本持续下降后的结构性调整。
来源:IT之家
5 月 25 日,在 2026 国际电路与系统研讨会(ISCAS 2026)上,华为董事、半导体业务部总裁何庭波发表「韬(τ)定律」——通过逻辑折叠等技术压缩信号传播时延,以「时间缩微」路径替代传统「几何缩微」。即将面世的麒麟芯片已率先采用该技术。华为预计,到 2031 年基于 τ 定律的高端芯片晶体管密度可达 1.4 纳米制程同等水平。这对 AI 算力基础设施的国产化路径具有直接意义。
来源:观察者网
5 月 26 日,Gartner 在上海高管交流大会上揭晓 2026 年中国 AI 25 强企业榜单,小米、小鹏、理想、蔚来、美的、比亚迪等入选。「AI + 制造」被认定为最核心的落地主线。同期,Gartner 将 IDE 编程工具 Cursor 评为 2026 年企业 AI 编程智能体魔力象限领导者,在「愿景完整性」维度上位居最右侧。两大评选共同指向一个趋势:AI 的价值评估正从「模型能力」转向「行业渗透深度」。
来源:Gartner 中国
5 月最后一周,三条线索在同时收紧。
第一条是模型迭代速度。GPT-5.5 到 GPT-5.6 仅隔三周,Gemini 3.5 Flash 到 3.5 Pro 间隔不到一个月。领先模型之间的代际差正在从「年」压缩到「月」。这对企业技术选型意味着:别再等「下一代」,现在选型、现在落地,然后保持每季度重新评估的习惯。
第二条是价格信号。V4-Pro 永久降价不是孤例。一季度 AI 融资超 1100 亿元,Claude 开发商 ARR 突破 440 亿美元——资本在涌入,但推理成本在同步下降。模型调用正在变成和水电一样的基础设施计价。对 AIcoding 工程团队来说,单位 Token 成本已不再是瓶颈,瓶颈转移到了「怎么把模型调用编排成可维护的软件工程流程」。
第三条是硬件底座。华为 τ 定律如果兑现,意味着到 2031 年前后,高端芯片的算力供给可能出现一条非传统制程路径。对于重度依赖 GPU 算力的 AI 应用团队,这条线索值得长期跟踪——它不是明天的决策依据,但会影响 3-5 年的基础设施布局。
一句话:2026 年 6 月,GPT-5.6、Gemini 3.5 Pro、Claude 新模型可能同时登场。这个夏天,AI 编程工具的基准线会被整体抬高。