6月5日AI早报：ChatGPT记忆升级、Spa…

今日 AI 圈有 7 件值得关注的事。聊天产品开发商发布 Dreaming V3 记忆架构，让 AI 真正学会「记住你」；太空探索公司敲定 750 亿美元史上最大 IPO，估值直奔 1.75 万亿美元；某软件巨头 Build 大会一口气亮出 7 个自研模型；国产旗舰模型 API 价格战杀进「分厘时代」——每百万 token 输入仅 0.025 元。

📋 目录

Dreaming V3 记忆系统发布：AI 终于会「记住」了
太空探索公司敲定 750 亿美元史上最大 IPO，6 月 12 日上市
Build 2026：自研模型矩阵 + 智能体平台全面铺开
特朗普签署 AI 行政令：新模型发布前需政府审查
腾讯云国产旗舰模型降价，最高降幅 97.5%
Claude 开发商发布 ant CLI，一行命令操控全部 API
芯片巨头 RTX Spark 落地：首款 Windows on ARM PC 亮相
我们的解读
延伸阅读

Dreaming V3 记忆系统发布：AI 终于会「记住」了

聊天产品开发商在 6 月 4 日正式推出 Dreaming V3——一套全新的记忆合成架构，替代了此前的「已保存记忆 + Dreaming V0」双轨机制。过去这款产品的记忆像一个人只记了几条便签，其余全靠你反复提醒；现在它能在后台自动梳理对话历史，提炼偏好、项目进展和约束条件，跨会话持续保持上下文新鲜度。

官方评测显示，相比 2024 年的纯已保存记忆方案和 2025 年的 V0 混合方案，Dreaming V3 在「跨会话携带上下文」「遵循用户偏好」「随时间推移保持信息时效」三个维度上均有阶跃式提升。目前该功能面向美国 Plus 和 Pro 用户先行推送。

为什么这事重要：记忆能力是 AI 从「工具」进化为「工作伙伴」的核心瓶颈。一个能真正理解你项目上下文、团队偏好、技术选型习惯的 AI，才能在企业级 AIcoding 全栈开发中做到「越用越懂你」。对于正在构建 AI 应用的企业团队来说，这意味着智能客服、知识库问答、代码审查等场景的个性化体验将有质的飞跃——不是每次对话都从零开始，而是延续上次的工程上下文。软件定制开发中常遇到的「每次换人接项目都要重新对齐」的痛点，在 AI 记忆层面正在被解决。 [来源：聊天产品开发商官网]

太空探索公司敲定 750 亿美元史上最大 IPO，6 月 12 日上市

太空探索公司于 6 月 3 日向美国 SEC 提交文件，确认 IPO 细节：基础发行 5.556 亿股，定价每股 135 美元，基础募资 750 亿美元，承销商另有超额配售权可追加 112 亿美元。以此计算，公司估值约 1.75 万亿美元，将成为全球有史以来规模最大的 IPO。募资将重点投向 AI 与发射业务。

最新季报显示，该公司季度营收从去年同期的 40.7 亿美元升至 46.9 亿美元。上市日期敲定为 6 月 12 日。

企业视角：750 亿美元是什么概念？这超过了许多国家一年的科技预算。AI 与太空技术正在资本层面深度融合——火箭发射需要大量仿真计算和自主导航，卫星星座依赖 AI 做任务调度。对于国内企业来说，这释放了一个清晰信号：AI 不再是「互联网行业专属」，物理世界 + AI 的交叉领域正在成为资本最密集的赛道。做 AI 应用开发的企业应当关注这一趋势——制造、物流、能源等实体行业对 AI 全栈开发的需求正在加速释放。 [来源：新浪财经]

Build 2026：自研模型矩阵 + 智能体平台全面铺开

6 月 2 日至 3 日，某软件巨头的年度 Build 开发者大会在旧金山举行，发布了三条主线的重磅更新。第一条，Microsoft IQ 上下文层正式上线——这是一个跨编程助手、Foundry 和 Copilot Studio 的通用知识层，让智能体同时接入企业知识库和世界知识。Work IQ 和 Fabric IQ 分别覆盖办公协作和结构化业务数据。

第二条，一口气推出 7 个自研 AI 模型，涵盖编程、推理、数据分析等场景。这意味着该巨头不再只靠投资外部模型公司，而是亲自下场造模型。第三条，Windows 开发者体验全面翻新——智能终端、本地智能体沙箱、WSL 能力增强，开发者可以在本地完成智能体开发全流程。

落地建议：Build 大会的「IQ 上下文层」思路值得企业技术决策者重点关注。目前多数企业的 AI 应用处于「有模型、没上下文」的阶段——智能体能回答问题，但不了解你的业务。IQ 层的设计哲学是「上下文即壁垒」：谁拥有更丰富的企业知识上下文，谁的智能体就更不可替代。对于正在评估 AIcoding 全栈开发方案的团队，建议将「上下文工程能力」作为选型评估的核心维度之一，而不仅仅是看模型 benchmark 分数。 [来源：该软件巨头官方博客]

特朗普签署 AI 行政令：新模型发布前需政府审查

当地时间 6 月 2 日，美国总统签署了名为《促进高级人工智能创新与安全》的行政令。核心内容分两块：一是拒绝用过度繁琐的监管扼杀创新，强调政府与私营部门合作；二是要求具备高级网络安全能力的新 AI 模型在发布前，需向联邦政府提供早期审查权限。司法部长将优先打击利用 AI 进行网络攻击和数据窃取的行为。

行政令出台的直接背景，是 Claude 开发商近期推出的 Mythos 模型在发现代码安全漏洞和网络渗透方面表现极为出色，引发国家安全层面的担忧。

行业警示：这是美国联邦层面首次对「高级 AI 模型」设立前置审查机制。它传递的信号是：AI 能力越强，监管层对「能力滥用」的警惕越高。对于出海企业或使用海外模型的企业来说，这意味着合规成本将显著增加。一个务实的选择是：在 AI 应用开发架构中预留「模型可替换层」，当某一海外模型因监管原因不可用时，能快速切换到备选方案。优码云在为企业客户做 AI 全栈架构设计时，已将多模型路由作为标配能力。 [来源：财新网]

腾讯云国产旗舰模型降价，最高降幅 97.5%

6 月 3 日起，腾讯云智能体开发平台对国产旗舰模型 V4 系列实施新定价，最高降幅达 97.5%。在此之前，该模型厂商已于 5 月宣布 V4 Pro 的 API 永久降价 75%，每百万 token 输入费用仅 0.025 元，输出 6 元，创全球主流大模型最低价。

这轮降价潮不止一家——小米 MiMo-V2.5 系列也在 5 月底宣布 API 最高降幅 99%。国内大模型 API 的计费单位已从「分 / 千 token」进入「厘 / 千 token」时代。

开发者启示：API 价格骤降对 AI 应用开发团队是直接利好。一年前做 RAG 知识库问答系统，token 成本可能是瓶颈；现在同样的预算可以支撑 10 倍以上的调用量。这意味着更多「高频调用 + 低延迟」的场景变得经济可行——比如实时代码审查、在线文档智能摘要、电商客服智能体。但要注意：降价不等于免费，当调用量从日均千次涨到百万次时，成本控制仍需要工程化手段（缓存策略、模型路由、语义压缩）。做 AI 软件定制开发的团队应当把这些成本优化能力作为交付标配。 [来源：证券时报]

Claude 开发商发布 ant CLI，一行命令操控全部 API

6 月 3 日，Claude 开发商推出名为 ant 的全新命令行工具，支持在终端中直接调用其开发者平台的全部 API 端点——包括 Messages API、文件管理以及处于 beta 阶段的智能体（Managed Agents）、会话和运行环境。该工具与 Claude Code 原生集成，共享同一套 OAuth 凭证体系。

ant 的设计亮点有三：一是浏览器 OAuth 登录免手动管理 API Key；二是每个 API 资源对应一个子命令（如 ant messages create），层级清晰；三是输出格式支持 JSON/YAML/JSONL，内置 GJSON 路径语法可直接提取字段。配合 shell 脚本可实现一行命令创建智能体、发送消息、提取结果并赋值给变量。

怎么看：CLI 工具的发布标志着这家头部模型企业正从「模型提供商」向「开发者平台」转型。ant 让 API 调用从写代码降低到敲命令行的门槛——以前要写 Python SDK 调用链，现在一行 shell 命令就行。这直接利好运维自动化（CI/CD 中嵌入 AI 审查步骤）和快速验证（5 分钟内验证一个 API 想法）。对于做 AIcoding 全栈开发的企业而言，这种「命令行即 API」的设计范式值得借鉴——把复杂 SDK 调用封装为开发者熟悉的终端体验，降低团队学习曲线。 [来源：53AI]

芯片巨头 RTX Spark 落地：首款 Windows on ARM PC 亮相

在 COMPUTEX 2026（6 月 2 日至 5 日）期间，芯片巨头与软件巨头联合发布了首款搭载 RTX Spark 处理器作为主处理器的 Windows PC，微软 Surface 系列和戴尔等厂商首批参与。RTX Spark 是一款面向 Windows PC 的全新处理器，两家公司耗时三年联合研发，将 GPU 级 AI 算力集成到 PC 主芯片中，支持本地运行大模型推理。

同期，Azure Cobalt 200 VM 在 Build 大会上发布，性能提升 50%，专为智能体工作负载优化。

我们的判断：本地 AI 算力 PC 的出现，将直接改变企业 AI 应用开发的部署架构选择。过去做 AI 功能必须在云端跑推理，延迟和成本都是瓶颈；现在部分推理可以下沉到终端。对于需要低延迟的场景（如本地代码补全、桌面端智能助手、工业质检），边端推理方案变得切实可行。优码云在桌面端 + AI 应用定制方面持续投入，RTX Spark 生态成熟后将进一步降低全栈 AI 应用在客户侧的部署门槛。 [来源：TrendForce]

我们的解读

这一周（6 月 2 日—5 日）的 AI 圈密集到让人喘不过气。如果把 7 条新闻串联起来，会发现三条清晰的叙事线正在并行推进：

第一条线：AI 能力从「聪明」到「懂你」。Dreaming V3 记忆升级、Build 大会的 IQ 上下文层、ant CLI 降低开发门槛——这三件事的共同指向是，AI 系统正在从「单次对话的聪明」进化到「跨时间、跨场景的理解」。这恰好是 AIcoding 全栈开发中最关键的一环：不是模型能写多复杂的代码，而是它能否理解你的代码库、团队的编码规范、项目的业务逻辑，并在此基础上持续优化。

第二条线：算力从云端下沉到终端。RTX Spark PC 和 Azure Cobalt 200 VM 分别代表了终边和云端两条算力路线。本地推理的可行性将催生一批新的 AI 应用形态——桌面端智能体、离线 AI 工具、隐私敏感场景的端侧处理。

第三条线：API 价格战进入「分厘时代」。国产旗舰模型 V4 Pro 输入仅 0.025 元 / 百万 token，几乎可以视为「准免费」。这意味着 AI 应用开发的重点从「省 token 成本」转向「工程化交付质量」——当模型调用成本不再是瓶颈，系统架构、上下文管理、多智能体协同、安全门禁这些工程化能力才真正构成壁垒。

三条线叠加，结论很清楚：AI 软件开发正在从「模型竞赛」转入「工程竞赛」阶段。企业需要的不是一个会写代码的聊天窗口，而是一套能够理解业务上下文、适配多模型、工程化交付的全栈 AI 开发体系——这正是优码云在做的事。

联系我们

AIcoding 全栈开发正在从概念验证走向工程化落地。如果你的技术团队正在评估 AI 应用开发方案——无论是智能客服智能体、RAG 知识库、还是桌面端 AI 工具——欢迎预约一次 30 分钟免费咨询。我们会基于你的业务场景，给出具体的技术选型建议和工期评估。

👉 预约免费咨询

2026年6月5日 AI 早报｜对话AI记忆系统革命性升级、SpaceX创纪录750亿美元IPO、腾讯云模型价格骤降97%