聊天产品开发商发布Dreaming V3记忆架构,让AI真正学会"记住你";太空探索公司敲定750亿美元史上最大IPO;某软件巨头Build大会披露自研模型矩阵;国产旗舰模型API价格战进入"分厘时代"。
今日 AI 圈有 7 件值得关注的事。聊天产品开发商发布 Dreaming V3 记忆架构,让 AI 真正学会「记住你」;太空探索公司敲定 750 亿美元史上最大 IPO,估值直奔 1.75 万亿美元;某软件巨头 Build 大会一口气亮出 7 个自研模型;国产旗舰模型 API 价格战杀进「分厘时代」——每百万 token 输入仅 0.025 元。
聊天产品开发商在 6 月 4 日正式推出 Dreaming V3——一套全新的记忆合成架构,替代了此前的「已保存记忆 + Dreaming V0」双轨机制。过去这款产品的记忆像一个人只记了几条便签,其余全靠你反复提醒;现在它能在后台自动梳理对话历史,提炼偏好、项目进展和约束条件,跨会话持续保持上下文新鲜度。
官方评测显示,相比 2024 年的纯已保存记忆方案和 2025 年的 V0 混合方案,Dreaming V3 在「跨会话携带上下文」「遵循用户偏好」「随时间推移保持信息时效」三个维度上均有阶跃式提升。目前该功能面向美国 Plus 和 Pro 用户先行推送。
为什么这事重要:记忆能力是 AI 从「工具」进化为「工作伙伴」的核心瓶颈。一个能真正理解你项目上下文、团队偏好、技术选型习惯的 AI,才能在企业级 AIcoding 全栈开发中做到「越用越懂你」。对于正在构建 AI 应用的企业团队来说,这意味着智能客服、知识库问答、代码审查等场景的个性化体验将有质的飞跃——不是每次对话都从零开始,而是延续上次的工程上下文。软件定制开发中常遇到的「每次换人接项目都要重新对齐」的痛点,在 AI 记忆层面正在被解决。 [来源:聊天产品开发商官网]
太空探索公司于 6 月 3 日向美国 SEC 提交文件,确认 IPO 细节:基础发行 5.556 亿股,定价每股 135 美元,基础募资 750 亿美元,承销商另有超额配售权可追加 112 亿美元。以此计算,公司估值约 1.75 万亿美元,将成为全球有史以来规模最大的 IPO。募资将重点投向 AI 与发射业务。
最新季报显示,该公司季度营收从去年同期的 40.7 亿美元升至 46.9 亿美元。上市日期敲定为 6 月 12 日。
企业视角:750 亿美元是什么概念?这超过了许多国家一年的科技预算。AI 与太空技术正在资本层面深度融合——火箭发射需要大量仿真计算和自主导航,卫星星座依赖 AI 做任务调度。对于国内企业来说,这释放了一个清晰信号:AI 不再是「互联网行业专属」,物理世界 + AI 的交叉领域正在成为资本最密集的赛道。做 AI 应用开发的企业应当关注这一趋势——制造、物流、能源等实体行业对 AI 全栈开发的需求正在加速释放。 [来源:新浪财经]
6 月 2 日至 3 日,某软件巨头的年度 Build 开发者大会在旧金山举行,发布了三条主线的重磅更新。第一条,Microsoft IQ 上下文层正式上线——这是一个跨编程助手、Foundry 和 Copilot Studio 的通用知识层,让智能体同时接入企业知识库和世界知识。Work IQ 和 Fabric IQ 分别覆盖办公协作和结构化业务数据。
第二条,一口气推出 7 个自研 AI 模型,涵盖编程、推理、数据分析等场景。这意味着该巨头不再只靠投资外部模型公司,而是亲自下场造模型。第三条,Windows 开发者体验全面翻新——智能终端、本地智能体沙箱、WSL 能力增强,开发者可以在本地完成智能体开发全流程。
落地建议:Build 大会的「IQ 上下文层」思路值得企业技术决策者重点关注。目前多数企业的 AI 应用处于「有模型、没上下文」的阶段——智能体能回答问题,但不了解你的业务。IQ 层的设计哲学是「上下文即壁垒」:谁拥有更丰富的企业知识上下文,谁的智能体就更不可替代。对于正在评估 AIcoding 全栈开发方案的团队,建议将「上下文工程能力」作为选型评估的核心维度之一,而不仅仅是看模型 benchmark 分数。 [来源:该软件巨头官方博客]
当地时间 6 月 2 日,美国总统签署了名为《促进高级人工智能创新与安全》的行政令。核心内容分两块:一是拒绝用过度繁琐的监管扼杀创新,强调政府与私营部门合作;二是要求具备高级网络安全能力的新 AI 模型在发布前,需向联邦政府提供早期审查权限。司法部长将优先打击利用 AI 进行网络攻击和数据窃取的行为。
行政令出台的直接背景,是 Claude 开发商近期推出的 Mythos 模型在发现代码安全漏洞和网络渗透方面表现极为出色,引发国家安全层面的担忧。
行业警示:这是美国联邦层面首次对「高级 AI 模型」设立前置审查机制。它传递的信号是:AI 能力越强,监管层对「能力滥用」的警惕越高。对于出海企业或使用海外模型的企业来说,这意味着合规成本将显著增加。一个务实的选择是:在 AI 应用开发架构中预留「模型可替换层」,当某一海外模型因监管原因不可用时,能快速切换到备选方案。优码云在为企业客户做 AI 全栈架构设计时,已将多模型路由作为标配能力。 [来源:财新网]
6 月 3 日起,腾讯云智能体开发平台对国产旗舰模型 V4 系列实施新定价,最高降幅达 97.5%。在此之前,该模型厂商已于 5 月宣布 V4 Pro 的 API 永久降价 75%,每百万 token 输入费用仅 0.025 元,输出 6 元,创全球主流大模型最低价。
这轮降价潮不止一家——小米 MiMo-V2.5 系列也在 5 月底宣布 API 最高降幅 99%。国内大模型 API 的计费单位已从「分 / 千 token」进入「厘 / 千 token」时代。
开发者启示:API 价格骤降对 AI 应用开发团队是直接利好。一年前做 RAG 知识库问答系统,token 成本可能是瓶颈;现在同样的预算可以支撑 10 倍以上的调用量。这意味着更多「高频调用 + 低延迟」的场景变得经济可行——比如实时代码审查、在线文档智能摘要、电商客服智能体。但要注意:降价不等于免费,当调用量从日均千次涨到百万次时,成本控制仍需要工程化手段(缓存策略、模型路由、语义压缩)。做 AI 软件定制开发的团队应当把这些成本优化能力作为交付标配。 [来源:证券时报]
6 月 3 日,Claude 开发商推出名为 ant 的全新命令行工具,支持在终端中直接调用其开发者平台的全部 API 端点——包括 Messages API、文件管理以及处于 beta 阶段的智能体(Managed Agents)、会话和运行环境。该工具与 Claude Code 原生集成,共享同一套 OAuth 凭证体系。
ant 的设计亮点有三:一是浏览器 OAuth 登录免手动管理 API Key;二是每个 API 资源对应一个子命令(如 ant messages create),层级清晰;三是输出格式支持 JSON/YAML/JSONL,内置 GJSON 路径语法可直接提取字段。配合 shell 脚本可实现一行命令创建智能体、发送消息、提取结果并赋值给变量。
怎么看:CLI 工具的发布标志着这家头部模型企业正从「模型提供商」向「开发者平台」转型。ant 让 API 调用从写代码降低到敲命令行的门槛——以前要写 Python SDK 调用链,现在一行 shell 命令就行。这直接利好运维自动化(CI/CD 中嵌入 AI 审查步骤)和快速验证(5 分钟内验证一个 API 想法)。对于做 AIcoding 全栈开发的企业而言,这种「命令行即 API」的设计范式值得借鉴——把复杂 SDK 调用封装为开发者熟悉的终端体验,降低团队学习曲线。 [来源:53AI]
在 COMPUTEX 2026(6 月 2 日至 5 日)期间,芯片巨头与软件巨头联合发布了首款搭载 RTX Spark 处理器作为主处理器的 Windows PC,微软 Surface 系列和戴尔等厂商首批参与。RTX Spark 是一款面向 Windows PC 的全新处理器,两家公司耗时三年联合研发,将 GPU 级 AI 算力集成到 PC 主芯片中,支持本地运行大模型推理。
同期,Azure Cobalt 200 VM 在 Build 大会上发布,性能提升 50%,专为智能体工作负载优化。
我们的判断:本地 AI 算力 PC 的出现,将直接改变企业 AI 应用开发的部署架构选择。过去做 AI 功能必须在云端跑推理,延迟和成本都是瓶颈;现在部分推理可以下沉到终端。对于需要低延迟的场景(如本地代码补全、桌面端智能助手、工业质检),边端推理方案变得切实可行。优码云在桌面端 + AI 应用定制方面持续投入,RTX Spark 生态成熟后将进一步降低全栈 AI 应用在客户侧的部署门槛。 [来源:TrendForce]
这一周(6 月 2 日—5 日)的 AI 圈密集到让人喘不过气。如果把 7 条新闻串联起来,会发现三条清晰的叙事线正在并行推进:
第一条线:AI 能力从「聪明」到「懂你」。Dreaming V3 记忆升级、Build 大会的 IQ 上下文层、ant CLI 降低开发门槛——这三件事的共同指向是,AI 系统正在从「单次对话的聪明」进化到「跨时间、跨场景的理解」。这恰好是 AIcoding 全栈开发中最关键的一环:不是模型能写多复杂的代码,而是它能否理解你的代码库、团队的编码规范、项目的业务逻辑,并在此基础上持续优化。
第二条线:算力从云端下沉到终端。RTX Spark PC 和 Azure Cobalt 200 VM 分别代表了终边和云端两条算力路线。本地推理的可行性将催生一批新的 AI 应用形态——桌面端智能体、离线 AI 工具、隐私敏感场景的端侧处理。
第三条线:API 价格战进入「分厘时代」。国产旗舰模型 V4 Pro 输入仅 0.025 元 / 百万 token,几乎可以视为「准免费」。这意味着 AI 应用开发的重点从「省 token 成本」转向「工程化交付质量」——当模型调用成本不再是瓶颈,系统架构、上下文管理、多智能体协同、安全门禁这些工程化能力才真正构成壁垒。
三条线叠加,结论很清楚:AI 软件开发正在从「模型竞赛」转入「工程竞赛」阶段。企业需要的不是一个会写代码的聊天窗口,而是一套能够理解业务上下文、适配多模型、工程化交付的全栈 AI 开发体系——这正是优码云在做的事。
AIcoding 全栈开发正在从概念验证走向工程化落地。如果你的技术团队正在评估 AI 应用开发方案——无论是智能客服智能体、RAG 知识库、还是桌面端 AI 工具——欢迎预约一次 30 分钟免费咨询。我们会基于你的业务场景,给出具体的技术选型建议和工期评估。