AWS联手Stripe打通智能体自主支付闭环,国产模型包揽全球开源前五,Devin开发商估值飙至260亿美元——5月最后一周,AI正在进入经济系统的毛细血管。
当AI智能体第一次学会"自己花钱"——5月7日,AWS与Stripe联手打通了智能体的自主支付闭环,而同一周天津世界智能产业博览会开幕,740余家企业展出AI落地新场景。正如昨日早报所关注的,智能体编程赛道正在经历格局重塑——今天是这一趋势在经济基础设施层的延续。这是5月最后一周的信号:AI不再是技术demo,而是正在进入经济系统的毛细血管。
5月28日至31日,2026世界智能产业博览会在天津举办,740余家企业参展,集中呈现"人工智能+"在制造、医疗、教育、城市治理等领域的落地实例。伽利略四足机器人、浪潮海岳薪酬监管模型、望圆科技泳池清洁机器人等新场景产品集中亮相,反映出AI正从实验室快速渗透进物理世界和垂直行业(证券日报5月30日现场报道)。
为什么这事重要:展会主题从往年的"展示能力"转向今年的"展示场景",740家企业不是来炫技的——他们是来找买家的。这个信号意味着AI产业链的价值重心正在从模型层向应用层迁移,做落地的团队比做模型的公司更需要被看见。
5月7日,AWS正式发布Bedrock AgentCore Payments预览版,智能体可在执行环路内自主完成资源发现、协商和支付。Stripe旗下Privy提供钱包基础设施,Coinbase提供链上结算,支持x402微支付协议,单笔交易可在200毫秒内完成USDC结算(钛媒体5月8日)。这是业内首个为自主智能体设计的托管式端到端支付方案,覆盖钱包认证、交易执行到支出治理全生命周期。
我们的判断:这才是本周被低估最大的新闻。当智能体从"能对话"跨越到"能交易",整个企业软件外包的交付物形态将发生根本改变——未来的交付物可能不再是一套代码,而是一个能自主采购API、自行协商价格、独立完成经济闭环的智能体集群。结合5月中旬智能体落地加速的趋势,支付能力的补齐意味着智能体从"工具"到"经济参与者"的转变已不可逆。
4月25日,权威评测机构Artificial Analysis更新全球开源模型榜单,DeepSeek V4 Pro(Max)以52分登榜,较上一代V3.2提升10分。更值得关注的是,榜单前五——DeepSeek V4 Pro、Kimi K2.6、Qwen 3、GLM 5等——全部由中国团队打造(新浪财经4月25日)。在智能体任务维度上,V4 Pro排名开源第一。同期SuperCLUE中文综合评测中,V4 Pro拿到70.98分,国内所有大模型中排名第一。这与此前关注的DeepSeek融资与模型迭代动向形成呼应——国产模型不仅在资本层面加速,技术层面同样在持续拉近差距。
企业该关注什么:开源模型的质量追平甚至反超闭源方案,意味着企业自建智能体系统的边际成本正在快速下降。过去"用最好的模型就得付最高的API账单"的逻辑正在瓦解——国产开源旗舰已经让这个等式不再成立。
5月27日,Cognition宣布完成超10亿美元新一轮融资,投后估值达260亿美元,较去年9月翻了一倍多。本轮由Lux Capital、General Catalyst和8vc联合领投。这家2023年成立的公司,旗舰产品Devin是一款面向软件工程全流程的智能体,企业用户使用量自2024年初至今持续高速增长(新浪财经5月29日)。
开发者启示:三年时间,三个华人创始人,估值从0到260亿美元——资本市场在用真金白银押注"AI编程"不是工具升级,而是软件生产关系的重构。对一线工程师而言,不是"AI会不会替代我",而是"我能不能成为最早一批把AI用进日常开发的人"。
ChatGPT开发商旗下的非营利基金会近日宣布,将投入2.5亿美元专项资金,用于三个方向:AI对就业市场的经济影响测量、劳动者过渡期技能培训支持,以及面向长期结构性失业的社会保障机制研究。该基金会的核心使命是在AI能力快速提升的背景下,为经济系统提供缓冲与转向机制。
行业警示:头部AI企业自己出资研究"AI造成的失业问题",这本身就是一个强烈信号。过去产业界的说法是"AI创造的新岗位会比消灭的多",现在连造AI的人都开始为"消灭比创造快"这种可能性准备预案。企业技术负责人在规划AI落地路线时,应当把"团队转型成本"纳入ROI计算,而不只是看API账单。
4月2日,火山引擎在"2026 Force Link AI创新巡展"武汉站上披露关键数据:豆包大模型日均Token使用量突破120万亿,三个月内翻倍,较2024年5月首次发布时增长超1000倍。在全球范围内,豆包已跻身调用量前三(中国经济网4月3日)。同期,多家国产大模型陆续调整定价策略,从免费试用转向按量计费,算力成本倒逼商业化的趋势愈发清晰。
落地建议:Token调用量三个月翻倍、一年千倍增长——这意味着中国市场的AI用量正在以超指数速度膨胀。对技术决策者来说,关键不是"要不要用大模型",而是"如何在不锁死一家供应商的前提下,让Token成本可控"。多云调度、开源模型混合部署、按场景匹配模型规格——这些不是可选项,是必选项。
本周最值得关注的信号不在模型评测榜单上,而在支付基础设施层。
当AWS、Stripe、Coinbase三家联手为智能体开通"钱包",这件事的性质已经超出了技术层面——它标志着智能体经济的基础设施开始成型。一个能自主发现服务、协商价格、完成支付的智能体,不再只是一个"工具",而是一个经济参与者。
这对软件外包行业的影响是结构性的:如果未来的交付物不再是代码仓库,而是一组运行在云上、能自主采购API和服务的智能体集群,那么"按人天计价"的外包模式将从根本上瓦解。取而代之的将是"按智能体产出计价"或"按业务结果分成"的新模式。
中国市场有自己的特殊性——支付牌照、数据合规、信创要求——但也正因如此,在中国率先跑通"合规的智能体经济闭环"的团队,将获得一个被监管壁垒保护的时间窗口。
四条逻辑线拆开讲:
第一,经济闭环优先于模型能力。不要再盯着榜单上的模型跑分了。当智能体可以自主完成支付,决定商业价值的不是"模型多聪明",而是"智能体能自己完成多少步经济动作"。企业在选型时应优先评估智能体平台的工具调用、支付集成、身份治理能力。
第二,开源模型的质量拐点已过。全球开源前五被国产模型包揽——这不是偶然。企业自建智能体系统的成本正在快速下降,过去一年API降价幅度远超摩尔定律。现在正是把"自建能力"纳入技术路线图的窗口期。
第三,AI编程不是工具升级,是生产关系重构。Cognition用三年时间冲到260亿美元估值,资本赌的不是一个更好的IDE,而是"软件由智能体编写、人类负责定义和审核"的新分工模式。技术负责人应该开始做组织层面的准备:团队结构、代码审查流程、交付验收标准都会变。
第四,Token成本是战略问题,不是财务问题。豆包120万亿日调用量背后,是中国市场AI用量的超指数膨胀。如果不做多云调度、不引入开源混合部署,一年后的Token账单可能吃掉软件预算的大头。这不是危言耸听——三个月翻倍的增长曲线,意味着任何线性规划都会失效。
问:AWS AgentCore Payments对国内企业有意义吗?
答:直接使用受限于支付牌照和数据合规,但"智能体自主支付"这个范式会快速传导到国内云厂商。预计2026年下半年到2027年上半年,国内头部云厂商会推出类似方案。企业现在就应该在智能体架构中预留"支付接口"。
问:国产开源模型真的能替代闭源方案吗?
答:在大部分企业场景(知识问答、文档处理、代码生成、数据分析)中,DeepSeek V4 Pro级别的开源模型已经足够。闭源方案的优势集中在极少数需要顶级推理能力的场景(前沿科研、高难度数学证明等)。建议企业以开源模型为默认选项,闭源方案为例外补充。
问:Cognition 260亿美元估值有没有泡沫?
答:如果Devin只是"更好的Copilot",那260亿确实贵了。但资本市场押注的是"AI软件工厂"这个故事——智能体从需求分析到部署上线全流程覆盖。这个叙事目前还处于早期验证阶段,但从企业用户使用量的增速来看,需求端是真实的。
问:Token成本涨这么快,小团队怎么办?
答:三步走:先用国产开源模型自建推理服务覆盖70%的日常调用,再用商业API做峰值溢出,最后对标豆包/火山引擎等平台的批量折扣策略谈协议价。120万亿日调用量意味着平台方有足够动力给大客户打折。