字节开源Bernini；特朗普AI新政落地；OpenAI把Codex塞进ChatGPT；微软连发7个模型；VAST完成近2亿美元融资；Google开始买代码训练AI- 大数跨境

首页

字节开源Bernini；特朗普AI新政落地；OpenAI把Codex塞进ChatGPT；微软连发7个模型；VAST完成近2亿美元融资；Google开始买代码训练AI

重构零售实验室

2026-06-03

导读：AI开源圈日报｜6月3日1. 美国签署新版AI行政令，前沿模型发布前安全审查走向“轻监管”美国新签署的AI行

AI 开源圈日报｜6 月 3 日

全球 AI 产业动态与监管风向

1. 美国新版 AI 行政令：前沿模型监管转向“轻约束”

美国签署新版 AI 行政令，聚焦前沿模型在网络安全、国家安全及关键基础设施的风险评估。相较于早期的强硬监管设想，最终版本明显收窄，确立“创新与安全并行”基调。这标志着美国 AI 政策正从“强约束”转向“产业可接受的安全框架”，为 AI 企业释放了更大的操作空间。

2. Google/Alphabet 资本动作：加速算力与数据中心扩张

市场传闻 Google/Alphabet 正进行大规模资本运作，旨在加码 AI 数据中心、下一代 TPU 及算力基础设施。尽管部分细节待证实，但趋势明确：AI 竞争已超越单纯的模型竞赛，演变为算力、能源、数据中心建设及资本成本的综合较量。

3. Anthropic Claude Mythos 拓展：AI 安全成本争议升温

Claude Mythos 应用场景扩展至关键基础设施安全检测等高风险领域。与此同时，高强度 AI 安全测试带来的 Token 消耗、算力成本及商业可持续性引发讨论。AI 安全正从“理念问题”转化为“成本问题”，付费主体、规模化能力及实际效能将成为企业采购的核心考量。

4. Google 推出 AI 诈骗电话检测：应对深伪冒充风险

Google Phone 及 Android 系统增强了对 AI 深伪语音和冒充联系人诈骗电话的检测能力。随着语音克隆和实时对话 AI 技术的成熟，诈骗手段已从“短信钓鱼”升级为“声音冒充”，手机系统级防护成为 AI 安全的新战场。

AI 编程与开发者生态演进

5. OpenAI 整合 Codex：AI 编程进入主产品入口

OpenAI 将 Codex 深度整合进 ChatGPT 工作流，支持通过 Sites 插件构建和部署托管站点。Codex 正从单一开发者工具向“人人可用的 AI 开发环境”演进。未来，ChatGPT 将不仅限于问答，更能直接辅助用户搭建网页、编写应用及运行自动化流程。

6. GitHub Copilot App 发布：打造桌面级 Agent 体验

GitHub 推出定位为"agent-native desktop experience"的 Copilot App，同时开放 Copilot SDK 预览，云端与本地沙箱能力同步升级，CLI 新增语音与调度功能。AI 编程正从 IDE 补全工具升级为“开发者桌面工位”，软件开发流程将转变为 AI 在任务、代码、测试与环境间的持续自主行动。

7. Google 付费获取 Play 开发者代码：私有数据价值重估

Google 向部分 Google Play 开发者发出付费邀请，以获取代码库访问权用于训练 AI 编程工具。这一动向表明，公开互联网数据已显不足，真实商业代码正成为稀缺训练资产。代码不仅是交付物，更已成为 AI 时代的关键数据资产与议价筹码。

8. 微软开源 ASSERT：自然语言测试 AI 行为

微软发布面向 AI Agent 和 LLM 应用的评测框架 ASSERT，支持用自然语言描述需求并生成行为测试。随着 Agent 步入生产环境，企业关注点从“能否回答”转向“能否稳定执行”。AI 测试框架将成为 Agent 工程化的重要基础设施。

大模型竞争与多模态 Agent 突破

9. 微软 Build 2026：连发 7 个 MAI 模型，构建独立生态

微软发布包括 MAI-Thinking-1（高级推理）和 MAI-Code-1-Flash（代码生成）在内的多款自研模型，覆盖推理与编码方向。微软正加速打通模型、Copilot、Agent 与操作系统入口，其 AI 战略显示出更强的独立性，减少对 OpenAI 单一路径的依赖。

10. 阿里 Qwen3.7-Plus 上线：多模态 Agent 强化工具操作

Qwen3.7-Plus 定位为多模态智能体基座，已上线阿里云百炼。该模型强调复刻桌面端专业软件的操作能力，核心在于看懂界面、理解任务、调用工具并完成操作。国内大模型竞争焦点正从参数规模与跑分，转向真实的工具链执行能力。

11. 微软 Scout 与 Project Solara 曝光：Agent 抢占操作系统入口

微软推出个人助理 Scout，并披露面向 AI Agent 设备的新系统方向 Project Solara。其战略意图是将 AI 从应用层推进至系统层，接管办公、设备、文件、通知及任务调度。未来的入口之争，或将聚焦于谁掌控 AI 执行任务的第一入口。

具身智能与应用场景落地

12. VAST 完成近 2 亿美元融资：世界模型路线升温

VAST 披露新一轮近 2 亿美元融资，明确深耕世界模型路线。作为具身智能、自动驾驶、机器人及视频生成的底层方向，世界模型旨在让 AI 理解物理世界与连续环境。此类融资表明，资本正押注“下一代 AI 不仅是聊天，更是理解与预测世界”。

13. 中国具身智能融资火热：千寻与星尘智能成焦点

国内具身智能赛道持续吸金，星尘智能完成超 10 亿元 B 轮融资，估值破百亿元；千寻相关融资规模亦受关注。机器人与具身智能已成为中国 AI 投资主线。相比纯大模型，具身智能更贴近制造、服务及实体场景，更易形成产业链带动效应。

14. 字节开源 Bernini：AI 视频编辑迈向“理解后创作”

字节开源统一框架 Bernini，为 DiT 视频生成/编辑模型赋予更强的理解与规划能力。AI 视频技术重心正从单纯追求生成效果转向可控编辑：即先理解用户意图与视频内容，再进行精准修改。视频 AI 正从“炫技 Demo"转型为专业创作工具。

15. 百度文心发布 PaddleOCR-VL-1.6：文档解析准确率新高

PaddleOCR-VL-1.6 面向文档理解与解析，准确率达 96.33%，支持网页端与 API 调用。文档解析涉及合同、票据、报表等非结构化资料，是企业 AI 落地的刚需场景。相比通用聊天机器人，文档理解模型更易直接嵌入企业业务流程。

要点速览

本期最值得关注的并非单个模型，而是四条核心主线：AI 监管策略降温但未放松安全底线；AI 编程能力全面融入主产品入口；高质量代码与企业私有数据被重新定价；具身智能、文档解析、视频编辑等垂直应用场景加速落地。

—END—

关注我，带你了解全球 AI 新鲜热点资讯！

【声明】内容源于网络

重构零售实验室

各类跨境出海行业相关资讯

内容 10674

粉丝 0

重构零售实验室各类跨境出海行业相关资讯

总阅读163.5k

粉丝0

内容10.7k