本周,全球大模型技术进展的热点包含扩散世界模型、智能体和模型能力评测。其中,微软研究院和日内瓦大学等机构的研究者提出了由扩散世界模型训练的强化学习智能体 DIAMOND,探索了将扩散世界模型直接作为模拟环境代替品的可能性。MBZUAI 和加州大学圣地亚哥分校的研究者则提出了基于扩散方法的 Pandora 通用世界模型,可通过生成视频来模拟世界状态,以及用自由文本动作进行实时控制。模型能力评测方面,上海人工智能实验室发布了两项成果,其与复旦团队合作开发的模型能力评测平台 3DGen-Arena,面向 3D 生成领域;其测评体系司南团队则与魔搭社区(ModelScope)推出了国内首个大语言模型评测竞技场 Compass Arena,为大模型能力提升提供客观评测指标。
国际市场中,本周热点多数集中在头部 AI 机构和独角兽的传闻。其中,由马斯克创建的 xAI 被曝计划建造超级算力工厂,可能涉及由 10 万块H 100 专用 GPU串联构建的超级计算机,其规模至少是当前最大 AI 集群的四倍;独角兽方面,Adept、Humane 和 Reka AI 等知名创企均被曝正在寻找收购者;此外,有媒体称谷歌的一份 2500页的内部文档被泄露,其内容揭示了搜索引擎的运作细节,引起业界极大关注。
国内市场中,百川智能发布了新一代基座大模型 Baichuan 4 和公司首款 AI 助手产品「百小应」。Baichuan 4 具备多模态能力,支持语音交互,并在5SuperCLUE 中文测评基准上位居国内第一,超越了 GPT-4-Turbo-0125 模型。此外,国内两家电信运营商分别发布大模型成果。中国电信人工智能研究院发布并开源了支持 30 种方言的混说语音大模型「星辰」,中国移动则发布了「九天智能基座」的全栈国产化生态大模型,以及在算力方面的进展和计划。此外,有媒体文章称字节跳动正在探索 AI 硬件领域,目前已有两条内部产品线。
政策方面,美国众议院以 43:3 的投票结果通过了一项有关「开源 AI 大模型出口限制」的法案,引起极大关注。该法案通过修改 2018 年出口控制改革法案(ECRA),增强对人工智能(AI)等关键技术的出口控制,以保护美国的国家安全和外交政策。国内方面,河北省发布《关于进一步优化算力布局推动人工智能产业创新发展的意见》,该文件通过一系列具体措施推动算力基础设施建设,计划到 2025 年实现算力规模达到 35 EFlops 以上,智能算力占比约35%,新增算力基础软硬件设施自主可控比例超过 60%
点击“阅读原文”
获取完整报告

