
本周,全球大模型技术进展呈现了较为旺盛的开源风气,包括 AI21 Labs、华 为、Databricks、北大和 Stability AI 等机构均发布了各自的开源工作,覆盖 模型架构优化,模型训练及推理成本压缩等方面。此外,苹果团队在近期在探 索 LLM 下游应用方面较为活跃,陆续发布了基于大语言模型的指代消解技术方 案,以及面向 UI 理解的多模态大语言模型。
国际市场中,本周多家海外科技巨头和明星创企公布了各自在人工智能和大模 型层面的进展与规划。其中,谷歌、xAI、Cohere 均发布了各自最新版本的大模 型产品及相关应用。此外,两条来自外媒的爆料引起了较多关注,一条消息称 微软与 OpenAI 计划在 2028 年建立百万芯片级数据中心,为 OpenAI 提供算力支 持;还有报道称由多家科技巨头组成的 UXL 基金会计划开发能够支持多种 AI 加速器芯片的软件和工具套件来削弱对英伟达 GPU 平台的依赖。
国内市场中,网信办宣布公开并将持续更新通过《生成式人工智能服务管理暂 行办法》备案的大模型产品,并提供名单。截至目前,已有 117 个模型通过备 案。人工智能物联网独角兽特斯联宣布完成了 20 亿元 D 轮融资,下一步将沿着 AI+IoT 方向完善其多模态能力的领域大模型。
政策方面,在此前欧盟通过《人工智能法案》,联合国通过《全球人工智能决 议》后,多个海外政府开始逐步明确其在人工智能治理层面的具体措施。其 中,美国政府颁布了 AI 新规,法国 CNIL 发布了关于 AI 系统开发的首份建议;美国、欧盟、英国之间还分别开展了有关 AI 层面的合作沟通。国内方面,北京 经开区发布了《北京经济技术开发区关于加快打造 AI 原生产业创新高地的若 干政策》,提出了 14 条具体措施,涵盖算力赋能、创新体系建设、数据基础 制度建设、应用场景赋能、产业集聚区打造和产业发展生态优化等方面,同时 启动了该区 AI 公共算力平台首期 3000P 智能算力的投入使用。



点击“阅读原文”
获取完整报告


