本周,全球大模型技术进展的热点集中于基础模型推理能力和计算资源方面的优化。其中,加州大学圣克鲁兹分校提出的 MatMul-free 语言模型将矩阵乘法(MatMul,深度学习的核心操作)移除的情况下,实现了在十亿参数规模上保持性能,达到接近人脑的效率。此外,上海的高校和研究机构在本周公布了多项进展。上海人工智能实验室团队提出了高质量大规模视频-文本数据集InternVid;上海交大 IPADS 实验室提出了适用移动设备的大模型推理引擎 PowerInfer-2.0;复旦大学语言与视觉团队提出了通用智能体平台 AgentGym,可支持大语言模型智能体进行数据采样、训练微调、自我进化和能力评测的全流程操作。
国际市场中,本周热点集中于苹果和多家创企的融资动态。苹果在开发者大会公布了以 Apple Intelligence 智能系统为代表的一系列更新,以及于 OpenAI 的合作关系,业界在关注的同时也出现了许多争议。AI 创企动态方面,法国 AI 独角兽 Mistral AI 近期完成了 6 亿欧元融资;由华人团队成立的 Pika 在近期完成了 8000 万美元的融资;还有媒体曝出法务 AI 创企 Harvey 正在寻求 6 亿美元的资金,还计划收购 25 年历史的法律研究服务公司 vLex 来训练其产品。
国内市场中,本周热点集中于开源大模型和视频生成进展。开源模型方面,阿里团队开源的 Qwen2 大模型在性能上超越了领先的 Llama3-70B 和一众国内闭源模型,引起极大关注;零一万物的 Yi1.5-34B 则在大模型竞技场排名中名列前茅。视频生成能力方面,快手发布「可灵」视频生成模型;生数科技于清华团队公布了 Vidu 视频生成模型的新能力,极佳科技则在一场路演中发布了「视界一粟 YiSu」视频生成大模型。
政策方面,外媒称美国加州立法者因联邦对人工智能监管进展滞后的情况,提出了约 30 项新措施,以保护消费者和就业。国内政策方面,广东省人民政府发布了《广东省关于人工智能赋能千行百业的若干措施》,旨在推动人工智能产业高质量发展,其中强调了对构建算力基础设施的发展目标。青岛发布的《青岛市海洋人工智能大模型产业集聚区建设实施方案(2024—2026 年)》则利用海洋特色资源优势,计划构建「1+N+X」海洋人工智能大模型体系,推动人工智能领域的发展。
点击“阅读原文”
获取完整报告

