本周,全球大模型技术进展的热点集中于基础模型的结构优化。一方面,Meta FAIR 团队提出了 CoPE 位置编码方法,可解决 Transformer 架构以往无法处理计数和复制任务的局限,有望为所有大模型带来改进。另一方面,Mamba 团队提出了结构化状态空间二元性理论框架和 Mamba 2 模型,为计算状态空间提供了更高效且易于实现的方式。此外,该工作还发现 Transformer 的注意力机制和 SSM 能够互补。
国际市场中,斯坦福开源多模态大模型抄袭中国 AI 创企面壁智能的丑闻引起社区热议,进而衍生了许多关于学术诚信、声誉和道德的讨论。英伟达 CEO 黄仁勋在一场演讲中分享了公司在 GPU 上突破,以及后续芯片产品的路线图,受到极大关注。
国内市场中,清华系 AI 创企智谱 AI 开源了新一代基座模型 GLM-4-9B,并公布公司的一系列业务进展和技术成果。腾讯则上线了基于混元大模型的 AI 智能助手「元宝」,深圳成立了大湾区首个大模型 AI 生态社区「模力营」,已有首批共 11 家企业入驻。
政策方面,美国伊利诺伊州近期通过了 466 项法案,其中明确了几项以人工智能为重点的治理措施,包括对使用 AI 制品的管制、对个人声音、图像等信息5的保护以及对受版权影响的个人权益保护等措施。新加坡政府基于 2019 年的人工智能治理框架,整合了对生成式 AI 的考虑,发布了最新版 MGF-Gen AI 治理框架。国内则有南京市政府推出了人工智能行动计划和政策措施「1+1」文件,计划到 2026 年实现人工智能核心产业规模达到 600 亿元、打造行业大模型 20 个以上、统筹智能算力超 6000P FLOPS(FP16)等目标。郑州市政府发布了《郑州市支持人工智能创新发展若干政策措施》,明确了对重大科技专项的单个项目、人工智能场景应用创新项目等提供数百到上千万元财政支持。
点击“阅读原文”
获取完整报告

