

大模型产业发展每周速递（5.31-6.6）

上海模速空间大模型创新生态社区

2024-06-06

导读：本周，全球大模型技术进展的热点集中于基础模型的结构优化。一方面，Meta FAIR 团队提出了 CoPE 位置编码方法，可解决 Transformer 架构以往无法处理计数和复制任务的局限，有望为所有

本周，全球大模型技术进展的热点集中于基础模型的结构优化。一方面，Meta FAIR 团队提出了 CoPE 位置编码方法，可解决 Transformer 架构以往无法处理计数和复制任务的局限，有望为所有大模型带来改进。另一方面，Mamba 团队提出了结构化状态空间二元性理论框架和 Mamba 2 模型，为计算状态空间提供了更高效且易于实现的方式。此外，该工作还发现 Transformer 的注意力机制和 SSM 能够互补。

国际市场中，斯坦福开源多模态大模型抄袭中国 AI 创企面壁智能的丑闻引起社区热议，进而衍生了许多关于学术诚信、声誉和道德的讨论。英伟达 CEO 黄仁勋在一场演讲中分享了公司在 GPU 上突破，以及后续芯片产品的路线图，受到极大关注。

国内市场中，清华系 AI 创企智谱 AI 开源了新一代基座模型 GLM-4-9B，并公布公司的一系列业务进展和技术成果。腾讯则上线了基于混元大模型的 AI 智能助手「元宝」，深圳成立了大湾区首个大模型 AI 生态社区「模力营」，已有首批共 11 家企业入驻。

政策方面，美国伊利诺伊州近期通过了 466 项法案，其中明确了几项以人工智能为重点的治理措施，包括对使用 AI 制品的管制、对个人声音、图像等信息5的保护以及对受版权影响的个人权益保护等措施。新加坡政府基于 2019 年的人工智能治理框架，整合了对生成式 AI 的考虑，发布了最新版 MGF-Gen AI 治理框架。国内则有南京市政府推出了人工智能行动计划和政策措施「1+1」文件，计划到 2026 年实现人工智能核心产业规模达到 600 亿元、打造行业大模型 20 个以上、统筹智能算力超 6000P FLOPS（FP16）等目标。郑州市政府发布了《郑州市支持人工智能创新发展若干政策措施》，明确了对重大科技专项的单个项目、人工智能场景应用创新项目等提供数百到上千万元财政支持。