本周,全球大模型技术进展的热点集中于开源大模型、提示工程以及垂类场景的应用。其中,英伟达开源了 3400 亿参数的 Nemotron-4 340B 模型,能力与其他开源大模型相仿甚至更优,引起极大关注。另一方面,马里兰大学、OpenAI 和斯坦福大学等机构的三十多名研究者共同发布 LLM 提示技术的研究报告,揭示了 LLM 的许多奇怪现象。此外,复旦和上海 AI Lab 的研究者结合蒙特卡洛树搜索和 Llama3 开发了 MCTSr 模型,在奥赛级别的数学题上实现了与 GPT-4 相当的准确率;上海交大 AIMS-lab 团队则发布 AI for Science 进展,提出了面向材料学中从头算分子动力学(AIMD)模拟的 Transformer 模型。
国际市场中,本周热点集中于多家头部机构的动态。其中,外媒曝出 OpenAI 在过去六个月内的年化收入翻倍,达到了 34 亿美元,结合公司近期的高层人员变动,引发了大量对 OpenAI 下一步发展的讨论。Meta 则公布了公司硬件部门的重组计划,该部门后续将分为元宇宙产品线和 Quest 头显产品线两个主要团队。此外,微软宣布将于 2024 年 7 月 10 日起停止其 Copilot GPTs 服务,该消息在社交媒体上引起了用户的强烈不满。
国内市场中,本周多家国内机构发布各自的大模型产品及技术进展。其中,智源研究院于智源大会公布了团队在大语言模型、多模态、具身、生物计算大模型领域的一系列进展。美图公司发布了「奇想」大模型的更新,以及配套的多项产品,面向内容创作领域;依图科技则发布了面向安防场景的天问大模型 4.0。在此之上,IDC 发布的实测报告引起了许多讨论。该报告对 11 家厂商的 16 款大模型产品进行了全面评估,从不同维度对比了国内外大模型产品。
政策方面,本周动态集中于国内政府单位落实人工智能发展的规划。其中,陕西省工信厅发布《陕西省加快推动人工智能产业发展实施方案(2024-2026 年)》,该方案明确了未来三年内人工智能产业的发展目标和行动计划。山东省工信厅则发布《关于加快大模型产业高质量发展的指导意见》,从基础级大模型、行业级大模型和场景级大模型三个层面提出了发展目标和对应的措施。
点击“阅读原文”
获取完整报告

