

谷歌AI新里程碑：一个能「做研究」的系统诞生了，用LLM+树搜索编写专家级软件

机器之心

2025-09-10

导读：减少调试，专注创新。

谷歌发布新型AI系统，可自动生成专家级科研软件

近日，谷歌发布一项重磅研究成果——一种能够帮助科研人员自动编写“专家级”实证软件的AI系统。该系统结合大语言模型（LLM）与传统树搜索算法，通过迭代生成、评估和优化代码，显著提升科研效率。

该AI系统不仅稳定达到专家水平，在基因组学、公共健康、数值分析等多个领域甚至超越顶尖研究团队和国家级集成系统。其核心创新在于将LLM作为智能“变异”引擎，整合并重组来自论文、教材及AI生成的研究思路，推动科研软件的系统性演进。

系统聚焦“可评分的科学任务”，即可通过准确率、误差率或基准测试等指标量化性能的计算问题，涵盖基因组学、流行病学、图像分析等广泛领域。其方法论由三大核心组件构成：

系统在Kaggle playground竞赛环境中开发，具备快速迭代周期和清晰的人类基准，适用于多学科验证。

基因组学：在单细胞RNA测序数据去批次效应任务中，系统发现40种新方法，性能全面优于OpenProblems排行榜现有方案。最优方法BBKNN (TS) 相比ComBat提升14%。

地理空间分析：在DLRSD卫星图像分割任务中，前三名解决方案平均交并比超过0.80，优于最新学术成果。系统优化了UNet++、SegFormer等架构与预训练编码器的集成方式。

神经科学：在斑马鱼全脑神经活动预测（ZAPBench）任务中，生成模型多步预测性能优于所有基线，训练速度远超同类视频模型，并成功整合生物物理模拟器Jaxley。

时间序列预测：在GIFT-Eval基准测试中表现优异，自主构建统一预测库，支持自适应配置与时间序列分解。

数值分析：针对标准算法失效的振荡积分问题，演化代码成功求解17/19个案例，误差控制在3%以内，采用域划分与欧拉变换等高级数学策略。

系统可分析不同方法的核心原理，合成混合策略。实验显示，指令如“请创建一种算法，结合两种策略优点，形成得分更高的混合策略”即可引导出高性能方案，无需复杂提示词。

研究表明，AI正从辅助工具转向驱动科研创新的核心力量。该系统实现了从“一次性代码生成”到“目标导向、搜索驱动”的范式转变，将开发周期从数月缩短至数天，有效突破科研瓶颈。

通过系统化探索大规模解空间、融合多元知识并精准定位高质量方案，该技术有望让更多研究者平等获取先进工具，同时拓展科学计算的边界。

【声明】内容源于网络

机器之心

专业的人工智能媒体和产业服务平台

内容 17012

粉丝 0

机器之心专业的人工智能媒体和产业服务平台

总阅读102.0k

粉丝0

内容17.0k