AI月产十亿行代码，暴增76%！程序员论坛炸锅：代码行数≠生产力！- 大数跨境

首页

AI月产十亿行代码，暴增76%！程序员论坛炸锅：代码行数≠生产力！

新智元

2026-01-08

新智元报道

编辑：peter东 LRST

【新智元导读】Greptile基于每月审核超十亿行代码的数据，发布《2025 AI编程年度报告》。报告显示AI显著提升代码产出量，但程序员对“效率提升”的实际感知存疑。

报告显示，工程师人均月提交代码行数从4450行升至7839行，增幅达76%；6–15人中型团队开发者提升达89%，接近翻倍。单次提交中每文件变更行数中位数亦上升20%（18→22行），反映迭代频率与复杂度同步提高。

然而，Y Combinator论坛讨论普遍持审慎态度：大量用户指出需耗费额外时间修复AI生成代码的缺陷；也有观点质疑——代码行数增长是否等同真实生产力提升？资深程序员常以极简代码实现复杂功能，而初级开发者可能用冗长逻辑完成简单任务。仅以提交量衡量效率，易忽视代码质量、重构价值及任务难度差异。

报告未涵盖代码删除率、重写频次等关键指标。有观点提出，“编辑行数”（增删各计1分）或比单纯统计新增行数更科学：每删一行代码，同样是技术价值的体现。

OpenAI仍居首位，但领先优势收窄

报告以SDK下载量为基准评估模型生态。OpenAI自2022年初近乎零起点，至2025年11月达1.3亿次下载，稳居第一；Anthropic同期增长1547倍，达4300万次，与OpenAI的份额比由47:1缩至4.2:1；Google GenAI同期下载量约1360万次，增速相对平缓。

在LLMOps层，LiteLLM下载量增长4倍至4100万次；LangSmith依托LangChain生态快速上位。模型调度、监控与降级能力正从“可选工具”升级为开发基建标配，其角色类比K8s之于微服务。

模型参数决定适用场景

报告实测五大主流编码模型在响应延迟、吞吐量与成本等维度表现：

Claude Sonnet 4.5与Opus 4.5首token延迟均＜2.5秒，显著优于GPT-5系（＞5秒），更适合交互式编程（2秒为“心流”临界点）；
GPT-5-Codex与GPT-5.1吞吐量断崖领先，适用于CI/CD流水线中的批量代码生成与测试填充；
Gemini 3 Pro首token延迟超10秒、输出速率低，不适宜实时交互场景。

报告还梳理了2025年基础模型与编程应用领域的关键研究进展：Self-MoA验证单模型多次采样+聚合可超越多模型混合，指向“推理路径多样性”替代“模型多样性”；Search-R1通过强化学习训练模型自主决策搜索时机，将搜索引擎转化为可学习的动作空间；RetroLM则直接在KV缓存层检索，重构大模型记忆组织机制。

需强调的是：所有AI编程工具的使用数据，均无法覆盖人工审查环节。唯有证实AI工具能缩短功能上线周期，而非仅增加过审代码量，其实际业务价值才更具说服力。

参考资料：

https://www.greptile.com/state-of-ai-coding-2025

https://news.ycombinator.com/item?id=46301886

【声明】内容源于网络

新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

内容 14740

粉丝 0

新智元智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

总阅读96.2k

粉丝0

内容14.7k