大数跨境
0
0

美团代码AI率52%?如何统计AI代码贡献率?

美团代码AI率52%?如何统计AI代码贡献率? 积加LAB
2025-05-30
0
导读:🔥 重磅消息!5月26日,美团CEO王兴在今日财报业绩会上称,目前美团新代码约52%由AI生成,超90%工程师团队成员广泛使用AI编码工具。

🔥 重磅消息!5月26日,美团CEO王兴在今日财报业绩会上称,目前美团新代码约52%由AI生成,超90%工程师团队成员广泛使用AI编码工具。这是第一个公布代码AI生成率的国内大厂。

💡 更震撼的是硅谷的一些创业公司能够用<10人,创造$10+M的营收,与他们交流发现普遍AI代码生成率>90%。

我们(积加)半年前就给全员开通了cursor,cursor已经在我们日常工作中占非常大的比重,但一直有个困扰:如何准确统计AI代码贡献率?

今天分享我们的解决方案,实测AI贡献率64%,超过美团!🚀

方案分析


IDE和插件没有这个功能,github,gitlab,甚至大模型AI查重也识别不出来哪些是AI生成的。

我在很多技术群咨询了一下,结合自己的想法,目前大概有这么三种做法:

一 、流量劫持

劫持 Copilot 的推荐数据,都入库,然后再跟 git 新增代码,计算相似度,高相似才算。

问了几位美团员工用AI的方式,他们也不清楚怎么做的AI率统计。如果王兴确切拿到数据的话,我猜测美团是用的第一种方式,流量劫持,因为他们用自己的LongCat大模型做代码生成,IDE和插件自研,确实很容易就可以把请求拦截并做对比了。

这种方式对于用Cursor和Windsurf的小公司来说,有一定开发成本,不太友好。

二、 AI生成的代码加上 开始 和 结束的注释

// Cursor AI Generated Code - Start

// ... generated code ...

// Cursor AI Generated Code - End

第二种方式虽然写脚本统计很方便,把  Cursor AI Generated Code - Start和 Cursor AI Generated Code - End之间的代码统计起来即可。

但是因为需要手工再去改代码,混淆了AI和人工,需要人去加注释,把end移动到改动之前,比较麻烦。

三、 git commit时加上前缀,区分是AI贡献的还是人贡献的

这个方法是在硅谷与hachi.ai CEO交流时他推荐的,这是一个很好的方式,但是还是需要人来写commit message,难道每次我提交代码都需要去声明一下吗?对于一个<10人的公司可以执行,但是对于积加100多名工程师的公司很难确保执行。如果让AI来写commit,AI提交代码时候会不会把人生成的也带进去?

三种方式的总

 方案

优点

缺点

适用场景

流量劫持

精确度高

开发成本高,需要自研工具

大厂/有技术实力的团队

代码注释

实现简单

需要手动标记,容易遗漏

小规模项目

Git前缀

统计相对准确

需要团队配合执行

小规模团队


最佳实践


基于git commit的方案,我尝试做了一些优化,发现确实把所有的问题都解决了!

设置步骤:

1️⃣ 在Cursor中添加全局cursorrules

2️⃣ 团队统一约定开始时间

3️⃣ 运行统计脚本

cursorrules

```Before generating code:1. Check for uncommitted changes using: git status --porcelain2. If changes exist, commit them with message format: "human [brief description within 50 chars]"3. Execute: git add . && git commit -m "human [description]"
After generating code:1. Automatically commit generated code to current branch2. Use commit message format: "Cursor-Generated [brief description within 50 chars]"3. Execute: git add . && git commit -m "Cursor-Generated [description]"
Always ensure commit messages are concise and descriptive, staying within 50 characters limit.```

这段话的意思是,在生成代码前,总结人类的代码并提交,加上human前缀;生成代码后就提交,加上Cursor-Generated前缀。

这样,就完全自动区分出AI和人了!

统计脚本


我们只需要在所有人都设置好rule后,约定一个时间开始,就可以统计一个项目的新代码AI生成率了!

./code_stats_flexible.sh --since "2025-06-01 00:00:00"

cursor写的脚本很周到,自己没有用cursor时提交的代码,就算没加上human标记,它也会识别成human!

AI贡献率64%,超过美团🤪!

这个脚本可以集成到CICD流程里。

如果你想直接用这个脚本,关注回复【AI率】,获取统计脚本。

后记


硅谷的知名创业加速器Y Combinator执行合伙人Jared Friedman在YouTube上的一段访谈中表示,他们W25届中,有四分之一的公司95%的代码库都是由AI生成的。

AI时代,优秀工程师的设计能力+ 解决问题能力,以AI协作的协助下,能够更放大自己的能力,互勉!

👇 关注公众号,回复「AI率」获取:完整统计脚本代码

💬 你的团队AI代码生成率是多少?欢迎评论区分享!

【声明】内容源于网络
0
0
积加LAB
AI时代的极客实验室,深耕AI硬件创新,探索具身智能边界,用AI与硬件重塑智能未来AI for Everything & Everyone
内容 7
粉丝 0
积加LAB AI时代的极客实验室,深耕AI硬件创新,探索具身智能边界,用AI与硬件重塑智能未来AI for Everything & Everyone
总阅读0
粉丝0
内容7