大数跨境
0
0

新AI模型“AlphaCode”发表,胜过近五成程序员

新AI模型“AlphaCode”发表,胜过近五成程序员 遇到未来
2022-12-16
1
导读:程序员自己卷自己

点击蓝字 | 关注我们


本文共: 2696字  14

预计阅读时间 7分钟



根据发表在最新一期《科学》杂志上的研究,一款名为“阿尔法扣”(AlphaCode)的新AI系统正在让人类离这一愿景更近一步。



该系统来自“DeepMind”研究实验室,整体性能相当于经过几个月到一年培训的新手程序员。

关于“DeepMind”


DeepMind,位于英国伦敦,是由人工智能程序师兼神经科学家戴密斯·哈萨比斯(Demis Hassabis)等人联合创立的Google旗下前沿人工智能企业。其将机器学习和系统神经科学的最先进技术结合起来,建立强大的通用学习算法。


最初成果主要应用于模拟、电子商务、游戏开发等商业领域。



在测试中,AlphaCode通过预测代码段并创建数百万个潜在的解决方案,实现“接近人类水平的性能”,还能在竞争中解决以往未发现的自然语言问题。在生成过多方案后,AlphaCode会将它们筛选为最多10个方案,所有这些方案都是在“没有任何关于计算机代码结构的内置知识的情况下”生成的。


在Codeforce竞争性编码平台最近的编码模拟评估中,AlphaCode在每个问题的第10代解决方案中平均排名前54.3%,而其中66%的问题第一次提交就得到了解决。


▲ 白色代码来自AlphaCode人工智能系统,紫色代码则由人类编写以解决类似问题


美国卡内基·梅隆大学博世人工智能中心教授齐科·科尔特说:“无论‘阿尔法扣’在多大程度上‘真正’理解了这项任务,它在前所未见的编码挑战中表现得非常出色。”


具体而言,研究者将 AlphaCode 放在 Codeforces 挑战中进行了测试,Codeforces 是全球知名的编程竞赛平台,类似于国际象棋中使用的 Elo 评级系统,聚集全世界顶尖编程者。


Codeforces 每周会分享编程挑战和问题排名。不同于编程人员在打造商业应用程序时可能面临的任务,Codeforces 的挑战更加独立,需要对计算机科学中的算法和理论概念有更广泛的了解,一般是结合逻辑、数学和编码专业知识的非常专业的难题。


AlphaCode 针对 Codeforces 网站上 5000 名用户解决的 10 项挑战进行了测试,总体排名位于前 54.3%,也就是说它击败了 46% 的参赛者 。


 AlphaCode 生成代码的具体例子:


在测试 AlphaCode 的一项挑战中,试题要求参赛者找到一种方法,使用一组有限的输入将一个随机、重复的 s 和 t 字母字符串转换为另一个相同字母的字符串。


例如,竞争对手不能只输入新字母,而必须使用「backspace」命令删除原始字符串中的几个字母。对于 AlphaCode 来说,这只是中等难度的挑战:



问题来自Codeforces,解决方案是由AlphaCode 生成的。


Codeforces 创始人 Mike Mirzayanov 表示:「我可以肯定地说 AlphaCode 的结果超出了我的预期。对此,有人怀疑我这么乐观,因为他们认为即使在简单的竞赛问题中,参赛选手不仅需要编写常规算法,还需要创新新算法,而这一部分是最困难的。但目前看来,AlphaCode 的表现与一个前途无限的人类参赛者相当,我迫不及待地想看看未来会发生什么!」


想要 AI 在编程比赛中脱颖而出并不容易,DeepMind 通过将大规模 transformer 以及采样、过滤相结合,AlphaCode 在解决问题数量上取得了重大进展。DeepMind 在选定的公共 GitHub 代码上预训练模型,并在相对较小的编程数据集上对其进行微调。


在评估期间,研究者为每个问题创建了大量的 C++ 和 Python 程序,且数量级比以前的工作大几个数量级。然后对这些解决方案进行筛选、聚类和重新排序,将这些解决方案分配到一个由 10 个候选程序组成的小集合中,并提交给外部评估。这个自动化系统取代了竞争对手的调试、编译、通过测试和最终提交的反复试验过程。


在 Codeforces 的允许下,DeepMind 通过模拟参与 10 场比赛来评估 AlphaCode。参赛者仅凭复制以前的解决方案等捷径来参加比赛是不可能取得好成绩的,相反,模型必须创造出新颖有趣的解决方案。


此外,该研究还在 CodeContests 测试集上检验了问题解决率和样本量的关系,结果如下图所示:



来自谷歌的世界级竞赛程序员 Petr Mitrichev 表示:「解决竞争性编程问题是一件非常困难的事情,需要良好的编码技能和人类解决问题的创造力。AlphaCode 在这一领域取得的进展给我留下了深刻的印象,很高兴看到 AlphaCode 使用语言理解能力来生成代码并进行随机探索以创建新的解决方案。」


“阿尔法扣”并不是唯一会编码的AI模型,但其性能超越了“前辈”Codex——OpenAI研究实验室于2021年发布的系统。GitHub也有自己的流行AI编程工具Copilot。


关于“OpenAI”

OpenAI是由马斯克(Elon Musk)等人于2015年在旧金山创立的一家非盈利的人工智能研究公司,从工具到算法到论文到模型,都有涉及,其建立的目标就是为了与其它机构合作,进行AI的相关研究,并开放研究成果以促进AI技术的发展,被认为是DeepMind的有力竞争者。


2019年3月11日,OpenAI宣布从”非盈利(non-profit)“性质过度到”封顶(‘capped’ for profit)“营利性,利润上限为任何投资的100倍(创立了OpenAI LP公司)。

关于“Codex”

Codex(和 Copilot)使用 OpenAI 的语言生成模型解析书面文本——它能够生成和解析代码,允许用户以自定义方式使用 Copilot——其中一种方法是生成其他人编写的编程代码,用于GitHub 存储库。


它理解代码元素,例如 Web 服务器、键盘控件或对象操作和动画,并响应自然语言命令,例如“缩小并裁剪它”,然后“通过左右箭头键控制其水平位置”。指的是同一个“它”。当你说“让巨石从天上掉下来”时,它也理解天空是屏幕的顶部,甚至让巨石像真正的下落物体一样加速。




然而,在解决复杂的竞争性问题方面,这两款AI都未表现出与人类匹敌能力。


DeepMind表示,经过培训,AlphaCode解决了约34%的指定问题。为进一步测试它的能力,公司让它参加了在线编码比赛。在至少有5000人参加的比赛中,AlphaCode的表现超过了45.7%的程序员。研究人员还将其与训练数据库中的程序进行了比较,发现它没有复制大段代码或逻辑,这表明它有惊人的创造力。


除了提高总体生产率外,AlphaCode还可让新一代开发人员更容易地进行编程。其未来有一天可能会改变人们的编程理念,即人类主要是为了制定问题,然后由AI来解决问题。


图文来源 | 澎湃好·机器之心、科技日报


【声明】内容源于网络
0
0
遇到未来
机器时代秉承“智能改善生活”的理念,严选时尚新潮的智能产品,让用户体验智能科技,感受未来生活,为中国人工智能技术和产品研发企业提供加速服务。
内容 255
粉丝 0
遇到未来 机器时代秉承“智能改善生活”的理念,严选时尚新潮的智能产品,让用户体验智能科技,感受未来生活,为中国人工智能技术和产品研发企业提供加速服务。
总阅读78
粉丝0
内容255