谷歌新算法改变计算基础！丨ChatPaper带你读论文- 大数跨境

AMiner AI

2023-06-08

导读：谷歌DeepMind打破十年算法封印，AlphaDev惊世登场，颠覆人类算法格局！

今天我们用ChatPaper读一篇新鲜出炉的论文「Faster sorting algorithms discovered using deep reinforcement learning」，带你冲浪在科研最前沿！！！

📌论文综述：这篇论文介绍了使用深度强化学习发现更快排序算法的研究。作者们将寻找更好排序算法的任务表述为单人游戏，并训练了一个新的深度强化学习代理 AlphaDev 来玩游戏。AlphaDev 发现了一些新的排序算法，这些算法比已知的人类基准程序更加高效。这些算法已经被集成到了 LLVM 标准 C++排序库中。论文还展示了该方法在其他领域的应用，展示了其应用的广泛性。

📌论文提出的问题：论文提出了 AlphaDev-S 在从头学习时难以发现程序，并在冷启动时陷入局部最优解的问题，这是由于其随机搜索过程的限制所导致的。

📌论文运用的方法：1)enumerative search techniques，包括 brute-force program enumeration 和 implicit enumeration 使用符号定理证明进行隐式枚举的方法；
2)机器学习方法，特别是强化学习方法；
3)对于一些算法，我们还会使用 latency benchmarking suite 来进行性能测试。