
极市导读
Relay Therapeutics 的人工智能负责人Patrick Riley与《Nature Reviews Materials》谈论了他在工业环境中从事机器学习项目的经验。 >>加入极市CV技术交流群,走在计算机视觉的最前沿

Google Applied Science 是 Google Research 的一个部门,将计算方法,尤其是机器学习,应用于广泛的科学问题。不久前帕特里克·莱利(Patrick Riley)还是该部门软件工程师之一,现在是 Relay Therapeutics 的人工智能负责人,他与《Nature Reviews Materials》谈论了他在工业环境中从事机器学习项目的经验。
你能告诉我们一些关于你所做的事情以及谷歌机器学习研究的事情吗?
我在 Google Applied Science (https://research.google/teams/applied-science/) 的小组致力于计算方法的各种应用,尤其是机器学习,以解决自然科学问题。我们是更广泛的 Google Research 组织的一部分,该组织在许多计算领域开展工作。我们定期在学术期刊上发表文章,发布开源项目,直接影响 Google 产品。这实际上意味着我们与学术界和工业界以及跨领域的许多不同科学家合作,共同尝试新的想法和方向。

Robert Gonzalez, Google。
你能举一些谷歌 Applied Science 所从事的项目类型的例子吗?
我们的工作范围非常广泛。例如,我们与 TAE Technologies 公司合作,优化了他们核聚变实验的参数 (https://www.nature.com/articles/s41598-017-06645-7)。他们拥有独特的设备、大量数据,并能够进行多次迭代实验。通过与他们的科学家的密切互动,我们将机器推向了新的性能体系。

C-2U 的中央约束室,一个等离子体约束实验。
另一个例子是我们与 Calico 合作探索酵母基因调控的工作 (https://www.embopress.org/doi/full/10.15252/msb.20199174)。有了大量细胞对特定遗传扰动反应的数据集,我们能够重新发现一些已知的生物相互作用并发现新的相互作用。
我要举的最后一个例子是我们与 X-Chem Pharmaceuticals (https://pubs.acs.org/doi/abs/10.1021/acs.jmedchem.0c00452) 合作的 DNA 编码小分子文库的工作。这些小分子可以为开发药物提供起点。使用来自这些 DNA 编码分子库的数据,我们能够构建出令人惊讶的有效机器学习模型,以找到用于药物开发的有前途的小分子。

你如何选择要研究的主题,如何选择学术合作者?
这个过程有两个不同的部分。首先,我们如何接触到正确的可能性和人?我们这样做的方式与大多数学者的做法相同:通过我们认识的科学家建立联系、阅读有趣的论文并与作者联系、参加会议,以及偶尔与组织中的科学家或领导者打个电话。
其次,我们与合作伙伴一起提出的基本问题是:我们是否有一种方法或想法,能够让我们利用我们的计算技能来真正影响对该领域至关重要的问题?重要的是,这不是一个我们一次就可以提出和回答的问题;相反,这是一个我们不断重新审视的问题。我有许多项目一开始看起来很令人兴奋,但是当我们深入细节时,我们失去了对我们的方法是否真的有效的信念。相反,有时我们开始时没有清晰的蓝图,当我们与合作伙伴一起工作时,机会就会成为焦点。
我们如何知道机器学习模型何时出现问题?
这是一个非常重要的问题。任何做过实际机器学习工作的人都知道,95% 的实际工作不是在构建和拟合模型上。这是所有其他工作,仔细检查输入和输出,构成一个真正有用的模型。我们必须以怀疑的态度对待我们的所有模型并质疑它们,就像我们对待任何科学结果一样。这种谨慎的怀疑是必不可少的。我在《自然》的评论和谷歌机器学习指南 (https://developers. google.com/machine-learning/guides/good-data-analysis)中写过关于这些主题的实用建议。

文章地址:https://www.nature.com/articles/d41586-019-02307-y
你认为机器学习研究中最有前途的方向是什么?
如果觉得有用,就请分享到朋友圈吧!
公众号后台回复“CVPR21检测”获取CVPR2021目标检测论文下载~
# CV技术社群邀请函 #
备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)
即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群
每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

