大数跨境
0
0

以后从对撞机信号中发现粒子的,可能就是软件而不是科学家了

以后从对撞机信号中发现粒子的,可能就是软件而不是科学家了 学术头条
2016-12-07
2
导读:Facebook用来识别人脸的技术能够识别粒子吗?

物理学家正越来越多地运用深度学习技术,Facebook用来识别人脸的技术能够识别粒子吗?




撰文  Molly Olmstead


当你把朋友的照片上传至Facebook时,其实已经引发了一系列后台操作过程。算法会高速运行,分析照片中的像素信息,直到得出你朋友的名字为止。同样的尖端技术让自动驾驶汽车可以从周围的环境中分辨出行人和其他车辆。


这一技术能用来区分μ子和电子吗?许多物理学家认为可以。目前,相关领域内的研究人员已经开始利用这一技术来分析粒子物理数据。


该技术的支持者希望能利用深度学习来节省实验时间、经费和人力,让物理学家们可以解放出来,去做一些没那么枯燥的工作。其他人希望这些技术可以提高实验质量,比以前的算法更好地识别粒子和分析数据。尽管物理学家并不指望深度学习成为“万能药方”,但一些人确实认为该技术是防止即将到来的数据处理危机的关键。


神经网络


到目前为止,计算机科学家经常手动编写算法,这需要使用复杂的计算机语言进行长时间的工作。费米国家加速器实验室的科学家加比·珀杜(Gabe Perdue)说:“我们的科学研究做得仍然不错,但我认为还可以做得更好。”


而深度学习则需要另一种不同的人力投入。


进行机器学习的一种方法是使用卷积神经网络(CNN),它能够模仿人类的视觉感知。人类使用身体内的神经网络来处理图片,而卷积神经网络靠的则是名为“节点”的多层输入。人类通过预处理过的图片来训练网络。算法利用这些图片作为输入,连续调整落在各个节点上的权重,从中学习识别图片的样式和某些感兴趣的地方。在算法对完成对权重的改善后,就会变得越来越精确,处理图片时的表现经常超过人类。


卷积神经网络将数据处理过程进行了重构,将多个权重结合在一起,实现了处理步骤的精简,减少了算法必须调整的要素数量。


卷积神经网络自上世纪90年代就已出现,不过近年来,这一领域的突破使图形处理的硬件价格更为低廉,可以使用更大的训练数据集,在卷积神经网络设计上也有许多创新之处。所以,已有越来越多的研究人员开始使用这种工具


卷积神经网络技术的发展带动了语音识别、翻译及其他传统上由人工完成的领域内的进步。谷歌旗下的DeepMind公司利用卷积神经网络创建了计算机程序AlphaGo,并于今年3月击败了世界排名第二的围棋棋手,围棋是比国际象棋复杂得多的策略棋类项目。


卷积神经网络使得对海量图像数据的处理变得更加可行,在高能物理中,这种数据量很常见。


进军物理领域

2006年,大数据和图形处理单元的出现,人们获得了处理大量信息所需的必要计算力,卷积神经网络的可行性得到提高。“准确性大幅度提高,人们在这个领域的创新热度更是前所未有。”珀杜说。


大约一年前,从事不同高能物理实验的研究人员开始考虑能否将卷积神经网络用于实验。SLAC国家加速器实验室的研究人员迈克尔·卡根(Michael Kagan)表示:“我们将物理问题转换为‘能不能区分出汽车和自行车’,现在我们正在研究如何用合适的方式重新提出问题。”


在大部分情况下,卷积神经网络将用于粒子的识别和分类以及粒子轨迹重建。一些实验已经在利用卷积神经网络分析粒子间的相互作用,精确度很高。比如在NOvA中微子实验中,研究人员就在利用卷积神经网络分析数据。


费米实验室的科学家亚历克斯·西莫尔(Alex Himmel)表示:“这种工具实际上是为识别猫、狗和人的图片设计的,但用来识别这些物理现象也表现得很不错。”


一些从事大型强子对撞机实验的科学家表示,希望能够利用深度学习来提高实验的自动化程度。欧洲核子研究中心的物理学家毛里奇奥·皮耶里尼(Maurizio Pierini)说:“我们正在尝试在一些任务上(用计算机)取代人类,人的成本要比计算机高得多。”


卷积神经网络也有望在探测器物理学之外的领域发挥作用。在天体物理学中,一些科学家正在开发能够发现新的引力透镜和大型天体(比如星系团,可以扭曲后面更遥远的星系所发出的光。)的卷积神经网络。为了找到引力透镜的迹象,对望远镜数据的扫描过程要花费大量时间,而一般的模式识别程序在这一任务上的区分效果并不理想。


 “可以这么说,我们在使用这些工具时,也才刚刚接触到皮毛。”亚历克斯·拉多维奇(Alex Radovic)是威廉玛丽学院的博士后,目前在费米实验室从事NOvA实验。


即将到来的数据洪流


一些人相信,神经网络可以帮助人们避开即将到来的数据处理危机。


计划于2025年建成的升级版大型强子对撞机产生的数据量将达到现在的10倍。暗能量光谱仪将会收集宇宙中约3500万个天体的数据,大型综合巡天望远镜将会录制近400亿个星系的高分辨率视频。


数据流必将增长,但从前计算芯片性能的指数级增长则不会继续。这意味着对数量更多的数据进行处理的成本会越来越高。


 “如果对撞数量提高10倍,数据处理能力就需要提高100倍,想用传统方式解决这个问题是行不通的。”皮耶里尼说。


不过,并非所有实验都同样适合采用这一技术。


 “我认为有时使用这种工具是合适的,但不是任何时候都合适。你的数据和自然图像的区别越明显,网络的用处就越小。”西莫尔说。


大多数物理学家都认为,卷积神经网络不适用于刚刚开始的物理实验,比如神经网络进行计算的过程不是很透明。“这就很难说服人们相信其真的有了新发现。我还是认为用纸和笔做研究仍然是有价值的。”皮耶里尼说。


在某些情况下,使用卷积神经网络的困难会大于收益。比如说,需要把非图片数据先转换为图片形式,而且网络需要消耗大量数据用于训练,根据模拟结果,训练网络有时需要数百万张图片。即使如此,模拟结果也比不上真实数据。所以网络需要用真实数据和其他交叉核对方式进行测试。


德克萨斯大学阿灵顿分校物理系副教授阿米尔·法尔宾(Amir Farbin)说:“物理学家接受新事物的标准很高。要想让每个人都相信这是正确的道路,还需要克服很多障碍。”


放眼未来


对于已经接受的人来说,卷积神经网络为他们开启了远大的梦想,可以推动物理学更快地发展,可能会出现意料之外的发现。


一些人期待利用神经网络来监测数据异常,这可能表示探测器出现了缺陷,也可能是新发现诞生的迹象。研究人员不再试图寻找新发现出现的特定迹象,而是希望新发现能引导神经卷积网络完成数据处理,然后试图找到一些显眼的发现。“你不用指定要找哪种新的物理现象,这是一种更开放的数据处理方式。”皮耶里尼说。


有朝一日,研究人员甚至可能利用非监督式学习来处理物理数据。顾名思义,非监督式学习是一种无需人类指导,对大量数据进行训练的算法。科学家只需向算法提供数据,算法将自行从数据中推出结论。


珀杜表示:“如果算法足够智能,你就可以利用它做各种事情。如果能够得出新的自然定律什么的,那就再好不过了。”


 “但这样的话,我就必须去找个新工作了。”他补充道。


原文链接:http://www.symmetrymagazine.org/article/deep-learning-takes-on-physics

【声明】内容源于网络
0
0
学术头条
致力于学术传播和科学普及,重点关注大模型、AI4Science 等前沿科学进展。
内容 1019
粉丝 0
学术头条 致力于学术传播和科学普及,重点关注大模型、AI4Science 等前沿科学进展。
总阅读0
粉丝0
内容1.0k