大数跨境
0
0

当强化学习碰到可编程的网络

当强化学习碰到可编程的网络 云深知网络
2020-08-06
4
导读:金凤玉露 相得益彰

(一)当机器学习碰到P4可编程的网络

(二)当强化学习碰到可编程的网络


人工智能是个筐

什么都能往里装



今天装到筐里的是

近几年的风口-强化学习RL



强化学习被认为是

真正的人工智能的希望

因为它的目的是学习如何做事情

它是与环境互动的目标导向的学习



分布式RL训练

具有独特的工作负载特征

频繁的梯度聚合生成大量的迭代

因此网络通信占用训练时间的83.2%



当前解决之道存在各自问题

集中式参数中服务器会成为瓶颈

AllReduce训练中交换机成为瓶颈

基于可编程交换机的在线加速才是王道



将梯度聚合

从服务器节点

移到可编程交换机

可以显著减少所需的网络跃点数



全新设计的交换机内加速器

大幅减少端到端通信开销和阻塞时间

训练算法得以全流水线执行本地梯度计算



作为可编程交换机的扩展

iSwitch不会影响其它常规网络功能



三种方法对比可见

基于可编程交换机的In-Switch

方式可以以最小代价降低训练时间




相关阅读:
P4落地之旅
P4语言培训视频
AI赋能SDN网络,老师,我终于悟道了!
火爆网络的《神经网络与深度学习》有了中文版
P4交换机与微软机器学习的亲密接触预示了Barefoot的未来
这个AI职位180万+400万,但是高考志愿不小心填了网络专业怎么办?


【声明】内容源于网络
0
0
云深知网络
“可能是中国最好的OPEN网络公众号” “嗯,必须是的”
内容 1315
粉丝 0
云深知网络 “可能是中国最好的OPEN网络公众号” “嗯,必须是的”
总阅读830
粉丝0
内容1.3k