周二,我仍然像往常一样在公司OmniAI (基于AWS的AI/ML开发平台)上工作,但是发现无法连接服务器的错误。同时,也就收到了OmniAI技术团队的邮件,由于亚马逊AWS宕机问题蔓延,所以架构在其上的OmniAI也出现问题。
由于我基本上所有工作都是在OmniAI这个开发平台,我也就顺势到咖啡间休息一下,也就看到了新闻上在报道亚马逊AWS出现大范围宕机。虽然我知道云计算作为计算基础设施,但是这次宕机也使我非常惊诧人们对云计算的依赖之深。下面我们来一块看看有哪些影响:
——联网的给猫咪定时分发猫粮的喂食机,由于其依赖的AWS平台故障而无法正常工作,因此当主人回到家时发现碗是空的,两只猫则不停地喵喵叫。
——由于亚马逊的Alexa当然也是基于AWS云计算平台,导致了许多用户无法像平常一样用语音来控制照明、打开关闭百叶窗等。当然,你也无法与之对话,询问天气、新闻或播放你喜欢的歌曲。
——扫地机器人无法根据手机App来指令来打扫地板,从而用户不得不从出库中拿出久违的扫把和簸箕。
上述服务可能有人会觉得不算那么关键,但是此次宕机也影响了许多将自身计算基础设施架构在AWS上的公司。
——许多流媒体公司,包括非常受欢迎的Netflix和迪士尼等都受到不同程度的影响,Netflix网络流量降低了26%。
——还有比如Canvas,它在北美大学使用非常广泛的应用,用于提交作业、评定成绩、教授与学生之间交流。AWS宕机也使得许多学生无法访问Canvas。
——西南航空公司的机场服务系统不得不从AWS东岸服务器切换到西岸服务器,从而并未对航班造成关键影响。
——丰田公司在美国东部地区的经销商服务也出现问题,该公司拥有处理经销商保修索赔和其他服务的应用程序,其中 20 多个受到亚马逊AWS宕机的影响。
普通消费者大多并不了解云计算业务在亚马逊整体战略中的作用,这一点可以从现任亚马逊云计算业务AWS主管安迪·杰西(Andy Jassy)接任新的亚马逊CEO一职可窥一斑。最近几年,微软(Microsoft)、谷歌(Google)、甲骨文(Oracle)都在云计算业务上大力投资,同时也会被越来越多的公司所采纳与应用。根据Gartner报告,近几年微软在云计算市场的份额已经从2016年的8.7%增长到19.7%,同时谷歌公司也增加到6.1%。2020年,亚马逊AWS的市场份额为40.8%,仍然是市场领先者,但是相比2016年的53.7%已经下降了不少。
然而,云计算发展(加上脸书、微软等大型技术公司已经达到了相当大的规模)某种程度上也使得互联网变得越来越集中化、并与互联网最初的设计目标—成为一个没有中心故障点的分布式网络,背道而驰,从而导致由于操作复杂性而难以完全避免的中断,但一旦发生就会产生非常大的影响。在今年10月,脸书及其旗下Instagram的即时通信功能宕机达数小时之久。此处,可以简单介绍一个复杂网络模型,无标度网络(Scale-free network),其典型特征是在网络中的大部分节点只和很少节点连接,而有极少的节点与非常多的节点连接,目前互联网就越来越符合此种网络模型。如果互联网的关键节点(称为“枢纽”或“集散节点”)出现故障或被攻击,整个网络就显得极为脆弱。
欢迎诸位企业家朋友
随时与朗玛峰管理服务团队沟通交流

