
大家下午好,我今天的分享主要是关于混合云的落地实践。我看了前面的议程,几个伙伴讲了在混合云场景下一些很棒的管理工具,我这个分享更多的是关于混合云在落地方面真正的一些实践,这些实践更多的是关于最后一公里!为什么这么来讲呢?安畅我们专注于提供一站式混合云解决方案和服务,我们把云计算中公有云的资源、私有云的解决方案,再结合数据中心、网络连接资源,安畅的专业技术服务能力,怎样把混合云真正的落地、交付到客户的手上,是我们近两年关注的重点。过去这几年,我们大概为客户交付了100多个百万以上合同额的项目。从这些项目中获得的实践经验,希望通过这个session给大家做个分享。

《中国特色混合云落地》——程小中
为什么要上云?云有什么好处?前面的伙伴已经讲了的很透彻了。我只说一点,在企业级的市场,因为有技术的原因、有成本的考量、有合规的因素,甚至还有企业基于战略的考虑,加上还有遗留资产的问题,混合云一定是企业级用户真正的主流的选择。

混合云趋势
这是RightScale在2016年一份关于美国市场的报告,可能美国的情况和中国的情况还有一些不一样,不管是用户使用云计算的比例上还是混合云的构成类别上。混合云到底是什么?这个话题我们和非常多的伙伴和客户都做了探讨,混合云究竟是什么?顾名思义简单的会把它理解为就是公有云+私有云,但在实践中会发现事实并不是这样,在实践中,我们发现了很多挑战和问题,举几个例子说明下:
第一,我们很多客户的确是部署了私有云,也用了公有云,但实际情况是他只是分了一些业务跑在公有云上,但这些公有云和他本地的物理架构或私有云,有没有真正的混起来,这样的场景只是分散的使用了一些不同类型的资源而已,彼此却没有关联。
第二,关于私有云。在中国真正的能在行业里或企业里落地私有云案例的,我觉得是不多的,个人认为应该只有100多左右,不会很多,绝大多数其实只是虚拟化。虽然说私有云的概念铺天盖地。简单的解释下,虚拟化和私有云最大的区别是什么,,虚拟化只是在IT的基础架构上通过虚拟化技术提高了资源利用率,做了一些自动化的管理工作,私有云是在虚拟化的基础上,把企业IT的管理、治理、流程体系和IT基础架构无缝的融合起来,甚至和业务应用的结合。私有云平台在虚拟化的基础上,它还加入了很多的self-service的自主服务特性在里面,以及计费等其他运营管理功能的,这才能被称之为私有云。所以说绝大多数的企业里的IT架构只能称为虚拟化场景。,还有一个重要的话题就是,我们很多客户在上云的过程中,只是做了一些应用程序在云环境上的重新部署,却并没有真正的把应用、业务按照云的真正特性去做重新的架构设计。

如何定义混合云
所以我们结合在中国市场的很多实践案例,从这四个角度来理解混合云,尤其是站在用户的角度。首先我们更愿意把混合云看成一种能力,他不应该只是一种技术;第二,如果把这句话展开来说,它是随着外部技术进化和产业环境的变化,和企业自身业务能力的变化,动态变化的一种能力组合。为什么这么说呢?从第一个维度,公有云、私有云和传统的物理架构,他们之间是一个动态变化的过程。目前我们更多的IT架构是往公有云变,往私有云迁移,实际上在未来,私有云往公有云之间也是一个动态的迁移,甚至还会有一些我们上云了之后,但是可能由于安全或性能的原因,公有云满足不了需求,会导致下云,重新回到物理架构,这样的情况在过去我们遇到比较多的案例。第二个维度,我们从技术堆栈的角度,在IaaS、PaaS、SaaS也呈现出混合的概念,这是当今很多企业已经在应用的一个现状,非常多的应用跑在公有和私有的IaaS上面,而有一些的场景在开发时使用了PaaS服务,还有一些业务直接使用公有云SaaS的服务。所以基于这种混合堆栈,我们不应该只是站在IT基础架构的层面去看IT怎么去管理,举个例子,在IaaS、PaaS、SaaS混合使用环境下,企业的用户账号的管控如何去实现?我们不可能为每一个堆栈上的独立系统都去建立一个自己的认证系统,肯定会去做一个统一身份认证的管理。第三个维度,需要IT部门和财务部门一起来看待混合云,云和传统IT更多的不同是一种交付模式,所以混合云也体现为不同的财务成本结构的一种组合,这个和企业一些战略、财务上的一些规划有很大的关系。第四点,我们要从管理的角度看待混合云。哪怕是传统的IT,也是三分建设七分管理,是你真正把业务的基础架构变成了云之后,相对应的围绕整个新的混合云IT架构的管理,我们的流程、我们的运维该怎么做?其实这是我们IT团队需要去面对的一个话题。从这个层面诞生了最近比较火的一个名词——双模IT(Bimodal)。

混合云落地的关键点
我们过去在做很多混合云落地项目中,在混合云的实施和管理方法论上,总结出几个关键的点,可以供大家参考。
第一,企业一定要去找一个好的帮手。这几年,技术和厂商产品成熟度有很快的进化,但随着越来越多的客户使用云,厂商支持已经跟不上众多的需求,尤其是到了不同行业的具体客户,业务场景的差异性、用户对云的技能缺乏,需要云计算厂商除了提供符合需求的产品,还需要在项目中的实际支持,比如怎么选择云,业务上云的过程,怎么部署迁移,怎么管理。这里面,尤其是公有云,比如AWS,近200个产品,几千个特性…对于很多用户而已,这个学习的曲线是非常的陡峭的。所以在这个上云的过程中,我们认为企业首先是需要找到一个好的帮手,不光是要去选择一个好的厂商,而是要去选择一个云中立的(Cloud Neutral)这么一个厂商,应该有这么一个好的伙伴,愿意和企业站在一起,站在企业的角度,站在企业立场,分析企业的应用、业务场景,来选择合适的技术,合适的供应商,合适的架构。
第二是评估,从业务和管理两个层面。业务层面是我们要去识别哪些业务更适合用公有云,哪些应该部署在私有云。举个例子,比如一些企业里有传统的ERP或财务软件,这些传统的业务很大程度上没必要往云上迁移了。真正适合尤其像公有云的,更多的应该是在Web、Internet场景下的2C业务,需要追求敏捷,追求高效的扩展,需要快速上线,在这样的场景下,公有云更适合。而那些讲究稳定,不会有太大变化的业务需求可能就不要去上公有云了,这是从业务角度去考虑的。第二从管理的角度,哪些业务对安全有极高的要求,哪些数据一定要控制在自己的手上,通过这样的考量,我们知道,哪些业务的数据我们把他运行保存在云上,哪些适合放在数据中心里。
第三叫重新设计(Re-design),不是Re-deploy,如果是Re-deploy,很多时候我们是没有办法最大化来享受云的这个福利。云的这个福利,需要我们要被动的去适应它,我们不可能让AWS、阿里云或是google来适应我们的应用架构,这个不可能的。我们要改变意识,充分的去利用云的架构特性,来重新设计我们的应用,这样才能最大化的来享受云的福利,使得业务能站在新的高度上推动创新,这也是企业转型过程中获取全新竞争力的关键。
再往下走就是评估供应商,未来在上云的过程里会分两个层面,第一就是和传统的IT一样,要去面对很多的上游厂商,公有云的厂商、私有云的厂商、设备的厂商,云模式下灾备的软件及云的管理平台;第二就是新的集成服务商,云集成服务已经不是一个新的概念。在传统的IT时代,就有很多集成商,也是站在用户的角度,帮大家去设计架构,去做一些集成的工作。而云时代有云时代的集成商,对能力的要求却有大的差别。
然后我们需要重点关注的是,面向新的云环境去做部署、迁移和持续的优化,这方面有两个关键点。第一就是千万别忽视POC,很多时候我们听了厂商的一些演讲,真的觉得云很好,就把应用迁上去了,结果发现里面还是有很多的坑。所以我们一定要耐心去做足够的POC,来发现一些潜在的风险。第二个话题就是不要觉得一旦上云就可以了,这只是一个开始,这是一场持久战。上云之后如何去优化架构,不断去调整迁移,这是一个持续的过程。
最后一点就是构建新的管理平台、工具平台。传统IT用一些简单单一的管理工具即可,但在云的场景下,我们需要一些针对混合云、针对多云场景下的新的管理工具和平台,另外,整个IT内部的流程都会发生变化,比如有很多安全的边界发生变化了,很多资源的申请、流程发生了变化了。这是总结下来的我们认为比较几个重要的关注点,今天时间有限,只能简单和大家分享。

全球混合云生态
下面,我们再讨论一个有趣的话题和角度,一起分析下不同国家云计算生态中的一些差异。在IT行业,不同的市场环境,不同的生态,不同过的服务模式,会催生不同的厂商。这里面有几个主要的比较维度。第一个就是从玩家的角度,第二个从整个的监管政策,第三个从市场的阶段、市场的环境。在云的生态,尤其是混合云的生态里面,主要的player分公有云、私有云、设备厂商、数据中心、网络服务商、云集成及软件开发商。分了美国、欧洲、中国,大体来说美国在技术无疑是走在最前面的,在市场的节奏上也是走在最前面的,欧洲相对来说本身社会比较保守的文化的社会,在技术上更多的是在跟随美国的一些节奏,再加上欧洲本土国家和行业都有一些自己的监管政策,欧洲基本上跟在美国的后面。玩家的市场,在公有云厂商里面,除了AWS、Azure进入欧洲,还有些本土的运营商也参与竞争,比如德国电信和华为,合作建了一个电信云平台。在中国,公有云的老大还是阿里,AWS和微软在中国的落地还是非常艰难的,这里面除了政策监管的因素,也有对本土市场的理解和适应挑战。其他比较大的区别,在设备厂商里面,中国本土的浪潮、华为、联想有很强的区域竞争力,而戴尔在全球范围的表现都非常优秀。不管在美国、欧洲还是中国,“在中国,为中国”的战略执行的非常到位。在数据中心领域就不一样,美国的主要玩家是Equinix、Coresite、DRT这些大型的数字地产公司,在中国几乎是运营商占No.1,但第三方的世纪互联、GDS也是很重要的力量,另外这两年A股上市公司也有不少玩家涌入,建设1-2W的机柜,这个市场现在非常的热,但可能在一两年内会出现严重的供大于求和残酷淘汰。但在网络市场就不一样,基本上都是每个国家一些本土的网络运营商,以及不同的垄断和竞争风格。而云方面的MSP也呈现不同的区域性,并呈现出明显的本地化特点,比如美国市场上快速崛起的2ndWatch,以及朝着云管理转型的Rackspace,在中国市场,包括安畅、驻云、云角和云络在内的一批新服务商也正在云生态中扮演不可或缺的角色。在市场阶段,就客户而已,美国的传统企业大部分已进入Cloud-first,优先选择云,互联网公司正在从Cloud-first到Cloud-Only转移。但在中国传统企业目前还是Cloud-maybe,还是在观望,但中国互联网公司对云的接受度目前是跳跃式的增长,要么是Cloud-first,要么是Cloud-Only,这点是和美国同步,甚至更激进。
简单总结一下,中国企业用户在落地混合云的挑战,主要体现在三个方面,一个是组织缺乏云技能,这个是需要足够时间去适应和提升的;第二是受限于现实网络,这里重点提下混合云中连接的问题,在一个完整的混合云架构中,从公有云到私有云、公有云到数据中心,如果你的网络延时非常高、非常不可靠的话,你的混合云运行会变得非常的糟糕,这是一个很大的陷阱。第三就是IT管理的工具、体系或是流程跟不上。

安畅的混合云服务能力模型
安畅从这几方面出发,针对中国市场建立了全栈的混合云服务能力。
首先,我们有一支150人左右专业的云计算专家团队,他们是拥有AWS、Azure、VMware、阿里云各种专家认证的架构师,这支团队熟悉行业内各种云计算技术、厂商的特点和优劣势。我们和客户交流的时候,我们可以自豪的说我们是最懂云的,我们会站在客户的立场,来帮助客户来选择适合企业的云技术、厂商和架构设计,以及协助客户提供实施阶段的部署、迁移服务,和持续的云运维管理。

FastFiber全连接网络
第二个就是平台,针对混合云的统一管理平台,如果没有这样一个平台,跨异构资源、跨平台管理会变得非常的低效和麻烦。我们针对国内的混合云生态和业务场景,构建了SmartOps平台,支持IaaS层多云的接入,包括公有云、私有云、物理服务器,甚至IBM Power小机,往上是云环境下的各种统一监控、安全的运维模块,资产管理,服务管理和财务管理。

混合云管理及运维平台——SmartOps
第三就是网络连接,安畅的网络能力建设经历了两个阶段。第一个阶段我们在大陆整合了中国电信、联通、移动这些Tier-1电信运营商,并在香港与PCCW、At&T、Singtel这些全球一线运营商进行BGP互联,我们把这些网络资源以BGP技术整合后,通过我们全国的Fastfiber传输网接入到北、上、广、深十几个大型数据中心,这些数据中心中的用户就拥有了非常丰富的高品质互联网接入选择。今天我们进一步的把这张网与阿里云、AWS这些全球一线公有云厂商打通,我们运营的数据中心里面的客户和公有云里面的客户,可以自由通过这张高速、稳定的专有网络来构建一个高质量、低延时、大带宽这种可靠的混合云连接,以支持数据中心到公有云,或云与云之间的数据交换和业务连接。

安畅的服务体系
最后,我分享下安畅今年和客户在混合云领域的一些共同实践案例:
第一个案例,主题是前后端分离。这是国内最大的一个订餐平台。对外和支付宝、百度地图等建立了连接,客户核心的业务是跑在IDC,在安畅上海的数据中心使用了400多台戴尔的服务器,这是他核心的业务部门。前端的业务在今年我们帮客户做了拆离,把前端所有的入口流量全部放到了公有云的节点,三个地区北京、上海、深圳。为什么这么做呢?第一他前端的波动性很强,这样利用公有云弹性的特点可以做到随扩随减,成本也得到了极大的优化;第二个原因是因为DDos攻击比较多,这方面,公有云有个非常大的福利,就是他的出口带宽非常大,可以充分去利用公有云抗D的这个能力。所以把前端的业务放在公有云上去过滤一些DDos的攻击,再把核心的业务连接和关键的流量导到核心生产的数据中心。这样相对对用户来说,不论从成本上,还是从安全上,这都是非常折中的、平衡的一个方案。

混合云案例——前后端分离
第二个场景是关于灾备和业务连续性,这是个做保险和医药零售相结合的一个平台。客户的架构相对简单,核心的生产系统部署在IDC,我们帮助客户在IDC里构建了一个托管式私有云。托管式私有云的概念指客户使用私有云,但是不用花钱去建,由安畅出钱去帮客户购置设备、设计架构,部署、运维管理,客户只需按月付费。因此他的交付模式和公有云类似,但是从物理上他是一个独立隔离的架构,这是一个很创新的业务模式,能够帮助企业降低在构建私有云时的财务压力和风险。客户在托管式私有云上运营的核心业务需要和很多银行和保险公司做结合,这个部分是通过我们的Fastfiber网络和外部运营商专线进行连接。关于灾备部分,我们帮助客户把灾备系统部署在公有云的系统上。这样客户就不用1:1去建设一套昂贵的系统,因此这个成本会比较低。生产系统的托管私有云和公有云上面的灾备系统之间,使用了100兆的CloudLink专线(混合云专线),来支持数据同步复制。当生产系统出现了问题,我们可以通过动态DNS把业务切换到灾备系统,而Fastfiber也会以极快的时间窗口将外部连接到保险公司和银行的切换到灾备系统。

混合云案例——灾备与业务联系性
第三个是一个偏互联网的场景,主题是Cloud Burst,一个做数字营销大数据的公司。规模非常大,每天有10亿PV,客户的系统最前端是对接google、百度、阿里、腾讯等所有广告流量的平台,中间是消息处理平台,最后端是一个Hadoop集群。这样的架构,最开始是跑在公有云上的,跑了一年左右,流量负载和数据处理规模上到一定程度后,公有云平台在性能上已经cover不住了,因为他所有节点与节点间带宽的吞吐量都要在10G左右,因此我们当时把他的架构做了拆分。把Hadoop这部分拆到了线下的物理机,用物理服务器帮他们做了一个高性能集群;前端把它拆为两部分,把Storm & Redis这些平台还是放在公有云上,可以利用公有云的弹性,再前端的一些广告的平台也放到了公有云上面。从最前端系统到中间的处理系统到最后面的大数据,非常有层次的跑在混合云上面。

混合云案例——Cloud Bursting
最后我想和大家总结的观点是,混合云不是简单的“平衡”或是“妥协”,他是通往云计算路上必经的一个路径,他是一个动态变化的路径。与其观望,不如行动!谢谢大家。
文丨安畅


