大数跨境

最严峻的双十一倒计时,这4个运维关键点,速看速查很重要

最严峻的双十一倒计时,这4个运维关键点,速看速查很重要 天旦Netis
2018-11-08
2
导读:4位运维老司机的实战经验,帮你拉响危机警报,安全度过史上最严峻的双十一。

十年来最特别的双十一,倒计时

这是马云卸任前的最后一个双十一,也是网络支付清算平台自“断直连”工程以来,第一次全面迎接双十一交易洪峰的考验。运维工程师们,你们准备好了吗?



人行:加急!

11月2日,中国人民银行办公厅向全国各商业银行、各股份制商业银行、中国邮政储蓄银行、中国银联股份有限公司、支付宝(中国)技术有限公司、财付通支付科技有限公司等加急发布《中国人民银行关于加强“双十一”期间支付清算保障工作的通知》(银发〔2018〕270号)文件(下文简称“通知”)。

央行的这份加急文件重点强调

网络支付清算平台负责牵头保障工作,积极协调各单位,充分考虑各商业银行实际情况,按照“一行一策”的原则,制定详细的保障方案和应急预案。而各单位应按要求提前做好业务、技术准各工作,并严格按照应急预案进行处置和报告。各单位可根据“断直连”工作进展和安全稳定运行的需要设置一段时间区间内禁止系统变更,并及时向网络支付清算平台、中国银联股份有限公司通报相关信息。对于业务峰值期间的流动性安排,各商业银行应根据业务处理情况提前备足头寸,有效应对业务峰值过后的资金清算需求,切实防止流动性风险向大额支付系统传递。


双十一倒计时,在剁手党们紧锣密鼓刷页面塞满购物车之时,各大银行积极响应中国人民银行的指示,所有承担支付保障工作的相关领导与运维团队正严阵以待,为迎接双十一0点的交易高峰做足完全准备。一如既往地,天旦专家保障团队将参与到各大银行的双十一重保之中。


多年来,天旦陪伴几十家银行用户进行双十一重保,那些万分紧张的紧急时刻,天旦期望帮助各位提前预防。我们特别采访4位一线作战的技术专家,提炼“老司机们”多年一线保障的丰富经验,希望在双十一带来之前,为各运维团队提供“危机预警”,有备无患。



TIP1  网络支付清算业务监控,宜周到,重细节

  小林  

天旦技术专家

“2017年的双十一,0点刚过5分钟,天猫就刷新了支付峰值的历史记录,达到25.6万笔/秒,是2016年的12倍。当晚,有一半的支付交易由网络支付清算平台完成。这是该行接入网络支付清算平台首次经历双十一的考验,虽然真正的交易量并不大,但该行领导对于交易的运行情况依然非常关注。我们在客户的重保现场,通过BPC中的网络支付清算应用对该行与网络支付清算平台之间的交易进行监控,可以看到,多维度的交易指标数据实时刷新,业务运行非常稳定,得到了该行领导的认可。”


在中国人民银行最近发布的《中国金融稳定报告(2018)》中,网络支付清算平台被正式写入报告。

《中国金融稳定报告(2018)》中指出

根据2017年8月,人民银行发布《关于将非银行支付机构网络支付业务由直连模式迁移至互联网平台处理的通知》,要求自2018年6月起,支付机构的网络支付业务将全部通过网络支付清算平台。截止至2017年末,已有248家银行和65家支付机构接入。


网络支付清算业务的全面接入已将近5个月,但全面迎接双十一的高峰挑战尚属首次。一方面,大家为是否能够顶住双十一恐怖交易量有所担忧;另一方面,双十一的巅峰时刻是最有价值的运维优化依据。因此,天旦建议:对于网络支付清算业务的监控原则应当尽可能全面周到、多维度、多视角。


2017年,天旦技术专家小林驻守某股份制商业银行数据中心,除了对电子支付业务进行重点监控之外,同时负责协助该行首次对网络支付清算业务进行全方位监控。通过天旦BPC互联数据应用商城中集成的「网络支付清算应用」,他与该行运维人员一起快速建立起多维度、秒级刷新的监控视图,时刻把握业务的运行状态:

交易总览视图:关注网络支付清算业务的总体交易量、交易金额,并区分借记、贷记账户分别统计。

核心交易指标:三大交易的交易量、成功率、响应时间、响应率当前值,和时间曲线,实时呈现网络支付清算业务的耗时数据。

6条专线实时状态统计:覆盖网络支付清算平台3地6中心与该行2地,共6条专线的实时运行状态。

服务器维度区分统计:对网络支付清算前置服务器进行秒级监控,实时区分交易情况。

三方机构交易指标统计视图:区分支付宝、财付通、其他支付机构大类型的实时交易指标与趋势曲线。


- 2017年双十一之夜,「天旦BPC网络支付清算应用」投放ECC大屏 -

- 0点前,该行核心开发部人员向领导介绍「天旦BPC网络支付清算应用」的监控效果 -


天旦BPC保障该股份制商业银行网络支付清算业务顺利度过双十一的支付高峰,核心开发部的两位工程师给与BPC高度评价:

天旦BPC这个支付清算APP非常实用、方便,这次双十一也极大帮助我们把今年工作成果给领导演示

天旦BPC支付清算业务APP功能强大,是个非常不错的工具



TIP2  让网络与业务联动的强悍守护

  小李  

天旦售前工程师

 “双十一重保,尤其在倒计时的时刻,出现任何问题都会让人紧张冒汗。网络与业务的运维人员一起工作,必须有一个共同认可的参考依据,才能高效联动。这就要求监控工具,能够统一视角、综合呈现网络与业务在交易量高峰挑战下的实时运行状态,同时这也是指导一线运维团队精准把握业务运行质量,快速决策启动应急方案的关键数据依据。”

在运维工程师眼中,服务器的各项性能指标就像是数据中心的生理体征,响应时间、请求数、服务器CPU/内存使用等等,是运维工程师悬丝诊脉的「脉象」。但是在性能指标之上,更让人直观关注的业务指标也非常重要:交易量、交易金额、交易成功率等等。在双十一0点前后,尽管做足了准备,总会有意外出现。也因此,运维团队期望将所有的指标都纳入监控视线,才能保证万无一失。这就需要一种立体化的监控手段,即能综合网络与应用的视角,又必须精准可靠:

将网络与业务的视角统一,一旦出现状况,能快速发现问题,即刻判断究竟是网络问题还是业务问题。尤其在0点前的最后时刻,能够快速定位排除任何干扰,尤为重要。

全业务路径立体化监控:综合呈现电子支付完整服务路径中的各项关键指标,以符合运维团队日常习惯的不同视角呈现监控视图。

能满足应用、网络等部门的差异化需求,提供更深入的差异化监控视图。


在过去几年的双十一保障中,天旦BPC的Smart View一直是用户在关键时刻的首选,并发挥着重要作用。


2016年11月10日23:45左右,在某大型国有银行,当科技部总经理考察重保准备工作时,通过Smart View发现系统核心响应时间突然上升到100多毫秒,相较正常状态上升近10倍,在视图的响应时间曲线上拉出一个尖峰,而从NPM视图上复核该现象,同样看到服务器响应时间变长。向负责人员询问得知,这是为了迎接马上到来的0点高峰,提前进行了核心的日切,属于正常现象。很快便恢复了正常。


在11月11日0:40时,该行三个主要渠道(支付宝、快捷支付、财付通)的响应时间均明显上升,而此时的交易量却是缓慢降低的。马上询问负责核心业务的相关人员,得到答复:此时开始每日的批量作业,跑批的时候核心的响应时间会上升,是正常现象。

←向左滑动,查看更多图片


Smart View统一业务与网络视角,在交易量暴增的压力之下依然保持稳定的性能,实时呈现业务指标,敏锐发现每一次性能波动,赢得了用户的认可。


双十一重保结束后,该行科技部总经理表示:

天旦BPC特有的Smart View有直观的图形展示很好,结合应用和网络指标的立体式监控的思路也很好,感谢天旦的保障工作。

作为BPC的使用者,该行运维人员表示:

以前看监控的数字没有感觉,有Smart View这样的展示很好。



TIP3 万众瞩目的ECC大屏,求精,求全,还是求炫?

   小夏   

天旦售后服务工程师

 “每年双十一,ECC大屏是作战指挥室所有人目不转睛关注的重点。那些滚动的数据和时刻变化的曲线,每一次跳动都牵动着所有领导和运维人员的心,这是最直接体现运维工程师们夜以继日劳动的成果,是向领导最好的汇报。”

ECC大屏的核心使命,不仅要呈现实时的业务动态情况;同时也要提供全面、精准的性能指标数据,对业务运行的健康度有准确的把控。有限的大屏,如何让投放的内容做到精简、全面、又酷炫?天旦觉得,这三点可以同时实现。


历年,天旦BPC的Smart View是最受用户喜爱的ECC大屏展示视图。它立体化地贯穿网络与应用,秒级刷新呈现交易数据、性能指标,通过直观的曲线,能够快速发现问题、定位问题。一张视图,即做到了「精」,又做到了「全」。

向左滑动,查看更多图片


此外,2017年天旦推出的Team Vision大屏展示应用,“直观高效是里,精致美观为表”。流畅的业务数据刷新动态效果,关键指标节点的动态提醒,双十一业务量飙升的关键时刻,也是用视觉冲击让领导认可科技部门实力的关键时刻。

- 天旦Team Vision展示大屏 -


TIP4  小心,别让你的监控工具成为了性能瓶颈


  小盛  

天旦售后服务专家

“记得2017年0点时刻,当我看着ECC大屏极速攀登的交易量数据,简直体验了一把速度与激情。当发现用户ECC大屏上投放的其他监控工具出现性能不稳定的状况,我立即关注到BPC。不负所托,Smart View的数据依然每秒稳定刷新,没有受到任何影响。”

在2017年双十一的0点时刻,我们亲眼见证剁手党的威力:

  • 南京银行,仅用5秒突破全行10000笔交易;

  • 浦发银行,支付宝单渠道交易量突破30万笔,仅用不到6分钟;

  • 华夏银行,0点刚过1秒交易量瞬间5倍爆发,2分钟内交易量达万笔/分钟......


亲爱的运维工程师,连续几天你可能已经喝饱了红牛,但你的业务监控工具还能承受的住吗?传统的agent式业务性能监控需要对业务应用进行改造,并且会插入服务器底层,影响业务应用稳定性、占用服务器性能资源。交易量瞬间并发的关键时刻,常常因系统应接不暇而失去感知,造成迟报、漏报。多年来现场重保的经验告诉我们,任何对业务系统本身造成影响的监控工具,一定会变成整个系统的短板。


天旦BPC得益于互联数据引擎的天然优势,通过旁路方式,贯穿全业务路径获取全量、实时的网络数据,无需对业务应用进行任何改动,也不会给核心业务系统带来任何性能负担,能够承受高强度的业务交易压力,成为双十一重保关键时刻的中流砥柱。基于互联数据引擎输出的实时、全量、精准的业务数据,BPC得以在双十一海量交易的猛烈冲击下,依旧表现稳定、时刻保持灵敏和警惕,精准呈现业务的运行质量。同时,互联数据引擎还可实时导出结构化的全量交易数据,为双十一的事后分析、运维优化、业务发展提供数据依据。


即使是十年来最艰巨的双十一,请放心,天旦本着“让运维稳定无忧,运营做你所想”的使命,依然陪伴各位用户左右。

- 长按图片保存,可转发至朋友圈,你的运维宣言让大家看到 -



释放科技潜力,启航数字化转型

天旦拥有丰富的行业专业知识,客户覆盖领先的数百家银行金融机构。天旦产品每天保障超过200亿笔金融交易的顺利达成。秉承让运维稳定无忧,运营做你所想的使命,天旦保障IT组织从容推进数字化转型战略而不用担忧现有关键业务的可靠运行,更可以通过互联数据促进新核心新应用即刻落地,建立实时客户洞察,直抵科技引领业务创新的征途彼岸。


关注天旦公众号

跟旦旦一起,

让运维稳定无忧,

运营做你所想。


【声明】内容源于网络
0
0
天旦Netis
上海天旦网络科技发展有限公司是国际领先的业务与网络性能管理领域的软件产品企业,针对关键业务保障、交易分析、大数据采集和挖掘等方面提供专业的产品和解决方案。
内容 236
粉丝 0
天旦Netis 上海天旦网络科技发展有限公司是国际领先的业务与网络性能管理领域的软件产品企业,针对关键业务保障、交易分析、大数据采集和挖掘等方面提供专业的产品和解决方案。
总阅读0
粉丝0
内容236