拥抱风险是一个选择么?
时间:2022-03-25 13:06:01 | 来源:行业动态
时间:2022-03-25 13:06:01 来源:行业动态
Google在互联网分布式系统和软件领域遥遥领先,分布式系统在很早以前就已经运行在Google全球上百万台PC服务器上,Google也从自身实践运营的系统和软件中开源了很多云计算、大数据和人工智能等领域里的关键技术,特别是基于微服务和容器的新型应用架构被奉为互联网、云计算和金融科技的标准。
Google分布式系统的运维之道即为Google站点可靠性工程(Site Reliability Engineering, SRE),这也是整个互联网、云计算和金融科技的基石,作为全球最大的基于PC服务器的分布式系统,Google SRE仅靠全球约1000人就维护了Google大部分家喻户晓的商业应用。为了运维世界上现存最大的互联网软件商业系统,Google SRE总结出了一整套方法论,被奉为互联网、云计算以及金融科技的核心理念。
而Google SRE的核心就是拥抱风险。Google认为,当服务器数量超过一定值后,再提高可靠性对于一项服务及其用户而言,结果可能更差而不是更好!过份追求稳定性限制了新功能的开发速度以及将产品交付给用户的速度,还将极大增加成本。经验表明,可靠性的下一个改进,可能比之前的改进成本增强100倍。为什么会这样呢?这主要是因为要投入冗余服务器、网络和存储等设备以及相应的机会成本。
相比之下,银行业核心业务对于风险的容忍度为零。TSB银行在向新系统迁移的过程中,并没有进行充分的测试,这种做法非常互联网化,但结果就是导致巨额损失以及关闭近百个分行。而即使是将业务数据备份到公共云上,后经调查,Capital One也因为一个连接公共云的网络防火墙的错误配置而导致上亿客户数据泄漏。
因此对于那些既想抓住重大历史发展机遇,又期望避免重蹈互联网金融覆辙的银行来说,可以选择两层架构:核心系统仍然部署在以小型机和大型机为代表的可靠硬件基础设施上,非核心系统可以考虑部署到以PC服务器为硬件基础设施的金融专有云上。实际上,因为金融行业有专门的监管和各类要求,即便是非核心系统也不能随便放到非金融专有云的公共云上,而是专门面向金融行业设计的公共云服务。
采用两层架构后,银行就可以在风险可控的前提下,实现创新与安全的平衡,用以小型机和大型主机为代表的稳态IT承载银行核心系统,同时以合规的金融专有云完成非核心业务和前端业务的互联网化,还能实现以DevOps为代表的敏捷开发与快速迭代,从而分享移动互联网与物联网的红利。