多活的云端技术路线

时间 • 2023-12-17 11:04:05
用户
中心
数据
业务

来源:Digital Business作者丁海

“青云云在北京、广东和上海三个地点拥有多实时数据中心。以北京为例,这是我们上线的第一个多活区域架构。“青云QingCloud运营副总裁林源日前接受采访时表示,青云QingCloud已经准备好从基础设施层、基础设施层或IaaS和分布式应用层或PaaS层向用户提供多实时部署方式。那么,什么是多活一般来说,随着企业数字化转型的开展,企业业务与IT基础设施和数据之间的联系越来越密切,如何保障数据安全和业务的全天连续运营?企业在IT建设过程中越来越成为关注的问题。在传统的企业IT体系结构中,通常有两个以上的数据中心,其中一个是主数据中心,另一个是辅助数据中心。在日常工作中:主数据中心承担主要的工作负荷和数据处理,而二级数据中心主要用于备份主中心的业务流程、数据等。只有在主数据中心发生停机等事故时,备用数据才会暂时承担主数据中心的工作,通过数据的快速恢复等,确保业务的一致性,减少业务中断造成的损失。我们称之为单一活动。双实况在此基础上,将备用数据中心和主数据中心置于同一平行位置,共同承担业务负载,同步复制数据,这样不仅减少了原来的单实况架构带来的资源浪费,当其中任何一个数据中心停机时,另一个数据中心同样可以快速恢复数据和业务。它还可以保证业务的连续性。“2014年,该银行的核心系统出现故障,服务中断了37小时。在这37小时内,所有与银行有关的帐户都无法存款或取款。如果在这个时候有人生病了,需要提取钱,那么可能会有多达37个小时的延误,他们的生命处于危险之中。林源在强调多活的重要性的同时,多活加强了系统的可靠性,提高了业务的连续性,保证了业务在运行过程中不受任何故障和灾害的影响,但并非所有场景都需要多活。用户需要用RTO和RPO两个技术指标来衡量自己业务对多活的需求程度。RTO是业务恢复时间,RPO是数据丢失量。“当每个人都在玩游戏的时候,肯定会有经验。当我想拍照的时候,我发现了我的手机卡。或者有一张服务卡。这很可能是数据中心的故障。但是卡了10秒或者一半后,就了,这10秒就叫做它了。林源举了一个例子。一般互联网行业对PRO更感兴趣,金融、保险等要求数据安全的行业对RPO更感兴趣“如果你欠朋友10万元,在还款的过程中,银行会出现故障”。比较好的情况是你朋友收到了10万块但你这边没有扣除;比较不好的是你的账户扣除了但是你朋友没有收到。这两种情况都表明银行在交易过程中失败,并且在故障恢复后丢失了数据。而且,无论丢失什么事务,都会对数据的完整性产生影响,都是不可容忍的。“很明显,RTO和RPO定义的两种业务形态,前者的业务面向广泛的客户,故障发生影响较大,如电子商务网站、微信、微博等;后者的业务本身很重要,故障发生后影响公司业务,导致客户资金受损,如银行、保险、重型制造等业务场景。从传统意义上讲,这些要求较高的商业场景往往由于成本高、人才短缺、施工周期长、技术难度大,用户企业需要付出相当大的决心和代价。此外,林元治强调,即使这样,也不能保证能达到预期的目标。“10月22日,GitHub发生了相对较大规模的故障,服务中断时间达到了24小时。由于超过80%的工程师依赖GitHub,这24小时的中断导致互联网公司的大多数技术人员无法正常工作。而此次故障正是由于他们的多系统故障而引起的两个机房之间的网络中断,当服务切换时,由于多系统考虑不完全,导致系统脑分裂,双方数据不一致。为了保证用户数据的一致性,GitHub可以直接停止,并在24小时内恢复数据。“林源认为,通过云为用户提供多活,可以帮助用户在业务和IT之间找到更好的结合点,使企业用户能够专注于自己的业务。林源介绍,在基础设施层,青云云在三个区域的数据中心拥有多活动服务--北京、广东和上海,通过青云云多活动区域架构,一个区域由多个可用区域或多个数据中心组成。用户在北京选择3个机房数据中心北京3B、北京3C、北京3D。通过多台机器之间的互连,确保数据中心的互连带宽和时延符合用户的需求。同时,在底层结构IaaS层,青云QingCloud提供了通用组件,帮助用户配置多活负载均衡、网络,确保在极端情况下,无论任何数据中心停机,用户使用负载均衡器的服务都不会受到影响,外部网络不会受到影响。在应用层或PaaS层,QingCloud的MySQL Plus基于MySQL的数据库服务MongoDB本身支持多实时部署,因此任何数据中心的停机时间都不会影响数据库。不仅如此,在青云的SD-WAN智能广域网中加入了私有云和公共云的统一架构,使用户能够在单一混合云架构下部署多活基础架构。“简单地说,用户想要多活,需要做最简单的应用层部分和中间件部分,其他负载平衡器、Redis、MySQL以及数据中心之间的互连,都是由全部提供的。因此,对于用户来说,导入多实况应用程序或者多实况服务变得容易且便宜。“林源说。技术的最终进步是使用户更容易部署、应用和维护,而无需学习更多的专业技能。这也是云计算能在这么短的时间内彻底改变原有IT世界格局的重要原因。无论从哪个方面来说,对专业的人,利用专业的做专业的,是对整个社会最有效的一种分工。