数据中心 频道

一体化双活解决方案如何保障关键业务在线


移动互联、云计算、大数据使得企业面临着结构化与非结构化数据并存的系统场景;同时,企业业务越来越不能忍受系统故障,例如金融等行业,业务中断一小时意味着数百万美元的损失。在这样的需求背景下,一体化双活数据中心方案应运而生。

 

一体化双活解决方案如何保障关键业务在线

各行业每小时停机造成的损失

一体化双活的诞生

数据高度集中的传统数据中心所面临的风险和威胁非常多,故障影响范围变得越来越广。主备数据中心是一个主流的容灾方案,业务部署于其中一个数据中心中,而另一个作为备用,当主数据中心故障,管理员需要将业务迁至备用数据中心上。系统故障后业务恢复操作复杂,中断时间长。对于分秒必争的企业来讲,这是无法容忍的。

而双活数据中心不再单一的从提高系统组件高可靠性上思考,而是从业务连续的角度,高效利用网络资源、计算以及存储资源,设置两个数据始终一致的数据中心,为上层应用提供服务。如此一来,当其中一个站点发生故障,另一站点仍然能够继续为业务提供服务,端到端实时可用,容灾切换也是自动实现的。

早期的双活数据中心以SAN双活为主,其中又有网关和阵列双活等实现方式,随着NAS的发展,NAS双活也成为双活数据中心的一个重要分支。事实上,以医院为例,对HIS和PACS信息系统的依赖加大。HIS信息系统的数据库数据采用SAN保存,而PACS系统的影像文件采用NAS保存。针对同时要求数据库与文件关键业务存储系统同时高可用的需求,所以需要融合SAN双活和NAS双活于一身的双活数据中心,才能保障业务连续。

华为HyperMetro SAN与NAS一体化双活解决方案

针对医院、制造、政府等行业客户要求数据库与文件关键业务存储系统同时要满足高可用的需求,华为推出HyperMetro SAN与NAS一体化双活解决方案,为数据中心关键业务提供7*24小时服务保障。

 

一体化双活解决方案如何保障关键业务在线

华为HyperMetro SAN与NAS一体化双活解决方案

华为一体化双活解决方案,具有浑然一体和化繁为简的两大特点

  1. 华为的一体化双活解决方案设计可谓浑然一体:一台设备+一套仲裁+一种网络就可以搞定

首先是一台设备。借助OceanStor V3融合架构,华为一体化双活方案采用免网关的架构,一台设备即可同时提供SAN和NAS双活服务。设备数量减少2台以上,同时提升了系统整体性能。

其次是一套仲裁。共用一套仲裁,统一的仲裁机制确保仲裁结果始终一致,从而保证SAN和NAS同时在一套设备上提供服务。这一设计规避了传统双活方案两套仲裁机制在站点间网络故障后,出现仲裁结果不一致的问题。

最后是一种网络。仅需要一种网络(IP或者FC)就可以满足站点心跳、配置、复制链路等需求,此外,业务网络、站点间网络以及仲裁网络均可以使用IP进行部署,组网和网络管理操作简单。

  1. 化繁为简的一体化双活方案:升级、恢复和扩展都很简单

升级简单:可实现单套设备在线平滑升级到双活,甚至扩展到两地三中心,提供更高级别的数据保护服务。

恢复简单:支持自动恢复双活关系,当故障设备修复后,无需人工进行干预即可恢复双活关系,实现运维自动化。

扩展简单:最大可在线扩展至32节点,满足客户业务不断增长的存储性能诉求。

那华为一体化双活方案SAN和NAS的读写流程是怎样的呢?是如何做到数据一致性的呢?让我们详细剖析一下。

SAN的读写流程

下图展示了一个I/O的处理流程。主机下发I/O到双活管理模块,系统记录日志。之后双活管理模块将I/O同时写入本端和远端Cache并收集两端Cache的写处理结果。如果写成功则清除日志,如果失败,日志则转换成为DCL(Data Change Log)并记录本端LUN与远端LUN差异。

 

一体化双活解决方案如何保障关键业务在线

一体化双活写请求流程(LUN)

与SAN的写操作类似,文件的写则是将写请求先下发到文件系统,文件系统再将请求下发给双活管理模块。在HyperMetro收到双端Cache写请求结果之后再将结果返回到文件系统。

正常情况下,任意应用I/O都需要同时写到两端阵列才能返回主机,确保两个数据中心的数据实时一致。当其中一端写I/O异常,那么双活管理模块会通过DCL进行记录,站点修复之后再依据DCL将数据增量写入存储。整个过程无需人工进行干预即可恢复双活关系,实现运维自动化。

 

一体化双活解决方案如何保障关键业务在线

一体化双活写请求流程(FS)

为了保障双活数据中心的数据始终一致,设计了分布式锁机制(DLM),一方面任何控制器访问数据之前都需要申请这个全局的锁,另一方面其他控制器无法对存在锁保护的地址进行访问操作,这就保障了同一地址上的数据不会出现访问冲突。

单点故障时,另一站点会自动接管所有请求,如果仲裁服务器故障,系统也会自动进入静态优先模式,所以不会影响业务;双点故障较为复杂,在仲裁服务器、优先站点、非优先站点以及三者之间的链路出现双点故障时,系统同样会通过静态优先等方式继续为应用提供服务,大部分双点不会影响业务连续性。

华为一体化双活方案可以实现大部分的非典型故障自动恢复,用户无需进行过多配置操作。

一体化双活解决方案如何保障关键业务在线

分布式锁机制(DLM)

在比利时Saint-LUC(UCL)医院,华为为客户提供300公里内的端到端双活数据中心解决方案,确保业务系统发生设备故障、甚至单数据中心故障时,业务自动切换,上层应用无感知,确保业务永续。

随着企业业务复杂度的不断提升,业务中断和数据丢失的风险越来越大。华为一体化双活解决方案,可以确保数据库与文件业务实时在线,并且通过统一管理平台实现了简易运维。更为重要的是,不论单点故障还是双点故障,都能够最大限度的缩短恢复时间,通过充分的自动化设计提高系统恢复效率,全面保障企业业务永续。目前,华为一体化双活解决方案在金融电子影像、公安警务综合系统、检察院电子检务等场景下均有着广泛的应用。

全文结束--

华为公司简介

作为全球领先的信息与通信(ICT)解决方案供应商,华为坚持以丰富人们的沟通和生活为愿景,坚持围绕客户需求的持续创新,与合作伙伴开放合作,在电信网络、企业网络、终端和音视频等领域构筑了端到端的解决方案优势。通过全球专注敬业的18万名华为人,致力于为运营商客户、企业客户和消费者创造最大的价值,提供有竞争力的ICT解决方案、产品和服务。目前,华为的业务遍及全球170多个国家和地区,服务全世界1/3以上的人口。华为公司成立于1987年,是一家由员工持有全部股份的民营企业。欲了解更多详情,请参阅华为官网:www.huawei.com

了解华为在企业市场的更多信息,请访问:http://enterprise.huawei.com

在新浪微博上关注 @华为企业业务 :http://weibo.com/hwenterprise

更多数字化转型故事,请访问:http://e.huawei.com/topic/leading-new-ict-cn

在微信公众号查找“华为企业业务中国”,或通过微信”扫一扫”功能扫描二维码进行添加:

一体化双活解决方案如何保障关键业务在线


特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章