数据中心 频道

三大利器实现华赛N8500系列高性能存储

  据标准性能评估机构SPEC官方网站(http://www.spec.org/sfs2008/results/res2011q2) 最近发布的数据显示,华为赛门铁克Oceanspace N8500集群NAS存储系统NFS(网络文件系统)和CIFS(通用互联网文件系统)两项SPECsfs2008测试结果分别为636036 OPS(每秒操作数)和712664 OPS。该结果在SPEC公布的各个厂商同类产品测试数据中位居第一,并且大幅领先第二名。

  那么打破NFS和CIFS两项业界记录的华赛Oceanspace N8500的“过人之处”究竟来自何方?对此,本文将从两方面入手探究,揭开Oceanspace N8500的高性能之谜。一是将传统NAS设备与N8500进行对比,从硬件架构方面分析Oceanspace N8500存储系统的性能优势;二是对比业界NAS产品的集群技术与华赛Oceanspace N8500集群技术,从软件层面分析Oceanspace N8500存储系统的性能优势。

  Scale-out架构设计让N8500“横行”

  传统NAS设备使用单控制节点或者双控制节点提供NAS业务,每个节点支持一组特定的工作负载和文件系统。在故障替换场景下,工作负载可以从一个节点转移到另一个节点。传统NAS设备虽然具有易部署、易维护的特性,但是随着信息社会数据的海量增长,其架构方面的缺陷越发明显。一是文件系统与节点的绑定导致任何时刻一个文件系统只在一个节点上处于活动状态,容易存在负荷热点。二是扩展性差,系统性能和空间不能随着用户需求的增加而增加。

三大利器实现华赛N8500系列高性能存储
▲图1.N8500集群架构示意图

  与传统NAS设备不同,Oceanspace N8500集群NAS存储系统采用Scale-out设计,其结构示意图如图1所示,前端NAS引擎由多个存储专用服务器构成,内部通过专用心跳网络互联;引擎通过FC-SAN与多套存储单元相连。当系统整体负载过大需要扩展系统整体性能时,可以再线横向扩展引擎和存储单元。另外,Oceanspace N8500各引擎节点可以同时并发访问同一文件系统,不存在负载热点问题。

  全Active集群技术赋予N8500每个引擎节点“平等”

  传统NAS设备的不足加速了集群技术在NAS设备中的应用。业界当前主要使用两种集群技术,一是N+M共享存储集群技术,二是基于分布式文件系统的分布式存储集群技术。

  N+M共享存储集群NAS系统架构示意图如图2所示,多个引擎节点之间使用专用心跳链路通讯,N个节点对外提供NAS业务,M个节点作为备用,允许系统中同时故障M个业务节点。N+M集群技术解决了传统NAS设备扩展性差的问题,但是单个文件文件系统仍然是与特定NAS节点绑定,容易存储负荷热点问题。

三大利器实现华赛N8500系列高性能存储
▲图 2 N+1集群配置图

  基于分布式文件系统的集群存储硬件组网比较简单,主要用存储节点和元数据节点组成,节点之前使用10Gb以太网或者infiniband技术通讯。各存储节点都有专用存储空间互不共享。同一文件系统横跨所有存储节点,所有节点并发对外提供服务。基于分布式文件系统存储系统解决了负荷热点问题,但是如果某一存储节点出现故障,该节点对应的存储空间就得不到利用。另外,由于使用分布式文件系统的原因,业务服务器访问某一文件可能需要访问多个存储节点,存在巨大的内部开销。

  与上述两种集群技术迥异,华为赛门铁克Oceanspace N8500存储系统采用全Active集群设计,前端NAS引擎由2~16个存储专用服务器构成。首先,与N+M集群技术不一样,Oceanspace N8500采用单一命名空间,所有集群节点可以并发方位同一文件系统,不存在负荷热点问题。Oceanspace N8500所有引擎节点互为备份,具有更高的系统可靠性。而与基于分布式文件系统存储相比,Oceanspace N8500具有更高资源利用率;引擎节点内部通讯使用千兆以太网,具有低成本优势。所有引擎节点共享存储空间,使得文件访问无需访问多个节点,更高效快捷。

  GAB、LLT协议架起N8500内部通信的“高速公路”

  高效的内部通讯设计尤其让Oceanspace N8500惊艳。Oceanspace N8500集群内部通讯采用经过市场检验的VCS(Veritas Cluster Server)组件,采用高效的GAB (Group Membership Services/Atomic Broadcast) 和LLT (Low Latency Transport)通讯协议。图 3大致介绍了引擎节点间的通信方式。

三大利器实现华赛N8500系列高性能存储
▲图 3 N8500引擎节点间通讯示意图

  每个引擎节点都作为独立单元运行并在集群级别共享信息。在每个系统上,作为集群决策逻辑的高可用性后台驻留程序 (HAD:High Available Demon) 维护着集群配置视图。该后台驻留程序作为重复状态计算机运行,这表示集群中的所有系统都具有同步的集群配置状态。

  GAB主要有两项主要功能,一是提供可靠的集群通信,二是维护集群成员集。GAB提供Atomic Broadcast功能用以确保集群中的所有节点都会接收到所有的配置更改消息,或全部回滚到先前状态,这与数据库原子提交非常相似。值得一提的是,Atomic Broadcast 消息并不是真的广播消息,而是从发送端到每个接收端的一系列点对点单播消息。

  LLT协议控制信息远少于IP协议控制信息,它是 IP 协议的一种高性能、低延迟替代协议。LLT 有两项主要功能,一是各心跳链路上进行流量负荷分担,二是心跳信息发送/接收。

  通过上面的技术分析可以看出GAB/LLT协议组比TCP/IP协议更加高效,更适用于系统间多链路通讯,为各系统维护统一配置视图。

  从以上的对比分析,用户不难看出Oceanspace N8500存储系统性能卓越的奥秘了。硬件架构的Scale-out设计使得系统各组件可以随着客户的性能需求进行横向扩展。全Active集群软件设计,发挥了每个引擎节点的作用。节点间的负荷分担控制,使得不存在全局热点。GAB、LLT高效协议的使用,使得集群内部通讯更高效、更可靠,降低内部资源消耗。

三大利器实现华赛N8500系列高性能存储
▲图 4华为赛门铁克Oceanspace N8500 SPEC测试NFS曲线

  综上所述,Oceanspace N8500集群NAS存储系统具有高性能、可扩展性和可获得性等特点,能够帮助客户采用更低的运营成本,而获得更高的性能。根据Oceanspace N8500产品资料介绍,在后端存储单元不存在瓶颈的情况下,随着引擎节点的增加性能呈近线性增长。有数据为证,图4即是根据相关数据整理的Oceanspace N8500在SPEC测试中NFS性能曲线图。由图中曲线可以看出随着节点数的增加,系统性能确实呈近线性增加。

0
相关文章