【IT168 专稿】在企业浩渺如烟的历史数据中,如何发现这些运营数据内蕴含的价值和规律,是驱动商业智能产生和发展的基本动力。然而,进行商业智能分析的基础平台——数据仓库本身也存在自身的“摩尔定律”。根据IDC的一份调研报告:企业数据仓库运营每隔18个月,规模就会增长到原有的6-7倍。这一结论客观上反映了企业运营数据急遽膨胀,给数据仓库带来的瓶颈和难题。具体来说,商业智能系统遭遇的瓶颈可被概括为扩展性、IO性能和可用性三点。
商业智能的三大瓶颈
首先,数据仓库和传统的OLTP系统不同。一般来说,OLTP往往只面向单个应用,商业智能系统则是面向整个企业的运营数据,牵涉到的数据集和维度可能多达数十个,数据规模也往往高达上百TB甚至PB级。这些系统有可能相互关联,也有可能毫无联系。这就形成了商业智能的第一大挑战:扩展性。无论是软件方面的可扩展性还是硬件平台的可扩展性,任何一方扩展受限,都会给商业智能系统的带来系统瓶颈。
▲商业智能的一般过程
尽管OLTP同样也面临着扩展性难题,相比商业智能数据仓库容量规模的指数级爆炸增长,也只能算是小巫见大巫。此外,企业一旦从商业智能分析中获益,各个业务部门将提出更多的分析需求,从而将更多的历史数据加载到数据分析平台中,这也是造成商业智能系统扩展瓶颈的另外一个潜在原因。
商业智能系统的第二个瓶颈则是IO瓶颈,商业智能系统需要对庞大的历史数据集进行查询、清洗、转换,分析数据属性并寻找规律,因而数据仓库往往是典型的IO密集型应用。众所周知,CPU在查找数据时,经历了“L1/L2级缓存—内存—内部存储—独立外部存储”的“由近到远”的过程,大量的数据需要从后端的外部存储系统读取到服务器进行相应计算。为了缓解IO瓶颈,商业智能的系统往往通过庞大的集群架构形成大规模并发IO。
此外,作为一种关键业务应用,商业智能在高可用性方面同样有较高的要求。以商业智能的底层平台数据仓库为例,一般通过Client/Server以及Web方式两种模式提供对外服务。在Web的访问模式下,用户的访问需求来自不同的时区、地点,如果系统故障,将对企业形象带来负面影响。一般而言,系统不能对外提供服务的原因主要来自两方面:包括计划外停机(系统故障)和计划内停机(系统维护、升级、检修等),前者往往源自系统本身的可靠性缺陷,后者则与系统在管理、维护、升级等方面是否简单有关。
尽管商业智能面临着扩展性、IO性能和高可用三方面瓶颈,然而,随着X86架构技术日益成熟,性能和可靠性不断提升,商业智能已经成为X86架构发挥其技术优势的另一个市场领域。
X86的另一个舞台
前面我们提到,商业智能对硬件系统平台的性能、可靠性和扩展性均存在苛刻要求,一直以来,商业智能系统往往基于传统的SMP架构小型机而构建。随着近年来X86平台的性能与日俱增、可用性日渐提升、扩展性飞速增长,X86平台在越来越多的市场领域开始侵蚀小型机份额,商业智能也成为X86架构向RISC小型机发起进攻的另一个战场。
例如,Oracle推出的基于英特尔至强平台的Exadata数据库云服务器,通过独有的smartscan技术,以及数据处理过程下移的设计,在X86架构基础上同时提供了较高的OLAP性能(数据仓库应用)和OLTP性能。此外,IBM也推出了基于X86平台的商业智能解决方案,基于IBM独有的EX5架构服务器和XIV网格存储系统提供了不输于小型机的智能信息处理能力。
实际上,小型机赢取客户的两道必杀技在于高可用性RAS和SMP扩展架构,然而,最新的英特尔处理器在两方面表现都打破了小型机旧有的技术壁垒。
首先,在高可用性方面,去年推出的至强7500处理器,集成了22项原属于小型机的RAS特性。这22项RAS功能分别围绕数据保护、高可用设计和降低系统计划内宕机时间三个方面做文章。包括自动侦测和修正错误、处理器之间动态分配负载、关联错误检测与修复以及虚拟环境中单个虚拟机恢复等可靠性技术,使得X86平台达到了媲美小型机的可用性。
其次,相对于小型机的SMP扩展架构,X86架构也表现出了超乎寻常的竞争力。X86平台近年来核心和线程数量都不断翻倍。例如至强7500处理器,凭借4条高速率QPI总线,在不借助节点控制器的前提下就可轻易的构建8路系统。一些厂商在借助第三方节点控制器的情况下,还可扩充到16路甚至32路。最新一代面向关键业务的E7系列处理器,拥有更强扩展性,可以支持到256路系统,完全满足企业大规模数据库应用的需求。
在更苛刻的关键业务环境下,还可部署多台X86服务器构建集群系统,并行处理能力和扩展性还将进一步获得大幅度提升。同时,基于X86平台的集群相比传统Unix小型机双机方案的高成本和封闭性,在性价比、可管理性等多个方面拥有更多得天独厚的竞争优势。
IBM的BI平台:EX5服务器+网格存储
下面我们以IBM为例,来剖析一下其X86商业智能解决方案。据了解,IBM System X3850 X5新型商业智能解决方案包括:IBM x3850 X5服务器系统、IBM独有的XIV网格存储系统、微软Windows Server 2008 R2和SQL Server 2008 R2数据库及BI套件。
▲IBM 商业智能解决方案参考配置架构
IBM System x3850 X5服务器基于IBM独特的EX5架构,以英特尔至强X7500和E7-8800系列处理器为基础,为微软Windows Server 2008 R2提供了高端的模块化运行环境。值得一提的是,IBM System x3850 X5服务器像模块化的“积木”一样,可配置一到两个安装有160个逻辑处理器和2TB内存机箱的扩展型服务器,另外借助其独有的MAX5内存扩展技术,还可以利用一台1U MAX5内存器扩展到4插槽,1.5TB内存配置。
▲IBM x3850 X5系统
XIV网格存储则是IBM于2008年推出的存储产品,即将进行新一轮升级换代,更新到XIV G3。XIV最初由IBM并购的一家以色列公司的技术整合发展而来,最早这家以色列公司的创始人曾任职EMC,是EMC高端系统Symentrix架构的主要研发人之一。
▲IBM XIV存储系统
XIV的网格存储架构简单但具革命性意义,总体而言,XIV的技术特点可被概括为三点:完全网格化的体系架构形成整体系统的高并发与高扩展性、内置类RAID1的数据保护模式完全摒弃了传统的RAID保护模式、以及独特的条带化IO消除系统热点。XIV的所有模块在一起形成一个网格体系结构的工作模式,通过内部算法提供了大规模并发IO能力,尤其适用于商业智能的并行分布式计算环境。
此外,整体系统还包括运行在微软Windows Server 2008 R2上的SQL Server 2008 R2,在此基础上,企业可建立全面的,企业级规模的智能分析交互平台,最高支持256个逻辑处理器,在处理能力不足的情况下,可升级服务器添加更多的逻辑处理器。SQL Server 2008 R2包括SQL关系数据库引擎,分析服务,集成服务和报表服务。这些组件共同构成一个完整的数据仓库和商业智能解决方案。
不同的系统配置对分析性能的影响
前面我们提到,IBM x3850 X5服务器是类似“积木”一样的模块化服务器,应用不同的配置可带来不同的商业智能分析性能。下表显示了整体方案在不同配置下的性能表现。我们分别采用配置1个至强7500节点、2个至强7500节点和1个至强E7节点的不同平台,分别构建同样的多维数据集,并记录各个平台构建多维数据集的时间,其结果总体概况如下:
2节点 (X7500)对比1节点 (X7500)的测试结果如下图:
▲扩展到2节点后与1节点构建多维数据集所用时间对比
测试表明,与标准配置(1节点X7500)相比,使用两个节点,其构建多维数据集所花的时间要少1个小时,速度提升了31%左右。而且不得不说的是,将1节点升级到2节点非常简单,这主要得益于英特尔QPI技术。只要通过QPI电缆将两个x3850 X5服务器连接就能形成一个8路服务器。连接之后,内存和处理器都是标准配置的两倍。把两个服务器连接之后,Windows操作系统并不需要重新安装,只是简单地重启,Windows就可使用新的处理器和内存。
1节点 (E7-8800)与1节点(X7500)的比较结果如下图所示:
▲基于不同处理器的平台构建多维数据集的时间比
我们知道E7系列处理器由英特尔于今年4月推出,采用了32nm制程,是新一代面向企业关键业务应用的多路至强处理器。上图显示了8核心X7500 2.26GHz升级到10核心E7 - 8800 2.40GHz后的测试结果。在此配置中,有较多核心处理器的运行速度略快于标准配置(10核40线程 : 8核32线程)。与标准配置相比,其构建多维数据集的时间减少了半个小时,提升了18%。
通过上述测试数据表明,在其他条件(存储系统、数据仓库、商业智能软件等)不变的情况下,单纯地升级处理器和加大内存可以显著地提高商业智能的分析处理效率。通过实施2节点X7500配置或升级到E7 - 8800处理器可实现加速,提升速度分别为31%和18%。
推动商业智能变革
IBM基于X86服务器与网格存储的解决方案较好地解决了商业智能应用中的扩展性瓶颈、IO瓶颈和可用性瓶颈,为企业提供足够的数据分析能力来增强市场洞察力。基于X86平台的商业智能解决方案也在广泛的市场应用中得到了验证,IBM商务智能的成功案例如今已经遍布零售、制造、电信、金融服务等行业。
随着客户选择模式日趋复杂,社交媒体和移动互联网在企业营销中也产生了重要的影响力,并推动企业营销模式发生变化。此外,大数据与云计算等IT发展趋势也同样驱动商业智能向规模更大、分析维度更精细、与业务模式更贴近的方向发展,这一系列变化也将导致商业智能对基础架构提出了更高的要求。X86服务器、网络存储和数据库等商业智能系统涉及的多个技术层面,都在持续的发展和突破,以适应今天复杂经营环境的变化,并成为商业智能变革的推动力量!