数据中心 频道

冲破神秘 图文细说Google数据中心

  【IT168 数据中心频道】 2010年7月20日,Google能源部向NextEra能源公司购买1.14亿瓦的风力电能,以供部分数据中心在未来20年使用。NextEra已从7月30日开始向Google供电。

Google数据中心分布图
  Google数据中心一直是业界中令人着迷的“对象”之一。那么Google到底有多少数据中心?它们分布在什么地方?伯乐在线-职场博客的这篇文章整理收集一些有趣信息,以供分享和参考。

  Google数据中心分布图

  Google 搜索速度为什么能这么快?这主要因为Google在全球分布着众多的数据中心。根据现有信息,如果包括在建的数据中心,Google共有36个数据中心。其中美国有19个、欧洲12个、俄罗斯1个、南美1个和亚洲3个(北京-Google.cn、香港-Google.com.hk和东京各1个)。不过,Google也并非完全独享这些数据中心,他们也向其他公司出租空间。
 

Google数据中心分布图

    图1:Google数据中心-全球

  

Google数据中心分布图

  图 2:Google数据中心-北美

  

Google数据中心分布图

  图3:Google数据中心-欧洲

  Google的第一个“数据中心”

  

Google数据中心分布图

  图4:Google的第一个“数据中心”--BackRub

  Google 的首个“数据中心”是在佩恩的宿舍楼。一句话概括:麻雀虽小,五脏俱全。详细配置请看文末《成名之前的Google:斯坦福大学期间的Backrub原貌》

  数据中心的服务器

  大部分公司都是向Dell、HP、IBM和SUN厂商直接购买服务器。购买服务器需要一大笔费用,如果 Google的服务器均从其他公司购买,估计Google也无法有今天。时至今日,Google的所有服务器均为自己一手打造。Google服务器厚度 3.5寸,2U(两机柜式),它有2个CPU、2个硬盘,采用技嘉主板,有8个内存插槽。Google采用AMD与英特尔的x86处理器。在同样大的空间 内,Google的服务器比其他厂商的服务器能容纳更多的CPU。  

数据中心的服务器

  图5-1:Google服务器  

数据中心的服务器

  图5-2:“世纪互联”机房中谷歌的一组服务器(DELL Precision 390 工作站)

  数据中心以集装箱为单位,每个集装箱里面有1160台服务器,每个数据 中心有众多集装箱。

  数据中心的核心技术

  Google一直都钟情于开源软件,也一直支持开源技术 (Google对手之一的Facebook也同样重视开源技术)。Google服务器使用的是Linux操作系统。Google的工程师按照平行计算的要 求对Linux进行了优化。Google开发自有核心软件,开发语言是Java和C++。

  Google的三大核心元素:

  Google 文件系统(GFS);(GFS负责服务器数据储存工作)

  Google大表;Bigtable:是Google一种对于半结构化数据进行 分布存储与访问的接口或服务);由于Google的文件系统异常庞大,以至于甲骨文和IBM公司的商业数据库在方面无用武之地。另外,商业数据库都是按 CPU数量来收费,如果Google使用商业数据库,可想而知,这是一笔天文数字。所以,Google量体裁衣地设计了符合自身的大表。

  Mapreduce 算法;它是Google开发的C++编程工具,用于大于1TB数据的大规模数据集并行运算。MapReduce能够找出一个词语在Google搜索目录中 出现的次数;一系列网页中特定词语出现的频率;链接到某个特定网站的所有网站数量等。

  虽然Google依靠许多开源项目实现了企业的腾飞,但Google始终对这三大核心元素保密。

  数据中心的专利

  服务器内置电池。 每台服务器都有一颗12伏特电,确保万一主断源断电时还可持续供电。最终目的,节约成本。

  可移动的数据中心集装箱。2008年10月获得该项专利,每个集装箱中最多可容纳1160台服务器。

  数据中心的开销

  根据Google的盈利报告,2006年Google在数据中心上的开销是19亿美元,2007年是24 亿,2008年23.6亿,2009年8亿9百万,2010年上半年已开销7亿1千5百万。  

数据中心的核心技术

  图7:Google数据中心“烧钱”曲线图

  数据中心的选址标准

  大量的廉价电力;

  绿色能源,更注重可再生能源;

  靠近河流或湖泊;(设备冷却需要大量水源)

  用地广阔;(隐秘性和安全性)

  和其他数据中心的距离;(数据中心之间的快速链接)

  税收优惠。  

Google的特殊数据中心—圣吉兰数据中心

  图8:Google的服务器(左)Google俄勒冈州Dalles数据中心(中)Google 服务器机柜特写(右)

  Google的特殊数据中心——圣吉兰数据中心

  Google在比利时的圣吉兰(Saint Ghislain)数据中心(图3中编号26)根本没有冷却装置,完全依靠纯自然冷却(即:用数据中心外面的新鲜空气来支持冷却系统)。一般来说,绝大部分数据中心都是采用水冷却装置。(这也就是为什么数据中心选址时要考虑水源。)  

Google的特殊数据中心—圣吉兰数据中心

  图9:Google比利时数据中心  

Google的特殊数据中心—圣吉兰数据中心

  图10:比利时国王(左五)参观Google比利时数据中心

  Google的Dalles(达尔斯)数据中心

  Dalles数据中心(图2中编号8)位于俄勒冈州的波特兰以东约80英里,旁边是哥伦比亚河,河上有座大坝——Dalles大坝,大坝为数据中心提供便宜的电力。数据中心有2座4层楼高的冷却塔。(注:“Dalles”不是“Dallas”,Dallas达拉斯在德州。)  

Google的Dalles(达尔斯)数据中心

  图11:Dalles数据中心鸟瞰图

  以下这段话来自Nicholasg Carr,他曾经在2009年访问Dalles数据中。蓝色部分是关关的注释。

  Dalles数据中心有3个超大机房(在图11中有4个白色建筑,但只有3个是服务器机房),每个机房有45个集装箱,每个集装箱可以放置1160台服务器,故Dalles数据中心可以存放约15万台服务器。

  Google的秘密

  Google在其数据中心的位置和数量方面的保密工作做得很好。比如说:如果你反查Google各种爬虫或者是Google各个域名的IP地址,所得结果几乎看起来都是加州山景城的IP地址。因此,想通过反查IP地址,基本无法推断出其数据中心的真正位置和真正数量。

  此外,Google通常把其数据中心“伪装”成有限责任公司, 表明上看起来和Google毫无瓜葛。比如:北卡罗来纳州Lapis公司和爱荷华州的Tetra公司。

  既然Google在其数据中心方面的保密工作做得很出色,所以本文的信息未必是百分百正确。

  其他相关旧闻

  2008年1月28日有报道称,Google将在TW建立一数据中心。TW经济负责人陈瑞隆已确认此消息,并且表示已在TW西部彰化的彰滨工业区内为Google预算了一块地。TW还将向 Google提供各种优待,包括土地税折扣、保证电力供应稳定在内。不过至今一直没有听到这个数据中心在台的任何动静。

  在陈瑞隆确认消息 后的第二天,马来西亚总理也宣布,Google有意在马来西亚建立数据中心。

  另据报道,Google有意在东欧的立陶宛新建数据中心。

  另外,Google曾于2007年在南卡罗来纳州的布利西伍德购买466英亩(1英亩约合4000平方米)土地,似乎是打算建立南卡的第二个数据中心。

  成名之前的Google:斯坦福大学期间的Backrub原貌 从1998年开始,Google一步一步地成长为互联网的巨人之一。

Google Logo

  现在,Google有了自己的数据中心,全球分布有36个数据中心,服务器总量外界不清楚。据猜测,应远远不止20万台,并且每天都在增长。依Google现在的超大规模,令人不禁想看看当初的Google在斯坦福大学时是什么样的。

  回到1998年初,Google的搜索引擎和网站是运行在如下设备的。

Google最初的硬件设备

  (我有个疑问:上面哪个才是他们DIY的硬盘扩展箱呢?)

  Google平台原貌 -- Backrub

  Google的最初平台被称为“Backrub”,是用Java和Python编写的,运行在如下硬件上:

  Sun Ultra II: 200MHz Dual;内存256MB。 这就是当时Backrub系统的主干设备。

  服务器:奔2 300MHz Dual x2; 内存512MB;硬盘9Gx9。 主搜索运行在此设备上。(Intel捐赠)

  F50 IBM RS/6000:4核;内存512MB;硬盘9Gx8。(IBM捐赠)

  Backrub最初的储存设备的是2个独立的机箱:9Gx3的硬盘箱和4Gx6的硬盘箱。这些硬盘是附加在Sun Ultra II上的。

  IBM的硬盘扩展箱,已配备8个9G的硬盘。(IBM捐赠)

  DIY的硬盘扩展箱,可以装10个9G的SCSI硬盘。

  Backrub首次使用Google的Logo

  在1997年,Backrub网站上有这样的一段自我描述的话。(比较有意思的是,他们遇到了网络故障,详情看下面的蓝色文字。)

  Backrub是“网络爬虫”,用来扫描互联网的。

  我们目前正努力提高网络搜索引擎的技术。我们会尽快提供多种相关服务的。

  “抱歉,由于遇到无法控制的网络问题,故诸多服务暂停使用。我们正努力解决这一问题,相信很快就能解决。1997年12月4日。”

  Backrub的Logo是什么样的?请看下图:

Backrub Logo

  (看到这个Logo,让我不禁想起《大话西游》中,紫霞说的一句话:“谁的手?”我也有这疑问,这是谁的手,是佩奇的么?还是布林的?)

Google first logo

  (上图是1997年Google Logo的第一次露面。一年后,Google正式上线。)

0
相关文章