数据中心 频道

蔡文海:做好数据规划整合信息资源

  【IT168 资讯】随着信息化的不断进展,IT规划越来越被CIO以及企业管理者们所重视,数据规划作为IT规划的一部分也逐渐的被人们所认可和理解,那么数据规划与管理究竟是怎么一回事,我想在这里可能需要请蔡主任给我们大家做一下入门的介绍吧。

  咱们先说一下IT规划,IT英文是Information Technology的缩写,就是信息技术的意思,大家讲IT规划,从字面意思来理解的话就是信息技术规划,过去大家在企业里做IT规划,业务部门就说那是IT部门的事,业务部门不用参与,这样的话就经常出现业务和IT两层皮的情况,业务做业务的规划,IT做IT的规划。如果把IT规划理解为信息化规划,加上“化”,就有效地把业务和IT结合起来了,我们理解的信息化规划就是用信息技术的手段对信息资源进行开发利用(IT+IR Information resource ),对业务进行管理,这是IT规划的大概意思。

  信息化规划分为三个层次:战略规划、架构规划、项目层面的实施规划,大家知道的最多的是战略规划和项目规划。今天讲的数据规划应该说是属于架构规划的一部分,因为它比较重要,是对企业和政府部门的业务数据的采集、存储、传输和利用的一种规划。

  通俗一点讲,数据规划其实就是要把我们准备放在数据库中的数据先放到数据库中,然后怎么去分类、怎么组织、存储以及使用的一种规划。再通俗一点说,举个例子吧,比如说我们去图书馆或者书店,数据库相当于图书馆或书店,那里的书就可以说是数据或者信息。首先,一个书店想要人喜欢或者经常去,肯定需要有比较全的书,还有你需要知道读者的需求,要知道不同年龄段、不同人群的需求是不同的,要分析不同消费群体对各种图书的需求(就像数据规划要对业务部门调研一样,要知道他们要什么,然后才是采购图书,就类似于数据管理的收集业务数据。然后那书买回来之后要上架吧,上架的话不能堆到那儿就行了,可能一本两本还可以自己去翻,但是一多的话不分类,不管理肯定不行,肯定要对图书进行先分区,再分架,然后进行分类摆放,最后制定图书目录方便检索或者开发网上书店,这是对图书的一种管理。其实数据的规划跟这个差不多,在策略上也是这样子的。

  说到数据管理,规划是出一些文件、方案等结果,数据管理是对数据规划结果的管理。数据规划会出一些标准,有数据元素标准、信息分类编码标准、数据模型标准等。在规划阶段的管理是对规划结果的管理,规划之后,要进行系统建设,因为规划不可能一成不变的,建设阶段可能会有变更,要进行相应的管理,系统建了以后,需要运行,运行就需要对版本升级,也需要管理。

  听了蔡主任的介绍,大家对数据规划有了一定的了解,那么在现在这个信息化时代,信息资源、数据这些概念基本上已为我们所耳熟能详,数据有数据规划,信息资源有信息资源的规划,那么数据规划和信息资源规划这两个概念有什么区别与联系?

  先说信息,现在我们业内把信息作为一种资源,信息资源的说法就是让大家都知道信息就是资源,把这个理念灌输进去,包括国家层面上也出了一些文件,04年的时候中办颁发了一个34号文件,这是关于信息资源开发利用的文件,从那之后才更多的提信息资源规划。现在来看,信息资源规划和数据规划两者有很多东西是相似的,都是对数据的结构化、规范化、标准化等进行规划和管理,从这个意义上来说数据规划和信息资源规划没有多大区别,但是从概念范畴的层次来讲,数据规划要小一些。

  听了蔡主任的讲解,我们大概对数据规划以及它与信息资源规划的区别和联系有了更深的一些了解,我们肯定想知道为什么要进行数据的规划与管理?进行数据规划的究竟有什么价值?蔡主任实践的一些现实案例或者能够给我们一些解答。

  为什么要进行数据规划?其实从意义上来说,缺乏统一标准。数据为什么会混乱呢?因为我们信息化的发展是具有阶段性的,企业的各个部门对信息化需求不一样,使用系统的时间段也不一样,最早是采用财务系统,实现财务的信息化,后来才是人力资源软件系统等。因为阶段不一样,也没有从整体上去考虑这个事情,所以就出现了各自的系统,后来发现就没法整合。提出数据规划,就是从数据层面上进行整合,是一种手段,当然也有从应用层面上讲整合的,数据规划就是迎合这样的需求而产生的,就是要消除信息孤岛,实现数据共享等这些角度去考虑的。

  近些年,我们在数据规划方面的实践,首先要摸清需求,摸清用户和企业、政府的需求,所以我们要对业务的需求进行分析,对业务发生过程中的数据进行分析,对数据进行整理,数据整理完了,从数据库设计中找到数据的本质,这样就要进行系统建模,重点进行数据建模,这样称为主题域,把它组织成一个数据域,最小的单元我们称为数据元素,这样的话我们就会形成数据的模型。

  在实践中,最近的一个案例是中国南方电网,项目名称是南方电网企业信息资源规划项目,这个项目主要成果是建立了数据模型标准,基本数据集标准信息分类与编码的标准等,为数据中心的建设奠定了基础。还有就是一些政府方面的案例,从数据层面进行规划,重点是数据标准化等。

  作为IT规划的一部分,数据规划据我所了解的似乎没有像战略规划、信息系统规划那样被人们所“津津乐道”,不知道蔡主任您怎么看待这样的问题?就是数据规划目前发展情况究竟是怎样的情形?

  刚才是有讲到IT规划或叫信息化规划,信息系统规划和战略规划刚才您也提到了,其实从IT规划角度来说,还有一个值得重视的就是IT架构规划,IT架构规划介于战略规划与系统规划之间,数据规划其实是属于IT架构规划的一部分。为什么要单独提出来做,是因为大家不重视。大家都比较重视应用,一提到系统,都是大家比较熟悉的,用户可以看到的,但是分析到本质的时候实际上更重要的是数据。另外,数据规划之所以被突出出来,因为用户也有数据规划这方面的需求。

  刚才您提到了数据库的概念,一般来讲,人们对数据库级别的数据规划了解的比较多一些,但是对企业级的数据规划了解的少一些,那么企业级的数据规划和数据库级的规划他们两个之间有什么区别?

  数据规划,狭义的来讲也是把最终的数据结果放在数据库里,因为规划的主要结果是建数据模型,而数据模型是建数据库的基础。数据库级的规划,大家最早做软件开发的时候,做信息系统设计的必不可少的两个东西,一个是需求,一个是数据。数据库级的规划大多是基于信息系统规划而提出的,作为信息系统规划的一部分。企业级的数据规划则是站在企业全局的角度,属于IT架构规划的一部分。不过,IT架构规划也只能算是民间说法,正规的应是企业架构(Enterprise Architecture,EA), EA这个方法论包括四部分,有业务架构、数据架构、应用架构、基础架构,后三部分就是刚才提到的IT架构。采用企业架构的方法论就使得业务和IT的关系有了互动,就不会出现我们之前说的IT和业务两层皮的现象。

  讲了这么多,那么数据规划与管理具体该怎么规划我们还不是很清楚,还有就是数据规划在做的过程中是否也存在一些方法论作指导?

  数据规划怎么做,我刚才举南方电网的例子时也说了,采用信息资源规划,还有另一种做法是把它作为标准化建设项目来做,基本上是分三个阶段,首先第一个阶段是业务分析,就是对业务进行分析、收集业务相关的数据,然后进行整理,第二阶段是系统建模阶段,就是数据的标准化建模阶段,把收集的资料归类整理,形成数据模型等,第三个阶段是文档化和固化的阶段,叫方案编制,就是出一些标准的文件,例如南方电网的这个项目就是出了两个标准,一个是数据模型的标准,一个是基本数据集的标准,作为企业文件来发布,要求企业的各个部门去执行,也要求开发商遵照遵守。

  至于方法论美国着名学者詹姆斯﹒马丁提出数据规划的概念,在《战略数据规划》与《信息工程》两本书中都有提到,当时对解决美国的数据处理危机(数据环境的混乱)、消除孤岛等起到了很大作用。所以数据规划方面的方法论不可避免的要遵循马丁的理论如:战略数据规划、信息工程等。

  还有威廉在这方面的贡献是出了一本《数据管理》的书,他强调的是在我们IT信息世界里最小的数据单元是数据元素,他跟门捷列夫的化学元素表的思想很类似,由数据元素构成的基本表类似于化学世界里组成化学元素的分子、原子等。威廉也强调了数据元素的重要性。

  在这方面还有个企业架构的方法论,目前比较流行的有三个,一个是Zachman提出的Zachman框架,这个框架是EA的一派吧,他也强调业务架构、数据架构、应用架构以及技术架构,他把数据架构定位为一个核心。 还有一个是开放组(open group)的架构框架TOGAF,它也跟Zachman框架一样是EA的一个体系,但是它和Zachman的区别是它还有一套单独实施的方法论,这两个方法论可能在企业里应用比较多一些, 在政府方面还有一个的方法论FEAF,就是美国联邦组的FEAF,它也是基于架构的方法论,它主要强调参考模型,有业务的参考模型,数据的参考模型,技术的参考模型,服务的参考模型,还有绩效参考模型。数据规划就是依据这些方法论的来做的。

  刚才蔡主任提到了信息化的基础数据标准,如果企业要做数据的标准化建设的话应该从哪几方面来入手?

  我们现在也有一些项目,用户的需求里也是提出觉得自己的标准比较混乱,数据规划的标准化建设,它更多的也是一个过程,是一个数据标准化的过程,国家有标准化的实施有三个阶段,数据的标准化建设也分为三个阶段,他们第一个阶段叫业务建模阶段,第二个是标准化阶段,相当于刚才说的系统建模阶段,标准化阶段是我们要出什么标准,标准什么样子,第三个阶段是文档化阶段,就是文档规范化阶段,文档的固化阶段。

  数据标准化建设的结果就是刚才说的三个比较重要的标准:信息分类编码,数据元素,数据模型。那么我们的数据元素标准是什么呢?就类似于我们的一个图书的名称、刊号、作者、出版社等,这就是我们的数据元的概念。那我们的编码是什么呢?大家可以理解,性别编码:男、女,性别编码这个不要小看,国家标准的编码是四项:0129未说明性,未知性,现在增加了男编女,女编男等,这就是信息分类的编码。数据模型就是一个架构框架,这个比较复杂一些,就不再展开来说了。

  也有人说数据架构是企业架构的核心,不知道数据架构与数据规划有什么关系?刚才您提到了企业架构的概念,那么从企业架构这个层面来讲的话,数据规划又有什么价值和意义?

  刚才说的企业架构的方法论,其实都有数据,它们都强调数据的重要性,所以EA的方法论中对数据方面的着墨也比较多,它对数据架构强调的也有几个层次,概念层,逻辑层等,越往细处分的话跟我们最终用户所需要的更适应一些。数据规划刚才也说了其实就是企业架构的一部分,为什么单独提出来说呢,就是它比较重要,让大家重视。在企业架构方面,最近比较热门的有数据规划、信息资源规划、架构规划等,我们比较一下这几个概念,数据规划>信息资源规划>架构规划。信息资源规划没有包括怎么样用技术的手段,例如网络、交换机、服务器怎么建设等,架构规划有一块是技术架构,专门讲怎么样用技术架构去为业务架构、数据架构等服务,在这个层面提的比较多一些。

  听您讲了数据规划和架构等内容,觉得您的知识面非常广泛和丰富,那么,就北达软信息化咨询与培训中心来说,在信息化这个领域主要是涉及哪方面的业务?

  就北达软来说,我们的团队在信息化领域从事相关的IT规划工作多年,形成了自己的一套方法论集合,叫PBORS方法论。

  PBORS简单说一下, P是Planing,主要是规划,我们可以做电子政务规划,企业规划,都是跟IT相关的规划。企业规划包括企业架构规划,IT架构规划,战略规划,还有信息系统规划、数据规划等都属于这个层面的,北达软在这些方面关注的多一些。其实我们知道,企业信息化建设中,IT规划是龙头,它是最开始的一部分,我们知道信息化有一个生命周期的特征,有规划、有项目建设,有运维等。规划完了,就形成一个项目,就是项目建设,项目建设有项目管理的一些方法。然后是运维,在运维体系有ITIL,ISO20000等体系,后面两个领域我们也跟相应的服务提供商进行合作。这里B是Building是项目建设,O是 Operation,是运维,R 是Resources,是信息资源管理,现在国家也比较重视,我们算是与时俱进吧,从国家的层面比较强调信息资源管理,我们把数据规划与管理纳入信息资源管理进来,它包括数据的管理、知识的管理、信息资源的管理等。在这个层面上我们其实也有自己的一套方法,包括刚提到的元数据的管理等。S是Security,是安全,因为整个信息化建设,现在大家对安全问题越来越重视,前不久出了一个信息泄露的安全方面的问题,都是对信息的保密重视程度不够。在信息安全方面,有ISO2700标准体系和国家登记保护等,我们也在跟相关的IT服务提供商进行合作。我们之所搭成这种架子,是因为我们想以规划为龙头,搭成一个信息化全程的业务服务,当然这个不是一下子能做的,但是我们基本上正朝这个目标去做。

0
相关文章