信息架构就是信息数据架构。它体现了在充分的构建和模拟了业务架构的基础上,企业总体架构的信息数据层。首先要鉴别每一个相对独立的信息数据模块,一个业务功能模块中可能有几个相对应的数据信息模块,或者说一个信息数据模块为几个业务功能提供了数据资源。
可以说,企业的运作,从内部讲,完全是依赖企业的信息数据架构。平板中小的模块代表着数据和信息模块,在模块之间的走线代表着数据流或者称为信息流。
1)信息架构信息流
信息架构工作流
2)信息架构数据模型和建立流程
数据模型是管理信息和业务需求的具体技术体现,对数据源分析也具有直接的指导意义。企业目标数据门模型的设计可以从头做起,也可以以行业模型作为设计基础,并结合企业已有的数据来缩短设计时间。
为了在设计初期对整个企业的业务从数据结构上有个清晰的高层的理解,常常会将有共性的数据结合成主题域,如对银行业务的主题域会包括机构、产品、市场、账户、资产、参考数据和交易等。每个主题域下会有不同的数据实体,如交易主题下会有ATM、存款、贷款、支票等。主题域模型用于数据仓库中操作型数据存储区。
(1)数据仓库主题模型(Data Warehouse Bus Model)
在对企业技术仓库进行多维建模时,往往会遇到不同多维应用主题之间共享相同的维度,为了在建模时对多维度数据模型有一个清晰的了解,常常会事先构建一个数据仓库主线模型,数据主线模型会描述事实实体与维度实体的关系。需要注意的是,数据集市由于应用主题比较简单,一般不需要构建该模型。
(2)概念模型(CDM)
概念模型也称信息模型,它是按用户的观点来对数据和信息建模。概念模型不依赖于某一个DBMS支持的数据模型。概念模型可以转换为计算机上某一DBMS支持的特定数据模型。概念模型具有两个特点:①具有较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识;②简单、清晰、易于用户理解,是用户与数据库设计人员之间进行交流的语言。
概念数据模型的表达方式就是E-R(实体-关系图),将确认对象和其间的逻辑关系。将现实的应用抽象为实体与实体之间的联系。CDM的具体对象包括域、数据项、实体、实体属性和继承链等。此时不考虑物理实现的细节,只表示数据库的整体逻辑结构。
(3)物理数据模型(PDM)
物理数据模型则针对某种数据管理系统(DBMS)定义物理层次上的各类数据对象(包括表、域、列、参照、码、索引、视图、扩展性和检查参数等)。主要包括网状模型、层次模型、关系模型等,是按计算机系统的观点对数据建模,主要用于DBMS的实现。物理数据模型用图形的形式表示数据的物理组织,可以生成数据库的创建和修改脚本,定义完整性触发器和约束,生成扩展属性等。
有很多CASE工具也可以用来进行逻辑建模、物理模型,如CA Erwin、Oracle Designer、Oracle Data Warehouse Builder、Sybase PowerDesigner。每种CASE工具的基本功能大致相同,但其扩展功能各不相同。在选择建模工具时,有多种考虑因素,如所选用数据库、是否需要作数据映射等。