过失1:如果您创建了数据仓库,它们的用途自然显现出来了
在构造数据仓库之前,一定不能盲目自信。成功的DW规划必须考虑整个企业的需要并开发出一系列文档说明的需求以引导工程的设计、构造和展示。
过失2:遗漏了体系结构框架
全面的体系结构框架的开发和维护是成功地构建DW的最重要因素之一,框架必须给出构造的蓝图以及不同DW组件的用途。体系结构中必须考虑期望的终端用户数量、数据容量及多样性,数据的更新周期等问题。
过失3:理解用文档对假设进行说明的重要性
DW相关假设和潜在数据冲突必须包含在项目体系结构的框架中,需要尽早地在项目文档中被确定和系统化,以确保在最终产品中反映出来。比如可以加载多少数据,期望数据粒度,多长时间需要对数据进行更新,在那些平台上开发和实现DW等问题。
过失4:没有使用正确的工具
DW设计和构造在很多方面都不同于OLTP应用系统的构造,DW工程需要完全不同的工具:
(1)分析工具:标识数据需求,DW主要数据源以及数据模型的构造,比如CASE工具
(2)开发工具:负责ETL过程,代码生成,集成等
(3)实现工具:收集、处理、清洗、复制和合并仓库中所包含的数据的数据获取工具
(4)交付工具:进行数据转化,数据推导以及向最终的交付平台输出报表,比如查询和报表用的数据词汇表的产生和访问之用的特殊工具。
过失5:滥用生命周期
数据仓库生命周期(DWLC)和传统系统开发生命周期的最大区别在于DWLC永不结束,它是一个持续行为的集合,从对DW需求的最初研究经过数据管理再返回。一般来讲,DW每个阶段完成后,都会根据新的数据需求、增加的客户群和新的数据源开始一个新的阶段。
过失6:忽略了数据冲突问题
要设计出好的DW,不得不进行大量的、非常冗长的分析以及确定企业内可用的最佳数据源。标识数据源系统后,需要解决不同命名习惯,文件格式大小,值范围相关冲突等等,这个解决过程需要与数据所有人协作以对未来可能对源数据进行的计划修改或未计划的修改达成共识。如果没有用充分的时间和资源来解决数据冲突问题,将会延迟构建仓库的开始时间并可能导致危害项目成功的僵局。
过失7:没有从失败中吸取经验教训
最好对以往项目过程的过失和错误做下详细记录
|