|
一、数据仓库选型 平台选型主要考虑了以下几点:
1.供应商的既往成功经验以及产品的成熟度
2.供应商的售后服务和技术支持能力
3.供应商的资源调配能力
4.衡量数据库性能的主要指标TPC-D。主要有3方面的数据需要考虑: 1) QppD:描述系统的查询处理能力。(数据越大越好) 2) QthD:即流量测试结果,描述系统在多个用户同时进行查询时的处理能力。换言之,它也充分代表了系统的并行处理能力。(数据越大越好) 3) QphD:即价格性能比。(数据越小越好)
5.系统的并行处理能力
6.系统管理的复杂度
7.系统的可用性和可靠性
8.系统的扩展性
9. 数据仓库是多种数据源数据集中后的数据集合,必须能够将来自多个数据源的数据的浏览和分析集成一体
10. 安全性。
11. 新建的数据仓库体系与现有信息框架总体规划的结合
12. 开放性
二、体系结构
数据仓库的方法学,数据仓库体系架构可以分为五个层次。这五个层次反映了应用运行的基本逻辑结构和过程。每层都具有自己的技术实现方式及相应的评价准则。这五个应用层次是:
设计建模层:该层次是整个分析应用系统的起点,主要完成对现有业务系统数据源的分析,按照数据仓库建模理论完成数据仓库结构设计。
数据获取层:确定项目实施所需的数据清洗工具,定义出数据从原业务系统到数据仓库系统的ETL技术方案,最终完成数据清洗、转换、加载的工作
数据存储层:通过对数据仓库数据量的估计,和客户访问数的估计对数据仓库主平台所需的软件和硬件作出评估,确定主平台的系统配置情况。
数据展现层:主要根据客户需求选定前端数据展现的软件,同时根据客户需求决定数据展现方式,进行数据展现的开发。
元数据管理层:主要完成对整个数据仓库实施中的元数据进行管理的功能,包括:逻辑到物理模型的映射、数据访问的授权、用户安全控制等等。
|