数据集市是附属于DW2.0环境的。DW2.0环境中的最终用户最直接访问的地方就是数据集市。
有两种基本类型的数据集市,分别是自发数据集市(spontaneous data marts)和持久数据集市(permanent data marts)。
自发数据集市是为了一时的目的而建立的,它可能会转化为持久数据集市,也可能不转化为持久数据集市。持久数据集市通常是为了长期跟踪KPI(key performance indicators)而建立的。
数据集市的数据来源是DW2.0,任何其他的数据来源都是不允许的。DW2.0中的任何一部分都可以作为数据集市的数据来源。
对于持久数据集市来说,通常是定位在企业中某个部门的。典型的部门数据集市包括财务、会计、销售、市场等等。每一个部门都可能有一个或者多个数据集市。
自发数据集市没有这样的定位,它可能定位于任何需要。
不论那种情况建立的数据集市,都对数据有一致性的需求。
数据集市的设计基础是多维技术。多维技术的核心是星型连接、事实表和维度表。
星型结构适合于所有的数据集市,不同的数据集市的星型结构是不同的。
大多数情况下,数据集市中保存的都是企业的KPI。
进入自发数据集市的数据主要是一些零星的数据,而进入持久数据集市的数据主要是有规律的数据。这些有规律的数据进入持久数据集市时,可以不改变数据集市的基础结构而更新其中的数据。也就是说,持久数据集市是可以增量更新的。
数据集市的使用者主要是农场主(farmer)。
设计数据集市时要综合考虑企业数据模型和业务过程处理模型。
当数据集市建立好以后,就不容易对它进行修改。
(还需要补充说明一下,这里说的数据集市是Inmon的数据集市,和Kimball的数据集市在概念和内容上有很大的不同。)
本日志来源于Inmon的网站。 |