![]() |
|
|||||
|
|
||||||
|
||||||
| 您现在的位置: 中国商业智能网 >> 专家 >> 齐红胤 >> 文章正文 |
|
|||||
| 浅析ETL过程的四步 | |||||
| 作者:佚名 文章来源:本站原创 点击数: 更新时间:2007-4-11 | |||||
|
What are the four basic Data Flow steps of an ETL process? 在ETL过程中四个基本的过程分别是什么? 答: Kimball数据仓库构建方法中,ETL的过程和传统的实现方法有一些不同,主要分为四个阶段,分别是抽取(extract)、清洗(clean)、一致性处理(comform)和交付(delivery),简称为ECCD。 1.抽取阶段的主要任务是: 读取源系统的数据模型。 连接并访问源系统的数据。 变化数据捕获。 抽取数据到数据准备区。 2.清洗阶段的主要任务是: 清洗并增补列的属性。 清洗并增补数据结构。 清洗并增补数据规则。 增补复杂的业务规则。 建立元数据库描述数据质量。 将清洗后的数据保存到数据准备区。 3.一致性处理阶段的主要任务是: 一致性处理业务标签,即维度表中的描述属性。 一致性处理业务度量及性能指标,通常是事实表中的事实。 去除重复数据。 国际化处理。 将一致性处理后的数据保存到数据准备区。 4.交付阶段的主要任务是: 加载星型的和经过雪花处理的维度表数据。 产生日期维度。 加载退化维度。 加载子维度。 加载1、2、3型的缓慢变化维度。 处理迟到的维度和迟到的事实。 加载多值维度。 加载有复杂层级结构的维度。 加载文本事实到维度表。 处理事实表的代理键。 加载三个基本类型的事实表数据。 加载和更新聚集。 将处理好的数据加载到数据仓库。 从这个任务列表中可以看出,ETL的过程和数据仓库建模的过程结合的非常紧密。换句话说,ETL系统的设计应该和目标表的设计同时开始。通常来说,数据仓库架构师和ETL系统设计师是同一个人。 |
|||||
| 文章录入:admin 责任编辑:admin | |||||
| 【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口】 | |||||
| ChinaBI版权、投稿与免责申明: |
| 1)凡本网署名文字、图片和音视频稿件,版权均属中国商业智能网所有。任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国商业智能网”,违者本网将依法追究责任。 2)本网注明“采编自”的文章均为转载稿,本网转载出于传递更多信息之目的。如本网转载稿涉及版权等问题,请作者速来电或来函与本网联系。 |
| 最新热点 | 最新推荐 | 相关文章 | ||
| 下一代数据仓库架构--DW2.0 定义事实表的粒度 EDW的几个缺点 如何规划数据仓库的架构 浅析查找ETL系统瓶颈 浅析一致性维度 浅析多值维度 齐红胤 简介 |
网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!) |
| | 关于我们 | 设为首页 | 加入收藏 | 广告服务 | 友情链接 | 版权申明 | |
|
版权所有 中国商业智能网 北京比艾科技有限公司 |