·设为首页
·加入收藏
·在线支付
 | 网站首页 | 资讯 | CIO | 案例 | 培训 | 专家 | 咨询 | 商城 | 下载 | 论坛 | 博客 | 
您现在的位置: 中国商业智能网 >> CIO >> BI知识 >> 文章正文 用户登录 新用户注册
数据仓库项目管理面试题十一           ★★★ 【字体:
数据仓库项目管理面试题(十一)
作者:Jerome    文章来源:本站原创    点击数:    更新时间:2008-1-31

数据质量

1.一个数据质量分析师正在试图分析一个数据仓库之中数据的质量状况。这个数据仓库的数据量非常的大,数据质量分析师准备用抽样的方式进行分析。但是他不知道需要抽样多少数据,如何抽样,以及如何向用户解释抽样分析的结果是准确的。这位数据质量分析师应该如何来进行工作呢?

2.一个电信公司有一个含有14TB数据的数据仓库。这家公司估计到,该数据中有10TB以上的数据可能是冗余的。这家公司没有命名约束,其中只有20%的数据有相关的元数据。面对这种局面,这家公司应该如何来识别和消灭冗余数据呢?

3.企业管理层没有意识到业务系统中数据是多么的脏乱。这些数据中存在冗余、记录不完备、默认值不正确、有不符合规则的数据存在、参照完整性缺乏等问题。随着数据仓库团队工作的逐步进展,来在项目团队和用户的意见已明确显示出,数据的质量已经不足以让项目继续下去。净化数据需要大量的时间,而这些时间在项目时间表中没有安排。面对这种局面,项目经理应该如何来处理?

4.企业数据仓库的数据质量非常差,净化的过程将是高代价的。管理层没有意识到数据质量的问题,这些业务系统表面上看工作的很好。此外,管理层不愿意花费金钱和资源纠正非常脏乱的数据。面对这种局面,数据仓库团队应该采取什么样的对策来让管理层相信需要净化他们的数据呢?

5.一名没有经验的数据仓库设计师坚决主张,只有100%正确的数据才能进入数据仓库。他开发了一个复杂的临时存储区,用来存储、检查、改正和重新处理错误的源数据。这个临时存储区很快变得非常巨大。由于太多的数据被拒绝进入数据仓库,大部分都是微不足道的错误,业务用户对数据仓库的信任度正在迅速下降。面对这种局面,项目经理应该采取什么样的对策?

6.一家企业的数据仓库系统已经开发完毕,也使用正式数据进行了详细的测试。但是正式上线几个月后,却发现出现了问题,经查实,是从源系统提取数据的FTP脚本出了问题。这个脚本会随机的出现故障,而ETL程序也没有确定出正在处理的数据只是部分数据集。现在数据仓库和源系统已经严重不同步。这个数据仓库团队应该如何才能使数据仓库回到正确的轨道上来呢?

7.一家企业的数据仓库根据源系统记录中的“最后更新”时间戳来从源系统中提取数据。脚本运行了几个月后,运行时间严重超常。经查实,问题出在一个源系统上。一名开发人员正在这个源系统上定期大规模修改数据,以便修改一个还没有在应用代码中得到纠正的错误。这名开发人员大规模修改一次,“最后更新”时间戳就会被全部更新,数据仓库迁移脚本就会一夜之间处理完全部的数据。这个问题应该如何来解决呢?

作者blog: www.chinabi.net/blog/user1/lastwood/index.html

文章录入:admin    责任编辑:admin 
  • 上一篇文章:

  • 下一篇文章: 没有了
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    ChinaBI版权、投稿与免责申明:
    1)凡本网署名文字、图片和音视频稿件,版权均属中国商业智能网所有。任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明稿件来源:中国商业智能网,违者本网将依法追究责任。
    2)本网注明“采编自”的文章均为转载稿,本网转载出于传递更多信息之目的。如本网转载稿涉及版权等问题,请作者速来电或来函与本网联系。
    最新热点 最新推荐 相关文章
    数据仓库项目管理面试题(十…
    中国银行财务系统SAP维护
    进出口银行新财务管理系统
    CRM如何在家电服务业取得应用
    上海天律信息技术有限公司
    BlueQuery高速比对数据功能
    管理仪表板和记分卡
    解析商业智能失败的根源
    挖掘Web日志的数据仓库系统
    烟草企业绩效考核中的问题
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)