周五交完一个长达30页的项目报告,长长地舒了一口气。
从项目开始到现在刚好五个星期,比起去年夏天做的第一个项目短了七个星期,不能不说是有很大的进步,经验就是这么积累下来的。
下星期开始马不停蹄又要开始重建去年那项目的模型,主要原因是上次说的MOSAIC码MISMATCH的问题。牵一发而动全身,之前的所有与此相关的分析都要推倒重来,数据质量问题的严重性由此可见一斑。
我不是做数据仓库的,所以这种问题我没时间精力更没能力去管。我所能做的,就是发现问题后报告。
问题是这样的方法会对自己很不利,我不想浪费时间在无谓的的分析上然后又推倒重来。
除非……我跟导师和主管商量下把研究重心稍微转一下,把data warehousing也作为研究的一部分。考虑中。