载入中…
公告栏:
切换到留言本方式 精华留言
查看所有留言 签写新的留言
留言模式:游客模式  查看模式:讨论区方式  发表模式:审核发表   有10条待审核
主题::在微软BI平台如何处理缺失数据与异常点数据 :2009/9/14 16:26:47


用户
xjm314

对于工厂里的控制数据常常出现数据丢失或是异常数据如下为一个设备的用电量:

日期                        电表读数 

2009- 1-1                 112

2009 -1-2                 122

2009-1-3                   133

2009-1-4                  143

2009-1-6                   165

2009-1-7                   176

2009-1-8                    112345

2009-1-9                    1953455

2009-1-10                   205

2009-1-11                  216

对于如上的数据显然 2009-1-5 的数据丢失了要填补,而2009-1-8的数据是异常点必须清除,我查了一下相关资料: 众数归因法、回归归因法、多重归因法等可以对连续性变量用样本进行填补,异常点检测的统计量有库克距离统计量(cookd)、删除学生化残差SRE(i)等。一般来说, 当cookd>50%或|SRE(i)|〉3则可以认为第i个观测值为异常点

可是在SQLSERVER 2005 中又如何处理呢,ETL可以处理吗,数据挖掘中是否有这些功能,又如何实现这种数据清洗呢?

 望赐教,不胜感激!

http:// xjm314@sina.com  返回列表
1 条贴子  首页 上一页 下一页 尾页 页次:1/1页  6条贴子/页 转到:
回 复 留 言
姓  名: *
性  别:
E-mail :
 Oicq :
 Icq :
 Msn :
个人主页:
留言主题: *
现在心情:

留言内容:
小提示:换行请按Shift+Enter,另起一段请按Enter
是否隐藏: 正常 隐藏 * 选择隐藏后,此留言只有管理员和留言者才可以看到。
  验证码:      *
留言搜索:
         
关于我们   |   设为首页   |   加入收藏   |   广告服务   |   友情链接   |   版权声明 
网站合作、内容监督、商务咨询、投诉建议 电话:0512-62861389  邮箱:chianbi@126.com
Copyright 2004-2014 中国商业智能网版权所有   |    苏 ICP 备 13004727 号