|
| |
挖掘工具之-IBM Intelligent Miner [Nirvana2000 发表于 2006-10-8 15:36:00] | |
| 一 、IM基本介绍
1.基本内容: 一个挖掘项目可有多个发掘库组成 每个发掘库包含多个对象和函数 对象: 数据:由函数使用的输入数据的名称和位置。 离散化:将记录分至明显可识别的组中的分发操作。 名称映射:映射至类别字段名的值的规范。 结果:由函数创建的结果的名称和位置。 分类:在一个项目的不同类别之间的关联层次或点阵。 值映射:映射至其它值的规范。 函数: 发掘:单个发掘函数的参数。 预处理:单个预处理函数的参数。 序列:可以在指定序列中启动的几个函数的规范。 统计:单个统计函数的参数。 2.选项设置:
二、 挖掘案例:(客户细分)
1. 商业需求: 客户细分 2. 数据理解(略): 根据用户基本信息(实际上还包括客户消费行为,人口统计信息等,本示例为简单起见,只在这个表的数据基础上进行挖掘)进行客户细分 3. 数据准备(略): 4. 建模: 选择挖掘模型(比如是分群,还是分类) 确定模型输入,需要做的处理,结果分析? 选择模型输入字段: 挖掘模型选择: 神经分群发掘函数使用了一个 Kohonen 特征映射神经网络。Kohonen 特征映射使用一个称作自组织的进程来将相似的输入记录组合在一起。您可以指定群集的数目和遍数。这些参数控制进程时间和将数据记录分配到群集时使用的粒度程度。分群的主任务是为每个群集查找中心。此中心也称为称为原型。对于每个在输入数据中的每个记录,神经分群发掘函数计算和记录计分最近的群集原型。 每个数据记录的计分是用到群集原型的欧几里得距离表示的。计分越靠近 0,与群集原型的相似性程度就越高。计分越高,记录与群集原型就越不相似。输入数据的每个遍历,中心被调整来达到更好的整个分群模型质量。在发掘函数运行时,进度指示器显示每次遍历的质量改进状况。
三、 IM操作步骤 挖掘具体操作步骤[以客户细分为例]:
详细内容见附件: UploadFiles/2006-10/108300318.rar
| |
|
|

<TTNN杂志列表> <Blog文章导航> <BI资源列表> |