![]() |
|
|||||
|
|
||||||
|
||||||
| 您现在的位置: 中国商业智能网 >> CIO >> BI知识 >> 文章正文 |
|
|||||
| SPSS Clementine 数据挖掘 Step( 1 ) | |||||
| 作者:cheney s… 文章来源:http://esestt.cnblogs.com 点击数: 更新时间:2007-7-11 | |||||
|
SPSS Clementine是Spss公司收购ISL获得的数据挖掘工具。在Gartner的客户数据挖掘工具评估中,仅有两家厂商被列为领导者:SAS和SPSS。SAS获得了最高ability to execute评分,代表着SAS在市场执行、推广、认知方面有最佳表现;而SPSS获得了最高的completeness of vision,表明SPSS在技术创新方面遥遥领先。
SPSS Clementine(在此简称clementine)在安装好后会自动启用服务,在服务端clementine没有复杂的管理工具,一般的数据挖掘人员通过客户端完成所有工作。下面就是clementine客户端的界面。
顾名思义,是对项目的管理,提供了两种视图。其中CRISP-DM (Cross Industry Standard Process for Data Mining,数据挖掘跨行业标准流程)是由SPSS、DaimlerChrysler(戴姆勒克莱斯勒,汽车公司)、NCR(就是那个拥有Teradata的公司)共同提出的。Clementine里通过组织CRISP-DM的六个步骤完成项目。
工具栏总包括了ETL、数据分析、挖掘模型工具,工具可以加入到数据流设计区中,跟SSIS中的数据流非常相似。Clementine中有6类工具。 源工具(Sources) 相当SSIS数据流中的源组件啦,clementine支持的数据源有数据库、平面文件、Excel、维度数据、SAS数据、用户输入等。 记录操作(Record Ops)和字段操作(Field Ops) 相当于SSIS数据流的转换组件,Record Ops是对数据行转换,Field Ops是对列转换,有些类型SSIS的异步输出转换和同步输出转换(关于SSIS异步和同步输出的概念,详见拙作:http://www.cnblogs.com/esestt/archive/2007/06/03/769411.html)。 图形(Graphs) 用于数据可视化分析。 输出(Output) Clementine的输出不仅仅是ETL过程中的load过程,它的输出包括了对数据的统计分析报告输出。
Clementine中包括了丰富的数据挖掘模型。
这个没什么好说的,看图就知道了,有向的箭头指明了数据的流向。Clementine项目中可以有多个数据流设计区,就像在PhotoShop中可以同时开启多个设计图一样。 比如说,我这里有两个数据流:Stream1和Stream2。通过在管理区的Streams栏中点击切换不同的数量流。 管理区
管理区包括Streams、Outputs、Models三栏。Streams上面已经说过了,是管理数据流的。 Outputs 不要跟工具栏中的输出搞混,这里的Outputs是图形、输出这类工具产生的分析结果。例如,下面的数据源连接到矩阵、数据审查、直方图工具,在执行数据流后,这个工具产生了三个输出。在管理区的Outputs栏中双击这些输出,可看到输出的图形或报表。
经过训练的模型会出现在这一栏中,这就像是真表(Truth Table)的概念那样,训练过的模型可以加入的数据流中用于预测和打分。另外,模型还可以到处为支持PMML协议的XML文件,但是PMML没有给定所有模型的规范,很多厂商都在PMML的基础上对模型内容进行了扩展,这里到处的模型是否能在其他工具上使用还未知。 |
|||||
| 文章录入:admin 责任编辑:admin | |||||
| 【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口】 | |||||
| {$MY_hd_google728} |
| ChinaBI版权、投稿与免责申明: |
| 1)凡本网署名文字、图片和音视频稿件,版权均属中国商业智能网所有。任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国商业智能网”,违者本网将依法追究责任。 2)本网注明“采编自”的文章均为转载稿,本网转载出于传递更多信息之目的。如本网转载稿涉及版权等问题,请作者速来电或来函与本网联系。 |
| 最新热点 | 最新推荐 | 相关文章 | ||
| 利用SOA简化集成BI 某港口贸易领域企业BI招标 建立企业信息的单一视图(一… 浅析数据仓库架构 大型复杂工程的项目管理——… 大型公共工程的项目管理——… ADM汉端系统级产品 ADM汉端工具级产品(二) ADM汉端工具级产品(一) 北京汉端科技有限公司 |
网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!) |
| | 关于我们 | 设为首页 | 加入收藏 | 广告服务 | 友情链接 | 版权申明 | |
|
版权所有 中国商业智能网 北京比艾科技有限公司 |