打印本文 打印本文  关闭窗口 关闭窗口  
十个原因你应该用DataStage 8.5
作者:汤洪清  文章来源:本站原创  点击数  更新时间:2011/4/11 8:31:14  文章录入:admin  责任编辑:kino

你应该升级到DataStage 8.5的十个原因

DataStage 8.5版已经发布让客户升级。这里有十大理由你应该把你的DataStage升级到8.5版本。

这里列举了DataStage 8.5版中的十个最好的特性。这些特性中的大部分是关于DataStage 并行工作的改进,另外几个是有关帮助服务器工作的客户。

1.       DataStage 8.5速度更快。

快了,更快了。DataStage 8.5中许多工作比8.1版快至少40%。诸如启动DataStage, 开启一个工作,运行一个并行工作(Parallel job),并且在执行时间上的表现均有所提高。

2.       DataStage 8.5现在是一种XMLETL工具

DataStage以前的版本在处理XML时表现平平,DataStage 8.5是一个优秀的XML处理工具。它能展开,理解和存储XML架构文件。                                                                                 

新的XML读与转换步骤在读较大的和复杂的XML文件,和将它们并行处理上更好。

3.       循环转换

DataStage 8.5并行转换器是目前最好的转换器。这要感谢它在转换和在一组记录中执行转换时新的循环功能。

转换中的循环让你可以在每一个输入行处理时有多行输出。在本例中,一个记录有一个公司名称和四个地区的四个销售收入数字 ― ―个循环要经过每一列,会给每个地区输出一行。也就是说一行的输入可产生四行的输出.

4.       转换的记忆功能

DataStage 8.5 的转换有记忆和对键(Key)变化的探测功能。多年来,ETL专家们用一些众所周知的变通方法通过手工编码为DataStage实现同样的功能。在一个DataStage的工作中,一个键的变化包括了拥有同一键的多项纪录,我们要将这些纪录作为一个数组来处理.

在一个转换中有两个新的缓存 ― SaveInputRecord()GetSavedInputRecord(),你可以保存一条记录并在以后取出,用来比较两个或更多的转换器中的记录。

针对循环和键变化探测有新的系统变量 ― @ITERATION, LastRow()显示同样键中的最后一行,LastTwoInGroup(InputColumn)显示一个指定列的值是否在下一纪录有变化.

下面是一个计算合计的例子,这里根据键的变化, 循环处理每个行并计算每个键的合计.

5.       容易安装

易于安装,运行更稳定。DataStage 8.5是在所有的DataStage版本中最好安装的。8.5版有最好的向导,最好的安装前检查和最好的恢复程序。它还有在信息服务器上的IBM支持助手补丁,使排除故障和将PMR的报告传送给IBM更容易。也有一个升级到InfoSphere信息服务信息8.5指导, 解释如何从最早期的版本生级到现有的版本。

新的安装程序在安装时能融合补丁和修复项,让补丁和修复更易于管理。

6.       检入检出工作(Jobs

检入和检出的版本控制。DataStage 8.5管理程序,借助Eclipse工作区,带有直接利用CVSRational ClearCase源程序控制的功能。你能从源程序控指系统外传送到源控制系统内并且替换DataStage组件.

DataStage 8.5带有将CVS Rational ClearCase整合进来的菜单箱。客户要想利用其它源控制系统,则需要安装Eclipse源控制插件。

7.       较以前有更好的可用性

1)     高可用性 ― 8.5版安装指南有三十多页针对信息服务器的拓朴结构,包括所有产品层的一系列高可用性情景。此外, 还有关于元数储存库,服务层和DataStage引擎高可用性的新章节。

2)     水平与垂直的可伸缩和负载平衡

3)     WebSphere 系统处理机的支持。

4)     XMETA储存库的群支持:DB2 HADR/Cluster Oracle RAC.

5)     提高了引擎的故障恢复能力

 

8.       新的信息架构图表工具

InfoSphere 蓝图指导 - DataStage 8.5提供一个免费的新产品,可以用来生成信息架构的图表并将图表中的元素直接链接到DataStage 的工作(jobs)中以及元数据工作平台(Metadata Workbench)的元数据上。方案设计师可以画出一个数据整合图表,包括数据源, 数据仓库以及软件库。

9.       垂直枢轴

许多人为有垂直枢轴(Vertical Pivot)已经争取了很长时间!现在终于有了。垂直枢轴可以把拥有共同键的多行输入枢轴成多项输出并有多列的行。这一功能提供了键位基础的的组合, 列枢轴和合计的功能。

你也可以在新的转换中用列变化探测和行的缓存做一个这样的垂直枢轴 ― 但是垂直枢轴功能让它变得很简单。

10.     Z/OS文件功能

为大型主机提供本地支持,让处理复杂的平面文件更简单。可以用在VSAM文件上――KSDS, ESDS, RRDS. 顺序的QSAM, BDAM, BSAM.  固定的和变长度的记录。单一或多记录的文件种类。

平衡优化的回归

DataStage 8.5中,平衡优化与设计融合,它有许多易用性方面的改进,让DataStage成为一个更好的ETLT ELT 选择。平衡优化考虑到一个正常的DataStage 工作(job)并把它改进。改进的工作会把一些步骤放到源数据库或目标数据库并让它们去操作。

8.5版本在登录和影响分析支持上有所提高,从创建,删除,重命名,转移,编辑以及部署它们这几方面来讲,在工作(jobs)的优化上更易于管理。

 

打印本文 打印本文  关闭窗口 关闭窗口