载入中…
公告栏:
当前位置: 中国商业智能网 >> CIO >> 产品方案 >> 文章正文
Pentaho 开放源码的商业智能平台--技术白皮书
作者:中国商业智能网    来源:Pentaho    点击数:    时间:2011-3-29
【摘要】      客户为了新需求,而不断去联系新的供应商,买进新的工具,聘请新的顾问。最终,公司的 BI initiative 变成了众多相互独立的解决方案(Solution),为了维护和协调它们,需要使用各种昂贵的调度管理程序来整合各个方案。

Pentaho 开放 BI 套件

Pentaho BI 平台不同于传统的 BI 产品。它是一个以流程为中心的,面向解决方案(Solution)的平台,具有商业智能 (BI) 组件,使得公司可以开发商业智能问题的完全解决方案(Solution

Pentaho BI 平台,是 Pentaho 开放 BI 套件的核心体系结构和基础,其以流程为中心,因为其中枢控制器是一个工作流引擎。工作流引擎使用流程定义来定义在 BI 平台上执行的商业智能流程。流程可以很容易的被定制,也可以添加新的流程。BI 平台包含组件和报表,用以分析这些流程的性能。

BI 平台是面向解决方案(Solution)的,因为平台的操作是定义在流程定义和指定每个活动的 action 文档里。这些流程和操作共同定义了一个商业智能问题的解决方案(Solution)。这个 BI 解决方案(Solution)可以很容易的集成进平台外部的商业流程。一个解决方案(Solution)的定义可以包含任意数量的流程和操作。

Pentaho 开放 BI 套件包含一个 BI 平台,end-user BI capabilities Pentaho Design Studio

  BI 平台提供了一个执行框架和服务,其包含日志,审计,安全,调度, ETLweb服务,属性库和规则引擎。

  end-user BI capabilities 包含报表,分析,工作流,仪表盘和数据挖掘。

  Pentaho Design Studio 是一套设计和管理工具,其被集成进流行的 Eclipse 环境。这些工具允许商业分析者或开发人员创建报表,仪表盘,分析模型,商业规则和 BI 流程。

  BI 平台和 end-user BI capabilities 组成 Pentaho 服务器。使用 Pentaho Design Studio 设计 BI solutions,并部署进 Pentaho 服务器。Pentaho 服务器是运行时引擎,由工作流引擎驱动,其协调所有 BI 组件间的执行和通信。

工作流引擎所形成的集中式控制对于 BI 平台的体系结构是很重要的:

  平台构建于流程和流程定义之上。BI 平台了解流程的本质,因为其中的任何事情均以一个流程的形式来执行。

  使用标准的流程定义语言定义流程,流程是可见的,可编辑的,可定制的,并没有任何隐藏的业务逻辑。

  日志,审计和安全内置于核心中,并被自动使用,以确保总有一个精确的审计跟踪可用于管理和性能监控。

体系结构是原创源码和成熟开放源码组件的一个结合,他们被集成在一起形成一个完整的,可伸缩的,复杂 BI 平台。

Pentaho BI 平台构建于服务器,引擎和组件的基础之上。包括:J2EE 服务器,安全,portal,工作流,规则引擎,图表,协作,内容管理,数据集成,多维分析和系统建模等功能。这些组件的大部分是基于标准的,可使用其他产品替换之。

为创建一个真正集成的、单源的解决方案(Solution),Pentaho 增加了以下特征:

• 在解决方案(Solution)定义文档形式上统一的元数据

• 统一的用户接口和用户接口组件

• 安全性

Email 和桌面通知

• 所有组件的安装,集成和校验

• 实例解决方案(Solution

• 应用程序连接器

• 使用和诊断工具

• 设计工具

• 个性化定制和配置

开放源码技术

Pentaho 开放 BI 套件使用了很多第三方开放源码组件。体系结构一节显示了相对于 Pentaho 组件,这些开放源码组件的体系结构和关系。开放源码组件允许 Pentaho 侧重于系统的增值功能:报表,分析,工作流集成,商业规则,审计,用户通知和接口,以及工作流的分析/建模。

作为 Pentaho 在其平台中使用这些开放源码组件的回报,它为这些项目捐献资源,将 BI 平台的发布组件也纳入进开放源码许可证的控制下

体系结构

为获得如上描述的解决方案(Solution),Pentaho BI 平台由 Pentaho 服务器和一个基于 Eclipse Design Studio 组成。

Pentaho 服务器

Pentaho 服务器由一个 BI 平台和提供给终端用户 BI 能力的库组成。服务器运行于一个 J2EE 兼容的 web 服务器(如 ApacheJBOSS ASWebSphereWebLogic Oracle AS)上。它们也可嵌入进其他服务器或应用中。后面的图显示了服务器中较大组件间的关系。

Pentaho 服务器使得 BI 平台的很多功能以一种一致的,熟悉的外观和行为展示给用户。例如,一个组件产生了用户可访问的报表列表,第二个以日历的方式列出了任务相关的最终期限,第三个显示了用户需要完成的当前任务。每个组件产生的内容和每个用户的角色相关。组件内容可以 XMLHTML 的形式获取或在被包含的 JSR-168 portlets 中显示。Pentaho portlets 可被嵌入进任何支持 JSR 168 标准的 portal,例如 IBM WebSphereOracleAS Portal BEA WebLogic Portal。组件用于展示在线报表内容的 XSL CSS 样式单是可访问的,并完全可定制

Pentaho 服务器包含用于报表,分析,商业规则,email 和桌面通知以及工作流的引擎和组件。这些组件被集成在一起,用于解决商业智能问题。在一个解决方案(Solution)中,每个子系统的行为,相互作用和用户交互被解决方案(Solution)定义文档的一个集合所定义。

解决方案(Solution)定义文档是 XML文档,它包含:

     业务流程的定义(XPDL 标准)

     活动的定义,这些活动按需作为部分流程执行,或被 web 服务调用,其包含以下定义:数据源,查询,报表模板,传送和通知规则,商业规则,仪表盘和分析视图。

     以上所有的项之间的关系。

服务器中的组件依赖于一个解决方案(Solution)引擎,可获得可用解决方案(Solution)文档,安全支持,报表,工作流项,数据,和审计信息。在服务器上可以执行多于一个的解决方案(Solution)。解决方案(Solution)定义文档可从一个服务器复制到另一个,并可被自由分发。

Pentaho 服务器包含了提供高级系统管理的基础设施。这包括系统监控(SMNP)服务,使用报表,Web 服务支持,配置确认工具,和诊断工具。

Pentaho 服务器包含了提供高级流程性能报表和分析的系统和组件。这包括工作流任务中涉及到的工作流项目,单独任务,employees services 上属性的切片和切块(slice-and-dice),what-if 和数据挖掘能力

Pentaho 服务器也支持 Enterprise Application Integration (EAI) 用于和 operational applications 进行 live 集成,以及 Extract, Transform, and Load (ETL) 能力,用于创建 数据仓库和数据集市。

Pentaho 服务器包括一个工具,用于企业信息集成(EAI)的 ETLExtractionTransformation Load)

下图是一个服务器体系结构图。

    

• 解决方案(Solution)引擎对于整个体系结构是很重要的,可以管理对于 BI 组件的访问。

BI 平台提供的服务:

• 为外部应用程序提供了 web 服务

• 可访问和用户接口组件相同的解决方案(Solution)引擎

• 被工作流引擎和调度器调用以执行系统 actions

• 审计内置于平台组件中。通过从工作流和审计库中抽取历史和实时数据,平台提供了流程性能报表功能。

• 组件是可以被添加进系统的模块。

• 每个引擎有相应组件,可以将引擎集成进平台。如果创建了必要的组件的话,引擎可被其他引擎替换,或添加进平台。

• 服务器包括用于构建一个商业智能解决方案(Solution)所必需的组件和技术:报表,工作流,商业规则,仪表盘/分析,web 服务,调度,方便的 web 和桌面用户接口的混合,以及审计。

Pentaho BI 平台和外部系统集成,这些系统提供了数据驱动报表引擎,并接收来自工作流引擎的事件。

• 经由简单网络管理协议(SNMP)Pentaho BI 平台提供了系统监控能力。

• 资源库被存储进 Pentaho 平台外的一个 RDBMS。预配置安装中内嵌的资源库存储在一个开放源码数据库中,FireBird(首选) MySQL。如果必需的话,这些数据库可被其他的关系型数据库代替,例如 OracleSQL服务器或 DB/2

Pentaho BI 平台中有多个规则引擎,因此业务规则被暴露,并可被简单定制。可在系统中添加额外的规则引擎。对于组件来说,业务规则引擎是外部的,且任何组件可以使用任何规则引擎。

• 不是所有组件均显示在图中,其他(未显示)的组件包括 email,打印,消息格式化,工作流实例属性管理,流程性能报表和 what-if 分析。

• 体系结构的一些部分使用了组合的技术,或者使用了易于等价替换的技术:

• 被提供的 J2EE 服务器是 JBoss AS,但是可以使用任何 Java JDK 1.4 兼容的应用程序服务器。

BI 平台提供了内置 Java Server Pages (JSPs)servlets portlets 的用户接口,可以添加第三方或定制的 JSPsservlets portlets

BI 套件包括一个开放源码的 OLAP 引擎(Mondrian),但是可以使用任何 MDX 兼容的 OLAP 服务器(我们计划测试 Microsoft OLAP 服务和 Hyperion Essbase)

• 平台提供了一个基于 javascript 的和基于 SQL 的规则引擎,并基于市场需求,计划支持 ILOG JRulesDrools Jess

Pentaho BI 平台集成和增强了现有的流行的第三方开放源码组件,例如:

Mondrian OLAP Server and jPivot Analysis Front-End

Firebird RDBMS

Shark and JaWE 工作流

Kettle EII and ETL

JBoss 应用程序服务器,Hibernate Portal

Weka 数据挖掘

Eclipse 工作台和 BIRT 报表组件

JOSSO单点登录和 LDAP 集成

Mozilla Rhino Javascript Processor      

BI 平台利用开放标准和协议,包括:

XML W3Cs Extensible Markup LanguageW3C 的可扩展标记语言

JSR-94 JCPs  Rules Engine APIJCP 的规则引擎 API

JSR-168 JCPs Portlet SpecJCP Portlet Spec

SVG W3Cs Scalable Vector GraphicsW3C 的可扩展适量图形(Scalable Vector Graphics

XPDL WFMCs XML Process Definition LanguageWFMC XML 流程定义语言

XForms W3Cs Web FormsW3C Web Forms

MDX Microsofts OLAP Query LanguageMicrosoft OLAP 查询语言

WSBPEL - Oasiss Web Services Business Process Execution LanguageOasis Web 服务业务流程执行语言

WSDL - W3Cs Web Services Description LanguageW3C Web 服务描述语言

SOAP - W3Cs Simple Object Access ProtocolW3C 的简单对象访问协议

服务器的资源库

Pentaho 服务器包括存储了定义,执行和审计一个解决方案(Solution)所必需的数据的内嵌资源库:

• 解决方案(Solution)资源库:定义了解决方案(Solution)的元数据。

• 运行时资源库:工作流引擎正在管理的工作项目

• 审计资源库:跟踪和审计信息

预配置安装

提供一个预配置的实例部署,这样平台就可以快速简单的被测试,配置包括:

JBoss 应用程序服务器

JBoss Portal V2.0,一个支持 JSR-168 portal 服务器

• 实例 JSPs,它演示了平台组件的使用

• 实例数据

• 实例报表和 BI 流程

• 在实例中使用的用户和角色

Pentaho Design Studio

设计和管理工作台是一个基于 Eclipse 的桌面工作台,它提供了:

• 报表,仪表盘,分析视图的易于使用的设计工具。

• 工作流流程设计器

• 商业规则编辑器

• 数据准备的数据挖掘工作台

OLAP 建模工具

上一页  [1] [2] [3] 下一页

责任编辑:朱莉   
 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    ChinaBI版权、投稿与免责申明:
    1)凡本网署名文字、图片和音视频稿件,版权均属中国商业智能网所有。任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明稿件来源:中国商业智能网,违者本网将依法追究责任。
    2)本网注明“本站来源处不写本站原创”的文章均为转载稿,本网转载出于传递更多信息之目的。如本网转载稿涉及版权等问题,请作者速来电或来函与本网联系。
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    最新热点
    娱乐资讯
    最新推荐
    网站合作、内容监督、商务咨询、投诉建议 电话:0512-62861389  邮箱:chianbi@126.com
    Copyright 2004-2014 中国商业智能网版权所有   |    苏 ICP 备 13004727 号