载入中…
公告栏:
当前位置: 中国商业智能网 >> 专家 >> 杜号权 >> 文章正文
Hadoop和Cassandra的近期合作
作者:杜号权    来源:本站原创    点击数:    时间:2011-4-18
【摘要】开源软件公司DataStax于上周三宣布,该公司正在研发一套软件,Brisk,将Cassandra的非关系型数据库与Apache Hadoop的数据处理框架结合起来,把看似在价值观上相互矛盾的快速的数据访问与深入的分析相融合。

开源软件公司DataStax于上周三宣布,该公司正在研发一套软件,BriskCassandra的非关系型数据库与Apache Hadoop的数据处理框架结合起来,把看似在价值观上相互矛盾的快速的数据访问与深入的分析相融合。

DataStax公司(之前被称为Riptano)创始人之一兼首席执行官(CEO) 麦特。费沃说,被称为Brisk的新产品会结合低延迟的数据存储和提取与对这一数据进行深入的数据分析。

通常,Cassandra被用于网络2.0的公司,这些公司需要一种快速、可扩展的方法来存储简单的数据集,而Hadoop则被用来分析横跨许多服务器的大量数据。

通常情况下,依靠实时数据库运行繁重的数据分析已经不被看好,因为它会拖慢数据库的反应速度。然而,这次宣布的软件,DataStax利用了Cassandra能够在多个节点之间分发数据的优势。

通过这个设置,数据可以被重复, 交换服务器将保留一份副本,而另一份存放于服务器的数据副本将被用来进行分析。“这两部分的数据不会相互干扰,”费沃说。

费沃解释说,最初的客户可能是互联网服务公司,这些公司已经使用了Cassandra进行大批量数据的抓取和检索。DataStax公司还向其他企业销售这一软件,作为一种潜在的低成本并且速度快的数据库和 CIO/dwh/> 数据仓库选择

The initial version of Brisk will use Hadoop version 0.20.2, the Hive data warehouse infrastructure version 0.7, and Cassandra 0.7.4. It will keep Hadoops MapReduce, job tracker and task tracker functionality, but will replace the underlying Hadoop File System (HDFS) with a Cassandra interface called CassandraFS, explains a DataStax white paper describing the technology.

一份DataStax的白皮书中这样描述它的技术:Brisk的初期版本将会使用Hadoop版本0.20.2Hive数据仓库基础版0.7Cassandra 0.7.4版。它将继续沿用Hadoop MapReduce,作业跟踪器和任务跟踪功能,但将用被称为CassandraFS Cassandra界面替换基本Hadoop文件系统(HDFS)

Apache开源软件授权,DataStax计划于近两个月之内,发行此分发数据库。
责任编辑:朱莉   
 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    ChinaBI版权、投稿与免责申明:
    1)凡本网署名文字、图片和音视频稿件,版权均属中国商业智能网所有。任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明稿件来源:中国商业智能网,违者本网将依法追究责任。
    2)本网注明“本站来源处不写本站原创”的文章均为转载稿,本网转载出于传递更多信息之目的。如本网转载稿涉及版权等问题,请作者速来电或来函与本网联系。
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    最新热点
    最新推荐
    网站合作、内容监督、商务咨询、投诉建议 电话:0512-62861389  邮箱:chianbi@126.com
    Copyright 2004-2014 中国商业智能网版权所有   |    苏 ICP 备 13004727 号