9号彩票开户

关注微信  |  微博  |  腾讯微博  |  RSS订阅
读者QQ群③:168129342,投稿请发dashuju36@qq.com
我要投稿

Cloudera与Databricks达成合作 Spark迈上企业级之路

Databricks

近日,Cloudera与初创公司Databricks展开了一项合作,在Cloudera的Hadoop软件内集成和支持Apache Spark数据处理平台。Spark专为速度和可用性设计,是推动Hadoop超越MapReduce的几种技术之一。

本年度Hadoop World会议上最火的一则消息可能就是Cloudera决定提供Apache Spark的全企业级支持——类似Hadoop发行版里的定制内容及付费产品支持,不仅仅是技术整合。这进一步证明了未来Hadoop的工作负载比现在和过去的看起来大不一样。

Spark是一个内存中的数据处理平台,兼容Hadoop数据源,但是比Hadoop MapReduce运行的更快。它非常适合机器学习作业,以及交互式数据查询,非常易于开发者使用,因为它包含了Scala、Python、Java的API。Spark已经在大量的网络公司和网络创业公司中使用,一个旨在商业化Spark的初创公司Databricks近日获得了1400万美元的风险投资。

实际上,Databricks是Cloudera Connet的第一个合作伙伴,它将帮助Cloudera提供支持,在Apache Spark未来发展中也将与大的Hadoop供应商合作,Cloudera公司联合创始人兼CTO Amr Awadallah解释了这个合作关系,也作为所有潜在客户的合作关系:将作为Cloudera所有感兴趣的客户创新的枢纽。Databricks以类似OEM的关系获益,但该协议仅限于扩展Apache Spark,不会发布任何商业版本的Databricks。

除下Databricks和Cloudera建立在Spark上的合作之外,Hortonworks也在致力流处理引擎Storm的企业级应用,这些探索都是非常重要的,因为只运行MapReduce的Hadoop永远都无法取得长期胜利。现在,YARN资源管理层已经可以投入使用,Cloudera和Hortonworks不用浪费任何时间为Hadoop未来的工作负载做准备,坦白来说,面对本质上Hadoop变成能支持可扩展性的开源数据层,我不明白过去几年那些对Hadoop持怀疑态度的人依然能够坚持,理论上,你可以使用它来处理任何类型。

Awadallah指出,虽然MapReduce仍然能流行一段时间,但是作为事实上的通用数据处理平台,Hadoop的未来应该更好。

End.

转载请注明来自36大数据(36dsj.com):36大数据 » Cloudera与Databricks达成合作 Spark迈上企业级之路

36大数据   除非特别注明,本站所有文章均不代表本站观点。报道中出现的商标属于其合法持有人。请遵守理性,宽容,换位思考的原则。

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
友情链接:万彩会彩票  北京赛车pk拾开奖号码查询  盛兴彩票  博乐彩票  港龙彩票  

免责声明: 本站资料及图片来源互联网文章,本网不承担任何由内容信息所引起的争议和法律责任。所有作品版权归原创作者所有,与本站立场无关,如用户分享不慎侵犯了您的权益,请联系我们告知,我们将做删除处理!