9号彩票开户

关注微信  |  微博  |  腾讯微博  |  RSS订阅
读者QQ群③:168129342,投稿请发dashuju36@qq.com
我要投稿

Spark 第4页

为什么Spark将成为数据科学家的统一平台

雪姬   2016-04-19

数据科学是一个广阔的领域。我自认是一个数据科学家,但和另外一批数据科学家又有很多的不同。数据科学家通常分为统计科学家和数据工程师两个阵营,而我正处于第二阵营。 统计科学家使用交...

阅读全文

用Spark/DBSCAN做地理定位数据聚类

小数点   2016-03-05

作者:Natalino Busa 如何利用机器学习和分布式计算来对用户事件进行分类 机器学习,特别是聚类算法,可以用来确定哪些地理区域被一个给定的用户经常访问和“入住”而哪些区域不是。这样的地理...

阅读全文

基于Spark的异构分布式深度学习平台

小数点   2016-03-05

深层神经网络技术最近几年取得了巨大的突破,特别在语音和图像识别应用上有质的飞跃,已经被验证能够使用到许多业务上。如何大规模分布式地执行深度学习程序,使其更好地支持不同的业务线成...

阅读全文

Apache Spark介绍及案例展示

雪姬   2016-02-16

原文作者:RADEK OSTROWSKI 原文链接:http://www.toptal.com/spark/introduction-to-apache-spark 译者:Fibears 2013年年底,我第一次接触到Spark,当时我对Spark所使用的Scala语言产生了...

阅读全文

你对Hadoop和Spark生态圈了解有几许?

蝙蝠侠   2016-01-29

作者简介:Andrew C. Oliver是养猫达人,副业是软件顾问。他是Mammoth Data公司(前身是Open Software Integrators)总裁兼创始人,这家大数据咨询公司的总部设在北卡罗来纳州达勒姆。 令人惊...

阅读全文

2分钟读懂大数据框架Hadoop和Spark的异同

LinkinPark   2015-12-15

谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。 解决...

阅读全文

大数据工具比较:R语言和Spark谁更胜一筹?

Optimus Prime   2015-12-07

本文有两重目的,一是在性能方面快速对比下R语言和Spark,二是想向大家介绍下Spark的机器学习库。 背景介绍 由于R语言本身是单线程的,所以可能从性能方面对比Spark和R并不是很明智的做法。...

阅读全文

运用Spark加速实时数据分析

雪姬   2015-10-29

Apache Hadoop是一个成熟的开发框架,其连接着庞大的生态系统,并且得到了Cloudera、Hortonwork、Yahoo这些卓越机构的支持与贡献,并且为各个组织提供了许多工具来管理不同大小规则的数据。 ...

阅读全文

脱离JVM? Hadoop生态圈的挣扎与演化

LinkinPark   2015-09-23

文|李呈祥,Hadoop攻城狮 新世纪以来,互联网及个人终端的普及,传统行业的信息化及物联网的发展等产业变化产生了大量的数据,远远超出了单台机器能够处理的范围,分布式存储与处理成为唯一...

阅读全文

Spark是什么?用Spark进行数据分析

李刘强   2015-09-22

36大数据专稿,本文由 李刘强 翻译并授权36大数据独家发布,转载必须获得本站及译者的授权。 1. 什么是Apache Spark? Apache Spark是一个为速度和通用目标设计的集群计算平台。 从速度的角...

阅读全文

Apache Spark在大规模分布式自然语言处理的应用

蝙蝠侠   2015-09-07

TripAdvisor基于自然语言构建回归模型预测用户对每个问题回答“是”或“不是”的概率。不仅用带有标签的地点评价数据训练模型,还使用了大量未标记的数据。基于Spark技术,处理所有这些数据的过...

阅读全文

Spark和Hadoop是友,非敌

小六子   2015-07-15

Spark 在 6 月份取得了激动人心的成绩。在圣何塞举办的 Hadoop 峰会上,Spark 成了人们经常提及的话题和许多演讲的主题。IBM 还在 6 月 15 号宣布,将对 Spark 相关的技术进行巨额投资。 这...

阅读全文

相比Hadoop,如何看待Spark技术?

小数点   2015-04-28

之前看Spark的评价,几乎一致表示,Spark是小数据集上处理复杂迭代的交互系统,并不擅长大数据集,也没有稳定性。但是最近的风评已经变化,尤其是14年10月他们完成了Peta sort的实验,这标志...

阅读全文

Apache Spark 的持续增长

Bella   2015-04-16

这周,快速发展的Apache Spark社区在纽约聚集,为了庆祝成为当今最受欢迎的开源项目之一。 2009年,Spark项目在UC伯克利的AMPLab启动,在过去的一年半里,Apache Spark迅速流行起来。在2014...

阅读全文

Spark点燃近实时大数据之火

小数点   2015-04-01

在用户体验达不到所宣传效果之后,IT领域中必然会随之出现“新的热门事件”。目前的新热门事件涉及大数据和对海量分布式数据的快速精准分析。 在目前的大数据领域中,Hadoop被作为存储和分配海...

阅读全文

Spark成为大数据分析领域新核心的五个理由

雪姬   2015-03-21

在过去几年当中,随着Hadoop逐步成为大数据处理领域的主导性解决思路,原本存在的诸多争议也开始尘埃落定。首先,Hadoop分布式文件系统是处理大数据的正确存储平台。其次,YARN是大数据环境...

阅读全文

友情链接:幸运农场官网幸运农场官网  必发彩票  北京赛车pk拾彩赔率多少  9号彩票注册  北京赛车pk拾地址  

免责声明: 本站资料及图片来源互联网文章,本网不承担任何由内容信息所引起的争议和法律责任。所有作品版权归原创作者所有,与本站立场无关,如用户分享不慎侵犯了您的权益,请联系我们告知,我们将做删除处理!