Spark是一个高效的分布式计算系统,发源于美国加州大学伯克利分校AMPLab的集群计算平台。 相比Hadoop MapReduce,Spark在性能上要高100倍,而且Spark提供了比Hadoop更上层的API,同样的算法在Spark中实现往往只有Hadoop的1/10或者1/100的长度。 那么,Spark会是大数据领域的下一个大家伙吗?

头条推荐

Spark是大数据领域的下一个大家伙吗?

Spark是一个基于内存in-memory数据处理平台,兼容于Hadoop 数据源但是比Hadoop MapReduce运行得快得多。.特别适合于机器学习处理。Databricks将提供$14M美金支持Spark,Cloudera决定支持Spark,Spark被认为是大数据领域的大事情。……>>详细

433894,426600,426592,426591,418304,410276

Spark相关

Apache Spark
Spark是个开源的数据分析集群计算框架,最初由加州大学伯克利分校AMPLab开…
Twitter将采用Spark分析大数
Twitter数据科学家Edwin Chen最近在接受媒体采访的时候透露,Twitter内部希…

投    票

专题推荐

Apache Spark是立足于内存计算的一种快速数据分析方案。其性能已经得到大家的认可,但我们该如何部署与实施
Spark部署与实践
Apache Spark是立足于内存计算的一种快速数据分析方案。其性能已经得到大家的认...
Mesos计算框架一个集群管理器,提供了有效的、跨分布式应用或框架的资源隔离和共享,可以运行Hadoop、MPI、
揭秘你不知道的分布式计算框
Mesos计算框架一个集群管理器,提供了有效的、跨分布式应用或框架的资源隔离和...
PM2.5肆虐着中华大地,令每个中国人呼吸困难。大数据的到来,让我们的环境治理与气象预报有了更有力的工具
气象大数据吹开雾霾 自由呼
PM2.5肆虐着中华大地,令每个中国人呼吸困难。大数据的到来,让我们的环境治理...
金融大数据将给中国银行带来极大的转变。它将让银行从被动服务客户,转向更加主动的方式。主动地去探索和挖
金融大数据到来,银行你准备
金融大数据将给中国银行带来极大的转变。它将让银行从被动服务客户,转向更加主...

一周排行

留言评论