登录注册

mapWithState

1 引用 • 294 浏览

参与讨论

关注

关注分享

累加器

1 引用
Spark

Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点；但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中，从而不再需要读写 HDFS，因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。
74 引用 • 46 回帖 • 562 关注

默认热议好评优选最近回帖关注者查看所有标签