2015-10-21
用Hadoop的各种语言进行wordcount(2):Apache Spark
本文永久链接地址:https://www.askmaclean.com/archives/spark-wordcount-2.html 继续昨天的内容,今天也是进行wordcount。今天是用Apache Spark (Scala、Python、Java)来执行wordcount。 Spark是用Scala、Python、Java来进行wordcount。Scala与Python是用REPL,Java是用Spark应用来执行。 Spark中的wordcount是在spark站点张有的样本,我参考了Cloudera的博客。 https://spark.apache.org/examples.html http://blog.cloudera.com/blog/2014/04/how-to-run-a-simple-apache-spark-app-in-cdh-5/ github 上的位置 https://github.com/kawamon/wordcount.git Spark (Scala) 首先从Scala开始。 Cloudera Quickstart VM的Spark有版本问题,在spark-shell启动时会出现版本错误。…
#POST
22 MIN READ