摘要:Spark作为新一代大数据计算引擎,因为内存计算的特性,具有比hadoop更快的计算速度。这里总结下对Spark的认识、虚拟机Spark安装、Spark开发环境搭建及编写第一个scala程序、运行第一个Spark程序。

1.Spark是什么

Spark是一个快速且通用的集群计算平台

2.Spark的特点

1)Spark是快速的

   Spark扩充了流行的Mapreduce计算模型

   Spark是基于内存的计算

2)Spark是通用的

    Spark的设计容纳了其它分布式系统拥有的功能

    批处理,迭代式计算,交互查询和流处理等

网友评论