首家大数据培训挂牌机构 股票代码:837906 | EN CN
位置:首页 > 【小牛原创】Spark SQL 从入门到实战 -- 概述 >

【小牛原创】Spark SQL 从入门到实战 -- 概述

作者:小牛君|发布时间:2017-06-07


1.       Spark SQL概述

1.1.    什么是Spark SQL


Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。

1.2.    为什么要学习Spark SQL

我们已经学习了Hive,它是将Hive SQL转换成MapReduce然后提交到集群上执行,大大简化了编写MapReduce的程序的复杂性,由于MapReduce这种计算模型执行效率比较慢。所有Spark SQL的应运而生,它是将Spark SQL转换成RDD,然后提交到集群执行,执行效率非常快!

1.易整合

2.统一的数据访问方式

3.兼容Hive

4.标准的数据连接


加入千人QQ群一起学习大数据:Spark大数据交流学习群613807316

分享到: