热线电话:13121318867

登录
2018-11-04 阅读量: 773
Spark中RDD和DataFrame的差异

Spark目前使用的主要数据结构是RDD和DataFrame。RDD是一个原创的概念,而DataFrame是后来引入的。RDD相对灵活。你可以在RDD结构上运行许多类型的转换与计算。然而,因为它太灵活了,所以很难对其执行进行优化。另一方面,DataFrame有一定的固定结构,能利用它来优化DataFrame数据集上的执行。但是,它不具备RDD的优点,主要是没有RDD的灵活性。RDD与DataFrame的主要区别如下表所示:

0.0000
4
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子