2018-11-04
阅读量:
773
Spark中RDD和DataFrame的差异
Spark目前使用的主要数据结构是RDD和DataFrame。RDD是一个原创的概念,而DataFrame是后来引入的。RDD相对灵活。你可以在RDD结构上运行许多类型的转换与计算。然而,因为它太灵活了,所以很难对其执行进行优化。另一方面,DataFrame有一定的固定结构,能利用它来优化DataFrame数据集上的执行。但是,它不具备RDD的优点,主要是没有RDD的灵活性。RDD与DataFrame的主要区别如下表所示:
0.0000
0
4
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
1条评论
0条评论
0条评论