first()案例和take(n)案例_大数据培训课程

发布于:2022-12-25 ⋅ 阅读:(177) ⋅ 点赞:(0)

first()案例

作用:返回RDD中的第一个元素

需求:创建一个RDD,返回该RDD中的第一个元素

(1)创建一个RDD

scala> val rdd = sc.parallelize(1 to 10)

rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at <console>:24

(2)统计该RDD的条数

scala> rdd.first

res2: Int = 1

take(n)案例

作用:返回一个由RDD的前n个元素组成的数组

需求:创建一个RDD,统计该RDD的条数

(1)创建一个RDD

scala> val rdd = sc.parallelize(Array(2,5,4,6,8,3))

rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[2] at parallelize at <console>:24

(2)统计该RDD的条数

scala> rdd.take(3)

res10: Array[Int] = Array(2, 5, 4)

想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习。

 


网站公告

今日签到

点亮在社区的每一天
去签到