foreach:对RDD中每个元素都应用某个函数操作
saveAsTextFile:保存到hdfs
collect:相当于将分布式的RDD返回为一个单机的数组
count:返回RDD中元素个数
top(k):返回最大的k个元素
take(k):返回最小的k个元素
takeOrdered:返回最小的k个元素,保证顺序
reduce:正常reduce操作
fold:于reduce原理相同,但是fold取的第一个数是zerovalue
aggregate:先对每个分区进行aggregate,然后对整个RDD做fold操作