目录

hadoop编程模型

本文主要关注InputFormat,Marpper,Combine,Partitioner,Reducer,OutputFormat几个阶段。

旧版的api为这几个阶段分别设计了接口,新版的api把接口改写成了抽象类(如果要添加新的函数,直接在抽象类中添加就好了,如果是接口的话,需要修改更上层的代码)

Map task阶段

Reduce task阶段