参考:http://blog.itpub.net/29754888/viewspace-1260026/

角色简介

topologies

Nimbus

Supervisor

Worker(集群间调度的最小单位)

executor

task

Streams

Nimbus和Supervisor之间的协作都是通过zookeeper完成的,Nimbus和Supervisor都是fail-fast和无状态的,所有的状态都保存在zookeeper。也就是说我们可以kill -9 Nimbus 或者 Supervisors,然后重启,都没有什么问题

失败策略

worker dies?

node dies?

Nimbus or Supervisor daemons die?

因此,重启即可,所有的worker进程都不会受到影响 所有Nimbus都挂了