HA:RM启动时会向zk的/mrstore路径下写入lock文件,写入成功的则为active RM,否则为standby RM。启动后,RM会将job信息写入/mrstore,RM进程中的ZKFC线程会监控/mrstore中的lock文件,若不存在则RM为active,存在则为standby,切换后可从/mrstore读取job信息。
运行:Client提交job,会访问RM,若访问到standby RM则重新访问active RM。RM根据job上下文以及从NM收集到的状态信息分配资源并调度,启动一个container用来运行AM。NM负责启动container,监控所在节点的资源使用情况,并通过心跳机制报告给RM。job的task会在container中运行。
RM,NM相当于写字楼的管理者,RM总管,NM区域管理,它们提供container(办公室);
AM相当于项目经理,向写字楼管理者申请办公室,在它们提供的container上执行task,完成客户提交的job。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。