map reduce

map reduce论文

map reduce流程

master需要储存的内容

fault tolerance worker failure

Q:为什么completed的map task还要重做？ A:因为map的输出intermediate file是放在local disk的。而reduce的输出是放在global file system的

Q:reduce task正在做的过程中，有一个intermediate file要重做，怎么办?

master filure

Q:nondeterministic的任务重试有什么影响？

input一般是放在map reduce集群上的分布式文件系统 master在分配任务的时候，要考虑文件的位置，尽量分配本地input给worker做

task granularity 一般来说M和R越大越好

M和R的瓶颈 master需要分配O(M + R)的task，保存intermediate file位置需要O(M * R) 一般分配之后，一个input的大小大概是16MB到64MB，根据分布式文件系统的block size决定，优化locality。 R的大小一般是业务需求决定

当差不多结束的时候，每一个in-progress的任务叫多几个worker来做，这种叫做backup task。

combiner 如果reduce的输入是一个monoid，可以用combiner，一般跟reducer是同一个函数，不过是在map完之后跑，跑完的结果输出到local disk