实现MapReduce全局排序有三种方法: 使用一个reduce实现全局排序 自定义分区函数实现全局排序 使用TotalOrderPartitoner进行全局排序 使用一个reduce实现全局排序 我们知道,MapReduce默认情况下只保证同一个分区中的key是有序的,不能保证全局有序。如果我们将所有的数据都用一个reduce来处理,就可以实现全局有序。 缺点:此方法的缺点也很明显,所有数据发送到一个reduce进行排序,不但不能充分利用集群的分布式资源,在数据量很大的情况...