归档
正在加载今日诗词...
07
06
MapReduce的流程及优化 MapReduce的流程及优化
MapReduce的流程相对来说比较复杂,这里借用尚硅谷的两张图来描述其流程. 上面两张图对MapReduce有比较详细的描述,通过这个图我们就能够发现一些MapReduce的优化方法. 数据输入小文件处理HDFS小文件会因为文件元数据存
2020-07-06
05
MapReduce中的两表join方案 MapReduce中的两表join方案
MapReduce中两表join方案概述随着互联网行业的发展,数据量变得越来越大,随之而来的就是hadoop生态圈的兴起,其中MapReduce作为较原始的分布式计算框架,在当时也是解决了很多分布式计算的问题,其中包括两张表的join操作,
2020-07-05
03