数据组织模式

在许多组织中,Hadoop以及其他一些MapReduce解决方案都仅仅是大数据分析平台的一部分。因此,为了能更好地和其他系统适配,数据通常需要转换。同样,为使得在MapReduce中的分析更为容易,数据也可能需要从原始状态转换成新的状态。

本章包含几种模式的子类别,如下所示:

  • 分层结构模式
  • 分区和分箱模式
  • 全排序和混排模式
  • 数据生成模式

results matching ""

    No results matching ""