用户可以在不了解分布式底层细节的 情况下,开发分布式程序。充分利用 集群的威力进行高速运算和存储。

Hadoop实现了一个分布式文件系统 有高容错性的特点,并且设计用来部 署在低廉的(low-cost)硬件上

Hadoop 还是可伸缩的, 能够处理 PB 级数据。

它提供高吞吐量(high throughput) 来访问应用程序的数据,适合那些有着 超大数据集(large data set)的应用 程序

Hadoop的框架最核心的设计就是: HDFS和MapReduce。HDFS为海量 的数据提供了存储,则MapReduce 为海量的数据提供了计算。

与一体机、商用数据仓库以及QlikVi ew、Yonghong Z-Suite等数据集市 相比,hadoop是开源的,项目的软 件成本因此会大大降低。