大数据生态系统

魔法师LQ

现今主要有两大生态,Hadoop生态和Spark生态。

Hadoop生态

Hadoop生态:存储-HdoopHDFS,资源管理-yann;驻内存数据量引擎;基于Hadoop的SQL分析-HIVE;NoSQL数据库-HBASE;机器学习-R/SparkMLib/mahout;搜索-Solr;脚本-Pig;等等

Spark生态系统

Spark生态系统

优势

Spark生态圈的优势:统一的开发框架和快速的数据处理