• 进入"运维那点事"后,希望您第一件事就是阅读“关于”栏目,仔细阅读“关于Ctrl+c问题”,不希望误会!
Hadoo实战:Hadoop生态圈组件介绍

Hadoo实战:Hadoop生态圈组件介绍

Hadoop生态圈组件介绍 Hadoop生态图,家族产品,通俗地说,就是Hadoop核心模块和衍生的子项目。常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Ha……

大数据概念

大数据概念

数据类型 结构化数据(structured data):RDBMS 传统的关系型数据库中的表通常由一个或多个字段组成,每个字段都预先定义了其可存储数据的格式及约束等,这类的数据就是结构化数据(structured data)一个设计良好的数据库在其schema中定义这些格式或约束,并由相应的RDBMS为这些提供实现保证相应地。 半结构化数据(semi-……

六大主流开源SQL引擎总结

六大主流开源SQL引擎总结

背景介绍 本文涵盖了6个开源领导者:Hive、Impala、Spark SQL、Drill、HAWQ 以及Presto,还加上Calcite、Kylin、Phoenix、Tajo 和Trafodion。以及2个商业化选择Oracle Big Data SQL 和IBM Big SQL,IBM 尚未将后者更名为“Watson SQL”。 (有读者问:Druid……