kudu
滴水穿石
241
1 分钟
- 数据模型和关系数据库类似,为结构化的表;列的数量有限(和HBase/Cassandra相比较而言)
- 内部数据组织方式为列式存储
- 很好的横向扩展能力,目前测试的是275个节点(3PB),计划支持到上千个节点(几十PB)
- 不错的性能,集群能达到百万级别的TPS,单节点吞吐为几个GB/s
- 本身不提供SQL接口,只支持类似NoSQL的接口,如 Insert(), Update(), Delete() and Scan() 等
- 通过与 Spark 和 Impala 等(Drill,Hive的支持还在进行中)的集成,对外提供基于 SQL 的查询分析服务
- 支持对数据按照 Range 以及 Hash 的方式进行分区
- https://www.jianshu.com/p/83290cd817ac
#{ isset image }
#{image}
#{ end }
#{title}
#{ isset description }
#{description}
#{ end }
#{content}
#{ isset categories }
#{ end }
#{ isset tags }
#{ end }