kudu

kudu

简介

特性

  • 数据模型和关系数据库类似,为结构化的表;列的数量有限(和HBase/Cassandra相比较而言)
  • 内部数据组织方式为列式存储
  • 很好的横向扩展能力,目前测试的是275个节点(3PB),计划支持到上千个节点(几十PB)
  • 不错的性能,集群能达到百万级别的TPS,单节点吞吐为几个GB/s
  • 本身不提供SQL接口,只支持类似NoSQL的接口,如 Insert(), Update(), Delete() and Scan() 等
  • 通过与 Spark 和 Impala 等(Drill,Hive的支持还在进行中)的集成,对外提供基于 SQL 的查询分析服务
  • 支持对数据按照 Range 以及 Hash 的方式进行分区

参考

  1. https://www.jianshu.com/p/83290cd817ac
updatedupdated2024-05-102024-05-10