kudu

2022.5.21 2025.11.19 滴水穿石 28 1 分钟

kudu

简介

特性

数据模型和关系数据库类似，为结构化的表；列的数量有限（和HBase/Cassandra相比较而言）
内部数据组织方式为列式存储
很好的横向扩展能力，目前测试的是275个节点（3PB），计划支持到上千个节点(几十PB)
不错的性能，集群能达到百万级别的TPS，单节点吞吐为几个GB/s
本身不提供SQL接口，只支持类似NoSQL的接口，如 Insert(), Update(), Delete() and Scan() 等
通过与 Spark 和 Impala 等（Drill，Hive的支持还在进行中）的集成，对外提供基于 SQL 的查询分析服务
支持对数据按照 Range 以及 Hash 的方式进行分区

参考

https://www.jianshu.com/p/83290cd817ac

作者：Justice
链接：https://justice.bj.cn/post/30.architech/kudu/
许可：CC BY-NC-SA 4.0

赞赏支持

微信打赏

支付宝打赏

比特币打赏