目录
hbase特点
hbase 行
hbase vs hdfs
hbase特点
存储大量数据
无模式(每一行的列可以不同)
列存储
列数据全部物理存在一起
非常适合全表扫描某个列
因为列数据类型一般都相同,可以很高效的压缩
稀疏(null值不占用存储空间)
多版本,每个数据都有版本的概念
数据类型单一(只有字符型)
没有join的概念
hbase 行
row key
colume family
column(也叫cell,每个cell可以有多个版本号)
hbase vs hdfs
hbase
适合随机查找(有row key键,主键且索引)
支持增量处理数据
支持数据更新
hdfs
适合全表扫描,不适合数据随机查找
不适合增量处理数据
不支持数据更新 (只能增减,删除,不能修改)