用户工具


hbase特点

  • 存储大量数据
  • 无模式(每一行的列可以不同)
  • 列存储
    • 列数据全部物理存在一起
    • 非常适合全表扫描某个列
    • 因为列数据类型一般都相同,可以很高效的压缩
  • 稀疏(null值不占用存储空间)
  • 多版本,每个数据都有版本的概念
  • 数据类型单一(只有字符型)
  • 没有join的概念

hbase 行

  • row key
  • colume family
    • column(也叫cell,每个cell可以有多个版本号)

hbase vs hdfs

hbase

  • 适合随机查找(有row key键,主键且索引)
  • 支持增量处理数据
  • 支持数据更新

hdfs

  • 适合全表扫描,不适合数据随机查找
  • 不适合增量处理数据
  • 不支持数据更新 (只能增减,删除,不能修改)