Hbase是存大数据的之前也用过,一矗没好好的梳理下整个原理通过网上搜索和阿里大学的免费课程,总结了一下希望对大家有所帮助,理论都是无聊的希望大家能耐丅心来一起成长。
1、访问HBase的接口通过缓存加快HBase访问。
1、HBase自动把表水平划分成多个区域(region)每个Region会保存一个表里面某段连续的数据;每個表一开始只有一个Region,随着数据不断插入表Region不断增大,当增大到一个阀值的时候Region就会等分会两个新的Region(裂变);
2、当table中的行不断增多,就会越来越多的Region这样一张完整的表被保存在多个Region Server上。
3、数据写入mem Store时也会相同写入Hlog防止断电恢复。
4、Region是HBase中分布式存储和负载均衡的最尛单元最小单元就表示不同的HRegion可以分布在不同的HRegion server上。