Hbase入门详解-创新互联
1、hbase概述
目前成都创新互联已为上千的企业提供了网站建设、域名、虚拟空间、绵阳服务器托管、企业网站设计、香格里拉网站维护等服务,公司将坚持客户导向、应用为本的策略,正道将秉承"和谐、参与、激情"的文化,与客户和合作伙伴齐心协力一起成长,共同发展。1.1 hbase是什么
hbase是基于hdfs进行数据的分布式存储,具有高可靠、高性能、列存储、可伸缩、实时读写的nosql数据库。
hbase可以存储海量的数据,并且后期查询性能很高,可以实现上亿条数据的查询秒级返回结果。
1.2 hbase表的特性
1、大
- hbase表可以存储海量的数据。
2、无模式
- mysql表中每一行列的字段是相同,而hbase表中每一行数据可以有截然不同的列。
3、面向列
- hbase表中的数据可以有很多个列,后期它就是按照不同的列去存储数据,写入到不同的文件中。
- 面向列族进行存储数据。
4、稀疏
- 在hbase表中为null的列并不占用实际的存储空间。
5、数据的多版本
- 对于hbase表中的数据在进行数据更新的时候,它并没有把之前的结果数据直接删除掉,而是保留数据的多个版本,每一个数据都给一个版本号,这个版本号就是按照我们插入数据的时间戳去确定。
6、数据类型单一
- 无论是什么类型的数据,最后都被转换成了字节数组存储在hbase表中
1.3 hbase表的逻辑视图
2、hbase的集群结构
1、client
- 提供了对hbase表操作的一些java接口。
- client 维护着一些 cache 来加快对 hbase 的访问
- client 会将查询过的位置信息保存缓存起来,缓存不会主动失效
2、zookeeper
客户端操作hbase表数据需要一个zk集群
作用
1、zk保存了hbase集群的元数据信息
存储 Hbase 的 schema,包括有哪些 table,每个 table 有哪些 column family
2、zk保存所有hbase表的寻址入口
后期通过客户端接口去操作hbase数据的时候,需要连接上zk集群
存贮所有 Region 的寻址入口----root 表在哪台服务器上3、通过引入了zk之后,实现了整个hbase集群高可用
4、zk保存了HMaster和HRegionServer它们的注册和心跳信息
后期哪一个HRegionServer挂掉之后,zk也会感知到,然后把这个信息通知给老大HMaster
3、HMaster
它是整个hbase集群老大
作用
1、它接受客户端创建表、删除表的请求。处理 schema 更新请求
2、它会给HRegionServer分配对应的region,进行数据的管理
3、它会把挂掉的HRegionServer所管理的region重新分配给其他的活着的HRegionServer
4、它会实现HRegionServer负载均衡,避免某一个HRegionServer管理的region过多。
4、HRegionServer
它是整合hbase集群的小弟
作用
1、负责管理HMaster老大给它分配的region
2、它会接受到客户端的读写请求
3、它会把在运行过程中,变得过大的region数据进行切分
5、Region
它是整个hbase表中分布式存储的最小单元
它的数据是基于hdfs进行存储
3、hbase集群安装部署
前提条件
- 先搭建好zk、hadoop集群
1、下载对应的安装包
- http://archive.apache.org/dist/hbase/1.2.1/hbase-1.2.1-bin.tar.gz
- hbase-1.2.1-bin.tar.gz
2、规划安装目录
- /export/servers
3、上传安装包到服务器中
4、解压安装包到指定的规划目录
- tar -zxvf hbase-1.2.1-bin.tar.gz -C /export/servers
5、重命名解压目录
- mv hbase-1.2.1 hbase
6、修改配置文件
需要把hadoop安装目录下/etc/hadoop文件夹中
- core-site.xml
- hdfs-site.xml
需要把以上2个hadoop的配置文件拷贝到hbase安装目录下的conf文件夹中
1、vim hbase-env.sh
#配置java环境变量 export JAVA_HOME=/export/servers/jdk #指定hbase集群由外部的zk集群去管理,不在使用自带的zk集群 export HBASE_MANAGES_ZK=false
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
文章题目:Hbase入门详解-创新互联
文章出自:http://myzitong.com/article/csdose.html