Hbase初识

  HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构存储集群。是建立的hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。

  与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。

HBase中的表一般有这样的特点:

1 大:一个表可以有上亿行,上百万列

2 面向列:面向列(族)的存储和权限控制,列(族)独立检索。

3 稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。

                

上图描述Hadoop EcoSystem中的各层系统。其中,HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。   此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。 1、[HBase]数据模型(逻辑结构)   HBase以表的形式存储数据。表由行和列族组成。列划分为若干个列族(row family),其逻辑视图如下: 下面分别说说几个关键概念: 1)行键(RowKey) -- 行键是字节数组, 任何字符串都可以作为行键; -- 表中的行根据行键进行排序,数据按照Row key的字节序(byte order)排序存储; -- 所有对表的访问都要通过行键 (单个RowKey访问,或RowKey范围访问,或全表扫描) 2)列族(ColumnFamily) -- CF必须在表定义时给出 -- 每个CF可以有一个或多个列成员(ColumnQualifier),列成员不需要在表定义时给出,新的列族成员可以随后按需、动态加入 -- 数据按CF分开存储,HBase所谓的列式存储就是根据CF分开存储(每个CF对应一个Store),这种设计非常适合于数据分析的情形 3)时间戳(TimeStamp) -- 每个Cell可能又多个版本,它们之间用时间戳区分 4)单元格(Cell) -- Cell 由行键,列族:限定符,时间戳唯一决定 -- Cell中的数据是没有类型的,全部以字节码形式存贮 5)区域(Region) -- HBase自动把表水平(按Row)划分成多个区域(region),每个region会保存一个表里面某段连续的数据; -- 每个表一开始只有一个region,随着数据不断插入表,region不断增大,当增大到一个阀值的时候,region就会等分会两个新的region; -- 当table中的行不断增多,就会有越来越多的region。这样一张完整的表被保存在多个Region 上。 -- HRegion是HBase中分布式存储和负载均衡的最小单元。最小单元表示不同的HRegion可以分布在不同的HRegionServer上。但一个HRegion不会拆分到多个server上。

2.Hbase表操作

  1、 对表的创建、删除、显示以及修改等,可以用HBaseAdmin,一旦创建了表,那么可以通过HTable的实例来访问表,每次可以往表里增加数据。

  2、 插入数据

    创建一个Put对象,在这个Put对象里可以指定要给哪个列增加数据,以及当前的时间戳等值,然后通过调用HTable.put(Put)来提交操作,子猴在这里提请注意的是:在创建Put对象的时候,你必须指定一个行(Row)值,在构造Put对象的时候作为参数传入。

  3、 获取数据

    要获取数据,使用Get对象,Get对象同Put对象一样有好几个构造函数,通常在构造的时候传入行值,表示取第几行的数据,通过HTable.get(Get)来调用。

  4、 浏览每一行

    通过Scan可以对表中的行进行浏览,得到每一行的信息,比如列名,时间戳等,Scan相当于一个游标,通过next()来浏览下一个,通过调用HTable.getScanner(Scan)来返回一个ResultScanner对象。HTable.get(Get)和HTable.getScanner(Scan)都是返回一个Result。Result是一个

KeyValue的链表。

  5、 删除

    使用Delete来删除记录,通过调用HTable.delete(Delete)来执行删除操作。(注:删除这里有些特别,也就是删除并不是马上将数据从表中删除。)

  6、 锁

    新增、获取、删除在操作过程中会对所操作的行加一个锁,而浏览却不会。

 

  1     import java.io.IOException;     
  2     import java.util.ArrayList;     
  3     import java.util.List;     
  4           
  5     import org.apache.hadoop.conf.Configuration;     
  6     import org.apache.hadoop.hbase.HBaseConfiguration;     
  7     import org.apache.hadoop.hbase.HColumnDescriptor;     
  8     import org.apache.hadoop.hbase.HTableDescriptor;     
  9     import org.apache.hadoop.hbase.KeyValue;     
 10     import org.apache.hadoop.hbase.MasterNotRunningException;     
 11     import org.apache.hadoop.hbase.ZooKeeperConnectionException;     
 12     import org.apache.hadoop.hbase.client.Delete;     
 13     import org.apache.hadoop.hbase.client.Get;     
 14     import org.apache.hadoop.hbase.client.HBaseAdmin;     
 15     import org.apache.hadoop.hbase.client.HTable;     
 16     import org.apache.hadoop.hbase.client.Result;     
 17     import org.apache.hadoop.hbase.client.ResultScanner;     
 18     import org.apache.hadoop.hbase.client.Scan;     
 19     import org.apache.hadoop.hbase.client.Put;     
 20     import org.apache.hadoop.hbase.util.Bytes;     
 21           
 22     public class HBaseTest {       
 23              
 24         private static Configuration conf =null;  
 25          /** 
 26           * 初始化配置 
 27          */  
 28          static {  
 29              conf = HBaseConfiguration.create();  
 30          }  
 31            
 32         /**   
 33          * 创建一张表   
 34          */    
 35         public static void creatTable(String tableName, String[] familys) throws Exception {     
 36             HBaseAdmin admin = new HBaseAdmin(conf);     
 37             if (admin.tableExists(tableName)) {     
 38                 System.out.println("table already exists!");     
 39             } else {     
 40                 HTableDescriptor tableDesc = new HTableDescriptor(tableName);     
 41                 for(int i=0; i){     
 42                     tableDesc.addFamily(new HColumnDescriptor(familys[i]));     
 43                 }     
 44                 admin.createTable(tableDesc);     
 45                 System.out.println("create table " + tableName + " ok.");     
 46             }      
 47         }     
 48              
 49         /**   
 50          * 删除表   
 51          */    
 52         public static void deleteTable(String tableName) throws Exception {     
 53            try {     
 54                HBaseAdmin admin = new HBaseAdmin(conf);     
 55                admin.disableTable(tableName);     
 56                admin.deleteTable(tableName);     
 57                System.out.println("delete table " + tableName + " ok.");     
 58            } catch (MasterNotRunningException e) {     
 59                e.printStackTrace();     
 60            } catch (ZooKeeperConnectionException e) {     
 61                e.printStackTrace();     
 62            }     
 63         }     
 64               
 65         /**   
 66          * 插入一行记录   
 67          */    
 68         public static void addRecord (String tableName, String rowKey, String family, String qualifier, String value)     
 69                 throws Exception{     
 70             try {     
 71                 HTable table = new HTable(conf, tableName);     
 72                 Put put = new Put(Bytes.toBytes(rowKey));     
 73                 put.add(Bytes.toBytes(family),Bytes.toBytes(qualifier),Bytes.toBytes(value));     
 74                 table.put(put);     
 75                 System.out.println("insert recored " + rowKey + " to table " + tableName +" ok.");     
 76             } catch (IOException e) {     
 77                 e.printStackTrace();     
 78             }     
 79         }     
 80           
 81         /**   
 82          * 删除一行记录   
 83          */    
 84         public static void delRecord (String tableName, String rowKey) throws IOException{     
 85             HTable table = new HTable(conf, tableName);     
 86             List list = new ArrayList();     
 87             Delete del = new Delete(rowKey.getBytes());     
 88             list.add(del);     
 89             table.delete(list);     
 90             System.out.println("del recored " + rowKey + " ok.");     
 91         }     
 92               
 93         /**   
 94          * 查找一行记录   
 95          */    
 96         public static void getOneRecord (String tableName, String rowKey) throws IOException{     
 97             HTable table = new HTable(conf, tableName);     
 98             Get get = new Get(rowKey.getBytes());     
 99             Result rs = table.get(get);     
100             for(KeyValue kv : rs.raw()){     
101                 System.out.print(new String(kv.getRow()) + " " );     
102                 System.out.print(new String(kv.getFamily()) + ":" );     
103                 System.out.print(new String(kv.getQualifier()) + " " );     
104                 System.out.print(kv.getTimestamp() + " " );     
105                 System.out.println(new String(kv.getValue()));     
106             }     
107         }     
108               
109         /**   
110          * 显示所有数据   
111          */    
112         public static void getAllRecord (String tableName) {     
113             try{     
114                  HTable table = new HTable(conf, tableName);     
115                  Scan s = new Scan();     
116                  ResultScanner ss = table.getScanner(s);     
117                  for(Result r:ss){     
118                      for(KeyValue kv : r.raw()){     
119                         System.out.print(new String(kv.getRow()) + " ");     
120                         System.out.print(new String(kv.getFamily()) + ":");     
121                         System.out.print(new String(kv.getQualifier()) + " ");     
122                         System.out.print(kv.getTimestamp() + " ");     
123                         System.out.println(new String(kv.getValue()));     
124                      }     
125                  }     
126             } catch (IOException e){     
127                 e.printStackTrace();     
128             }     
129         }     
130              
131         public static void  main (String [] agrs) {     
132             try {     
133                 String tablename = "scores";     
134                 String[] familys = {"grade", "course"};     
135                 HBaseTest.creatTable(tablename, familys);     
136                       
137                 //add record zkb     
138                 HBaseTest.addRecord(tablename,"zkb","grade","","5");     
139                 HBaseTest.addRecord(tablename,"zkb","course","","90");     
140                 HBaseTest.addRecord(tablename,"zkb","course","math","97");     
141                 HBaseTest.addRecord(tablename,"zkb","course","art","87");     
142                 //add record  baoniu     
143                 HBaseTest.addRecord(tablename,"baoniu","grade","","4");     
144                 HBaseTest.addRecord(tablename,"baoniu","course","math","89");     
145                       
146                 System.out.println("===========get one record========");     
147                 HBaseTest.getOneRecord(tablename, "zkb");     
148                       
149                 System.out.println("===========show all record========");     
150                 HBaseTest.getAllRecord(tablename);     
151                       
152                 System.out.println("===========del one record========");     
153                 HBaseTest.delRecord(tablename, "baoniu");     
154                 HBaseTest.getAllRecord(tablename);     
155                       
156                 System.out.println("===========show all record========");     
157                 HBaseTest.getAllRecord(tablename);     
158             } catch (Exception e) {     
159                 e.printStackTrace();     
160             }     
161         }     
162     }    

 


 

转载于:https://www.cnblogs.com/shufy/p/5360977.html


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部