技术实操丨HBase 2.X版本的元数据修复及一种数据迁移方式

华为云开发者联盟

阅读 2 分钟

0

摘要：分享一个HBase集群恢复的方法。

背景

在HBase 1.x中，经常会遇到元数据不一致的情况，这个时候使用HBCK的命令，可以快速修复元数据，让集群恢复正常。

另外HBase数据迁移时，大家经常使用到一种迁移方式是：拷贝HBase的数据目录/hbase/data/default到新的集群，然后在新集群执行HBCK的命令让元数据重建，这种拷贝数据目录然后恢复元数据的方式是一种快速直接的手段。

HBase升级到2.X版本之后，hbase hbck中的一些修复命令已经不再支持，包括，所以在HBase遇到集群故障，无法通过HBCK快速把元数据修复，通过HBase数据目录迁移的方式也就使用不了。

在HBase 2.X的客户端执行hbase hbck时，常用的fixMeta命令已经不再支持。

hbck-1无法使用

HBase 2.X版本加强了可靠性，因为使用了 procedure，由于之前的hbck(hbck-1)是会直接去向region server或者hdfs发送请求进行修复，而在HBase 2.0版本上集群内部操作全部都被挪到了procedure v2(下文都称为procedure)上进行处理。

因为所有的命令都是经过master来协调处理，所以在修复时也需要通过master进行修复。否则反而可能导致更严重的不一致问题。所以hbck-1在HBase 2.x版本是不适用的。

HBase2.X版本中元数据的恢复方法

1. 修改配置hbase.assignment.skip.empty.regions=false

如果是普通的hbase:meta系统表中的元数据不正确，在修改完此参数重启HBase后就已经能恢复

当第一步骤完成后还不能修复，就要使用下面的命令了

例如启动后发现，hbase shell能list出数据，但是表无法put或者scan，这时候hbase:meta表里的t1表记录其实是不正确的

2. hbase org.apache.hadoop.hbase.util.hbck.OfflineMetaRepair -fix

这个命令需要停止HBase然后执行。

当表的数据目录存在(/hbase/data/default/<table>)，而在hbase:meta表中元数据不正确时，需要HBase停止后，执行这个meta表修复命令，

执行完成后，启动HBase。

启动完成后，查看hbase:meta表的用户表记录，可以看到t1表的元数据都生成了。

3. 此时用户表就恢复了，如果还存在region空洞fixHdfsHoles或者fixHdfsOverlaps问题，可以使用hbck1中的["-fixHdfsHoles -fixHdfsOrphans -fixHdfsOverlaps -fixReferenceFiles"]

在华为云EI内核团队的hbase2中，已经将这4个命令重新集成进hbck-1中，便于维护。

新集群清理及数据迁移

看完上面的元数据恢复，应该就知道接下来的这种HBase数据迁移方式的原理：通过拷贝数据目录，让HBase元数据与业务数据目录重新建立关系，达到业务正常读写。

下面例子只考虑用户使用default命名空间

拷贝旧集群的HBase数据目录到新集群，将旧集群的/hbase/data/default目录拷贝到了hdfs上的/mydata/目录；
如果新集群数据不需要清理，则跳过此步骤

停止HBase

清除HBase在数据存储目录，hdfs dfs -rm -r /hbase

清除HBase在zk的节点，使用ZK客户端工具zkCli.sh –server <ZK NODE>:2181 进入后执行deleteall /hbase

启动HBase,让目录结构自动生成

保持HBase集群停止状态，拷贝旧机器数据目录到新集群HBase的数据目录中；

hdfs dfs -cp /mydata/default/* /hbase/data/default/

执行hbase修复命令hbase org.apache.hadoop.hbase.util.hbck.OfflineMetaRepair –fix
设置hbase.assignment.skip.empty.regions=false并启动HBase

运行完上述步骤，在新的集群就能对迁移过来的HBase进行业务访问了。

点击关注，第一时间了解华为云新鲜技术~

阅读 2.8k发布于 2020-10-21

华为云开发者联盟

1.4k 声望1.8k 粉丝

生于云，长于云，让开发者成为决定性力量

« 上一篇

技术实践丨手把手教你使用MQTT方式对接华为IoT平台华为云开发者社区

下一篇 »

原来AI也可以如此简单！教你从0到1开发开源知识问答机器人

引用和评论

推荐阅读

华为云开发者联盟入选 2023 中国技术品牌影响力企业榜，深耕开发者生态

华为云开发者联盟赞 1阅读 719

2027倒计时：5个关键数据揭秘100%国产替代实施路径

3Q聊工具阅读 775

用C#在Excel工作表中创建数据透视表和数据透视图

大丸子阅读 711评论 2

NocoBase v1.6.0 正式版发布

NocoBase阅读 616

通过阿里云Milvus与通义千问VL大模型，快速实现多模态搜索

阿里云大数据AI阅读 613

企业如何平稳实现从Tableau到FineBI的信创迁移？

迅易科技阅读 577

ClkLog埋点分析系统支持自定义SQL 查询

clklog阅读 557

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。