在实际生产环境中,数据库出现文件损坏并非个例。当标准 SQL 查询无法进行时,如何快速定位损坏块,并找到受影响的数据?YashanDB 提供了 dump 命令与 rowid 查询的组合方案,帮助你在应急场景下快速排查。

一、问题场景

客户环境中,部分数据文件可能由于异常宕机或磁盘故障出现损坏,直接查询表数据时提示如下错误:

YAS-02147: failed to read block from file

image.png
此时就需要通过系统级工具直接 dump 数据文件内容,再结合 rowid 获取相关记录,辅助排查数据丢失、定位表结构等问题。

image.png
image.png
二、适用版本

本方法适用于 所有 YashanDB 版本

三、操作步骤详解

image.png
步骤 1:确认目标文件 ID 和 block 起始位置

1、查询表空间对应的文件 ID:

SELECT tablespace_name, file_id FROM v$datafile;

例如 users 表空间对应的 file_id 可能是 4.

2、确认目标表的起始 block 和 block 数量:

SELECT segment_name, header_block, blocks FROM dba_segments WHERE segment_name = 'CUSTOMER';

如果 CUSTOMER 表从 block 131 开始,包含 8 个 block,那有效范围就是 131 到 138.

步骤 2:执行dump命令

ALTER SYSTEM DUMP DATAFILE 4 MINBLOCK 131 MAXBLOCK 140;

该命令会将指定范围的数据块内容以 trace 文件形式导出,文件默认保存在 trace 目录。

可通过系统日志查看 trace 文件路径,一般命名类似 yashan_yas_xx.trc

image.png
步骤 3:分析 trace 文件内容

使用 cat 或编辑器打开 .trc 文件,找到如下类似内容:

DISK BLOCK DUMP
heap data
head: id 0-135 ...
rows: 1
row[0]: size: xxxx columns: 3 ...

说明第 135 号 block 中仍有有效数据。
image.png

步骤 4:拼接rowid查询数据

通过 trace 文件中的字段提取构造 rowid:

dataoid = 2486
spaceid = 4
fileid = 0
blockid = 135
slot(dir) = 0

拼接规则:

rowid = dataoid:spaceid:fileid:blockid:slot

即:

2486:4:0:135:0
然后使用如下 SQL 查询原始记录:

SELECT * FROM your_table WHERE rowid = '2486:4:0:135:0';

这样,即使表已部分损坏,也能直接定位某一数据块内的记录,极大提高了排查效率。

image.png
四、小结建议

遇到 YAS-02147 类错误时,可第一时间通过 dump+rowid 方法辅助定位;

建议运维人员熟悉数据文件结构与系统视图,提升应急响应速度;


数据库砖家
1 声望0 粉丝