Ceph 独立 DB 盘故障处理
故障场景
假设我们遇到以下情况:
- 数据盘:
/dev/sdX - 独立 db 盘:
/dev/ceph-db/db-1 - 出问题的 OSD id:2
- 出问题的节点:ceph228
处理步骤
-
确认集群状态
ceph -s ceph health detail确认问题 OSD(例如 osd.2)处于
down/in状态。 -
定位故障原因
检查系统日志 (
dmesg,/var/log/messages) 和 Ceph OSD 日志,确认是否是 DB 盘故障导致的 OSD 崩溃。 -
更换 DB 盘
如果确认是 DB 盘物理故障,需要更换硬盘并重建 OSD 的 DB 分区。