『壹』 生產etcd伺服器掉電故障修復
客戶現場集群異常掉電,我們於中午進行遠程恢復集群。啟動etcd服務時。出現如下錯誤
查看資料說是:
One of the member was bootstrapped via discovery service. You must remove the previous data-dir to clean up the member information. Or the member will ignore the new configuration and start with the old configuration. That is why you see the mismatch.
大概意思:
其中一個成員是通過discovery service引導的。必須刪除以前的數據目錄來清理成員信息。否則成員將忽略新配置,使用舊配置。這就是為什麼你看到了不匹配。
看到了這里,問題所在也就很明確了,啟動失敗的原因在於data-dir (/var/lib/etcd/default.etcd)中記錄的信息與 etcd啟動的選項所標識的信息不太匹配造成的。
解決方案:將該節點的etcd從集群中移除,並刪除相關數據(後面可同步恢復)。再重新加入etcd集群。
1.查看現有etcd節點
2.將報錯節點移除
3.修改/usr/lib/systemd/system/etcd.service
4.刪除數據
5.重新將etcd節點進行添加
6.啟動etcd,重新加入的節點會向前兩個節點重新同步數據