‘壹’ 生产etcd服务器掉电故障修复
客户现场集群异常掉电,我们于中午进行远程恢复集群。启动etcd服务时。出现如下错误
查看资料说是:
One of the member was bootstrapped via discovery service. You must remove the previous data-dir to clean up the member information. Or the member will ignore the new configuration and start with the old configuration. That is why you see the mismatch.
大概意思:
其中一个成员是通过discovery service引导的。必须删除以前的数据目录来清理成员信息。否则成员将忽略新配置,使用旧配置。这就是为什么你看到了不匹配。
看到了这里,问题所在也就很明确了,启动失败的原因在于data-dir (/var/lib/etcd/default.etcd)中记录的信息与 etcd启动的选项所标识的信息不太匹配造成的。
解决方案:将该节点的etcd从集群中移除,并删除相关数据(后面可同步恢复)。再重新加入etcd集群。
1.查看现有etcd节点
2.将报错节点移除
3.修改/usr/lib/systemd/system/etcd.service
4.删除数据
5.重新将etcd节点进行添加
6.启动etcd,重新加入的节点会向前两个节点重新同步数据