问题现象
ECS挂载过一个vepfs后,需要重新挂载新的vepfs,报错如下:
排查步骤
- 在ecs节点执行如下命令:
df -h
查看是否挂载点还存在,如果存在将其umount。
- 在老vepfs 管理节点执行如下命令:
vepfs delforce "ECS IP"
将节点从集群中删除后,再重新挂载文件系统。如果执行此命令后仍然报错,继续进行查看。
- 使用ls -al 查看/mnt目录,是否结果如下:
然后使用lsof | grep vepfs ,是否结果如下: 可以看到/mnt/vepfs 有文件处于State file handle 状态。 此时,最直接的方法直接重启,然后让处于State file handle状态的文件释放,然后删除vepfs目录,再重新进行挂载。
根因描述
由于文件系统出问题的原因复杂,这里只是总结可能的原因:
突然跟vepfs server 端断开连接,此时有进程仍然保持vepfs中文件句柄,但对应的目录项已经不存在;