PVE 故障 500,虚拟机无法重启,如何处理?
PVE 今天突然故障了,请教下如何处理?现象如下:
SSH 可以正常连接,但有些命令无法执行,reboot 重启也无效,虚拟机和宿主机都无法关机或重启
PVE 管理页面 local-lvm 报错:no such logical volume pve/data(500),如图
是一台 AMD 小主机,配的一块 M2 固态。用了快一年了,一直没动过。
是不是额外的磁盘没挂上,重新挂一下看看,不然就是磁盘有问题
no such logical volume pve/data(500) 磁盘掉了/坏了 ?
实体机看看 raid 挂了没
开 ssh ,我帮你远程看下
感觉是盘挂了,建议描述下硬件情况
最近没动过硬盘,怎么重新挂载?
别啊,这个 AMD 小主机,刚用了没一年呢
内网机器不方便远程呢
AMD 小主机,配的一块 M2 固态 1T ,常年开着,跑一些 docker ,平时开发用
看下主机在线时间,如果没重启过,就是硬盘坏了
大概率硬盘挂了,重新接下 m2 再开机吧
如果开不了,那只能换硬盘重装系统了
目测 SSH 能连接,fdisk 把 locla-lvm 分区容量扣 10G 下去
如果是硬盘坏了,为啥 SSH 能连接,文件内容也能看到。好奇怪
怎么执行?在 pve 终端执行命令都返回:-bash: /usr/bin/*: Input/output error
minio.hoopan.net/lobe/files/482478/f808658b-832b-470f-a189-b6569301d531.png
df -h
pvs
vgs
lvs -a
fdisk -l
lsblk
blkid
都贴一下吧
dmesg
journalctl -e
看看日志里的 error
pve 宿主机 journalctl 日志
报错日志: minio.hoopan.net/lobe/files/482478/6a07683c-ce64-489b-8df0-3d6ff4e666d4.png
上面是日志,麻烦看下
-bash: /usr/bin/*: Input/output error 这就是硬盘读取失败最明显的信息
硬盘坏了,但是常用文件在内存缓存内,所以直接读内存返回了
别挣扎了,就是硬盘故障。如果有重要的小文件,可以尝试备份下
然后关机重新接下硬盘,看能不能恢复(有时候接口问题或硬盘、控制器过热,重新接下可能会恢复)
你的日志也指向了硬盘故障
不信群里大佬的分析,你就让 AI 分析日志吧
终端上 Input/output error 就是盘坏掉了,而且你这前面的路径是系统盘路径。
vm 上能 ssh 就 ssh 上去把数据备份下。然后准备一个 ISO 的 Linux 启动到内存修复下 pve 的系统盘试试
前段时间刚坏过一块硬盘,也是一样的 Input/output error ,只不过我的是数据盘,不是系统盘,也是一块固态,所以确定是硬盘坏了,不要重启,抓紧时间备份换硬盘吧,重启了可能就起不来了
有一定概率重启自动 fsck 就好了
测试机,倒没什么重要数据,就是要重新安装一遍,烦。这吊固态没有 nas 的机械盘稳
嗯嗯,晚点我试试
大概率是你改了 ip 或者 hostname 导致的
不对,应该就是磁盘掉了,不一定是磁盘问题,也有可能是主板问题。
你应该 fsck 先尝试修复,不行的话,试试换到别的主板上。如果别的主板也不行,那就是磁盘换了
各位 V2EXer 大家好,我是《 Redis 应用实例》的作者黄健宏! 最近新书刚刚出版,今天问出版社拿了些样书进行宣传,好些年前在 V2EX 给大家送过我的其他两本 Red…
在仅考虑 HTTP API 开发的前提下,大家有什么推荐的 Golang Web 框架或脚手架吗? 如果不使用框架/脚手架自己组合的话,常用组件大家是如何选型的呢? ww…
1972 – C语言的先驱——B语言,被贝尔实验室开发。B语言是一个很快速的,容易维护的,而且对于从系统到应用开发是很好用的。设计这门语言的整个团队被马上解雇了,因…