自己用 N5105 配 nvme 硬盘搭建的 pve ,用了 2 年了吧
突然在前天断电了一次,就启动不了了,接上显示器查看卡在了
/dev/mapper/pve-root: clean, 213944/7012352 files, 16716818/20049408 blocks
一直进不去
在网上搜索相关资料,基本都是说重装/硬盘损坏等,有 1-2 个说改配置文件之类的,照着改了也没生效,一样卡住
然后自己进恢复模式也不行,也是一堆的报错,一直卡住,我就一直手动重启重启,也不知道重启了多少次,折腾了 3 个小时,突然进系统了
但是特别的卡,web 页面很久都加载不出来,哪怕 ssh 输入了都很久没反应,从 ip 能 ping 通到 ssh 能连上,起码有 20 分钟
我总共就装了 2 个 lxc ,1 个 vm
等能正常进 ssh 和 web 了,我在 web 看了下 io ,基本几秒钟就能跑 80%以上,甚至 95%以上,直接卡红,但是通过 iotop 等命令查看,并没有很高的磁盘读写进程,然后又用命令看了下硬盘健康度,也都是正常范围内,没有问题,磁盘剩余空间也大于 60%
现在就不知道怎么搞了,也不敢再重启或者断电,怕又起不来,现在在 web 端备份一下虚拟机(备份完成文件 8g 左右),备份了一下午才备份完成,以前都是 4-5 分钟就好了
来问问各位大佬,这种该如何排查,请指教,谢谢。
![]() |
1
OP
12 小时 27 分钟前 没有老哥指点吗?
|
![]() |
2
12 小时 2 分钟前 应该是硬盘有问题了。可能你的盘坏了
|
![]() |
3
10 小时 1 分钟前 iowait 很可能是主要问题 看看硬盘
|
![]() |
5
OP
8 小时 52 分钟前 @Alliot SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00 Temperature: 55 Celsius Available Spare: 91% Available Spare Threshold: 10% Percentage Used: 6% Data Units Read: 113,625,498 [58.1 TB] Data Units Written: 62,643,145 [32.0 TB] Host Read Commands: 1,455,671,213 Host Write Commands: 1,812,177,678 Controller Busy Time: 191,896 Power Cycles: 160 Power On Hours: 20,235 Unsafe Shutdowns: 146 Media and Data Integrity Errors: 0 Error Information Log Entries: 0 Warning Comp. Temperature Time: 68 Critical Comp. Temperature Time: 14 这是硬盘信息,应该没啥问题哇 |
![]() |
6
7 小时 26 分钟前 趁着还能访问,别折腾了,直接备份 -> 更换,就得了。N5105 这种小主机更换成本也相对不高,也算正好有理由换个 N150 ,N355 的升级下
|
![]() |
7
4 小时 56 分钟前 而且你放小主机本来应该也不是啥重要数据 重来就行了 重要的还是推荐 NAS+云端双保险
|