SS Sub
免费、付费机场节点和订阅

PVE 运行缓慢如何排查?

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请  登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

V392920

V2EX  ›  程序员

PVE 运行缓慢如何排查?

  •  
  •   V392920 · 16 小时 14 分钟前 · 406 次点击

    自己用 N5105 配 nvme 硬盘搭建的 pve ,用了 2 年了吧

    突然在前天断电了一次,就启动不了了,接上显示器查看卡在了

    /dev/mapper/pve-root: clean, 213944/7012352 files, 16716818/20049408 blocks 一直进不去

    在网上搜索相关资料,基本都是说重装/硬盘损坏等,有 1-2 个说改配置文件之类的,照着改了也没生效,一样卡住

    然后自己进恢复模式也不行,也是一堆的报错,一直卡住,我就一直手动重启重启,也不知道重启了多少次,折腾了 3 个小时,突然进系统了

    但是特别的卡,web 页面很久都加载不出来,哪怕 ssh 输入了都很久没反应,从 ip 能 ping 通到 ssh 能连上,起码有 20 分钟

    我总共就装了 2 个 lxc ,1 个 vm

    等能正常进 ssh 和 web 了,我在 web 看了下 io ,基本几秒钟就能跑 80%以上,甚至 95%以上,直接卡红,但是通过 iotop 等命令查看,并没有很高的磁盘读写进程,然后又用命令看了下硬盘健康度,也都是正常范围内,没有问题,磁盘剩余空间也大于 60%

    现在就不知道怎么搞了,也不敢再重启或者断电,怕又起不来,现在在 web 端备份一下虚拟机(备份完成文件 8g 左右),备份了一下午才备份完成,以前都是 4-5 分钟就好了

    来问问各位大佬,这种该如何排查,请指教,谢谢。

    V392920
        1

    V392920  

    OP

       12 小时 27 分钟前

    没有老哥指点吗?
    yc8332
        2

    yc8332  

       12 小时 2 分钟前

    应该是硬盘有问题了。可能你的盘坏了
    Alliot
        3

    Alliot  

       10 小时 1 分钟前

    iowait 很可能是主要问题 看看硬盘
    V392920
        4

    V392920  

    OP

       8 小时 53 分钟前

    @yc8332 我通过命令和 web 看 smart 值,都是正常的,还有啥方法确认是硬盘问题吗?
    V392920
        5

    V392920  

    OP

       8 小时 52 分钟前

    @Alliot SMART/Health Information (NVMe Log 0x02)
    Critical Warning: 0x00
    Temperature: 55 Celsius
    Available Spare: 91%
    Available Spare Threshold: 10%
    Percentage Used: 6%
    Data Units Read: 113,625,498 [58.1 TB]
    Data Units Written: 62,643,145 [32.0 TB]
    Host Read Commands: 1,455,671,213
    Host Write Commands: 1,812,177,678
    Controller Busy Time: 191,896
    Power Cycles: 160
    Power On Hours: 20,235
    Unsafe Shutdowns: 146
    Media and Data Integrity Errors: 0
    Error Information Log Entries: 0
    Warning Comp. Temperature Time: 68
    Critical Comp. Temperature Time: 14

    这是硬盘信息,应该没啥问题哇

    GobyHsu
        6

    GobyHsu  

       7 小时 26 分钟前

    趁着还能访问,别折腾了,直接备份 -> 更换,就得了。N5105 这种小主机更换成本也相对不高,也算正好有理由换个 N150 ,N355 的升级下
    hysjw
        7

    hysjw  

       4 小时 56 分钟前

    而且你放小主机本来应该也不是啥重要数据 重来就行了 重要的还是推荐 NAS+云端双保险

    未经允许不得转载:机场推荐官 » PVE 运行缓慢如何排查?