用 Debian 或其他 Linux 发行版做主系统,相比于群晖的自动报警,该如何检测硬盘健康状态 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。

如果没有发送到 /go/in,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
henryshen233
V2EX    NAS

用 Debian 或其他 Linux 发行版做主系统,相比于群晖的自动报警,该如何检测硬盘健康状态

  •  
  •   henryshen233 2023-05-20 12:05:42 +08:00 4524 次点击
    这是一个创建于 927 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如果是群晖 NAS 的话,硬盘出问题会通过手机 App 提醒,假如是 Debian 的话,该如何察觉硬盘问题
    24 条回复    2023-07-11 18:13:57 +08:00
    changnet
        1
    changnet  
       2023-05-20 12:10:18 +08:00
    自己部署运维脚本(也有现成开源的运维系统),监测到有问题就发封邮件,发短信、电话都行。
    sNullp
        2
    sNullp  
       2023-05-20 12:10:44 +08:00
    自己写一个脚本定期 run smart test ,让 smartmontools 自带的 daemon 遇到 test 错误就发邮件。
    或者跟我一样用 zfs ,有问题自动发邮件。
    jim9606
        3
    jim9606  
       2023-05-20 12:13:04 +08:00
    smartmontools 可以后台监视,会发通知,应该有用 smtp 发邮件的方法
    ltkun
        4
    ltkun  
       2023-05-20 12:23:34 +08:00 via Android
    zfs mdadmin 天天给我发邮件
    optional
        5
    optional  
       2023-05-20 12:31:15 +08:00 via iPhone
    找个 exporter 然后要么 Prometheus 要么自己写个小脚本
    Hardrain
        6
    Hardrain  
       2023-05-20 12:51:10 +08:00
    man smartd
    wellerman
        7
    wellerman  
       2023-05-20 13:11:23 +08:00
    群晖之类的 NAS 系统,本来就是缝合怪。缝合了一堆开源工具,就拿出来卖了。
    pollux
        8
    pollux  
       2023-05-20 15:22:16 +08:00
    用 smart 来监控异常,使用 shell 脚本或 python 胶水语言,调用钉钉或者飞书接口报警
    mingl0280
        9
    mingl0280  
       2023-05-20 15:31:15 +08:00 via Android
    smartd(smartmontools)自动监视发邮件,然后 sendmail 和 msmtp 之类的客户端找个能用的 pop3 配置好直接邮件发到手机上。我现在就这么搞的。
    FrankAdler
        10
    FrankAdler  
       2023-05-20 16:26:27 +08:00 via iPhone
    我是 pve 开了 grafana 和 prometheus ,采集 cpu 、内存啥的,加上 smart 信息应该也不难
    greenskinmonster
        11
    greenskinmonster  
       2023-05-20 16:37:50 +08:00 via Android
    smartctl -H /dev/sda --json 定时检查是不是 passed 状态即可
    raptor
        12
    raptor  
       2023-05-20 17:32:57 +08:00
    配置一个 smartmontools 监控啊: https://mental.we8log.com/mental/post/400/
    shijingshijing
        13
    shijingshijing  
       2023-05-20 17:40:50 +08:00
    硬盘本身每那么娇气,真正靠谱的是离线冷备,RAID1 什么的都不如冷备,数据不铭感上传网盘做备份也行。群辉这种很大部分是智商税,他那个硬盘监控很多只要 SMART 数据稍微异常就给你废掉整个盘其实完全没必要,让你多花钱而已,硬盘本身就带有纠错,PList ,GList 等各种措施,只要你不用叠瓦一般都皮实的很,更高级的氦气盘防护措施更多。

    你可以看下这个新闻: https://finance.sina.com.cn/tech/2021-02-02/doc-ikftssap2457855.shtml
    itechify
        14
    itechify  
    PRO
       2023-05-20 18:14:00 +08:00 via Android
    组 RAID 不是备份
    0superx0
        15
    0superx0  
       2023-05-20 21:20:58 +08:00
    折腾过 nas ,个人环境找不出什么使用场景,
    要文件共享方案,其实主机开个 smb 完事了,
    要科学上网,挂个 clash 跑机场当网关,
    除了小姐姐外,个人文件还不如挂个 webdav 网盘来得安全
    azure2023us559
        16
    azure2023us559  
       2023-05-20 21:23:49 +08:00 via Android
    容灾备份才能算上真正意义上的备份。
    mikewang
        17
    mikewang  
       2023-05-20 23:07:47 +08:00
    我用的成品 NAS ,也不完全信任 NAS 系统自带的自动报警。
    自己写了一个 Python 脚本定时调用 smartctl 命令。
    举个例子:`smartctl -x /dev/nvme0 -json`
    然后解析 json ,自行判断。
    mikewang
        18
    mikewang  
       2023-05-20 23:13:51 +08:00
    #17 @mikewang 更正:`smartctl -x /dev/nvme0 --json`,漏打一个横杠。
    Zhouisme
        19
    Zhouisme  
       2023-05-21 03:56:19 +08:00
    cron + brank ,配合一种语言
    1.cron 定时执行程序 bash.sh ,grep 获取想要的硬盘 status ,加以判断,或者直接存为环境变量。py 、go 去获取环境变量判断。
    2.py 、go 手写一个发送 get 的小程序,被 bash.sh 调用。
    3.brank 只能用于 iOS 。

    这是最简单最轻量的吧,智力负担也小。
    Zhouisme
        20
    Zhouisme  
       2023-05-21 03:58:42 +08:00
    @Zhouisme

    补充,不会 py 、go 等编程语言也没问题。用 curl 发送 get 请求即可。复杂度又降低了。
    laucenmi
        21
    laucenmi  
       2023-05-21 10:53:38 +08:00
    @FrankAdler pve 硬盘有故障会自己发送邮件,就是安装的时候填写的 email 地址
    gvdlmjwje
        22
    gvdlmjwje  
       2023-05-21 14:51:19 +08:00 via Android
    如果是物理服务器,用 bmc 的硬件告警功能
    FrankAdler
        23
    FrankAdler  
       2023-05-22 00:16:17 +08:00
    @laucenmi 那还挺好
    xinyu391
        24
    xinyu391  
       2023-07-11 18:13:57 +08:00
    @wellerman 如果用了 gpl 的开源代码,可以要求群晖 开源 他们的代码啦
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5561 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 90ms UTC 03:13 PVG 11:13 LAX 19:13 JFK 22:13
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86