This topic created in 627 days ago, the information mentioned may be changed or developed.
服务器上一直不停报错没注意,跑了几个月,竟然把 journal 的日志占满了。journal 日志一直没限制。后来清理的时候发现大概占了硬空间的 80%左右,其实是发现 ssh 登不上去了才发现这个问题。
商家的 vnc 也因为硬盘满了,tty 进不去。
还好进救援模式才进去了,不然只能重装了。一看是真的 100%,一点也没有空余空间了。
期间还发现了如果硬盘满了,挂载里面 loop 文件也挂载不上去,提示“块有问题”。清理完后就行了
后来复盘的时候才发现是一个 loop 硬盘满了,读写一直失败。导致宿主机一直记录这个失败日志,导致宿主机硬盘也满了。
硬盘满了后,感觉有不少软件会卡在 syslog 或者其他 log 函数上。很多软件都会出现预期之外的行为。
22 replies 2024-09-24 11:07:25 +08:00  | | 1 wacxr123 Sep 15, 2024 via Android 确实,我的经验是如果按 Tab 无法自动补全路径,就知道是盘满了( |
 | | 2 flynaj Sep 15, 2024 via Android 这个时候你就知道 zabbix 的好处了。 |
 | | 3 Donaldo Sep 15, 2024 我中招过几次,但我一堆服务器总是懒得去设置,其实可以设置一下 rotate 或者过期日期,要不迟早有满的一天。。。啊,好累。。。 |
 | | 4 Kumo31 Sep 15, 2024 这些行为就是预期内的,只不过大部分软件的设计者就没考虑处理这种情况。我们还有一个专门的避免任何 IO 的程序去做这种情况下的节点降级处理 |
 | | 5 june4 Sep 15, 2024 我自己写了个快满了无限 5 分钟发一次邮件的定时任务,放在我的 linux 服务器初始化安装脚本里。
#!/bin/bash -e if [[ -f /etc/default/disk-usage-agent ]]; then . /etc/default/disk-usage-agent fi max_usage=${max_usage:-90} usage=$(df | grep -e '/$' | awk '{print $5}' | tr -d %) if (( usage > max_usage )); then warnmsg="WARNING: disk-usage-agent: exceeds max usage: $usage%" echo $warnmsg >&2 df -h | /opt/util/bin/mailadmins "$warnmsg" - fi |
 | | 6 totoro625 Sep 15, 2024 某些程序的写入操作是删除原有数据再写入(并不是追加和修改),硬盘已满的情况下这样会导致文件丢失 这里点名 acme |
 | | 7 kneo Sep 15, 2024 via Android 这不叫 bug 。举个再极端的例子,你电脑断电了程序挂了,你能说这是软件 bug ? |
 | | 8 L4Linux Sep 15, 2024 你们运维在干啥? logrotate 都不跑一下的吗? |
 | | 9 dfdd1811 Sep 15, 2024 所以虽然我自己只有三台机器,但我还是用 prometheus+grafana… |
 | | 10 wheat0r Sep 15, 2024 这事最大的 bug 是有人把硬盘跑满了 |
 | | 12 wolonggl Sep 15, 2024 磁盘满了。依赖在磁盘创建临时文件基本收到影响, 报告/tmp 空间满了后,一大堆软件受影响 |
 | | 13 flyqie Sep 16, 2024 这个其实蛮正常的。
毕竟不同软件的内部流程是不一样的,自然是没法统一的。
并且说真的。。应该设个剩余空间报警,不然很麻烦。 |
 | | 14 Yii234 Sep 16, 2024  最基础的主机监控告警都没有,是生产服务器吗? |
 | | 15 PerFectTime Sep 16, 2024 想起来之前看到的一个段子,新拿到服务器先 dd 一个 10g 的空文件,等到磁盘满了删除该文件以快速解决磁盘占用满的问题 |
 | | 16 sunxvvv Sep 16, 2024 硬盘满了,数据无法写到硬盘上,程序和内核的部分功能无法正常完成,不出问题才不合理吧...... |
 | | 19 FrankAdler Sep 17, 2024 /usr/bin/journalctl --vacuum-size=50M 放定时任务把 |
 | | 22 dode Sep 24, 2024 升级系统命令好久都执行失败,提示请求源错误,后来看一下,系统根目录空间满了。 |