База знаний / Серверы• 1 мин
Диски на Linux: SMART, деградация и мониторинг IOPS/latency
Как заранее поймать проблемы с дисками: SMART, ошибки, latency и правильные алерты.
SMART — что смотреть
- Reallocated / Pending sectors
- UDMA CRC errors (кабель/контроллер)
- Temperature
Метрики диска
- Latency (read/write)
- IOPS / throughput
- Queue length / utilisation
Алерты
- Рост latency выше baseline
- Ошибки I/O в dmesg/journal
- Заполнение FS > 80% (и отдельный алерт > 90%)