IT
IT-Konsult
ИТ‑аутсорсинг для бизнеса

База знаний / Серверы 1 мин

Диски на Linux: SMART, деградация и мониторинг IOPS/latency

Как заранее поймать проблемы с дисками: SMART, ошибки, latency и правильные алерты.

SMART — что смотреть

  • Reallocated / Pending sectors
  • UDMA CRC errors (кабель/контроллер)
  • Temperature

Метрики диска

  • Latency (read/write)
  • IOPS / throughput
  • Queue length / utilisation

Алерты

  • Рост latency выше baseline
  • Ошибки I/O в dmesg/journal
  • Заполнение FS > 80% (и отдельный алерт > 90%)