Для Centos 7

 

Проверяем наличие утилиты:

# sudo whereis smartctl

Устанавливаем утилиту smartmontools:

# sudo yum install smartmontools

Добавляем в автозагрузку:

# sudo systemctl enable smartd

 

Информация о диске /dev/sda:

# sudo smartctl -i /dev/sda

Если S.M.A.R.T. отключен, то для включения нужно выполнить команду

# sudo smartctl -s on /dev/sda

Проверить диск:

# smartctl -t long <диск>, далее смотрим smartctl -x <диск>  (smartctl -t long /dev/sgX)

или:

# smartctl -d sat --all /dev/sdX

Проверить SCSI диск:

# sudo smartctl -d scsi --all /dev/sdX

и смотрим:

# smartctl -d sat --all /dev/sdX -H

Где:

-t short : Запуск быстрого теста.
-t long : Запуск полного теста.
-d scsi : Указывает scsi, как тип устройства.
--all : Отображает всю SMART информацию для устройства.

Список поддерживаемых тестов и примерное время на каждый текст:

# sudo smartctl -c /dev/sda

Т.к. тест запускается в фоне, то статус проверки можно узнать с помощью

# sudo smartctl -l selftest /dev/sda

Журнал ошибок, произошедших во время работы диска

# sudo smartctl -l error /dev/sda

Журнал тестов самодиагностики

# sudo smartctl -l selftest /dev/sda

 

Для периодического тестирования дисков в ОС без systemd настроим демон smartd, для этого нужно

  • под Ubuntu: активировать smartd в /etc/default/smartmontools, задать настройки в /etc/smartd.conf, перезапустить демон sudo /etc/init.d/smartmontools restart;
  • под CentOS: активировать smartd в /etc/smartd.conf, задать настройки в /etc/smartd.conf, перезапустить демон sudo /etc/init.d/smartd restart;

 

В Centos 7 настраиваем конфиг /etc/smartmontools/smartd.conf и выполняем:

# sudo systemctl restart smartd

Увидеть диски за RAID контроллером Megaraid:

# sudo smartctl -a -d megaraid,N  /dev/sda

# sudo /usr/sbin/smartctl -a -d sat+megaraid,1 /dev/sda

где N - это номер контроллера

 

-------------------------------------------------------+

 

Параметры которые требуется проверять:

 

# sudo smartctl -d sat --all /dev/sdX

05 Reallocated Sectors Count    -Число операций переназначения секторов. (не критично)

187 Reported UNC Errors  -Неустранимые аппаратные ошибки.

197 Current Pending Sector Count   -число секторов- кандидатов на перенос в резервную зону

198 Uncorrectable Sector Count   -Число некорректируемых ошибок при обращении к сектору.

199 UltraDMA CRC Error Count   -Число ошибок при передаче данных по внешнему интерфейсу.

http://sysadm.pp.ua/linux/monitoring-systems/smart-attributes.html

 

так же смотрим на наличие ошибок раздел:

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       40%     22197         1389062303
# 2  Extended offline    Interrupted (host reset)      80%     22171         -
# 3  Short offline       Completed without error       00%     10892         -

 

LBA_of_first_error = 1389062303   -это плохо

 

Материалы:

https://ru.wikipedia.org/wiki/S.M.A.R.T.

http://proft.me/2012/02/10/smartd-monitoring-sostoyaniya-zhestkogo-diska/

http://www.wandmagic.ru/news/178.html

https://www.thomas-krenn.com/en/wiki/Smartmontools_with_MegaRAID_Controller

 Подробно про SMART:

https://www.ixbt.com/storage/hdd-smart-testing.shtml