Мониторинг сервера

Данная статья является продолжением серверной тематики. Подняв свой сервер, за ним необходимо следить. Ведь он, как ребенок, нуждается во внимании, заботе и обеспечении безопасности. Нужно следить за состоянием как аппаратной, так и программной части. Отслеживать на нем все внештатные ситуации, такие как перегруз, атака на сервер или выход из строя жестких дисков в RAID-массиве. Вот здесь нам помогут некоторые утилиты, о которых я расскажу чуть ниже. Сразу оговорюсь, что это просто обзорная статья и здесь не будут расписаны способы установки этих утилит.

Итак, одним из критически важных компонентов сервера является жесткий диск. Именно его состоянию необходимо уделять огромное внимание. Желательно, чтобы у вас был настроен RAID. Например, RAID 1 повышает вероятность сохранности данных в 2 раза, а RAID 10 еще и скорость записи. Одним из признаков того, что что-то не так, является распад RAID-массива. Тут необходимо просмотреть логи, а также S.M.A.R.T. дисков. Логи обычно хранятся в /var/log, ну а S.M.A.R.T. можно глянуть при помощи утилиты smartctl. Если есть ошибки, то желательно этот диск заменить и не использовать больше на сервере.

Температура. Перегрев – крайне нежелательное состояние для любой техники, и компьютер не исключение. Да, на уровне BIOS есть защита, которая не даст спалить ваш процессор, просто отключив питание в критический момент. Но нам ведь этого не надо?! Сервер, по возможности, должен стоять в прохладном месте. Да в прочем, и любая другая техника не откажется от такого блага в +30. Следить за температурой можно при помощи sensorsd.

Нагрузка на сервер. Одна нелепая ошибка в приложении или скрипте может стоить употреблением всех ресурсов этим приложением или скриптом. Если серьезно, то тут все зависит от того, где стоит и для чего предназначен этот сервер. Домашний сервер, вряд ли, ждет перегруз. Но все же, время от времени лучше за ним поглядывать, для этого можно использовать htop (удобно и понятно).

Важно не забывать про антивирусную защиту сервера. В случае с почтовым сервером можно "на лету" проверять почту на содержание вредоносного кода и СПАМа. На файловом хранилище – заливаемые файлы. Говоря про защиту, невозможно не упомянуть про firewall. Лучше закрыть все порты и оставить только нужные для правильной работы. SSH перенести со стандартного порта. Ну и временами проверять Auth.log. Иногда, там можно увидеть что-то интересное.

Все это, конечно, хорошо. Но не удобно пользоваться всем этим по-отдельности. Нужно запускать каждую утилиту отдельно или же запускать их скриптом, при этом просматривая кучу лишних данных. Именно для этого существуют комплексные экраны отслеживания. И один из них – Zabbix. Гибкий и удобный инструмент системного администратора. Отлично дополняется при надобности. Есть несколько способов оповещения о проблеме – email, jabber, sms. Есть очень удобная вещь – карта сети. То есть, можно так же отслеживать и другие сетевые устройства, такие как роутер, рабочие станции пользователей и т.д. Все удобно в читабельном виде выводится в виде графиков, к тому же легко устанавливается. Проблем с ним возникнуть не должно.

На этом все. Стабильной работы и большого аптайма вам.

Добавить комментарий