Безопасно проводить тесты, требующие отключения сервера
Итак, в основном я тестирую и диагностирую свои ИБП, а также источники питания (PSU) моего сервера. Для этого я отключаю сервер "трудным путем", отсоединяя его от стены, чтобы имитировать потерю мощности.
Я делал это, как описано выше, и помог мне определить, какие ИБП не работают должным образом, а также какие блоки питания нужно изменить (если сервер выключается, что-то нужно менять, иначе все в порядке). Тем не менее, я начинаю беспокоиться о том, что постоянное отключение моего сервера и "убийство" его трудным способом может привести к некоторому повреждению его или моих данных.
Это подводит меня к моему вопросу: существует ли альтернативный способ выполнения этих тестов, чтобы минимизировать вероятность повреждения сервера или его частей? Или в том, что я сейчас делаю, нет проблем?
Опять же, я пытаюсь определить, какие источники питания неисправны (то есть ИБП в порядке, но сервер все равно умирает при отключении от сети). Источники бесперебойного питания, которые я могу протестировать самостоятельно, чтобы не испытывать этот метод на сервере, но я не могу понять, как проверить, могут ли мои блоки питания обрабатывать колебания и пики, фактически не испытывая их на работающем сервере. Любое руководство с благодарностью.
Рассматриваемый сервер: сервер HP ProLiant DL380 G7 с Intel Xeon. У меня также есть это с RAID 1 уровня на его жестких дисках. На его SSD работает Ubuntu 16.04.3 LTS.
3 ответа
У вас есть HP ProLiant DL380 G7. Посмотрите на следующее:
Дисплей системного обзора (SID) показывает состояние внутренних компонентов.
Если у вас есть желтый индикатор на любом из источников питания: показанный на SID или на реальных физических единицах, есть проблема.
Вы также можете войти в ILO сервера, чтобы проверить журнал интегрированного управления. Если вы внезапно теряете мощность, в журнале может быть запись, указывающая что-то вроде:
- Server reset.
- Server power removed.
- Server power restored.
У вас есть возможность не подключать оба источника питания к одному ИБП. Подключите один к электросети и наблюдайте за поведением.
Проверьте прошивку в вашей системе. Серверы G7 сейчас старые, но при использовании Ubuntu вам, вероятно, не хватает агентов отчетов и управления HP (они оптимизированы для RHEL/CentOS/VMware/Windows). Вы можете загрузить полный набор прошивок для этой модели, используя этот загрузочный DVD-диск HP.
Не отсоединяйте ИБП от стены. Я задал похожий вопрос 9 лет назад на этом сайте и получил следующий ответ от Evan Anderson:
ИБП теряет электрическое заземление, когда вы отсоединяете его от стены. Хотя маловероятно, что что-то пойдет не так, разработчики ИБП "ожидают", что этот путь к земле будет всегда оставаться доступным, и если что-то будет коротким во время теста, вы можете увидеть искры (дым, пламя и т. Д.), Когда электричество берет другое путь к земле. Я отсоединил ИБП от стены для тестирования раньше, но, увидев вспышку "молнии" и услышав громкий "грохот", выходящий из ИБП во время одного из таких испытаний, дал мне "религию" о том, что я больше не буду этого делать.
Поэтому, если вы подключены к розетке, выключите ее. Если вы не подключены к розетке, подумайте о том, чтобы подать питание на автоматический выключатель, чтобы цепь заземления оставалась подключенной.
Что касается отключения ваших серверов, потянув за вилки, вы не должны наносить физический ущерб машинам, делая это. Вы можете повредить RAID-массивы без батарейного питания или прервать запись в полете, что может привести к грязным файловым системам и потере данных, но с физическими серверами все должно быть в порядке.
Что касается вашей реальной проблемы, которая заключается в том, что во время отключений / отключений / скачков вы все еще теряете свои серверы перед вашим ИБП, есть несколько причин, которые могут вызвать это:
- Если на ваших серверах установлены два блока питания, и один из них подключен к ИБП, а другой - нет (что является достаточно распространенным), возможно, произошла ошибка при переключении блока питания внутри сервера.
- Опять же, если у вас два источника питания, возможно, один из них перегружен, а сервер выключен из соображений безопасности.
- В зависимости от типа ИБП, он может перестать работать правильно. Когда-то у меня был сайт с постоянными отключениями - от 20 до 30 раз в день мощность падала бы ниже 200 В (обычно 230 В), и ИБП переходил в режим повышения напряжения, а иногда напряжение резко возрастало до 250 В, и ИБП выходил из строя. Режим. Это значительно сократило срок службы традиционных ИБП (я обычно получал около года от ИБП). Мы перешли на ИБП с двойным преобразованием (также называемый онлайн-ИБП), который решил эту проблему.
Две заметки:
Один из них заключается в том, что лучший способ подключения ИБП - через два источника питания ваших серверов. В случае сбоя питания или ИБП (аккумулятор) все остается на месте.
Второе: кроме того, что было сказано о потере позиции, неплохо отключить сервер (если вас не волнует повреждение данных), за исключением SSD. В зависимости от того, какие SSD у вас могут быть, он может иметь суперконденсатор для работы с ним. Но потеря власти может повредить блоки, которые стираются или записываются.
Отредактируйте информацию о двойном источнике питания: правильный способ - один источник питания в стене, другой источник питания через ИБП. Неправильно было бы подключать только один источник питания или подключать их оба через ИБП. В противном случае самопроверка ИБП приведет к прерыванию питания, и вы не сможете выключить его, чтобы заменить батарею.
Конечно, такой роскоши не хватает для серверов без двойного блока питания.