Устранение необычной проблемы питания в серверной комнате. (Предполагаемые скачки напряжения или скачки)
Мы столкнулись с очень странной проблемой в серверной комнате нашего нового офиса во всех розетках.
В частности, когда все оборудование запущено и работает (то есть система кондиционирования, 2x стоечных сервера, 5 48-портовых коммутаторов PoE, а также система доступа к двери, которая имеет свои резервные батареи и основные цепи управления, расположенные в серверной комнате) мы иногда видим, что серверы самопроизвольно перезагружаются, система дверного доступа перезагружается, и переключатели PoE одновременно переходят в нерабочее состояние на 20 или более минут за раз. Когда это происходит, все три системы перезагружаются одновременно. Все три системы находятся в одной цепи.
Серверы и коммутаторы работают на устройстве ИБП, а система доступа к карте также имеет собственную резервную батарею - поэтому простая кратковременная потеря питания не объясняет этого, так как все должно продолжать работать от ИБП без перерыва. Мы отключили ИБП от стены и увидели, что серверы продолжают работать, как и ожидалось, - поэтому ИБП, кажется, работает должным образом, что касается перебоев в подаче электроэнергии.
Ни один из автоматических выключателей не сработал и не нуждается в сбросе.
Система кондиционирования, по-видимому, находится на отдельной цепи с серверами и сетевым оборудованием; тем не менее, его силовые кабели имеют общий провод с силовыми кабелями, которые идут к настенным розеткам, используемым серверами и т. д. Может ли быть риск наведения напряжения от одной цепи к другой, когда переменный ток включается или выключается, поскольку они параллельны друг другу на несколько метров?
Я поговорил с одним из электриков, который пытался выяснить, что происходит, и он сказал, что, хотя блок кондиционирования воздуха находится на отдельной цепи с серверами и другими системами, две цепи фактически имеют общую нейтраль - что-то, что он думал потенциально может вызвать проблемы. Это нормальная конфигурация или считается плохой практикой иметь что-то вроде блока переменного тока с нейтральным и чувствительным оборудованием в серверной комнате?
В настоящее время проблема утихла сама по себе. Серверы перестали самопроизвольно перезагружаться, и коммутаторы снова подключены к сети, но никаких реальных изменений сделано не было, поэтому основная проблема все еще существует и, вероятно, рано или поздно возникнет.
Учитывая, что во время этих эпизодов мы наблюдаем перезагрузку нескольких систем с отдельными резервными батареями, какие могут быть возможные объяснения, кроме скачков напряжения или скачков напряжения?
1 ответ
Хотя это и не прямой ответ "вот вам вопрос", на который вы надеялись, вот мое предложение.
Похоже, что, несмотря на благородство, ваше стремление выяснить, что не так, не будет быстро решено вами.
Вы можете делать то, что предлагали другие, и пытаться регистрировать все, что можете, и надеяться на появление паттерна.
Мне нравится предложение Дероберта о найме кого-то для измерения качества электроэнергии...
ОДНАКО, вот мое реальное предложение, которое вы уже сделали. Оставь это электрикам.
Шутки в сторону. Квалифицированный электрик (даже если вам придется отдать его на аутсорсинг) должен быть в состоянии сообщить вам основную причину, если она носит электрический характер или нет. Они могут проверить каждую цепь, чтобы убедиться, что они не перегружены (особенно при пиках / запусках), они могут убедиться, что проводка адекватна, и цепи имеют правильный размер для того, что вы подключаете к ним. и т. д.
В большинстве случаев у ИТ не будет собственного квалифицированного электрика, и мы часто просто "подключаемся" и не понимаем, используем ли мы правильные схемы, схемы балансировки и т. Д.
Если ваш ИБП поддерживает сбор журналов, я бы сделал это, если не для того, чтобы помочь доказать проблему. Хотя ваш ИБП может быть недостаточно мощным, чтобы компенсировать шипы / впадины должным образом (достаточно быстро), это не означает, что это является основной причиной. Это звучит как электрическая проблема для меня. Если вы используете хороший ИБП, работающий в режиме онлайн, и он, кажется, корректно компенсирует входное напряжение (на основе его журналов), то было бы странно, если бы все ИТ-оборудование было подключено к нему, а система считывателя карт перезагружалась одновременно.,
Поговорите со своим боссом и объясните проблему с точки зрения необходимости квалифицированного электрика для диагностики. Несправедливо ожидать от электрика настройки маршрутизации BGP и, наоборот, не ожидать, что системный администратор будет квалифицированным электриком.