Какое время лучше всего запланировать регулярные обновления на собственном производственном сервере?

Учитывая наличие внутреннего сервера, работающего в производственном режиме, я бы хотел, чтобы влияние на пользователей было как можно ниже при развертывании регулярных обновлений (на самом сервере, а не на пользовательских машинах... но это было бы довольно схожей проблемой).

Очевидный ответ на мой вопрос - "ночью, когда пользователи дома". Но "ночь" - это длительный период времени. Следует ли начинать рано вечером, чтобы, возможно, поймать проблемы с обновлением на раннем этапе и быть готовым к откату? Или лучше начать рано утром и использовать первых пользователей как "морских свинок", чтобы быстрее вызвать проблемы? Или посреди ночи, когда концентрация тех, кто наблюдает за обновлением, довольно низка, но гарантированно не будет никаких дескрипторов открытых файлов некоторых поздних работающих пользователей?

Есть ли исследовательские работы по этой теме?

6 ответов

Решение

Почему бы не посмотреть на одновременное использование вашей системы исторически и определить, в какое время дня использование минимально? Затем вставьте свои изменения прямо в середине этого периода низкого использования.

При определении того, сколько времени займет изменение, включите тестирование до и после внедрения, а также тестирование с проверкой производства. Кроме того, определите, сколько времени потребуется для отката в случае неудачного тестирования.

ИМХО, ваши "первые пользователи" не должны быть морскими свинками. Наличие живых пользователей в основном для проверки производственной проверки ваших изменений не очень хорошая вещь. Это разрушает доверие конечных пользователей, и неожиданные результаты могут испортить производство, что означает, что вам нужно не только откатить изменения, но и откатить "ущерб", который могло вызвать изменение.

Я не знаю ни одной исследовательской работы, но взгляните на любую инфраструктуру управления ИТ-услугами (ITSM), такую ​​как ITIL, вы найдете множество стандартов и лучших практик управления выпуском программного обеспечения. Все системы разные, поэтому зависит от того, сколько практики вы принимаете, и от формальности. Стандарты ITSM имеют в виду большие системы.

Это полностью зависит от характера бизнеса. Некоторые офисы работают 9-5 дней в неделю. Другие предприятия работают 24 часа в сутки, 365 дней в году. Другие факторы, такие как наличие персонала и ресурсов, играют важную роль. Ни один исследовательский документ не может всесторонне охватить каждый возможный график или случайность.

В конечном счете, руководство компании или департамента совместно с ИТ-менеджментом должны определить, что лучше.

Ключом к успеху является общение с пользователями, когда запланировано время простоя, сколько времени он продлится, какая требуется подготовка пользователей и что они могут ожидать в результате успеха или неудачи. Большая часть этого соответствует ожиданиям, которые вы установили.

В конце концов, ничего не выгравировано в камне. Если процесс не работает, внесите коррективы. Ваша гибкость и адаптивность будут оценены.

Выполняя процедуры технического обслуживания и обновления тестового оборудования, когда это возможно, вы будете лучше подготовлены к внедрению их в производственные системы.

Я работаю у интернет-провайдера, и, по моему опыту, большинство людей, которых я бы назвал системными администраторами, предпочитает вечерние пятницы в выходные, чтобы проводить капитальный ремонт своей сети. Это дает им дополнительные 24 часа на тестирование и, если необходимо, откат их изменений. Тем не менее, в значительной степени это полностью зависит от характера и привычек ваших пользователей.

Мы устанавливаем обновления в 9 вечера, достаточно поздно, большинство людей не будут включаться, достаточно рано, чтобы вытянуть всю ночь, если это необходимо.

В моем случае мы устанавливаем обновления в 4 часа утра, чтобы избежать влияния на пользователей, даже тех, кто работает немного поздно.

Если у вас есть хорошая система мониторинга, которая предупреждает вас о возникновении проблемы, вы сможете исправить ее рано утром, даже не выходя на работу.

Это действительно зависит от характера вашего бизнеса, но я лично предпочитаю среду вечером после 5 вечера. Вы никогда не хотите делать это по вечерам в пятницу, потому что если что-то пойдет не так, вы будете работать в выходные. Выполнение этого в среду даст вам четверг и пятницу, чтобы исправить проблемы, если таковые имеются.

Другим важным фактором является планирование окон управления изменениями. Очень важно, чтобы люди знали, что вы выполняете техническое обслуживание, - что службы могут быть прерваны или недоступны в течение этого периода. Это позволит вам работать с уверенностью, а не беспокоиться о том, что пользователи будут жаловаться на то, что сервисы не работают. Разумеется, вашему руководству необходимо утвердить окна изменений.

Другие вопросы по тегам