Рекомендации по прошивке и графики обновления

Прошивка получает очень мало внимания, когда дело доходит до обновлений. С глаз долой, из сердца вон.

Многие устройства: RAID-контроллеры, сетевые адаптеры, наборы микросхем и даже жесткие диски получают некоторую выгоду от обновления. Лучшие функции, безопасность / исправление ошибок и т. Д.

Большинство SA говорят: "Всякий раз, когда он ломается, обновите прошивку". Но это может привести к трудностям в будущем; Несколько раз при обращении в Dell по поводу неисправного жесткого диска меня спрашивали, обновлена ​​ли прошивка моего жесткого диска. Все мои серверы используют некоторый тип конфигурации RAID. Если у меня уже есть сбой одного диска, стоит ли мне даже пытаться обновить прошивку на остальных дисках или контроллере RAID? Я бы сказал нет. Но у Dell, похоже, другое мнение.

  • Каков реалистичный график обновления прошивки системы?
  • Есть ли у вас какие-либо лучшие практики, чтобы поделиться?

(Мне известно, что у Dell есть хорошая утилита под названием Server Update Utility, которая проверяет все новые прошивки на любом сервере Dell.)

10 ответов

Решение

Я обновляю прошивку в двух ключевых случаях.

  1. При подготовке сервера.
    • Когда я только получу сервер, я проверю на сайте HP дату их последнего "CD с обновлением прошивки". Если он достаточно новый, я запустлю его на сервере, прежде чем запускать его в производство.
    • Когда я переназначаю сервер. Как правило, этому серверу 2-5 лет, и, вероятно, за все это время не было обновления прошивки. Так как я все равно переформатирую его, я обновлю все различные прошивки на сервере.
  2. Когда определен поставщик, это необходимо сделать.
    • Иногда выявляются серьезные проблемы со стабильностью, такие как невозможность перестроить массив RAID5 после неправильного сбоя или серьезная ошибка производительности в модуле TCP-offload на сетевой карте.
    • Иногда, обращаясь за поддержкой, специалист службы поддержки попросит меня обновить прошивку. Я сделаю это тогда.

Есть третий случай, который я не перечислил выше, потому что это еще не произошло:

  • При размещении гораздо более нового компонента на старом сервере. Иногда BIOS системы необходимо обновить, чтобы справиться с этим.

Мы используем HP SIM (System Insight Manager) для развертывания микропрограмм, мы делаем это по платформам - сначала тестирование, затем разработка, затем интеграция, затем ссылка, а затем, наконец, производство - обычно около недели или около того для каждой платформы, поэтому у нас 5/6 недельный выпуск в производственное окно. Кажется, работает, но одна вещь, которую мы НИКОГДА не делаем, - это развертывание микропрограммы одновременно с другими обновлениями, такими как драйверы / код и т. Д., - это позволяет сэкономить много времени.

Вы должны относиться к обновлениям прошивки так же, как к исправлениям, хотя эти обновления, как правило, сложнее развернуть, поэтому вы можете проверить примечания к выпуску, чтобы определить, стоит ли это усилий (но, опять же, вы можете делать это и для исправлений).). Обновления прошивки, скорее всего, будут содержать новую неприятную ошибку, как и ее исправление.

Обновление прошивки должно выполняться при вводе в эксплуатацию (или повторном вводе в эксплуатацию оборудования), так как это легко сделать.

Развертывание должно примерно соответствовать следующим направлениям:

  1. Тест на лабораторных машинах
  2. Развертывание в неважных системах
  3. Подождите
  4. Развертывание в важных / производственных системах

Опять же, некоторые вещи не могут следовать за этим. В частности, очень важно очень быстро распространять исправления Microsoft на рабочие столы Windows, а тестирование сложно выполнить быстро без значительных ресурсов.

Я мог бы идти против зерна здесь, но если оно не сломано, не чините его. Если это не проблема безопасности, тогда я оставлю это в покое.

По этой причине у меня никогда не было отказа Dell в обслуживании.

Может быть, вы можете запланировать утилиту один раз в месяц, а затем обновить их с другими перезагрузками?

Я обычно обновляю прошивку при вводе в эксплуатацию любого нового оборудования инфраструктуры. Рабочие станции и принтеры обновляются только в том случае, если есть конкретная проблема, такая как исправление ошибки или проблема безопасности. Это менее важно для серверов, так как по большей части код прошивки либо не выполняется вне процесса загрузки, либо настолько прост, что мало что может пойти не так.

У меня был плохой опыт обновления прошивки RAID на серверах, так как многие производители не гарантируют, что текущая конфигурация RAID будет жизнеспособной, если изменится версия прошивки, то же самое с отдельными дисками в массиве.

Моя тенденция состояла бы в том, чтобы по большей части применять политику "если не сломано, не исправляйте". Стоит проверить, возможно ли восстановление после неудачного обновления программного обеспечения (т. Е. Избыточного ПЗУ на серверах HP, или если у вас есть флеш-память EEPROM и вы хотите использовать ее в качестве съемного чипа).

Я не могу говорить о Dell, но многие люди в группе хранения IBM сказали мне, что первые уровни их встроенного ПО RAID НИКОГДА не являются лучшими. Сначала они стремятся к стабильности, а затем повышают производительность с будущими уровнями оборотов. К сожалению, немногие из нас думают (или, возможно, имеют смелость) вернуться позже и связываться с прошивкой RAID исправной системы, если не было проблем. Итак, наша стратегия заключалась в том, чтобы обновлять уровни встроенного ПО RAID каждый раз, когда мы настраиваем новый сервер, при условии, что адаптер RAID не является фирменной шлепающей новой моделью. Таким образом, мы, по крайней мере, получаем лучшие уровни производительности, доступные в то время. Если это новый адаптер режима, мы постараемся сделать пометку, чтобы вернуться через несколько месяцев и проверить наличие обновлений, но мы не религиозны в этом.

На материнских платах мы НЕ связываемся с ними, если только техническая поддержка производителя не сообщит нам. Наш многолетний опыт показывает, что, если нет конкретной проблемы, которую необходимо решить, риски значительно перевешивают трудноизмеримые выгоды.

// SPK

Я успешно использовал SUU и аналогичные продукты HP и IBM. Единственные проблемы, с которыми я когда-либо сталкивался, были, когда драйвер поставщика использовался для замены драйвера Dell без технической причины, что приводило к тому, что обновление SUU приводило к сбою обновления OM на сервере Dell. Мы обновляли микропрограммы и драйверы на нескольких сотнях серверов не реже двух раз в год, чтобы поддерживать их актуальность. Мы никогда не сталкивались с проблемами с прошивкой RAID.

Мы обновляем прошивку при каждом удобном случае, что, к сожалению, возможно, 3-4 раза в год (основные периоды обслуживания) для некоторых систем.

Я думаю, это зависит от типа среды, с которой вам приходится иметь дело. Если вы работаете в среде, требующей высокой доступности, и не можете перезагрузить серверы, когда хотите. На мой взгляд, лучшая практика заключается в выполнении графика технического обслуживания. Выберите период времени для каждой системы, уведомите пользователей и выполните всю необходимую работу, включая обновления прошивки, в течение этого выделенного периода времени. Таким образом, вы можете быть уверены, что все ваши системы обновлены и одновременно минимизируют влияние на производство. Также, как отмечалось в комментариях ранее, необходимо проверять наличие обновлений прошивки при создании нового сервера.

Если вы прочитаете сообщение, сопровождающее обновление прошивки Dell, то обнаружите, что оно классифицирует обновление как критическое, важное или что-то еще, и описывает, что исправление исправляет (не всегда так ясно, как хотелось бы!).

Я считаю, что я не буду применять обновление прошивки без веской причины. Если это критическое обновление и оно устраняет проблему, с которой у меня есть разумные шансы, тогда да, я буду ее применять, даже если это напряженный бизнес.

Как вы говорите, службы поддержки Dell обычно настаивают на применении любых соответствующих обновлений, прежде чем они будут поддерживать вас, и, очевидно, в этом случае у вас нет большого выбора. Вы можете понять, что Dell не хочет тратить время инженера, хотя я никогда не знал, что прошивка является причиной обращения в службу поддержки.

JR

Другие вопросы по тегам