Как восстановиться после потери питания на сервере OVM

У нас произошла ошибка ИБП и мы потеряли питание на физическом сервере, на котором размещено более 10 виртуальных машин с использованием платформы Oracle VM. Мы вернули его в рабочее состояние, но мне интересно, как лучше всего восстановиться после этого. В частности, мне интересно, нужно ли нам запускать fsck на каждой отдельной виртуальной машине и / или мы должны запускать fsck на уровне платформы? Наш системный администратор недавно вышел из системы, и я гораздо больше программист, чем системный администратор, так что это немного выше моего понимания. Я просматривал документацию по OVM (OVM Manager 3.2.1), но, похоже, не могу найти что-то конкретное в отношении ситуаций такого типа. Я благодарен всем, кто может указать мне правильное направление.

1 ответ

Решение

В идеале вы должны fsck файловые системы каждой виртуальной машины. Для этого вы должны запустить виртуальную машину в однопользовательском режиме или загрузиться из сети или с образа компакт-диска. Если вы хотите загрузить виртуальную машину в однопользовательском режиме, выполните следующие действия:

  1. Войдите на сервер VM от имени пользователя root.
  2. Найдите файл конфигурации виртуальной машины. Я обычно grep для имени виртуальной машины:

    grep -r vm_name /OVS/Repositories/*
    
  3. Запустите виртуальную машину вручную с помощью инструментов Xen, а не из OVM Manager, подключившись к консоли:

    xm create -c <path_from_above>
    
  4. Когда GRUB Появится меню, отредактируйте параметры загрузки. Вы не сказали, в каком дистрибутиве работают ваши виртуальные машины, но предполагая что-то похожее на RHEL (RHEL, CentOS, OEL), я бы убрал опции rhgb а также quiet и добавить single console=xvc0, single опция говорит init запустить однопользовательский, console=xvc0 говорит ядру использовать xvc0 в качестве консольного устройства. Это консоль Xen, доступ к которой осуществляется через Oracle VM Manager.

После загрузки в однопользовательском режиме вы можете fsck файловые системы. Однако вы не должны пытаться fsck корневой файловой системы или любых других смонтированных файловых систем. Файловые системы пользователя / данных можно безопасно проверять, если они отключены. Вы можете запустить fsck -n проверить корневую файловую систему на наличие ошибок. Если при этом появляются сообщения об ошибках, вы должны либо выполнить загрузку по сети, либо выполнить загрузку с компакт-диска виртуальной машины и запустить fsck оттуда, чтобы файловая система не была смонтирована.

Другие вопросы по тегам