Как восстановиться после потери питания на сервере OVM
У нас произошла ошибка ИБП и мы потеряли питание на физическом сервере, на котором размещено более 10 виртуальных машин с использованием платформы Oracle VM. Мы вернули его в рабочее состояние, но мне интересно, как лучше всего восстановиться после этого. В частности, мне интересно, нужно ли нам запускать fsck на каждой отдельной виртуальной машине и / или мы должны запускать fsck на уровне платформы? Наш системный администратор недавно вышел из системы, и я гораздо больше программист, чем системный администратор, так что это немного выше моего понимания. Я просматривал документацию по OVM (OVM Manager 3.2.1), но, похоже, не могу найти что-то конкретное в отношении ситуаций такого типа. Я благодарен всем, кто может указать мне правильное направление.
1 ответ
В идеале вы должны fsck
файловые системы каждой виртуальной машины. Для этого вы должны запустить виртуальную машину в однопользовательском режиме или загрузиться из сети или с образа компакт-диска. Если вы хотите загрузить виртуальную машину в однопользовательском режиме, выполните следующие действия:
- Войдите на сервер VM от имени пользователя root.
Найдите файл конфигурации виртуальной машины. Я обычно grep для имени виртуальной машины:
grep -r vm_name /OVS/Repositories/*
Запустите виртуальную машину вручную с помощью инструментов Xen, а не из OVM Manager, подключившись к консоли:
xm create -c <path_from_above>
Когда
GRUB
Появится меню, отредактируйте параметры загрузки. Вы не сказали, в каком дистрибутиве работают ваши виртуальные машины, но предполагая что-то похожее на RHEL (RHEL, CentOS, OEL), я бы убрал опцииrhgb
а такжеquiet
и добавитьsingle console=xvc0
,single
опция говорит init запустить однопользовательский,console=xvc0
говорит ядру использоватьxvc0
в качестве консольного устройства. Это консоль Xen, доступ к которой осуществляется через Oracle VM Manager.
После загрузки в однопользовательском режиме вы можете fsck
файловые системы. Однако вы не должны пытаться fsck корневой файловой системы или любых других смонтированных файловых систем. Файловые системы пользователя / данных можно безопасно проверять, если они отключены. Вы можете запустить fsck -n
проверить корневую файловую систему на наличие ошибок. Если при этом появляются сообщения об ошибках, вы должны либо выполнить загрузку по сети, либо выполнить загрузку с компакт-диска виртуальной машины и запустить fsck
оттуда, чтобы файловая система не была смонтирована.