Безопасно ли использовать не ECC RAM для сервера холодного резервного копирования?
Мне нужен домашний компьютер для простого резервного копирования (просто cronjob в Linux, он будет запускаться один раз в день):
- Загрузите файл с моего рабочего сервера (в центре обработки данных, это хороший сервер с Xeons, ECC RAM и т. Д.) На этот домашний компьютер, проверьте контрольные суммы.
- Запишите его на DVD-RW (позже я куплю Blu-ray привод для этого, позже (не уверен, что цена для меня сейчас слишком велика) Я куплю стример и напишу резервные копии на ленты LTO).
- После записи прочитайте диск и снова проверьте контрольные суммы.
Безопасно ли использовать для этой задачи не ECC RAM (сервер холодного резервного копирования)?
Из-за того, что я собираюсь использовать перезаписываемые диски, можно будет свободно повторять операцию при ошибке, поэтому для меня это приемлемое решение, если когда-нибудь мне понадобится потратить немного больше времени на эту операцию.
Но я не уверен, может ли проверка файла спасти меня от ошибок памяти?..
Так что мне нужно покупать отдельный сервер с ОЗУ ECC у себя дома для этой задачи, или я могу просто использовать свой старый домашний ПК (ОЗУ без ECC) и вообще не тратить деньги?.. [Я могу купить сервер, я понимаю, сегодня все дешево, но я предпочитаю не тратить деньги, если это возможно, не тратить их, также это будет потреблять больше энергии, тратить мое время на управление, и мне нужно найти место для этого в своей комнате..]
4 ответа
Вам не нужна память ECC для этого. Что вам нужно, это сквозная проверка целостности данных.
Если вы используете как память ECC, так и сквозные проверки целостности, то память ECC станет одним из нескольких промежуточных хранилищ, через которые проходят ваши данные. Все они будут охвачены сквозными проверками, поэтому любое повреждение, не обнаруженное в памяти ECC, будет рассматриваться так же, как и повреждение, происходящее где-то еще в цепочке.
Если бы вы использовали память ECC и не проводили сквозных проверок целостности, то память ECC могла бы спасти вас от некоторых повреждений, которые в противном случае могли бы остаться незамеченными. Но отсутствие сквозной целостности может привести к коррупции в других местах на этом пути. Если повреждение происходит в другом месте, чем память ECC, то память ECC ничего не может сделать, чтобы спасти вас от нее.
Таким образом, память ECC не является ни достаточной, ни необходимой для проверки целостности данных, необходимой в вашем случае. Вот почему я начал этот ответ, сказав, что он вам не нужен.
Один из способов выполнить сквозные проверки целостности - это создать ISO-образ на самом сервере и сохранить контрольную сумму (достаточно MD5, поскольку он существует для защиты от повреждения данных из-за случайных бит-флипов, чтобы не защищать от вредоносной активности).,
После того как изображение было записано в окончательное хранилище, принимающая машина считывает данные из окончательного хранилища и вычисляет контрольную сумму, которую отправляет обратно на сервер для проверки. Важно, чтобы контрольная сумма вычислялась путем считывания данных с окончательного носителя, потому что, если вы этого не сделаете, это не будет полной целостностью.
Если сравнение контрольных сумм на сервере обнаруживает повреждение, вы должны начать резервное копирование заново. Если дополнительная резервная копия требуется слишком часто, тогда вы можете начать исследовать, какая часть цепочки приводит к повреждению, и посмотреть на повышение надежности этой части. В этот момент возможно обновление памяти с не-ECC до ECC.
Таким образом, память ECC не нужна для целостности данных, но это может повысить производительность всей цепочки.
Статистически говоря, вы в безопасности с тараном без ECC во всех ситуациях. Я покупаю баран ECC, чтобы, когда мой номер истек, мне не приходилось лежать без сна ночью, задаваясь вопросом, была ли это моя вина или это действительно было неизбежно.
Это дорого для защиты от коррупции. Программное обеспечение / методы раннего обнаружения и хорошо организованное, проверенное решение для резервного копирования намного дешевле, чем оснащение каждого сервера ECC-плеерами (где n>1). Учитывая, что вы должны иметь те, независимо от ECC RAM. Тем не менее, ECC ram очень дешевый для страховки прикрытия - будь то босс, с которым вам придется столкнуться, или ваши собственные мысли.
Если ваш md5 установлен на вашем производственном сервере, он полностью безопасен, потому что любая ошибка будет обнаружена вашей последней проверкой контрольной суммы.
Память - не единственный элемент, который может изменять данные: передача по сети и DVD/ диски также могут вносить ошибки.
Сквозная контрольная сумма перехватит каждую ошибку (но не исправит ее).
Может ли проверка файла спасти меня от ошибок памяти?
Проверка файлов - это хорошая идея, но она не может компенсировать ошибки памяти из-за сбоя или зависания операционной системы в случае ошибки памяти.