Чем облачное хранилище (Amazon AWS, Microsoft Azure, Google Apps) отличается от традиционных сетей хранения данных в центрах обработки данных (SAN и NAS)?
Некоторая путаница из-за моего вопроса, чтобы сделать его проще:
"Какой тип хранилища используют крупные облачные провайдеры и почему?"
Насколько я понимаю, однако я не могу найти каких-либо официальных отличий сетей хранения данных между типичными центрами обработки данных и облаками, все поставщики облачных услуг используют DAS, отличные от типичных центров обработки данных.
Даже у DAS есть много недостатков, чем у SAN или NAS, я хочу узнать подробности, почему облака используют DAS для хранения или приложений.
Любой ресурс или описание будет оценено, чтобы дать мне понять.
РЕДАКТИРОВАТЬ: читая статью "Сетевые вызовы и результирующие подходы для построения крупномасштабных облаков, Дэвид Бернштейн и Эрик Людвигсон (Cisco)", они упоминают, что
Любопытно, что мы не видим облаков от основных провайдеров, использующих NAS или SAN. Типичная облачная архитектура использует DAS, что не типично для хранилищ данных.
Но здесь возникает конфликт: по моему мнению, который также будет указан позднее в статье, Clouds должна использовать SAN или NAS, потому что DAS не подходит, когда виртуальная машина перемещается на другой сервер, но все еще нуждается в доступе к хранилищу с исходного сервера.
Какие еще причины влияют на облака, предпочитая DAS, NAS или SAN? какие хранилища используют крупные облачные провайдеры и почему?
4 ответа
Этот ответ был отредактирован после уточнения вопроса.
Каковы другие причины влияния облаков на DAS?
Где "DAS" означает хранилище с прямым подключением, то есть жесткие диски SATA или SAS.
Все поставщики облачных услуг используют DAS, потому что он предлагает на порядок улучшения цены / производительности. Это случай масштабирования по горизонтали.
Короче говоря, жесткие диски SATA и контроллеры SATA являются дешевым товаром. Это продукты для массового рынка, и цены на них очень низкие. Создав большой кластер дешевых ПК с дешевыми дисками SATA, Google, Amazon и другие получают огромную емкость по очень низкой цене. Затем они добавляют свой собственный программный слой сверху. Их программное обеспечение выполняет многосерверную репликацию для обеспечения производительности и надежности, мониторинга, повторной балансировки репликации после сбоя оборудования и других вещей.
Вы можете взглянуть на MogileFS как на более простой представитель программного обеспечения, которое Google, Amazon и другие используют для хранения. Конечно, это другая реализация, но в ней используются те же цели и решения, что и в крупных системах. Если вы хотите, вот прыжок для получения дополнительной информации о GoogleFS.
далее в статье указывается, что облака должны использовать SAN или NAS, поскольку DAS не подходит, когда виртуальная машина перемещается на другой сервер.
Есть 2 причины, по которым SAN не используются.
1) Цена. SAN чрезвычайно дороги в больших масштабах. Хотя они могут быть технически "лучшим" решением, они обычно не используются в очень крупных установках из-за стоимости.
2) Теорема CAP Теорема CAP Эрика Брюера показывает, что в очень большом масштабе вы не можете поддерживать строгую согласованность при сохранении приемлемой надежности, отказоустойчивости и производительности. SAN - это попытка обеспечить согласованность аппаратных средств. Это может хорошо работать для установки сервера 5.000, но никогда не было доказано, что он работает для 250.000+ серверов Google.
Результат: Пока производители облачных вычислений решили довести сложность поддержания состояния сервера до разработчика приложений. Текущие облачные предложения не обеспечивают согласованное состояние для каждой виртуальной машины. Серверы приложений (виртуальные машины) могут выйти из строя, и их локальные данные могут быть потеряны в любое время.
У каждого поставщика есть своя собственная реализация постоянного хранения, которую вы должны использовать для важных данных. Предложения Amazon являются хорошими примерами; MySQL, SimpleDB и Simple Storage Service. Сами эти предложения отражают теорему CAP - экземпляр MySQL имеет сильную согласованность, но ограниченную масштабируемость. SimpleDB и S3 фантастически масштабируются, но только в конечном итоге согласуются.
Если вы используете DAS, то проблема с доступностью
Если они используют DAS, то доступность является их проблемой. И если они хороши, они будут использовать несколько уровней абстракции, чтобы их проблема не стала вашей. Вместо того, чтобы зависать от того, как они решили монтировать свои диски внутри своего центра обработки данных, вопрос заключается в том, соответствует ли доступность, которую они гарантируют в своем SLA, вашим потребностям. Да, и настоящий слон в комнате, что вы делаете, если они уходят из бизнеса (возможно, для некоторых провайдеров, вероятно, но вы все равно должны это учитывать) и что вы делаете, если вы используете эти данные локально, и ваше межсетевое соединение недоступен - последний значительно более вероятен, чем их выбор DAS, непосредственно приводящий к отключению.
Хотя у меня нет ответа на вопрос DAS против SAN/NAS... Есть много вещей, которые следует учитывать при поиске решений для хранения данных.
Количество данных? Если мы говорим о Gb, хорошо, NAS с резервной копией может сделать эту работу. Если есть террабайты данных, цена очень быстро растет.
Я думаю, что цена является основным фактором... если у вас есть SAN, вам нужно:
- Админы настраивают / управляют им.
- Серверная комната (Электричество, пропускная способность, меры безопасности вокруг этой комнаты, ...)
И все же у вас нет никакой избыточности вообще. Если у вас есть доступ к центру обработки данных, все может быть иначе.
Другая вещь, чтобы рассмотреть, является доступностью. Вы архивируете? Если доступность не является проблемой, пару раз в день / неделю / месяц вы архивируете в свое решение для хранения данных.
Если, с другой стороны, у вас есть данные, к которым требуется постоянный доступ, вы быстро обнаружите узкое место в пропускной способности и аппаратные ограничения (такие как ввод-вывод). Но, с другой стороны, если у вас большой объем передачи ваших данных, есть хорошие шансы, что решение для онлайн-хранилища обойдется вам дорого.
ROI (возврат инвестиций) - это то, о чем рекламируют все поставщики решений для онлайн-хранилищ, и они часто правы, конечно, в зависимости от использования.
Удачи.
(Мнение только и очень обобщающее.)
Разница заключается в том уровне абстракции, на который вы смотрите (как правило).
SAN / NAS обычно предоставляют вам том, на котором вы можете установить файловую систему. Ценность этого подхода для конечной системы заключается в том, что вы передали на аутсорсинг детали физического оборудования (например, уровень RAID, физическое местоположение и т. Д.).
В отличие от этого, облачное хранилище обычно предоставляет интерфейс с файловой системой. Преимущество здесь в том, что вы часто можете получить функции более высокого порядка бесплатно (например, Dropbox выполняет автоматическое управление версиями каждого файла прозрачно).