Насколько плохо сетевое хранилище для определенных облачных приложений?

Я слышал, что рекомендовал держаться подальше от хостинга AWS для некоторых приложений "больших данных" (например, Hadoop, Cassandra, Solr), потому что экземпляры EC2 обычно используют сетевое хранилище (хотя в последнее время есть несколько экземпляров с высоким вводом / выводом, но они видимо довольно дорого).

Для меня имеет смысл, что NAS приведет к довольно приличному падению производительности, но сколько? Поскольку AWS существует, то, вероятно, существует множество примеров приложений, которые имеют смысл в среде такого типа, но каково хорошее правило для определения, является ли конкретное приложение подходящим кандидатом для AWS и NAS? (Кроме того, чтобы прикрепить его к AWS и попробовать.)

2 ответа

Решение

Задержка хранения будет вашей метрикой.

Если ваше приложение очень чувствительно к задержке хранилища, вам нужно избегать AWS и работать физически, или потратить деньги, чтобы получить экземпляры Storage Optimized. Они специально утверждают, что это такие вещи, как Hadoop и Cassandra.

Что касается более высоких уровней типов экземпляров AWS, то это то, что это не NAS, а физическая поддержка NAS. Детали не ясны, но вы гораздо ближе к аппаратному обеспечению, когда вы управляете системой хранения, оптимизированной для кластерно-оптимизированного экземпляра.

Я использую Cassandra Cluster на AWS, и я согласен с тем, что вы читали о том, чтобы держаться подальше от NAS(EBS), я недавно перешел на боксы hi1.4xlarge (они поставляются с 2 твердотельными накопителями 1 ТБ), и я RAID0 их, чтобы получить максимальную отдачу этого При такой настройке я легко могу обрабатывать 15 тыс. Операций чтения в секунду, мое приложение не сильно ориентировано на запись, поэтому я не могу вам помочь. Надеюсь это поможет.

Другие вопросы по тегам