Дополнительные параметры хранения для узлов Hadoop HDFS

У нас небольшой производственный кластер Cloudera Hadoop (14 узлов, но растущий). По мере того, как мы расширили использование этого кластера, мы обнаружили, что дисковое хранилище является нашим самым большим блокирующим устройством и требованием. Использование ОЗУ и ЦП минимально для наших рабочих нагрузок, и наши разработчики уже значительно сократили объем хранимых данных.

Используемое нами оборудование относительно низкое, и поэтому мы максимально увеличили количество дисков, которое можно установить в каждом узле. В настоящее время у нас нет свободного места, но у нас есть новый источник данных, который ускорит наш рост данных, и мы хотели бы просто добавить хранилище в систему.

Системы имеют только один слот для карт расширения, в котором в настоящее время наш SAS HBA работает с внутренними дисками. Я полагаю, что мы можем заменить это HBA, который имеет внутренние и внешние порты SAS, что позволяет нам поддерживать внутренние диски и подключаться к внешним. Я не могу найти оптимальную настройку для хранения внешних жестких дисков и предоставления каждому серверу прямого доступа к SAS 6 Гбит / с, поскольку я использую ограничения моего понимания и возможностей Google.

Hadoop HDFS предпочитает, чтобы между ним и жестким диском не было никакой другой технологии, и я бы хотел, чтобы это так и оставалось. Если бы я использовал SATA, я бы взял внешний корпус для монтажа в стойку, который напрямую соединяет внешние порты eSATA с внутренними дисками без расширителей дисков или контроллеров рейда. Я не могу найти эквивалент в оборудовании SAS.

Я пытаюсь найти предложения для DAS SAS, желательно с одним шасси, которое может обслуживать несколько серверов и не делает ничего более творческого. Если это не удастся, какие у меня будут варианты для предоставления эквивалентных хранилищ и скоростей для дисков SAS, которые мы используем сейчас?

Джаред

1 ответ

Вы ищете внешний корпус JBOD, который может вместить диски SAS и иметь возможность зонирования или размещения нескольких серверов...

Единственный пример, который я могу вспомнить - это HP MDS600 (более старый) или D6000 (текущий)

Они могут безопасно использоваться со стандартным SAS HBA (LSI) и обеспечивать прямой доступ к диску без уровня RAID.

См. Вопросы совместимости HP MDS 600

http://images02.olx.co.ke/ui/17/23/43/1371146616_516962043_2-Pictures-of--AJ866A-HP-StorageWorks-MDS600-with-Dual-IO-Modules-459158-005-Over-200TB.jpg

Другие вопросы по тегам