Получение доступа к большим данным без необходимости настройки среды

Кто-нибудь знает о какой-либо песочнице, где среда уже настроена для обработки больших данных?

Это может быть Hadoop, Кассандра, Свинья и т. Д...

Я программист SQL Server, и я пытаюсь получить доступ к решениям для больших данных /nosql, но мне очень тяжело пытаться настроить свою собственную среду в Linux.

Существуют ли какие-либо бесплатные / платные сервисы, которые позволяют загружать большие данные, играть с ними и настраивать кластеризацию?

1 ответ

Amazon, Windows Azure.

Вы можете легко получить 100 или 1000 виртуальных машин за короткое время.

Проблема любой такой внешней вещи заключается в том, что "большие данные" трудно перемещать. Большая часть обработки проста, но как вы получаете терабайты данных в Amazon для тестирования?

Другие вопросы по тегам