Получение доступа к большим данным без необходимости настройки среды
Кто-нибудь знает о какой-либо песочнице, где среда уже настроена для обработки больших данных?
Это может быть Hadoop, Кассандра, Свинья и т. Д...
Я программист SQL Server, и я пытаюсь получить доступ к решениям для больших данных /nosql, но мне очень тяжело пытаться настроить свою собственную среду в Linux.
Существуют ли какие-либо бесплатные / платные сервисы, которые позволяют загружать большие данные, играть с ними и настраивать кластеризацию?
1 ответ
Amazon, Windows Azure.
Вы можете легко получить 100 или 1000 виртуальных машин за короткое время.
Проблема любой такой внешней вещи заключается в том, что "большие данные" трудно перемещать. Большая часть обработки проста, но как вы получаете терабайты данных в Amazon для тестирования?