HBase - это база данных Hadoop. Используйте его, когда вам нужен случайный доступ в режиме реального времени для чтения / записи ваших больших данных. Целью этого проекта является размещение очень больших таблиц - миллиардов строк и миллионов столбцов - поверх кластеров аппаратного оборудования.

HBase - это распределенное, версионное, ориентированное на столбцы хранилище с открытым исходным кодом, созданное по образцу Google Bigtable: распределенная система хранения для структурированных Chang et al. Так же, как Bigtable использует распределенное хранилище данных, предоставляемое файловой системой Google, HBase предоставляет возможности, подобные Bigtable, поверх Hadoop. HBase включает в себя:

  • Удобные базовые классы для поддержки заданий Hadoop MapReduce с помощью таблиц HBase, включая модули каскадирования, кустов и свиноводства
  • Предикат запроса выдвигается через сканирование на стороне сервера и получает фильтры
  • Оптимизация для запросов в реальном времени
  • Thrift-шлюз и веб-служба REST-ful, которая поддерживает XML, Protobuf и опции кодирования двоичных данных
  • Расширяемая оболочка на основе jruby (JIRB)
  • Поддержка экспорта метрик через подсистему метрик Hadoop в файлы или Ganglia; или через JMX