Описание тега hbase
HBase - это база данных Hadoop. Используйте его, когда вам нужен случайный доступ в режиме реального времени для чтения / записи ваших больших данных. Целью этого проекта является размещение очень больших таблиц - миллиардов строк и миллионов столбцов - поверх кластеров аппаратного оборудования.
HBase - это распределенное, версионное, ориентированное на столбцы хранилище с открытым исходным кодом, созданное по образцу Google Bigtable: распределенная система хранения для структурированных Chang et al. Так же, как Bigtable использует распределенное хранилище данных, предоставляемое файловой системой Google, HBase предоставляет возможности, подобные Bigtable, поверх Hadoop. HBase включает в себя:
- Удобные базовые классы для поддержки заданий Hadoop MapReduce с помощью таблиц HBase, включая модули каскадирования, кустов и свиноводства
- Предикат запроса выдвигается через сканирование на стороне сервера и получает фильтры
- Оптимизация для запросов в реальном времени
- Thrift-шлюз и веб-служба REST-ful, которая поддерживает XML, Protobuf и опции кодирования двоичных данных
- Расширяемая оболочка на основе jruby (JIRB)
- Поддержка экспорта метрик через подсистему метрик Hadoop в файлы или Ganglia; или через JMX