MySQL кластер: таблицы 20 ТБ х 3 КБ

В течение следующих 2-3 лет мы будем расширять сбор данных для проекта. В результате объем данных вырастет в 10 раз. Наша текущая установка MySQL может идти в ногу с 2 ТБ данных, но для более крупных запросов существует достаточное количество IOWait.

Я изучаю переход к кластерному решению для распространения ввода-вывода, но мне интересно узнать о NDB и о том, что происходит с данными, доступ к которым происходит не очень часто. Когда я читаю о кластере MySQL, у меня складывается впечатление, что для большей части данных он использует таблицы памяти. Что происходит с таблицами, доступ к которым осуществляется не очень часто (или вообще)? И как работает резервное копирование? Могу ли я использовать MYSQLDUMP или есть лучшее решение?

1 ответ

Решение

NDB имеет некоторые ограничения для больших таблиц из-за его модели в памяти. Для вас ситуация не имеет смысла.

Недавно мы протестировали кластер Percona с некоторыми очень многообещающими результатами. Он поддерживает репликацию мастер-мастер и полностью соответствует требованиям ACID InnoDB. Стоит отметить, что скорость запросов ограничена самым медленным узлом в кластере - у многих установок MySQL, которые являются Master/Slave, обычно гораздо быстрее Master.

Если вам нужен действительно быстрый доступ, вы также можете конвертировать действительно большие наборы данных в MongoDB или Cassandra. Обе они значительно быстрее, чем СУБД, как MySQL. Кластеризация в этих базах данных NoSQL является нативной.

Другие вопросы по тегам