Datastax вопросы по ремонту

Итак, два дня назад у нас вышел из строя узел, и потребовалась лучшая часть дня, чтобы восстановить его. Я все еще учусь, поэтому я не знаком с вариантами ремонта, но на основе статьи здесь: http://www.datastax.com/dev/blog/repair-service-opsc4

Могу ли я просто включить ремонт? Устраняет ли это необходимость запускать восстановление nodetool вручную, что является болью, потому что оно ручное, и, по-видимому, может быть довольно интенсивным вводом-выводом, что вызывает у меня большую озабоченность.

Кроме того, если предположить, что этот сервис работает в реальном мире, как описано в статье, могу ли я быть уверен, что запуск сервиса с указанным интервалом не вызовет проблем с производительностью?

1 ответ

Решение

Регулярный ремонт

Рекомендуется выполнять ремонт часто еженедельно в качестве антиэнтропийного механизма. Вы можете столкнуться с проблемами (данные зомби), если вы не выполняете ремонт чаще, чем установлено в gc grace секунд, и у вас много надгробий.

Запуск ремонтной службы в реальной жизни

Короткий ответ: да. Служба ремонта упрощает вашу жизнь, автоматизируя эту операцию, а также разбивает ремонт на мелкие детали, чтобы сгладить рабочую нагрузку и предотвратить возникновение конфликта ресурсов и проблем с производительностью во время ремонта. Для большинства кластеров он должен работать "из коробки", в некоторых случаях может потребоваться настроить некоторые параметры по умолчанию. Полезные рычаги включают - max_parallel_repairs, min_repair_time, snapshot_override

Возвращение сбитого узла

В этом конкретном сценарии, когда вы знаете, что один узел не работает примерно один день или около того, я ожидаю, что ваш кластер будет испытывать нагрузку во время восстановления. Создание деревьев Меркель требует много ресурсов процессора и много времени. Меньшие кусочки, которые рассчитывает служба ремонта, должны облегчить этот процесс.

Другие вопросы по тегам