Datastax вопросы по ремонту
Итак, два дня назад у нас вышел из строя узел, и потребовалась лучшая часть дня, чтобы восстановить его. Я все еще учусь, поэтому я не знаком с вариантами ремонта, но на основе статьи здесь: http://www.datastax.com/dev/blog/repair-service-opsc4
Могу ли я просто включить ремонт? Устраняет ли это необходимость запускать восстановление nodetool вручную, что является болью, потому что оно ручное, и, по-видимому, может быть довольно интенсивным вводом-выводом, что вызывает у меня большую озабоченность.
Кроме того, если предположить, что этот сервис работает в реальном мире, как описано в статье, могу ли я быть уверен, что запуск сервиса с указанным интервалом не вызовет проблем с производительностью?
1 ответ
Регулярный ремонт
Рекомендуется выполнять ремонт часто еженедельно в качестве антиэнтропийного механизма. Вы можете столкнуться с проблемами (данные зомби), если вы не выполняете ремонт чаще, чем установлено в gc grace секунд, и у вас много надгробий.
Запуск ремонтной службы в реальной жизни
Короткий ответ: да. Служба ремонта упрощает вашу жизнь, автоматизируя эту операцию, а также разбивает ремонт на мелкие детали, чтобы сгладить рабочую нагрузку и предотвратить возникновение конфликта ресурсов и проблем с производительностью во время ремонта. Для большинства кластеров он должен работать "из коробки", в некоторых случаях может потребоваться настроить некоторые параметры по умолчанию. Полезные рычаги включают - max_parallel_repairs, min_repair_time, snapshot_override
Возвращение сбитого узла
В этом конкретном сценарии, когда вы знаете, что один узел не работает примерно один день или около того, я ожидаю, что ваш кластер будет испытывать нагрузку во время восстановления. Создание деревьев Меркель требует много ресурсов процессора и много времени. Меньшие кусочки, которые рассчитывает служба ремонта, должны облегчить этот процесс.