Как отслеживать и измерять работоспособность карт Compact Flash, используемых в качестве серверных хранилищ?

контекст

Компания продает доступ к своего рода кассовому веб-приложению. Доступ к приложению предоставляется через VPN. Точкой входа VPN для клиентов является плата Soekris под управлением Voyage Linux (урезанная версия Debian). Эти платы работают в течение 3 лет MySQL с репликацией и стеком приложений RoR.

Для хранения этих плат используется карта памяти Compact Flash 4 ГБ.

Эта проблема

Мы получаем регулярные ошибки и случайные сбои приложений на этих платах. Наиболее частые ошибки:

24 августа 14:54:44 box45 puppetd[3669]: не удалось запустить Puppet::Network::Client::Master: устаревший дескриптор файла NFS - /var/lib/puppet/state/state.yaml

24 августа 13:37:01 box76 ядро: [ 2091.575622] Ошибка EXT2-fs (устройство hda1): read_block_bitmap: невозможно прочитать растровое изображение блока - block_group = 30, block_bitmap = 983040

Если бы они были основаны на жестких дисках, я бы запустил средства мониторинга SMART для проверки поврежденных секторов и общего состояния диска. За исключением того, что они являются CF-картами, я нахожусь в неведении, и мне трудно измерить, насколько плохая (или хорошая!) Ситуация.

Что я могу сделать, чтобы контролировать здоровье этих карт и измерить их здоровье? Я настаиваю на "мере", поскольку мне нужно привести некоторые неопровержимые факты, которые в конечном итоге будут мотивировать смену всех CF-карт.

И чтобы сделать все немного сложнее, у меня нет физического доступа к платам Soekris, поэтому все это должно быть удаленным.

2 ответа

Решение

Ошибка, кажется, довольно четко указывает на проблему с разделом носителя CF-карты. Если какое-то время он работал без проблем, и теперь он дает эти проблемы, я думаю, что карта начала портиться. Самый простой способ проверить это - отправить технику с заменяющей картой и заменить ее, особенно если вы видите это на ограниченном числе систем. У всех СМИ есть продолжительность жизни и нормы неудачи; чем больше циклов чтения / записи у вас будет, тем быстрее они умрут.

Еще одна вещь, на которую стоит обратить внимание: ошибки чтения каждый раз находятся в одном и том же месте? Это говорит мне о том, что это, вероятно, плохая ячейка в определенной части карты.

Я не знаю, будет ли fsck работать одинаково на этих картах или нет. Моя первая склонность видеть эту ошибку - заменить ее.

С какой стати вы избавились от CF-карт? Используйте твердотельные носители (предназначенные для этой цели), если вам нужно флэш-накопитель. CF-карты не сделаны с техническими стандартами, чтобы включить мониторинг. Максимум, что вы можете сделать, - это проверить диск на наличие поврежденных секторов.

Другие вопросы по тегам