Как отслеживать и измерять работоспособность карт Compact Flash, используемых в качестве серверных хранилищ?
контекст
Компания продает доступ к своего рода кассовому веб-приложению. Доступ к приложению предоставляется через VPN. Точкой входа VPN для клиентов является плата Soekris под управлением Voyage Linux (урезанная версия Debian). Эти платы работают в течение 3 лет MySQL с репликацией и стеком приложений RoR.
Для хранения этих плат используется карта памяти Compact Flash 4 ГБ.
Эта проблема
Мы получаем регулярные ошибки и случайные сбои приложений на этих платах. Наиболее частые ошибки:
24 августа 14:54:44 box45 puppetd[3669]: не удалось запустить Puppet::Network::Client::Master: устаревший дескриптор файла NFS - /var/lib/puppet/state/state.yaml
24 августа 13:37:01 box76 ядро: [ 2091.575622] Ошибка EXT2-fs (устройство hda1): read_block_bitmap: невозможно прочитать растровое изображение блока - block_group = 30, block_bitmap = 983040
Если бы они были основаны на жестких дисках, я бы запустил средства мониторинга SMART для проверки поврежденных секторов и общего состояния диска. За исключением того, что они являются CF-картами, я нахожусь в неведении, и мне трудно измерить, насколько плохая (или хорошая!) Ситуация.
Что я могу сделать, чтобы контролировать здоровье этих карт и измерить их здоровье? Я настаиваю на "мере", поскольку мне нужно привести некоторые неопровержимые факты, которые в конечном итоге будут мотивировать смену всех CF-карт.
И чтобы сделать все немного сложнее, у меня нет физического доступа к платам Soekris, поэтому все это должно быть удаленным.
2 ответа
Ошибка, кажется, довольно четко указывает на проблему с разделом носителя CF-карты. Если какое-то время он работал без проблем, и теперь он дает эти проблемы, я думаю, что карта начала портиться. Самый простой способ проверить это - отправить технику с заменяющей картой и заменить ее, особенно если вы видите это на ограниченном числе систем. У всех СМИ есть продолжительность жизни и нормы неудачи; чем больше циклов чтения / записи у вас будет, тем быстрее они умрут.
Еще одна вещь, на которую стоит обратить внимание: ошибки чтения каждый раз находятся в одном и том же месте? Это говорит мне о том, что это, вероятно, плохая ячейка в определенной части карты.
Я не знаю, будет ли fsck работать одинаково на этих картах или нет. Моя первая склонность видеть эту ошибку - заменить ее.
С какой стати вы избавились от CF-карт? Используйте твердотельные носители (предназначенные для этой цели), если вам нужно флэш-накопитель. CF-карты не сделаны с техническими стандартами, чтобы включить мониторинг. Максимум, что вы можете сделать, - это проверить диск на наличие поврежденных секторов.