Прерывистые падения на файловом сервере Windows
У нас есть Windows Storage Server (2003 R2), который служит нашим NAS для нашей компании. За последние несколько недель мы начали испытывать периодические "падения", когда клиент ненадолго теряет соединение с сервером. Это может быть при попытке доступа к подключенному диску или пути UNC. Когда это происходит, они обычно получают одно из 3 сообщений об ошибках:
Папка не существует
Каталог не существует
Указанное имя сети больше не доступно
В течение нескольких секунд после отбрасывания, как правило, вторая или третья попытка успешна, и все в порядке. Это, однако, разрушает многие наши производственные процессы.
Когда это происходит, это влияет на всех клиентов, которые пытаются получить доступ к NAS в данный момент. В какой-то момент мы подумали, что решили эту проблему, заменив неисправный жесткий диск в массиве raid, но проблема продолжается, и мы фактически начинаем видеть его на другом NAS с идентичным оборудованием (и того же возраста). Оба они являются серверами с истекшим сроком эксплуатации, которые должны были быть заменены давно.
В журналах событий сервера, журналах рейдов или журналах коммутаторов заметок не обнаружено. Уязвимые клиенты варьируются от коробок Linux до коробок Windows.
Любая помощь или совет будет принята с благодарностью. Я думаю, что мы собираемся попробовать некоторый анализ пакетов и посмотреть, сможем ли мы что-нибудь увидеть таким образом. Не уверен, однако, какой инструмент будет хорош для этого.
Обновить
Я пытался использовать NetMon, но трафик общего доступа к файлам настолько велик, что сервер не успевает за анализом пакетов.