Windows 2003 Terminal Server не отвечает после перезагрузки
У нас есть 5 терминальных серверов Windows 2003 R2 SP2 Std x64, которые настраиваются на перезагрузку каждую ночь в течение 45 минут друг от друга. Часто по крайней мере один из них не будет отвечать на запросы RDP после перезагрузки. Если я подключаюсь к консоли, я могу войти в систему просто отлично. NETstat показывает прослушивание TS на 3389 и т. Д. Единственный способ заставить их ответить снова - это перезагрузить компьютер вручную.
Все терминальные серверы показывают следующие ошибки в журнале событий после перезагрузок (однако не все из них не отвечают, большинство работает нормально после перезагрузки)
Event ID 5719 - Error - Netlogon - This computer was not able to set up a secure session with a domain controller in domain DOMAIN due to the following: There are no logon servers available.
Event ID 4321 - Error - NetBT - The name DOMAIN :1d" could not be registered on the interface with IP address [IP address]. The machine with the IP [IP address of domain controller] did not allow the name to be claimed by this machine.
Однако эти события отображаются на машинах, которые также успешно перезагружаются. Может кто-нибудь, пожалуйста, помогите мне решить эту проблему? Как я уже сказал, это происходит не каждый раз и не на каждом сервере. Только иногда один или два сервера. Очень расстраивает.
Спасибо за любую помощь!
4 ответа
Похоже, проблема со службами TS на затронутых серверах. Возможно, они зависли или ожидают ответа от DC, который был потерян или искажен в сети, или не смог правильно запуститься при загрузке ОС и т. Д.
- Первое, что я хотел бы сделать, - это установить службы TS на отложенный запуск, в случае, если это проблема загрузки ОС или компьютера. Он настроит службу на запуск после большинства всего остального, поэтому любые зависимости должны быть полностью запущены, и не будет никаких конфликтов с ним, запущенных одновременно с другими.
- В противном случае я бы использовал запланированное задание для перезапуска службы через пару минут после загрузки ОС. (Чтобы правильно составить расписание, потребуются некоторые догадки, основанные на времени перезагрузки, скорости загрузки компьютера и скорости загрузки ОС.)
- Исследовать сетевые карты на машинах? Возможно ли, что причина в устаревших драйверах или микропрограммах, а также в том, что обновленное программное обеспечение (например, Windows Updates и любые другие исправления, которые вы, как мы надеемся) применили, конфликтует время от времени?
- В противном случае (и, возможно, в любом случае, чтобы попытаться устранить основную причину, а не просто устранить симптом), я бы сделал переустановку (удаление, установка новой) служб терминалов на затронутых серверах. У меня была такая проблема, отсутствовал EventID 4321, и это обычно решает ее, по крайней мере, когда это проблема со службами TS на сервере, а не вызванная сетью или контроллером домена.
- (Возможно, сделайте это до #4). Устраните неполадки в контроллере домена. Есть причина, по которой Eventlog сообщает вам, что сервер не может связаться с сервером входа в систему, а контроллер домена не позволяет назначить имя хоста указанному интерфейсу. Это может быть вызвано настройками домена или контроллера домена. Посмотрите на DC, чтобы увидеть, есть ли какие-либо признаки этого. (Не забудьте поискать настройки GPO, сценарии запуска и тому подобное.)
- (Возможно, сделайте это до #4). Устраните неполадки с точки зрения сети. Возможно ли, что сеть иногда искажает трафик между этими серверами и DC, вызывая проблемы аутентификации и назначения имен, которые вы видите в журналах событий сервера.
- (Возможно, сделайте это раньше всего) Попытайтесь убедить своих боссов (или тех, кто "контролирует" ночные перезагрузки), что причиной этого являются ночные перезагрузки, и / или что это "ожидаемое поведение", когда вы вступаете в тупую практику ночных сервер перезагружается. Или вы, если вы исправите / исправите это, исправление перестанет работать, если перезагрузка не прекратится или не уменьшится по частоте. Вы получите дополнительное преимущество, заключающееся в том, что вам не придется заменять свои серверы через пару лет после того, как дополнительная нагрузка при загрузке вызовет сбой оборудования.:/
Я видел эти ошибки на нашем сервере Windows 2003 SP2 TS. Он перезагружается каждую ночь (как и ваша) по причинам совместимости с устаревшими приложениями.
Я полагаю, вы уже это проверили, но в прошлом у меня были некоторые проблемы с жестким пространством, которые привели нас к похожему сценарию.
Кстати, любой из этих серверов TS является DC. Не так ли?
Похоже, вы не используете STATIC IP-адреса, но это может быть проблема с отображением. Я настоятельно рекомендую вам установить статические IP-адреса, если вы уже этого не делаете. Каждый сервер терминалов должен иметь свой собственный статический IP-адрес и быть настроен вручную, чтобы указывать на соответствующий контроллер домена.
Код события 4321 - Ошибка - NetBT. Эта конкретная ошибка может быть вызвана несколькими причинами. У меня такое ощущение, что у вас есть терминальные серверы. Есть большая вероятность, что после того, как они были изображены, виртуальный сетевой адаптер не был переделан; таким образом, информация NIC одинакова для всех серверов. Если они были отображены, и если это так, я предлагаю скопировать информацию, которую вы имеете для виртуальных адаптеров (сфотографировать ее или что-то... информация об ip-адресе, информация о dns и wins, суффиксы dns и т. Д.), А затем затем заново создайте вирусный адаптер. Все терминальные серверы могут пытаться связаться, и сеть запутывается... так как 3 сервера имеют одинаковую информацию NIC. Также не забудьте проверить всю вашу информацию. Убедитесь, что ваша маска подсети правильная (вероятно, 255.255.255.0).
У меня была такая ситуация, когда я, казалось, мог использовать компьютеры напрямую, но я не мог удаленно войти. Я обнаружил, что из-за создания образа машин мои виртуальные адаптеры необходимо было переделать. Надеюсь, это поможет!
Я нашел много статей из КБ от Microsoft, которые намекали на проблемы с сетевыми картами, и, как вы сказали, все серверы демонстрировали одинаковые ошибки. Я думаю, что проблема в ваших переключателях. Если у вас есть управляемый коммутатор, вы должны отключить связующее дерево или включить быстрый запуск (для Cisco).
Вот команды, чтобы сделать это в Коммутаторе Cisco Catalyst:
config terminal
interface Gi1/0/19
spanning-tree portfast
Обратите внимание, чтобы отключить использовать команду:
no spanning-tree portfast
Для справки Cisco