Устранение неполадок при случайном зависании сервера без записей в журнале
Мы сталкиваемся с очень специфической и уникальной проблемой в нашем приложении C#, которое работает в.NET Framework 4.7.2, в режиме киоска в операционной системе Windows 10, которая работает на Lenovo ThinkStation P320 Tiny as Hardware (та же проблема была обнаружена и в другое оборудование).
Описание среды:
сценарий включает в себя всегда работающее приложение с автоматическим переключением дня / ночи.
Когда приложение не находится в режиме видеовызова, оно воспроизводит непрерывный цикл некоторых видео / фильмов.
Приложение запускается в Windows точно в режиме киоска при запуске системы. К мини-ПК (Lenovo) подключены следующие периферийные устройства:
- Основной монитор (планшет сенсорный)
- Дополнительный монитор (телевизор 40")
- сканер
- USB-камера
- USB-микрофон
- USB LAN
Единственно возможное взаимодействие пользователя с системой осуществляется в контролируемой среде с помощью сенсорного планшета.
Описание проблемы:
случайным образом мы испытываем нечто вроде зависания машины:
основной и дополнительный мониторы включены с фиксированным образом, сетевой интерфейс не отвечает на команду ping.
Операционная система в этот период времени не отслеживает никакого выполнения (без сбоев в журнале системных событий, без дампа, без активных процессов).
Даже подключив мышь и клавиатуру к мини-ПК, невозможно восстановить контроль над операционной системой.
Нет точного момента, когда проблемы такого типа начали проявляться, когда мы начали этот проект несколько месяцев назад.
Та же проблема также встречалась на разных моделях оборудования, отличающихся от оборудования Lenovo ThinkStation P320 Tiny, используемого в качестве цели.
Мы безуспешно пытались включить журналы системных событий в утилите настройки BIOS Lenovo, но не обнаружили никаких ошибок.
Мы пытались принудительно генерировать дамп из Windows, но операционная система не может этого сделать.
Мы привлекли поставщика Lenovo (даже если на самом деле проблема также возникает на другом оборудовании), выполнив диагностические инструменты, которые могут выявить любые несовместимости оборудования или внутренние проблемы нашей компании.
Конфигурация: проблем не обнаружено.
В этой ситуации единственной возможностью является отключение блока питания мини-ПК.
При перезагрузке, анализируя приложение и системные журналы, ничего не обнаруживается в течение периода времени, в течение которого мини-ПК был заблокирован (заморожен), никаких проблем не обнаружено в период точно до остановки или после перезагрузки.
Вопрос:
Учитывая, что ни с точки зрения приложения, ни из операционной системы невозможно получить информацию о диагностике системы и анализе проблемы, нам хотелось бы понять, как устранить проблему, или включить низкоуровневые журналы или дампы, которые могут расскажите подробнее о состоянии мини-ПК, когда он зависает, или о возможных причинах его возникновения.
1 ответ
Если программное обеспечение не может зарегистрировать проблему, то оно определенно находится в аппаратной неисправности. Обычно проблемы взаимодействия между драйвером и программным обеспечением вызывают паническую реакцию (BSOD).
Вещи, чтобы проверить:
- Устройство перегревается? (Убедитесь, что в киоске хороший воздушный поток)
- Есть ли проблемы с источником электричества? (Отсутствует замыкание на землю / замыкание на землю, падение напряжения и скачки напряжения? Используйте ИБП для выравнивания напряжения. Вызовите электрика для устранения замыканий на землю.)
- Неисправный или дешевый источник питания. (Это может произойти на нескольких устройствах, использующих один и тот же блок питания. Проверьте блок питания.)
- Большой источник электромагнитных помех поблизости? (Пример: МРТ машины, катушка Тесла)
- Ошибка BIOS. (Может существовать на всех устройствах с определенной прошивкой. Проверьте наличие обновлений.)