Случайные сбои на моем сервере WIndows
На этой неделе я получаю любопытные случайные сбои на одном из моих компьютеров с Windows. Сбой всегда заканчивается BSOD, но случайными кодами ошибок в случайных системных драйверах. Нет записи в журнале событий.
Итак, первое предположение - память, но я понял, что внутри только один SSD-диск. Я не доверяю никаким SMART-данным с дисков, но на этот раз, возможно, это тот случай, когда мне следует. Как вы думаете? Самопроверка диска с помощью Parted magic прошла нормально. Я не могу позволить себе сделать тест записи.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 120 120 050 Pre-fail Always - 0/0
5 Retired_Block_Count 0x0033 100 100 003 Pre-fail Always - 0
9 Power_On_Hours_and_Msec 0x0032 095 095 000 Old_age Always - 4581h+05m+42.650s
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 290
171 Program_Fail_Count 0x0032 000 000 000 Old_age Always - 0
172 Erase_Fail_Count 0x0032 000 000 000 Old_age Always - 0
174 Unexpect_Power_Loss_Ct 0x0030 000 000 000 Old_age Offline - 11
177 Wear_Range_Delta 0x0000 000 000 000 Old_age Offline - 1
181 Program_Fail_Count 0x0032 000 000 000 Old_age Always - 0
182 Erase_Fail_Count 0x0032 000 000 000 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
194 Temperature_Celsius 0x0022 128 129 000 Old_age Always - 128 (0 127 0 129 0)
195 ECC_Uncorr_Error_Count 0x001c 100 100 000 Old_age Offline - 0/0
196 Reallocated_Event_Count 0x0033 100 100 003 Pre-fail Always - 0
201 Unc_Soft_Read_Err_Rate 0x001c 100 100 000 Old_age Offline - 0/0
204 Soft_ECC_Correct_Rate 0x001c 100 100 000 Old_age Offline - 0/0
230 Life_Curve_Status 0x0013 100 100 000 Pre-fail Always - 100
231 SSD_Life_Left 0x0013 100 100 010 Pre-fail Always - 0
233 SandForce_Internal 0x0000 000 000 000 Old_age Offline - 1319
234 SandForce_Internal 0x0032 000 000 000 Old_age Always - 944
241 Lifetime_Writes_GiB 0x0032 000 000 000 Old_age Always - 944
242 Lifetime_Reads_GiB 0x0032 000 000 000 Old_age Always - 1317
Model Family: SandForce Driven SSDs
Device Model: Corsair Force 3 SSD
3 ответа
У меня есть люди. В этих SSD есть огромная ошибка в спящем режиме. Если диск переходит в спящий режим, иногда может возникнуть проблема с его пробуждением, поскольку он игнорирует оператор COM_WAK. Я не знаю, почему он начал это делать сейчас, может быть, это было вызвано обновлением Windows.
Тем не менее, я обновил каждую прошивку системы и после обновления прошивки дисков до 5.3, сбои исчезли.
Это по крайней мере создать дамп памяти? Если нет, проверьте, настроена ли ваша система на создание дампов памяти, подождите, пока это произойдет снова, и используйте Windbg для просмотра файла memory.dmp.
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
194 Temperature_Celsius 0x0022 128 129 000 Old_age Always - 128 (0 127 0 129 0)
Хм, если предположить, что это действительно так, проблема в том, что ваш компьютер нагревается достаточно, чтобы вскипятить воду. Итак, что вам нужно сделать, это инвестировать в надлежащий чайник для ваших нужд с кипячением воды, и держать ваш компьютер намного прохладнее, вместо того, чтобы использовать его для выработки пара.