Сбой дискового пространства - том в автономном режиме

Мы настроили недорогой физический сервер с кучей дисков объемом 3 ТБ для использования в качестве промежуточной области резервного копирования перед тем, как приступить к записи на ленту. Мы установили Windows Server 2012 R2 и настроили дисковые пространства / пулы. Мы выполняем резервное копирование с помощью Veeam на более быстрый сервер, работающий по оптоволоконному каналу, а затем используем сценарии для перемещения резервных копий, которые старше x дней, на наш сервер Storage Spaces.

Первоначально у нас были некоторые сбои, так как мы обнаружили, что использование Robocopy для перемещения данных по пути UNC изящно не закрывало соединение SMB. мы решили эту проблему, добавив net use, а затем net use /delete к сценарию (а затем используя букву диска в качестве цели Robocopy). Это работало прекрасно в течение последней недели или двух.

Сегодня утром, хотя сценарии сообщили о сбое. В ходе расследования я обнаружил серию предупреждений с идентификатором события 51, за которыми следовал идентификатор события 134 (из источника ReFS). Мне кажется, что физический диск в пуле хранения вышел из строя. Однако, глядя в Диспетчер серверов, он показал виртуальный диск / том / не совсем уверен, что называть его "автономным"; простое возвращение его в оперативный режим работало, и в пуле хранения нет сбойных физических дисков. Есть также два горячих резерва, и ни один из них не был заменен.

Мне интересно, что здесь произошло? А также почему громкость отключилась? Я думал, что весь смысл ReFS и Storage Pools состоит в том, чтобы обеспечить надежность в случае подобных сбоев?

РЕДАКТИРОВАТЬ: Добавление всех соответствующих журналов ниже.

<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
  <Provider Name="disk" /> 
  <EventID Qualifiers="32772">51</EventID> 
  <Level>3</Level> 
  <Task>0</Task> 
  <Keywords>0x80000000000000</Keywords> 
  <TimeCreated SystemTime="2014-12-23T22:13:12.704827200Z" /> 
  <EventRecordID>23901</EventRecordID> 
  <Channel>System</Channel> 
  <Computer>****</Computer> 
  <Security /> 
  </System>
 <EventData>
  <Data>\Device\Harddisk25\DR25</Data> 
  <Binary>040080000100000000000000330004802D0100006B0400C000000000000000000000000000000000FC8F470200000000FFFFFFFF0100000058000030020000000020101280032040000080003C000000000020AB09E0FFFF783583D201E0FFFF0000000000000000507383D201E0FFFF30C99FC108E0FFFF6B0400C0000000008A00000000027C288D60000008000000000000000000000000000000000000000000000000000000</Binary> 
  </EventData>
  </Event>

Обнаружена ошибка на устройстве \Device\Harddisk25\DR25 во время операции подкачки.

FYI Disk25 - это виртуальный диск, созданный пространством хранения, а не один из физических дисков

<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
 <System>
  <Provider Name="ReFS" Guid="{036647D2-2FB0-4E32-8349-3F5C19C16E5E}" /> 
  <EventID>134</EventID> 
  <Version>0</Version> 
  <Level>2</Level> 
  <Task>0</Task> 
  <Opcode>0</Opcode> 
  <Keywords>0x8000000000000000</Keywords> 
  <TimeCreated SystemTime="2014-12-23T22:13:13.329846900Z" /> 
  <EventRecordID>23902</EventRecordID> 
  <Correlation /> 
  <Execution ProcessID="4" ThreadID="31267444" /> 
  <Channel>System</Channel> 
  <Computer>*****</Computer> 
  <Security UserID="S-1-5-18" /> 
  </System>
<EventData>
  <Data Name="VolumeIdLength">2</Data> 
  <Data Name="VolumeId">D:</Data> 
  <Data Name="FailureReason">0xc000000e</Data> 
  </EventData>
  </Event>

Файловая система не смогла записать метаданные на том носителя D:. Ошибка записи со статусом "Указано несуществующее устройство". ReFS отключит громкость. Может быть установлен снова автоматически.

 <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
 <System>
  <Provider Name="Microsoft-Windows-StorageSpaces-Driver" Guid="{595F7F52-C90A-4026-A125-8EB5E083F15E}" /> 
  <EventID>304</EventID> 
  <Version>0</Version> 
  <Level>3</Level> 
  <Task>0</Task> 
  <Opcode>0</Opcode> 
  <Keywords>0x8000000000000000</Keywords> 
  <TimeCreated SystemTime="2014-12-30T23:43:40.519688500Z" /> 
  <EventRecordID>21</EventRecordID> 
  <Correlation /> 
  <Execution ProcessID="4" ThreadID="3723912" /> 
  <Channel>Microsoft-Windows-StorageSpaces-Driver/Operational</Channel> 
  <Computer>****</Computer> 
  <Security UserID="S-1-5-18" /> 
  </System>
 <EventData>
  <Data Name="Id">{DE94C7EF-6A25-11E4-80B7-647002019326}</Data> 
  </EventData>
  </Event>

Виртуальный диск {de94c7ef-6a25-11e4-80b7-647002019326} находится в ухудшенном состоянии. Это может произойти, если физический диск, на котором размещен виртуальный диск, выходит из строя, отключается или возникает ошибка записи.

Windows попытается восстановить виртуальный диск. В настоящее время никаких действий не требуется.

2 ответа

Решение

После продолжительного обсуждения по электронной почте с инженером службы поддержки Microsoft мы установили следующее накопительное обновление:

http://support.microsoft.com/kb/2887595

Это включает в себя обновление, которое, кажется, специально предназначено для этой проблемы:

https://support.microsoft.com/en-us/kb/2897150

После установки накопительного обновления том постоянно оставался в сети без каких-либо проблем.

Предполагая, что вы определенно используете отказоустойчивый режим, такой как четность или зеркальное отображение, эта ошибка не должна быть возможной. Я смог воспроизвести эту ошибку в установке чередования с имеющимся у меня диском, который, как я знаю, плох. Так что либо вы настроены на чередование, либо обнаружили ошибку. Я бы привлек Microsoft на этом этапе, если вы еще этого не сделали.

Другие вопросы по тегам