Table of contents
TOC
Свернуть оглавление
Развернуть оглавление

Управление работоспособностью памяти хранилища (NVDIMM-N) в Windows

Jason Gerend|Последнее обновление: 28.10.2016
|
1 Участник

Область применения: Windows Server 2016, Windows 10 (версия 1607)

В этой статье представлены сведения об обработке ошибок и управлении работоспособностью памяти хранилища (NVDIMM-N) в Windows для системных администраторов и ИТ-специалистов. Описаны различия между памятью хранилища и традиционными запоминающими устройствами.

Если вы не знакомы с поддержкой Windows устройств памяти хранилища, просмотрите обзор, представленный в следующих видеороликах.

JEDEC-совместимые устройства памяти хранилища NVDIMM-N поддерживаются в Windows с помощью собственных драйверов начиная с Windows Server 2016 и Windows 10 (версия 1607). Эти устройства работают точно так же, как и другие диски (HDD и SSD), но есть некоторые отличия.

Все описанные здесь ситуации встречаются довольно редко и зависят от условий эксплуатации оборудования.

Рассмотренные ниже случаи могут относиться к конфигурациям дисковых пространств. Например, к конфигурации, в которой два устройства NVDIMM-N используются как зеркальный кэш обратной записи в дисковом пространстве. Чтобы настроить такую конфигурацию, см. статью о настройке дисковых пространств с кэшем обратной записи NVDIMM-N.

Проверка работоспособности памяти хранилища

Чтобы запросить сведения о работоспособности памяти хранилища, используйте указанные ниже команды в сеансе Windows PowerShell.

PS C:\> Get-PhysicalDisk | where BusType -eq “SCM” | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Будут получены такие примеры результатов.

SerialNumberHealthStatusOperationalStatusOperationalDetails
802c-01-1602-117cb5fcHealthyОК
802c-01-1602-117cb64fПредупреждениеПрогнозируемый сбой{Превышено пороговое значение, ошибка NVDIMM_N}

Для получения сведений о различных состояниях работоспособности см. следующие разделы.

Состояние работоспособности "Предупреждение"

Это состояние возникает, если при проверке работоспособности устройства памяти хранилища для него отображается значение Предупреждение, как показано в примере.

SerialNumberHealthStatusOperationalStatusOperationalDetails
802c-01-1602-117cb5fcHealthyОК
802c-01-1602-117cb64fПредупреждениеПрогнозируемый сбой{Превышено пороговое значение, ошибка NVDIMM_N}

В следующей таблице перечислены некоторые сведения об этом состоянии.

Описание
Вероятное состояниеПредупреждение NVDIMM-N: превышено пороговое значение
Основная причинаУстройства NVDIMM-N отслеживают различные пороговые значения, например температуру, время действия NVM и/или источника энергии. При превышении одного из этих пороговых значений в операционную систему поступает соответствующее уведомление.
Общее поведениеУстройство сохраняет полную работоспособность. Это предупреждение, а не ошибка.
Поведение дисковых пространствУстройство сохраняет полную работоспособность. Это предупреждение, а не ошибка.
Дополнительные сведенияПоле OperationalStatus объекта PhysicalDisk. Журнал событий — Microsoft-Windows-ScmDisk0101/Operational
Что делатьВ зависимости от порогового значения, после превышения которого поступило предупреждение, возможно, понадобится заменить все устройство NVDIMM-N или некоторые его компоненты. Например, если превышено пороговое значение времени действия NVM, имеет смысл заменить NVDIMM-N.

Сбой записи в NVDIMM-N

Это состояние возникает, если при проверке работоспособности устройства памяти хранилища для него отображается значение Неработоспособное, а для рабочего состояния появляется сообщение Ошибка ввода-вывода, как показано в этом примере:

SerialNumberHealthStatusOperationalStatusOperationalDetails
802c-01-1602-117cb5fcHealthyОК
802c-01-1602-117cb64fUnhealthy{Устаревшие метаданные, ошибка ввода-вывода, временная ошибка}{Потеря сохраняемости данных, потеря данных, NV...}

В следующей таблице перечислены некоторые сведения об этом состоянии.

Описание
Вероятное состояниеПотеря сохраняемости / питания для резервного копирования
Основная причинаУстройствам NVDIMM-N для сохранения данных требуется резервный источник питания. Обычно это батарея или суперконденсатор. Если резервный источник питания недоступен или устройство не может его использовать по любой причине (ошибка контроллера или флэш-памяти), данные подвергаются риску и ОС Windows запрещает для таких устройств любые последующие операции записи. Для эвакуации данных сохраняется возможность чтения.
Общее поведениеТом NTFS будет отключен.
В поле состояния работоспособности PhysicalDisk будет отображаться значение "Неработоспособное" для всех устройств NVDIMM-N в зоне риска.
Поведение дисковых пространствДисковое пространство будет оставаться работоспособным до тех пор, пока в зоне риска будет только одно устройство NVDIMM-N. Если в зону риска попадет несколько устройств, запись в дисковом пространстве не будет выполнена.
В поле состояния работоспособности PhysicalDisk будет отображаться значение "Неработоспособное" для всех устройств NVDIMM-N в зоне риска.
Дополнительные сведенияПоле OperationalStatus объекта PhysicalDisk.
Журнал событий — Microsoft-Windows-ScmDisk0101/Operational
Что делатьРекомендуется выполнить резервное копирование данных на устройствах NVDIMM-N в зоне риска. Чтобы получить доступ для чтения, можно вручную перевести диск в оперативный режим (он отобразится как том NTFS только для чтения).

Чтобы полностью удалить это состояние, необходимо устранить основную причину (т. е. в зависимости от проблемы провести обслуживание источника питания или заменить NVDIMM-N). Том на NVDIMM-N должен быть переведен в автономный режим, а затем снова в оперативный, либо же необходимо перезагрузить систему.

Чтобы устройство NVDIMM-N снова можно было использовать в дисковых пространствах, воспользуйтесь командлетом Reset-PhysicalDisk, который повторно интегрирует устройство и запустит процесс восстановления.

Для устройства NVDIMM-N отображается емкость 0 байт, или устройство распознается как "Универсальный физический диск".

Это состояние возникает, если устройство памяти хранилища не удается инициализировать, поскольку для его емкости отображается значение "0 байт". Или оно распознается как объект "Общий физический диск" в рабочем состоянии Связь потеряна, как показано в примере ниже.

SerialNumberHealthStatusOperationalStatusOperationalDetails
802c-01-1602-117cb5fcHealthyОК
ПредупреждениеСвязь потеряна

В следующей таблице перечислены некоторые сведения об этом состоянии.

Описание
Вероятное состояниеBIOS не предоставляет NVDIMM-N для ОС
Основная причинаУстройства NVDIMM-N созданы для DRAM. При ссылке на поврежденный адрес DRAM большинство процессоров инициируют проверку компьютера и перезагрузку сервера. В таком случае некоторые серверные платформы отключают привязку NVDIMM, предотвращая доступ к нему ОС, осуществление которого может сопровождаться повторной проверкой системы. Кроме того, это может произойти, если BIOS обнаруживает, что произошел сбой NVDIMM-N и устройство необходимо заменить.
Общее поведениеNVDIMM-N отображается как неинициализированное устройство емкостью 0 байт, недоступное для чтения или записи.
Поведение дисковых пространствДисковое пространство сохраняет работоспособность (при условии, что в зоне риска только одно устройство NVDIMM-N).
Объект PhysicalDisk NVDIMM-N отображается как "Общий физический диск" с состоянием работоспособности "Предупреждение".
Дополнительные сведенияПоле OperationalStatus объекта PhysicalDisk.
Журнал событий — Microsoft-Windows-ScmDisk0101/Operational
Что делатьУстройства NVDIMM-N должны быть заменены или обработаны таким образом, чтобы серверная платформа снова предоставляла их для ОС узла. Рекомендуется замена устройства, иначе могут произойти дополнительные неустранимые ошибки. Новое устройство для замены в конфигурации дисковых пространств можно добавить при помощи командлета Add-Physicaldisk.

После перезагрузки устройство NVDIMM-N отображается как RAW или пустой диск

Это состояние возникает, если при проверке работоспособности устройства памяти хранилища для него отображается сообщение Неработоспособно, а значение рабочего статуса — Нераспознанные метаданные, как показано в этом примере.

SerialNumberHealthStatusOperationalStatusOperationalDetails
802c-01-1602-117cb5fcHealthyОК{Неизвестно}
802c-01-1602-117cb64fUnhealthy{Нераспознанные метаданные, устаревшие метаданные}{Неизвестно}

В следующей таблице перечислены некоторые сведения об этом состоянии.

Описание
Вероятное состояниеСбой резервного копирования/восстановления
Основная причинаСбой процедуры резервного копирования или восстановления, скорее всего, приведет к потере всех данных на NVDIMM-N. При загрузке операционной системы NVDIMM-N будет отображаться как новое устройство без секционирования или файловой системы и распознаваться как необработанные данные, что свидетельствует об отсутствии файловой системы.
Общее поведениеNVDIMM-N будет находиться в режиме только для чтения. Для возобновления использования потребуется явное действие пользователя.
Поведение дисковых пространствДисковые пространства сохраняют работоспособность (если в зоне риска только одно устройство NVDIMM).
Объект физического диска NVDIMM-N будет отображаться с состоянием работоспособности "Неработоспособно" и не будет использоваться дисковыми пространствами.
Дополнительные сведенияПоле OperationalStatus объекта PhysicalDisk.
Журнал событий — Microsoft-Windows-ScmDisk0101/Operational
Что делатьЕсли пользователь предпочитает не заменять устройство в зоне риска, можно воспользоваться командлетом Reset-PhysicalDisk, чтобы отменить состояние "только для чтения" для NVDIMM-N в зоне риска. В средах дисковых пространств также будет выполнена попытка повторно интегрировать NVDIMM-N в дисковое пространство и запустить процесс восстановления.

Чередующиеся наборы

Чередующиеся наборы обычно создаются в BIOS платформах, чтобы несколько NVDIMM-N отображались как одно устройство для операционной системы узла.

Windows Server 2016 и Windows 10 Anniversary Edition не поддерживают чередующиеся наборы NVDIMM-N.

На время написания этой статьи не существует механизма, позволяющего операционной системе узла правильно определить отдельные NVDIMM-N в таком наборе и явно сообщить пользователю, какое устройство вызвало ошибку или требует обслуживания.

© 2017 Microsoft