PFA realizada por un PSHED Plug-In

Un complemento del controlador de errores de hardware específico de la plataforma (PSHED) puede realizar un análisis predictivo de fallos (PFA) en la memoria ECC. Cuando esto ocurre, el complemento y no WHEA debe supervisar las páginas de memoria ECC. Si el complemento determina que una página de memoria ECC ha superado un umbral de error, indica este estado en WHEA. WHEA intenta desconectar la página de memoria.

Nota Si el complemento PSHED realiza PFA y usa el Registro para almacenar sus valores de configuración, como umbrales de error y tiempos de espera de supervisión, no debe depender de ni usar las opciones de configuración de PFA de WHEA descritas en Configuración de directiva de WHEA.

Cuando se produce un error de memoria ECC, WHEA y el complemento realizan los pasos siguientes:

  1. El controlador de errores de hardware de bajo nivel (LLHEH) recibe una notificación sobre la presencia de la condición de error de memoria.

  2. LLHEH recoge información sobre el error de memoria del origen del error y usa los datos del error para completar un paquete de error de hardware. Este paquete tiene el formato de estructura WHEA_ERROR_PACKET .

  3. LlHEH llama al PSHED para recuperar cualquier información de error de hardware específica de la plataforma. Si un complemento PSHED está instalado y está registrado para recuperar información sobre los errores, el PSHED llamará al complemento PSHED para que el complemento pueda modificar la información sobre el error que se devuelve a LLHEH.

  4. El LLHEH llama al kernel del sistema operativo Windows y le pasa el paquete de error.

  5. El kernel de Windows crea un registro de error y lo agrega a la información del paquete de error que se recibió de LLHEH. Además, el kernel de Windows agrega otra información sobre el error, como el origen del error, la gravedad del error y cuántas veces se ha producido el error en el registro de errores.

  6. El kernel de Windows llama a PSHED para permitir que PSHED agregue secciones al registro de error.

  7. Si se instala un complemento PSHED y se registra para recuperar información de error, PSHED llamará al complemento PSHED para que pueda modificar la información en el registro de error.

  8. Si el complemento PSHED realiza PFA en la página de memoria ECC, debe hacer lo siguiente:

    • Establezca el bit PlatformPfaControl en el miembro WHEA_ERROR_PACKET_FLAGS de la estructura WHEA_ERROR_PACKET. Si este bit está configurado, WHEA ya no es responsable del PFA en esa página de memoria.
    • Si el complemento determina que la página de memoria ECC que encontró el error debe desconectarse, establezca el bit PlatformDirectedOffline en el miembro WHEA_ERROR_PACKET_FLAGS. Si se establece este bit, WHEA intenta desconectar la página de memoria.

    De lo contrario, el complemento PSHED debe borrar los bits PlatformPfaControl y PlatformDirectedOffline en el miembro WHEA_ERROR_PACKET_FLAGS de la estructura WHEA_ERROR_PACKET.

    Nota Si el bit PlatformPfaControl se borra, WHEA realizará PFA si se ha configurado para hacerlo y determinará si la página de memoria ECC en la que se encontró el error debe desconectarse. Para obtener más información sobre este proceso, vea PFA Realizado por WHEA.

  9. Si la página de memoria ECC se debe desconectar, WHEA llama primero al administrador de memoria del sistema para realizar esta operación.

    Nota Cuando se llama al administrador de memoria del sistema, no hay ninguna garantía de que la página de memoria ECC se desconectará realmente.

WHEA agrega la página de memoria al almacén de datos de configuración de arranque (BCD) en el sistema. Esto impide que la página de memoria se use después del siguiente reinicio del sistema.

Nota WHEA no tomará un componente de hardware, como una página de memoria ECC, fuera de línea si el valor del Registro DisableOffline está establecido en un valor distinto de cero. Además, WHEA no agregará la página de memoria al almacén BCD si el valor del Registro MemPersistOffline está establecido en 0. Para obtener más información sobre los valores del Registro, consulte Configuración de directiva de WHEA.

Para obtener más información sobre el administrador de memoria del sistema, consulte Administración de memoria en la documentación de Windows SDK.

  1. El kernel de Windows genera un evento ETW y registra la información de error en el registro de eventos del sistema.