Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Los modelos de uso de caché le permiten personalizar cómo azure HPC Cache almacena los archivos para acelerar el flujo de trabajo.
Conceptos básicos del almacenamiento en caché de archivos
El almacenamiento en caché de archivos es cómo Azure HPC Cache acelera las solicitudes de cliente. Usa estos procedimientos básicos:
Caché de lectura: Azure HPC Cache mantiene una copia de los archivos que los clientes solicitan del sistema de almacenamiento. La próxima vez que un cliente solicite el mismo archivo, HPC Cache puede proporcionar la versión en su caché en lugar de tener que recuperar el archivo del sistema de almacenamiento back-end de nuevo. Las solicitudes de escritura se pasan al sistema de almacenamiento de fondo.
Caché de escritura: opcionalmente, Azure HPC Cache puede guardar una copia de los archivos modificados que se envían desde las máquinas cliente. Si varios clientes realizan cambios en el mismo archivo durante un breve período, la memoria caché puede recopilar todos los cambios de la memoria caché en lugar de tener que escribir cada cambio individualmente en el sistema de almacenamiento back-end. Después de una cantidad de tiempo especificada sin cambios, la memoria caché mueve el archivo al sistema de almacenamiento a largo plazo.
Temporizador de verificación: la configuración del temporizador de verificación determina con qué frecuencia la memoria caché compara su copia local de un archivo con la versión remota en el sistema de almacenamiento back-end. Si la copia de back-end es más reciente que la copia almacenada en caché, la memoria caché captura la copia remota y la almacena para futuras solicitudes.
La configuración del temporizador de verificación muestra cuándo la memoria caché compara automáticamente sus archivos con archivos de origen en el almacenamiento remoto. Sin embargo, puede forzar que Azure HPC Cache compare los archivos realizando una operación de directorio que incluya una solicitud readdirplus. Readdirplus es una API NFS estándar (también llamada lectura extendida) que devuelve metadatos de directorio, lo que hace que la caché compare y actualice los archivos.
Temporizador de reescritura : para una memoria caché con almacenamiento en caché de lectura y escritura, el temporizador de reescritura es la cantidad máxima de tiempo en segundos que la memoria caché espera antes de copiar un archivo cambiado en el sistema de almacenamiento back-end.
Los modelos de uso integrados en Azure HPC Cache tienen valores diferentes para esta configuración para que pueda elegir la mejor combinación para su situación.
Elección del modelo de uso adecuado para el flujo de trabajo
Debe elegir un modelo de uso para cada destino de almacenamiento del protocolo NFS que use. Los destinos de Azure Blob Storage tienen un modelo de uso integrado que no se puede personalizar.
Los modelos de uso de HPC Cache permiten elegir cómo equilibrar la respuesta rápida con el riesgo de obtener datos obsoletos. Si quiere optimizar la velocidad de lectura de los archivos, es posible que no le interese si los archivos de la memoria caché se comparan con los archivos de back-end. Por otro lado, si desea asegurarse de que los archivos estén siempre actualizados con el almacenamiento remoto, elija un modelo y establezca el temporizador de comprobación en un número bajo para comprobar con frecuencia.
Estas son las opciones del modelo de uso:
Almacenamiento en caché solo de lectura: use esta opción si desea acelerar el acceso de lectura a los archivos. Elija esta opción cuando el flujo de trabajo implique operaciones de escritura mínimas como 0% a 5%.
Esta opción almacena en caché las lecturas del cliente, pero no almacena en caché las escrituras. Las operaciones de escritura se transmiten al almacenamiento de fondo.
Los archivos almacenados en la memoria caché no se comparan automáticamente con los archivos del volumen de almacenamiento NFS. (Lea la descripción del temporizador de verificación anterior para aprender a compararlos manualmente).
Al elegir la opción de almacenamiento en caché de solo lectura, puede cambiar el temporizador de verificación. El valor predeterminado es de 30 segundos. El valor debe ser un entero (sin decimales) comprendido entre 1 y 31536000 segundos (1 año).
Almacenamiento en caché de lectura y escritura : esta opción almacena en caché las operaciones de lectura y escritura. Al usar esta opción, se espera que la mayoría de los clientes accedan a los archivos a través de Azure HPC Cache en lugar de montar el almacenamiento back-end directamente. Los archivos almacenados en caché tendrán cambios recientes que aún no se han copiado en el back-end.
En este modelo de uso, los archivos de la memoria caché solo se comprueban con los archivos del almacenamiento back-end cada ocho horas de forma predeterminada. Se supone que la versión almacenada en caché del archivo es más actual. Un archivo modificado en la memoria caché se escribe en el sistema de almacenamiento back-end después de haber estado en la memoria caché durante una hora de forma predeterminada.
Al elegir la opción de caché de lectura-escritura, puede cambiar tanto el temporizador de verificación como el temporizador de escritura diferida. El valor predeterminado del temporizador de verificación es de 28 800 segundos (8 horas). El valor debe ser un entero (sin decimales) entre 1 y 31536000 inclusive. El valor predeterminado del temporizador de reescritura es de 3600 segundos (1 hora). El valor debe ser un entero (sin decimales) comprendido entre 1 y 31536000 segundos (1 año).
En esta tabla se resumen las diferencias del modelo de uso:
| Modelo de uso | Modo de almacenamiento en caché | Temporizador de comprobación | Temporizador de escritura diferida |
|---|---|---|---|
| Almacenamiento en caché de solo lectura | Leer | 30 segundos | Ninguno |
| Almacenamiento en caché de lectura y escritura | Lectura/escritura | 8 horas | 1 hora |
Warning
Cambiar los modelos de uso provoca una interrupción del servicio. Los clientes de HPC Cache no recibirán respuestas mientras se realiza la transición del modelo de uso. Si debe cambiar los modelos de uso, se recomienda que el cambio se realice durante una ventana de mantenimiento programada para evitar la interrupción del cliente.
Si tiene preguntas sobre el mejor modelo de uso para el flujo de trabajo de Azure HPC Cache, póngase en contacto con su representante de Azure o abra una solicitud de soporte técnico para obtener ayuda.
Sugerencia
Una utilidad está disponible para volver a escribir archivos individuales específicos en un destino de almacenamiento sin escribir todo el contenido de la caché. Obtenga más información sobre el script flush_file.py en Personalizar la escritura diferida de archivos en Azure HPC Cache.
Pasos siguientes
- Incorporación de destinos de almacenamiento a Azure HPC Cache