Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Azure Elastic SAN est un service SAN (Cloud-Native Storage Area Network) qui fournit une solution de stockage évolutive, économique, hautes performances et complète pour une gamme d’options de calcul. Le san élastique vous permet de créer et de gérer des volumes, qui sont des disques virtuels que vous pouvez connecter à vos machines virtuelles, conteneurs ou autres services Azure via le protocole iSCSI.
Lorsque vous utilisez Azure, la fiabilité est une responsabilité partagée. Microsoft offre une gamme de fonctionnalités permettant de prendre en charge la résilience et la récupération. Vous êtes responsable de comprendre le fonctionnement de ces fonctionnalités dans tous les services que vous utilisez et de sélectionner les fonctionnalités dont vous avez besoin pour atteindre vos objectifs métier et vos objectifs de temps d’activité.
Cet article explique comment rendre Azure Elastic SAN résilient à diverses pannes et problèmes potentiels, notamment les erreurs temporaires, les défaillances de zone de disponibilité et les défaillances à l’échelle de la région. Il décrit également les options de sauvegarde et de récupération, et met en évidence les informations clés relatives au contrat de niveau de service (SLA) Azure Elastic SAN.
Recommandations de déploiement de production pour la fiabilité
Pour les charges de travail de production, nous vous recommandons de :
- Utilisez le stockage redondant interzone (ZRS) : ZRS répartit les copies de vos données dans trois zones de disponibilité.
- Configurez l’accès réseau pour réduire l’intervention manuelle pendant les défaillances de zone : Les points de terminaison privés permettent le basculement automatique de zone sans intervention manuelle, tandis que les points de terminaison de service peuvent nécessiter une intervention manuelle.
- Pour les charges de travail nécessitant une récupération d’urgence inter-régions : Créez régulièrement des instantanés de vos volumes et exportez-les vers des captures instantanées de disque managées pour la protection des données. Copiez les instantanés dans une région secondaire qui est géographiquement distante de votre région primaire.
Vue d’ensemble de l’architecture de fiabilité
Elastic SAN a une hiérarchie de ressources de trois niveaux :
- SAN élastique : ressource de niveau supérieur dans laquelle vous configurez la redondance, allouez la capacité de stockage et définissez des limites de performances. Le nombre d’unités de base allouées à votre SAN élastique détermine le nombre total d’E/S par seconde et le débit disponibles dans l’ensemble du réseau SAN.
- Groupes de volumes : constructions de gestion utilisées pour gérer les volumes à grande échelle. Les paramètres d’accès réseau, tels que les points de terminaison privés ou les points de terminaison de service, sont configurés au niveau du groupe de volumes et hérités par tous les volumes du groupe.
- Volumes : volumes de stockage individuels partitionnés à partir de la capacité totale du san. Les volumes sont connectés aux ressources de calcul via le protocole iSCSI.
Pour plus d’informations sur les ressources que vous déployez, consultez ressources SAN élastiques.
En interne, elastic SAN stocke vos données dans des clusters de stockage. Lorsque vous configurez votre san élastique pour utiliser le stockage localement redondant (LRS), vos données sont répliquées trois fois au sein d’un seul cluster de stockage dans un centre de données. Vous pouvez configurer le stockage redondant interzone (ZRS) pour stocker des copies des données dans trois zones de disponibilité. Pour plus d’informations, consultez Résilience aux échecs de zone de disponibilité.
Résilience aux erreurs temporaires
Les erreurs temporaires sont des défaillances courtes et intermittentes dans les composants. Elles se produisent fréquemment dans un environnement distribué comme le cloud, et font partie intégrante des opérations ordinaires. Les erreurs temporaires se corrigent après une courte période de temps. Il est important que vos applications puissent gérer les erreurs temporaires, généralement en réessayant les requêtes affectées.
Toutes les applications hébergées dans le cloud doivent suivre les instructions de gestion des erreurs temporaires Azure lorsqu’elles communiquent avec toutes les API, bases de données et autres composants hébergés dans le cloud. Pour plus d’informations, consultez Recommandations pour la gestion des erreurs temporaires.
Si votre connexion iSCSI à un volume SAN élastique est interrompue, l’initiateur iSCSI sur le client tente automatiquement de se reconnecter. Vous pouvez rencontrer une brève pause dans les opérations d’E/S pendant la reconnexion. Configurez votre initiateur iSCSI avec les paramètres de nouvelle tentative et de délai d’attente appropriés pour gérer les interruptions temporaires. Pour obtenir des recommandations détaillées sur les paramètres iSCSI et MPIO, consultez Optimiser les performances de votre san élastique.
Résilience aux échecs de zone de disponibilité
Les zones de disponibilité sont des groupes physiquement distincts de centres de données au sein d’une région Azure. Lorsqu'une zone tombe en panne, les services peuvent basculer vers l'une des zones restantes.
Azure Elastic SAN pouvez être configuré pour utiliser le stockage redondant interzone (ZRS), ce qui signifie que vos données sont répliquées de manière synchrone sur trois zones de disponibilité dans la région. La redondance de zone vous permet d’obtenir une résilience et une fiabilité pour vos charges de travail de production.
Votre approche de connectivité affecte la capacité de votre charge de travail à basculer de manière transparente lors d’une défaillance de zone. Nous vous recommandons d’utiliser des points de terminaison privés pour vous connecter à vos volumes. Les points de terminaison privés prennent en charge le basculement automatique. Si vous utilisez des points de terminaison de service, le basculement peut nécessiter une intervention manuelle. Pour plus d’informations sur les approches de connectivité, consultez En savoir plus sur les configurations réseau pour elastic SAN.
L’utilisation du stockage localement redondant (LRS) laisse votre SAN élastique non protégé contre les défaillances de zone de disponibilité. LRS rend le san élastique nonzonal en stockant des données dans une seule zone de disponibilité plutôt que de la distribuer entre les zones avec ZRS.
Exigences
Prise en charge de la région : Les ressources ELASTIC SAN redondantes interzone peuvent être déployées dans un sous-ensemble de régions. Pour obtenir la liste des régions, consultez Cibles de mise à l’échelle pour Elastic SAN.
Coûts
Lorsque vous créez un SAN élastique avec ZRS, le coût est supérieur à celui de LRS. Pour plus d’informations sur la tarification, consultez Azure Elastic SAN tarification.
Configurez la prise en charge des zones de disponibilité
Créez un san élastique avec ZRS : Lorsque vous créez un SAN élastique et sélectionnez ZRS comme option de redondance, votre SAN élastique est automatiquement redondant interzone. Vous ne pouvez pas modifier l’option de redondance une fois le SAN élastique créé. Pour plus d’informations sur la création d’une ressource SAN élastique, consultez Déployer un SAN élastique.
Activez la redondance de zone sur un SAN élastique LRS existant : Vous ne pouvez pas convertir un SAN élastique LRS en ZRS en place. Pour migrer, capturez des instantanés de vos volumes SAN élastiques, exportez-les vers des instantanés de disque managé, déployez un nouveau SAN élastique sur ZRS, puis créez des volumes sur le nouveau SAN élastique à l’aide de ces captures instantanées de disque. Pour plus d’informations, consultez Snapshot Azure Elastic SAN volumes.
Comportement lorsque toutes les zones sont saines
Cette section décrit ce qu’il faut attendre lorsque vous configurez un SAN élastique pour la redondance de zone et que toutes les zones sont opérationnelles.
Opération interzone : Lorsque vous vous connectez à un volume SAN élastique, votre connexion iSCSI est acheminée vers un cluster dans l’une des zones de disponibilité. La plateforme achemine automatiquement le trafic entre les zones.
Réplication des données interzones : Lorsqu’un client écrit des données dans un volume SAN élastique, ces données sont écrites de manière synchrone dans des clusters dans trois zones de disponibilité avant l’accusé de réception de l’opération d’écriture. La réplication synchrone garantit un niveau élevé de cohérence des données et garantit qu’il n’y a aucune perte de données lors d’une défaillance de zone.
Le déploiement d’un stockage redondant interzone (ZRS) Elastic SAN offre plus de fiabilité qu’un stockage localement redondant (LRS) Elastic SAN, mais il ajoute davantage de latence d’écriture. Évaluez votre SAN élastique et simulez la charge de travail de votre application pour comparer la latence entre le LRS et le ZRS afin de voir si cela affecte votre charge de travail.
Comportement lors d’une défaillance de zone
Cette section décrit ce qu’il faut attendre lorsque vous configurez un SAN élastique pour la redondance de zone et qu’il existe une panne dans l’une des zones.
Détection et réponse : La plateforme SAN élastique détecte les défaillances dans une zone de disponibilité. Vous n’avez rien à faire pour initier un basculement inter-zone pour les SANs élastiques ZRS.
Notification: Microsoft ne vous avertit pas automatiquement lorsqu’une zone est en panne. Toutefois, vous pouvez utiliser Azure Service Health pour comprendre l’intégrité globale du service, y compris les défaillances de zone, et vous pouvez configurer des alertes Service Health pour vous avertir des problèmes.
Demandes actives : Lorsqu’une zone de disponibilité devient indisponible, le service peut mettre fin aux opérations d’E/S en cours qui se connectent aux réplicas de la zone affectée, et vous devez réessayer ces opérations. Si vous utilisez des points de terminaison privés, le service bascule automatiquement. Si vous utilisez des points de terminaison de service, vous devrez peut-être redémarrer l’initiateur iSCSI pour basculer vers une zone saine.
Perte de données attendue : Le réseau SAN élastique empêche la perte de données lors d’une défaillance de zone en répliquant de façon synchrone les données sur trois zones de disponibilité.
Temps d’arrêt prévu : Lors de l'utilisation de points de terminaison privés, le basculement de zone s'effectue automatiquement. Vous pouvez rencontrer une dégradation des performances et de la disponibilité pendant quelques minutes après un basculement, tandis que le SAN se rééquilibre.
Lorsque vous utilisez des points de terminaison de service, elastic SAN ne bascule pas automatiquement vers une zone saine. Il est possible que vous deviez redémarrer l’initiateur iSCSI pour initier un basculement vers une autre zone saine.
Réacheminement du trafic : Lorsqu’une zone n’est pas disponible, la plateforme SAN élastique détecte la perte de la zone et achemine le trafic vers les zones saines restantes.
Pour garantir le basculement automatique de zone sans intervention manuelle, utilisez des points de terminaison privés pour vous connecter à votre réseau SAN élastique. Lorsque vous utilisez des points de terminaison de service au lieu de points de terminaison privés, vous devrez peut-être redémarrer manuellement l’initiateur iSCSI pour lancer un basculement vers une zone saine.
Récupération de la zone
Lorsque la zone de disponibilité récupère, la plateforme SAN élastique restaure automatiquement les opérations normales et reprend la réplication entre trois zones. Vous n’avez pas besoin d’agir.
Tester les pannes de zone
La plateforme Azure Elastic SAN gère le routage du trafic, le basculement et la récupération de zone pour les ressources redondantes interzone. Étant donné que cette fonctionnalité est entièrement gérée, vous n’avez pas besoin de valider les processus d’échec de zone de disponibilité.
Résilience aux défaillances à l’échelle de la région
Azure Elastic SAN est un service à région unique. Si la région devient indisponible, votre ressource SAN élastique n’est pas disponible. Il n'existe aucune réplication ou basculement entre régions intégré pour un SAN élastique. Vous êtes responsable de l’architecture de votre propre solution de récupération d’urgence multirégion si votre charge de travail nécessite une résilience au niveau de la région.
Solutions multirégions personnalisées pour la résilience
Vous êtes responsable de l’implémentation de la récupération d’urgence multirégion pour vos données SAN élastiques. L’approche recommandée consiste à prendre des instantanés de volume :
Créez régulièrement des instantanés. Utilisez des captures instantanées de volume pour capturer des copies ponctuelles de vos volumes SAN élastiques.
Votre objectif de point de récupération (RPO) dépend de la fréquence à laquelle vous créez et copiez des instantanés dans la région secondaire. Plus vous créez et copiez fréquemment des instantanés, moins vous risquez de perdre des données lors d’un sinistre.
Exportez des instantanés vers des instantanés de disque managé.Exportez vos instantanés de volume vers des instantanés de disque managé, qui peuvent être copiés dans d’autres régions.
Copiez des instantanés dans une région secondaire.Copiez l’instantané incrémentiel vers une nouvelle région géographiquement distante de votre région primaire. Cela réduit le risque de plusieurs régions affectées par une seule catastrophe.
Restaurer à partir d’instantanés. Dans un scénario de récupération d’urgence, créez de nouveaux volumes sur le SAN élastique secondaire à partir des instantanés de disque managé copiés.
Votre objectif de temps de récupération (RTO) dépend de la taille de vos données, du temps nécessaire à la copie d’instantanés entre les régions et du temps nécessaire pour déployer et configurer un nouveau SAN élastique dans la région secondaire. Pour réduire le temps de récupération, envisagez de déployer un san élastique secondaire dans votre région de récupération avant qu’un sinistre ne se produise. Cela permet également d’éviter les contraintes de capacité lors d’une panne.
Sauvegarde et restauration
Pour la plupart des solutions, vous ne devez pas vous appuyer exclusivement sur les sauvegardes. Utilisez plutôt les autres fonctionnalités décrites dans ce guide pour prendre en charge vos exigences de résilience. Toutefois, les sauvegardes protègent contre certains risques que d’autres approches ne le font pas. Pour plus d’informations, consultez Que sont la redondance, la réplication et la sauvegarde ?.
Elastic SAN prend en charge deux types de sauvegarde :
Azure Elastic SAN backup : Cette fonctionnalité de Sauvegarde Azure offre une solution entièrement managée pour planifier des sauvegardes, définir des chronologies d’expiration pour les points de récupération et les données de récupération sur un nouveau volume. Il permet de protéger contre la perte de données contre les suppressions accidentelles, les ransomwares et les mises à jour des applications. Pour plus d’informations, consultez Azure Elastic SAN sauvegarde (préversion).
Important
Comme cette solution est couverte par les conditions supplémentaires de Microsoft pour les préversions Azure, utilisez-la pour les tests et non pour une utilisation en production.
Snapshots: Vous pouvez également créer et gérer des instantanés en fonction de vos besoins en matière de protection des données.
Azure Elastic SAN prend en charge les instantanés de volume pour la protection des données. Les instantanés sont des copies incrémentielles et ponctuelles de vos volumes qui consomment de l’espace de la capacité totale de votre SAN élastique. Pour protéger vos données, créez régulièrement des instantanés. La fréquence dépend de la quantité de données que vous pouvez vous permettre de perdre (votre RPO). Vous pouvez créer manuellement des instantanés ou créer votre propre automatisation pour les créer selon une planification.
Les instantanés sont stockés dans le même SAN élastique que vos volumes et utilisent le même paramètre de redondance. Pour vous protéger contre les défaillances à l’échelle de la région, exportez vos instantanés vers des instantanés de disque managé et copiez-les dans une autre région. Pour plus d’informations, consultez Exporter l’instantané de volume et Copier un instantané incrémentiel dans une nouvelle région.
Vous pouvez créer un volume SAN élastique à partir d’un instantané ou d’un instantané de disque managé. Pour plus d’informations, consultez Créer un volume à partir d’un instantané.
Résilience à la maintenance du service
Microsoft applique régulièrement des mises à jour de service et effectue d’autres maintenances. La plateforme Azure gère automatiquement ces activités, garantissant que la maintenance se déroule sans heurt et reste transparente pour vous. Aucun temps d'arrêt n'est prévu pendant les événements de maintenance, sauf si vous avez été informé via la maintenance planifiée d'Azure Service Health.
Contrat de niveau de service
Le contrat de niveau de service (SLA) pour les services Azure décrit la disponibilité attendue de chaque service et les conditions que votre solution doit respecter pour atteindre cette attente de disponibilité. Pour plus d’informations, consultez les SLA pour les services en ligne.