Récupérer un cluster de basculement sans quorum

La récupération d’un cluster de basculement sans quorum est une compétence critique, car elle vous permet de restaurer rapidement les services et de réduire le temps d’arrêt si le quorum est perdu. Le quorum est essentiel pour le bon fonctionnement d’un cluster de basculement, car il empêche les situations de fractionnement (split-brain) et garantit l’intégrité constante des données. Sans quorum, le cluster ne peut pas prendre de décisions faisant autorité, ce qui entraîne des interruptions de service. En suivant ces instructions, les administrateurs peuvent améliorer la résilience de leur système et maintenir des opérations continues et fiables, même face à des défis inattendus.

Un cluster qui n’a pas suffisamment de votes de quorum ne démarre pas. La première mesure à prendre dans ce cas consiste invariablement à vérifier la configuration de quorum du cluster et de chercher à comprendre pourquoi le cluster n'a plus le quorum. Cela peut se produire si vous avez des nœuds qui ont cessé de répondre ou si le site principal n’est pas accessible dans un cluster multisite. Après avoir identifié la cause originelle de la défaillance du cluster, vous pouvez suivre la procédure de récupération décrite dans cette section.

Note

  • Si le service de cluster s’arrête parce que le quorum est perdu, l’ID d’événement 1177 apparaît dans le journal système.
  • Il est toujours nécessaire d’examiner la raison pour laquelle le quorum du cluster a été perdu.
  • Il est toujours préférable de ramener un nœud ou un témoin de quorum à un état sain (intégrer le cluster) plutôt que de démarrer le cluster sans quorum.

Prerequisites

  • Votre appareil doit exécuter Windows Server 2012 ou version ultérieure sur tous les nœuds de cluster.

  • La fonctionnalité de cluster de basculement doit être installée sur chaque nœud. Pour en savoir plus, consultez Installer ou désinstaller des rôles, services de rôle ou fonctionnalités.

    Vous pouvez également exécuter la commande suivante pour installer le clustering de basculement :

    Install-WindowsFeature -Name Failover-Clustering -IncludeManagementTools
    
  • Vous devez être membre du groupe Administrateurs ou Administrateurs de domaine.

  • Stockage partagé accessible par tous les nœuds du cluster, tel que le stockage NAS (Network Attached Storage) ou le réseau san (Storage Area Network).

Forcer le démarrage de nœuds de cluster

Dès lors que vous avez déterminé ne pas être en mesure de récupérer le cluster en rétablissant l’intégrité des nœuds ou du témoin de quorum, vous n’avez pas d’autre alternative que de forcer le démarrage de votre cluster. Forcer le cluster à démarrer remplace les paramètres de configuration de votre quorum de cluster et démarre le cluster en mode ForceQuorum .

Pour forcer le démarrage du nœud de cluster sans quorum, exécutez la commande suivante dans une fenêtre PowerShell avec élévation de privilèges :

Start-ClusterNode -ForceQuorum

Forcer un cluster à démarrer lorsqu’il n’a pas de quorum peut être particulièrement utile dans un cluster multisite. Envisagez un scénario de récupération d’urgence avec un cluster qui contient des sites principaux et de sauvegarde situés séparément, tels que SiteA et SiteB. S’il y a une véritable catastrophe sur SiteA, il peut prendre beaucoup de temps pour que le site revienne en ligne. Vous voudriez probablement forcer SiteB à venir en ligne, même s’il n’a pas de quorum.

Lorsqu’un cluster est démarré en mode ForceQuorum et après avoir récupéré suffisamment de votes de quorum, le cluster quitte automatiquement l’état forcé et se comporte normalement. Par conséquent, il n’est pas nécessaire de redémarrer le cluster normalement. Si le cluster perd un nœud et perd le quorum, il est de nouveau hors connexion, car il n’est plus dans l’état forcé. Pour restaurer un cluster où le quorum est perdu, vous devez le forcer à démarrer sans quorum.

Note

  • Une fois qu’un cluster est démarré de force, l’administrateur prend le contrôle total de ses opérations.
  • Lorsque le cluster est forcé sur un nœud spécifique, il utilise la configuration de ce nœud et le réplique sur tous les autres nœuds accessibles.
  • Si vous forcez le cluster à démarrer sans quorum, tous les paramètres de configuration de quorum sont ignorés pendant que le cluster reste en mode ForceQuorum . Les affectations de vote de nœud et les paramètres de gestion de quorum dynamique sont des considérations essentielles pour la configuration efficace des clusters de basculement.

Empêcher le quorum sur les nœuds de cluster

Après avoir forcé le démarrage du cluster sur un nœud, il est nécessaire de démarrer les nœuds restants dans votre cluster avec un paramètre pour empêcher qu'un quorum ne soit atteint. Un nœud démarré avec un paramètre qui empêche le quorum indique au service de cluster de se joindre à un cluster opérationnel existant au lieu de créer une nouvelle instance de cluster. Cela empêche les nœuds restants de créer un cluster fractionné contenant deux instances concurrentes.

Cela devient nécessaire lorsque vous devez récupérer votre cluster dans des scénarios de récupération d’urgence multisite après avoir forcé le démarrage du cluster sur votre site de sauvegarde, SiteB. Pour rejoindre le cluster démarré de force dans SiteB, les nœuds de votre site principal, SiteA, doivent être démarrés sans tenir compte du quorum.

La récupération du cluster peut être effectuée à l’aide du Gestionnaire du cluster de basculement ou de PowerShell dans une fenêtre avec des privilèges élevés.

Important

Après que vous forcez le démarrage d’un cluster, nous vous recommandons de toujours démarrer les nœuds restants en empêchant le quorum.

  1. Dans le Gestionnaire de serveur, sélectionnez Outils, puis sélectionnez Gestionnaire du cluster de basculement.

    Vous pouvez également sélectionner Démarrer, taper Le Gestionnaire du cluster de basculement et le sélectionner.

  2. Dans le volet gauche, sélectionnez le cluster à récupérer.

    Pour spécifier un cluster, dans le volet droit sous Actions, sélectionnez Se connecter au cluster. Tapez le nom du cluster, puis sélectionnez OK.

  3. Dans le volet droit sous Actions, sélectionnez Forcer le démarrage du cluster, puis Sélectionnez Oui.

Si vous sélectionnez Démarrer le service de cluster au lieu de forcer le démarrage du cluster, le nœud est automatiquement démarré avec le paramètre qui empêche le quorum.

Éléments de quorum à prendre en considération pour les configurations de récupération d'urgence

Cette section synthétise les caractéristiques et les configurations de quorum pour deux configurations de cluster multisite dans des déploiements de récupération d'urgence. Les consignes de configuration de quorum varient selon que vous avez besoin d'un basculement automatique ou manuel pour les charges de travail entre sites. Votre configuration s’aligne généralement sur les contrats de niveau de service (SLA) établis dans votre organisation. Ces contrats SLA définissent les attentes en matière de fourniture et de prise en charge des charges de travail en cluster pendant les défaillances de site ou les sinistres.

Dans cette configuration, le cluster se compose de plusieurs sites capables d'héberger des rôles en cluster. Si une défaillance se produit sur un site, les rôles en cluster doivent basculer automatiquement sur les sites restants. Par conséquent, le quorum de cluster doit être configuré de sorte que n'importe quel site puisse supporter une défaillance de site complète.

Le tableau suivant résume les éléments à prendre en considération et les recommandations pour cette configuration.

Item Description
Gestion de quorum dynamique Activation souhaitable
Nombre de votes par nœud et par site Doit être égal
Attribution de votes aux nœuds Les votes de nœud ne doivent pas être supprimés, car tous les nœuds sont tout aussi importants
Configuration du témoin Configuration d'un témoin de partage de fichiers recommandée sur un site distinct des sites de cluster
Workloads Possibilité de configurer des charges de travail sur n'importe quel site

Le témoin de partage de fichiers doit être configuré sur un site distinct pour donner à chaque site une même chance de survie.

Voir aussi