Sobre simulações de indisponibilidade de zona de disponibilidade no Infrastructure Resiliency Manager (versão preliminar)

O Gerenciador de Resiliência de Infraestrutura permite avaliar a resiliência dos recursos do Grupo de Serviços simulando interrupções de zona em recursos individuais. Você pode avaliar o desempenho de soluções de resiliência entre zonas para seus aplicativos e identificar recursos que exigem melhorias de resiliência para dar suporte à continuidade do aplicativo.

Os modelos de simulação de indisponibilidade da Zona de Disponibilidade fornecem falhas recomendadas pelo Azure para tipos de recursos com suporte e permitem sobrescrevê-las com lógica personalizada por meio de Runbooks do Azure. Após a injeção de falha, você pode executar failover e nova proteção para recursos configurados com soluções ativas-passivas usando Planos de Recuperação integrados. Você também pode medir o tempo de inatividade do aplicativo durante interrupções. Você também pode monitorar o grupo de serviços e a saúde do recurso em tempo real durante a execução da simulação por meio de métricas integradas.

Principais componentes para a análise de zona de disponibilidade para baixo

A tabela a seguir lista os componentes centrais que você usa em simulações de indisponibilidade de Zona de Disponibilidade:

Componente  Descrição 
Grupo de Serviços Um grupo lógico de recursos Azure que representam um aplicativo ou carga de trabalho. 
Análise de Zona Para Baixo Modelo que simula uma interrupção de zona de disponibilidade nos recursos do Grupo de Serviços para avaliar a resiliência entre zonas.
Injeção de falha O processo de introdução de falhas controladas para simular interrupções de zona. 
Plano de Recuperação Uma sequência definida de operações de failover e reproteção para recuperar recursos após a injeção de falha. 
Projetista de Falhas A interface serve para revisar e editar as falhas aplicadas a cada recurso na simulação.
Monitoramento de saúde Experiência integrada de métricas para acompanhar a saúde do recurso em tempo real durante a execução do simulado.

Ciclo de vida da execução da simulação

A sequência a seguir descreve cada estágio no ciclo de vida de drill e as ações executadas em cada etapa:

  1. Injeção de falhas: Aplique falhas controladas aos recursos na zona de disponibilidade selecionada.

  2. Failover: acionar o failover para recursos configurados com soluções ativo-passivo por meio do Plano de Recuperação associado.

  3. Reproteger: Habilite a replicação para recursos que passaram por failover para restabelecer a redundância.

  4. Failover (Inverso): fazer failback dos recursos da zona de destino para a zona de origem. 

  5. Refazer a proteção (Inverso): Habilite novamente a replicação na direção original para restaurar a configuração inicial.

Próximas Etapas