Política de Ciclo de Vida e Suporte dos Modelos Foundry da Microsoft

Microsoft Foundry Models passam por um ciclo de vida previsível, desde a versão prévia à disponibilidade geral (GA), até serem eventualmente desativados, dando-lhe tempo para avaliar substituições e migrar cargas de trabalho. Este artigo explica cada estágio do ciclo de vida, os compromissos durante a transição que a Microsoft assume quando um modelo é desativado e como você é notificado. Para datas específicas de aposentadoria, consulte o cronograma de aposentadoria do modelo.

Como funciona o ciclo de vida do modelo

Microsoft Foundry atualiza continuamente seu catálogo de modelos com modelos mais recentes e mais capazes. Quando um modelo é substituído, ele passa por um ciclo de vida previsível que dá aos clientes tempo para avaliar substituições e migrar. O ciclo de vida se aplica uniformemente aos Modelos de Foundry vendidos diretamente pela Azure e de parceiros e comunidade, embora os prazos de notificação diferem ligeiramente de acordo com a origem do modelo.

Estágios do ciclo de vida

Cada modelo no catálogo do Foundry pertence exatamente a um destes cinco estágios:

Captura de tela mostrando as transições de estágio do ciclo de vida do modelo.

Etapa O que significa Pode criar novas implantações? As implantações existentes funcionam?
Visualizar Experimental. Os pesos, o runtime e o esquema de API podem mudar. Não é garantido que se torne GA. Rotulado como "Pré-visualização" no catálogo. Sim Sim
GA (Disponibilidade Geral) Pronto para produção. Os pesos e as APIs são fixados. Os patches de runtime para vulnerabilidades de segurança não afetam as saídas. Nenhum rótulo mostrado (estado padrão). Sim Sim
Legado Existem modelos mais recentes e mais capazes. Você deve planejar a migração de cargas de trabalho. Esse estágio é opcional: os modelos podem pular diretamente de GA para Preterido. Sim (até a desativação) Sim
Preterido Os clientes existentes podem continuar a criar e gerenciar implantações. Não está mais disponível para novos clientes— novos clientes não podem criar implantações nem acessar o modelo. O "cliente existente" é determinado no nível da assinatura: se essa assinatura de Azure já implantou a versão específica do modelo. Uma nova assinatura no mesmo locador não herda o acesso. – Clientes existentes: Sim.
- Novos clientes: Não
Sim
Aposentado Removido do serviço. Todas as solicitações de inferência retornam 410 Gone. Não Não

Nota

  • Modelos ajustados seguem uma agenda de aposentadoria separada para treinamento e implantação. Consulte modelos afinados para obter detalhes.
  • Modelos do Foundry (catálogo): alguns provedores de modelo definem um ciclo de vida de disponibilidade geral mais curto, por exemplo, 12 meses em vez de 18. Quando um ciclo de vida mais curto se aplica, isso é indicado diretamente no modelo na Agenda de Desativação do Modelo.

Inicialização e disponibilidade do modelo

Novos modelos ficam disponíveis por meio de tipos de implantação nesta ordem:

Captura de tela mostrando a ordem de disponibilidade do tipo de implantação para modelos.

Pedido Tipo de implantação Quando disponível
1 Padrão Global No início — maior disponibilidade e menor latência entre regiões
2 Provisionado Global Segue de perto o Global Standard — fornece throughput reservado com roteamento global
3 Zona de Dados Standard e Zona de Dados Provisionada Após o Provisionamento Global – o processamento de dados permanece dentro de um limite geográfico definido
4 Padrão e Provisionado Por último — apenas regional, à medida que os modelos mais antigos são descontinuados e a capacidade é realocada

Dica

Para obter uma comparação completa dos tipos de implantação, consulte a comparação de tipos de implantação.

Ciclo de vida e variações de disponibilidade

Vários fatores afetam como o ciclo de vida padrão se aplica às suas implantações, incluindo a região em que você opera, o ambiente de nuvem usado e os requisitos de segurança.

Disponibilidade regional

  • Nem todas as combinações de modelo e versão estão disponíveis em todas as regiões.
  • Normalmente, modelos mais especializados — por exemplo, geração de áudio, imagem e vídeo — só estão disponíveis como tipos de implantação de Zona de Dados ou Global.
  • Versões de modelo sucessivas podem não estar disponíveis nas mesmas regiões. Uma versão mais recente pode aparecer em algumas regiões antes que as atualizações sejam agendadas em outras.
  • Microsoft pode limitar novos clientes em regiões específicas para manter a qualidade do serviço para clientes existentes.

Nuvens do Azure Governamental

  • As implantações do Global Standard não estão disponíveis em nuvens governamentais.
  • Nem todos os modelos ou versões disponíveis em nuvens comerciais estão disponíveis em nuvens governamentais.
  • As nuvens governamentais normalmente dão suporte a apenas uma versão de um determinado modelo de cada vez, com uma sobreposição de 30 dias quando uma nova versão fica disponível.

Para obter mais informações, consulte Modelos Foundry vendidos diretamente pela Azure (governamental), Versões de modelos e Tipos de implantação no Governo do Azure.

Aposentadorias baseadas na segurança

Se um modelo for encontrado com problemas de conformidade ou segurança, a Microsoft reserva-se o direito de realizar uma aposentadoria de emergência com aviso prévio reduzido. Consulte os termos de serviço Azure para obter detalhes.

Compromissos do cronograma do ciclo de vida

Microsoft faz compromissos específicos sobre por quanto tempo as versões do modelo permanecem disponíveis e quando as substituições aparecem, para que você possa planejar migrações com confiança.

Compromissos de sobreposição do modelo de substituição de Disponibilidade Geral (GA)

Confirmamos uma sobreposição significativa entre um modelo de GA desativado e sua substituição para que os clientes possam testar, avaliar e migrar com confiança.

Captura de tela do ciclo de vida do modelo de disponibilidade geral mostrando sobreposição de modelo e tempos de transição de substituição.

Fase Padrão
Inicialização de GA Cada modelo é lançado de acordo com seu próprio tipo de implantação e a matriz de disponibilidade da região. A data de desativação (daqui a 18 meses) é definida programaticamente e disponível por meio da API de Modelos.
Preterido (somente clientes existentes) A 12 meses do início, os clientes existentes podem continuar a criar e gerenciar implantações. Novos clientes não podem acessar o modelo.
Substituição disponível no padrão internacional Os clientes podem usar e testar o modelo de substituição no padrão global aproximadamente 90 dias antes da desativação.
Substituição disponível em regiões provisionadas O modelo de substituição fica disponível para teste em regiões provisionadas onde o antecessor está em desativação aproximadamente 30 dias antes da desativação, proporcionando aos clientes provisionados um período de migração manual.
Versão do modelo desativada Após 18 meses do lançamento, todas as inferências retornam 410 Gone.

Dica

Por que 90 a 120 dias? O modelo de substituição oficial é escolhido e anunciado aproximadamente 90 a 120 dias antes da data de desativação do modelo a ser desativado, não antes. Dado o ritmo rápido de melhoria na IA gerativa, declarar uma substituição muito cedo corre o risco de direcionar os clientes para um modelo que não é mais a melhor opção disponível no momento em que eles precisam migrar.

Visão geral do ciclo de vida do modelo

Os modelos de versão prévia têm um ciclo de vida fundamentalmente diferente dos modelos de GA. Eles são lançados com uma data de desativação "não antes de" (normalmente a 90 dias de distância), mas às vezes são estendidos além dessa janela inicial, até que uma versão adequada de modelo em versão preliminar ou em GA esteja disponível. Quando uma decisão de desativação é tomada, os clientes são obrigatoriamente atualizados para uma substituição (uma versão prévia mais recente ou o modelo GA) ou o modelo é desativado sem substituição. Não há opção de permanecer em um modelo de prévia em desativação. Todas as implantações de versão prévia são atualizadas ou encerradas.

Nota

Modelos de versão prévia não são recomendados para cargas de trabalho de produção.

Captura de tela do ciclo de vida de pré-visualização dos modelos, mostrando a sobreposição de modelos e os prazos de transição de substituição.

Resultado O que acontece
Atualizar para a versão prévia mais recente As implantações de versão preliminar existentes têm atualização imposta para uma versão de preliminar mais recente. Os clientes recebem pelo menos 30 dias de aviso prévio. O ciclo se repete até que uma versão de GA esteja disponível.
Atualizar para GA Quando o modelo GA é lançado, as implantações de versão preliminar são obrigatoriamente atualizadas para a versão GA. Os clientes recebem pelo menos 30 dias de aviso prévio. Em seguida, o modelo GA segue o ciclo de vida de GA padrão de 18 meses.
Nenhuma substituição (rara) Se não houver substituição, os clientes receberão 30 dias de aviso prévio antes que o modelo seja desativado e a inferência retorne 410 Gone.

Atualizações automáticas

Para os tipos de implantação Global Standard, Data Zone Standard e Standard, a Microsoft gerencia atualizações automáticas quando uma versão do modelo é descontinuada.

  • As atualizações automáticas são agendadas de forma contínua, região por região .
  • O cronograma de atualização é publicado com antecedência no Cronograma de Aposentadoria do Modelo.
  • As atualizações podem ocorrer mesmo se a nova versão do modelo ainda não estiver disponível separadamente nessa região ou para essa SKU. O processo de atualização a disponibilizará.

Importante

As implantações provisionadas NÃO são atualizadas automaticamente. Os clientes provisionados devem migrar manualmente para o modelo de substituição.

Use a API de Modelos para verificar programaticamente lifecycleStatus, deprecation e deprecationDate por SKU de qualquer modelo a qualquer momento.

Exemplo: gpt-4o → atualização gpt-5.1

Quando as versões gpt-4o 2024-05-13 e 2024-08-06 foram desativadas em 31/03/2026, elas foram atualizadas automaticamente para gpt-5.1 na SKU Standard. Antes da atualização, o gpt-5.1 não tinha nenhuma presença Standard. Após a atualização, o gpt-5.1 Standard foi adicionado a todas as oito regiões que anteriormente tinham essas versões gpt-4o (centralus, eastus, eastus2, northcentralus, southcentralus, swedencentral, westus, westus3). A versão 2024-11-20 não foi afetada (será descontinuada em 2026-10-01).

Migração para um modelo de substituição

Quando um modelo usado entra no estágio Herdado ou Preterido, verifique a coluna "Substituição Sugerida" no Agendamento de Desativação do Modelo e siga as etapas em Trabalhar com modelos para implantar, testar e migrar para a substituição.

Notificações

Os modelos de GA têm a data de desativação definida programaticamente no lançamento para após 18 meses, não há um "anúncio" separado. As transições de modelos "Herdado" e "Desativado" seguem a linha do tempo publicada e são visíveis em tempo real por meio da API de Modelos.

Quando você recebe notificações ativas

Evento Cronometragem Aplica-se a
Aviso de desativação do modelo GA Pelo menos 60 dias antes da aposentadoria Todos os modelos de GA. Enviado aos proprietários de assinatura com implantações ativas.
Aviso de desativação do modelo de visualização Pelo menos 30 dias antes da aposentadoria Modelos de pré-visualização. As implantações de pré-visualização poderão ser atualizadas automaticamente para o modelo de substituição caso um modelo de substituição esteja disponível e seja aplicável (por exemplo, não exija um contrato de API diferente).

Como você é notificado

Canal Detalhes
Email Enviado automaticamente aos proprietários de assinatura com implantações ativas.
Integridade do Serviço do Azure Os avisos de saúde são exibidos para assinaturas afetadas. Vá para Service Health > Health advisories, filtre por Serviço OpenAI do Azure e crie uma regra de alerta para notificações de email, mensagens de texto ou webhook.

Métodos programáticos para verificar o ciclo de vida e a descontinuação do modelo

Os clientes podem verificar os campos de ciclo de vida e substituição em qualquer modelo usando a API de Modelos (com escopo de assinatura, todos os modelos em uma região):

GET https://management.azure.com/subscriptions/{sub}/providers/Microsoft.CognitiveServices/locations/{location}/models?api-version=2024-10-01

Campos-chave: lifecycleStatus, deprecation.inference, deprecation.fineTune, por SKU deprecationDate (datas ISO).

Importante

A API usa terminologia diferente dos documentos e do portal. A tabela a seguir mapeia os estágios voltados para o cliente usados neste documento e no portal Foundry para os valores correspondentes dos campos da API.

Estágio (documentos e portal) Campo de status da API (lifecycleStatus) Campo de data da API (deprecation.inference) O que significa
Visualizar Preview Data futura ou não definida Experimental. Pode alterar ou ser removido.
Disponibilidade geral GenerallyAvailable Data futura (definida no início) Pronto para produção. Pesos e API fixos.
Preterido Deprecating Data futura Ainda serve para inferência. Bloqueado para novos clientes.
Aposentado Deprecated Data passada Totalmente aposentado. A inferência retorna 410 Gone.

Por exemplo, um modelo que os documentos listam como "Preterido" (ainda funciona, bloqueado para novos clientes) aparece na API como lifecycleStatus: "Deprecating"— não "Deprecated". O valor "Deprecated" da API significa que o modelo está desativado e não serve mais inferência.

Para determinar o estágio de um modelo programaticamente, verifique os dois campos juntos:

if lifecycleStatus == "Deprecated"         → Retired (410 Gone)
if lifecycleStatus == "Deprecating"        → Deprecated (existing customers only)
if deprecation.inference < today           → Retired (regardless of lifecycleStatus lag)
if lifecycleStatus == "GenerallyAvailable" → GA
if lifecycleStatus == "Preview"            → Preview

Modelos afinados

Os modelos ajustados são desativados em duas fases: treinamento e implantação.

A menos que explicitamente declarado, o treinamento não será descontinuado antes da data de aposentadoria do modelo base. Depois que um modelo é desativado para treinamento, ele não está mais disponível para ajuste fino, mas todos os modelos treinados anteriormente permanecem disponíveis para implantação.

Na desativação da implantação, a inferência e a implantação retornam respostas de erro.

Modelo Versão Data de desativação do treinamento Data de desativação da implantação
gpt-4o 2024-08-06 Não antes de 2027-04-011 01/10/2027
gpt-4o-mini 18/07/2024 Não antes de 2027-04-011 01/10/2027
gpt-4.1 2025-04-14 Não antes de 2027-04-141 14/10/2027
gpt-4.1-mini 2025-04-14 Não antes de 2027-04-141 14/10/2027
gpt-4.1-nano 2025-04-14 Não antes de 2027-04-141 14/10/2027
o4-mini 2025-04-16 Desativação do modelo base Um ano após a descontinuação do treinamento

1 Somente para clientes existentes. Caso contrário, a desativação do treinamento ocorre na desativação do modelo base.

Perguntas frequentes

Pergunta Resposta Saiba Mais
Qual é a diferença entre uma família de modelos, uma versão e uma variante? Uma família de modelos é uma geração de modelos (por exemplo, GPT-4o, GPT-5). Uma versão de modelo é um lançamento datado dentro de uma família (por exemplo, gpt-4o 2024-05-13 versus 2024-08-06). Uma variante de modelo é uma camada de tamanho/capacidade dentro da mesma família (por exemplo, GPT-5, GPT-5-mini, GPT-5-nano). Versões do modelo
Posso controlar quando minha implantação Standard é atualizada automaticamente? Sim. Defina a versionUpgradeOption propriedade em sua implantação como um dos três valores: OnceNewDefaultVersionAvailable (atualizar quando um novo padrão é definido), OnceCurrentVersionExpired (atualizar somente na desativação) ou NoAutoUpgrade (nunca atualizar automaticamente– a implantação para de funcionar na desativação). Você pode definir essa configuração por meio da API REST, Azure PowerShell ou do portal do Foundry. Trabalhando com modelos — configuração de atualização
Como fazer para migrar uma implantação provisionada? As implantações provisionadas não são atualizadas automaticamente. Você tem duas opções: In-place migration (Azure lida com a migração de tráfego em uma janela de 20 a 30 minutos sem tempo de inatividade) ou Migração lado a lado (multi-implantação) (você cria uma nova implantação, testa, alterna o tráfego e exclui a antiga). Gerenciando modelos em tipos de implantação provisionados
Minha cota será transferida para o modelo de substituição? Para atualizações automáticas padrão, sim, a cota é tratada automaticamente. Para implantações provisionadas, você deve garantir que a cota esteja disponível para o modelo de destino antes de migrar. A capacidade de PTU é independente de modelo e fungível em implantações gerenciadas provisionadas. Provisão de largura de banda — quota
Eu posso obter uma exceção para prorrogar a data de desativação de um modelo? Não. As datas de aposentadoria não são extensíveis. Planeje sua migração usando as linhas do tempo publicadas no Agendamento de Desativação do Modelo e na API de Modelos. N/A
Quais ferramentas podem me ajudar a avaliar um modelo de substituição? Use a tabela de classificação do modelo no portal do Foundry para comparar desempenhos de referência, o recurso de comparação de modelos ao implantar, e Avaliações para testes de carga de trabalho personalizados. Aplique engenharia de prompts e ajuste fino quando necessário para corresponder à precisão anterior. Preparação para aposentadorias de modelo
Os modelos de inserção seguem o mesmo ciclo de vida? Os modelos de inserção de texto (text-embedding-3-large, text-embedding-3-small, text-embedding-ada-002) têm linhas do tempo estendidas e são tratados de forma diferente dos modelos de inferência. Verifique a Agenda de Desativação do Modelo para obter as datas específicas. Desativações de modelos — incorporações
Como o Processamento Prioritário e as Implantações em Lote são realizadas? O Processamento de Prioridade segue o mesmo processo de atualização que as implantações padrão (suporte a atualização automática). As implantações em lote seguem a abordagem de migração lado a lado (várias implantações) – implantar o novo modelo, reenviar trabalhos e, em seguida, desativar a implantação antiga. Trabalhando com modelos
Não consigo encontrar "Microsoft Foundry" no Integridade do Serviço do Azure: como configuro alertas? Selecione Serviço OpenAI do Azure como o nome do serviço ao configurar os alertas de Integridade do Serviço. Não há nenhum serviço "Microsoft Foundry" separado na Integridade do Serviço. Configurar alertas de Saúde do Serviço