Versões de modelo em modelos de Microsoft Foundry (clássico)

Exibição no momento:Versão do portal Foundry (clássico) - Alternar para a versão do novo portal Foundry

Nota

Links neste artigo podem abrir conteúdo na nova documentação do Microsoft Foundry em vez da documentação da Foundry (clássica) que você está exibindo agora.

Os Microsoft Foundry Models lançam regularmente novas versões de modelo que incorporam os recursos e melhorias mais recentes dos fornecedores de modelos. Este artigo explica como funciona o versionamento de modelos, quais políticas de atualização estão disponíveis para suas implantações e como as versões dos modelos Azure OpenAI e dos parceiros são gerenciadas.

Depois de ler este artigo, você saberá qual política de atualização escolher ao implantar um modelo, como Azure gerencia atualizações de versão automaticamente e como o controle de versão do modelo de parceiro é diferente de Azure controle de versão do modelo OpenAI.

Como funcionam as versões do modelo

Você pode optar por começar com uma versão de modelo específica e permanecer nela ou atualizar automaticamente à medida que novas versões são lançadas.

Há duas versões diferentes a serem consideradas ao trabalhar com modelos:

  • A versão do próprio modelo.
  • A versão da API que é utilizada para acessar uma implantação de modelo.

Versão do modelo

Nota

As diretrizes de atualização a seguir se aplicam apenas aos tipos de implantação Standard. Para obter diretrizes sobre como atualizar ou migrar tipos de implantação provisionadas, examine a documentação de gerenciamento de modelos.

Você configura as políticas de atualização ao implantar um modelo no portal do Foundry. Você também pode alterar a política posteriormente nas configurações de implantação. As políticas de atualização são configuradas por implantação e variam de acordo com o modelo e o provedor.

As políticas de atualização de versão incluem as seguintes opções:

  • As implantações definidas para recusar atualizações automáticas de versão do modelo exigem uma atualização manual se uma nova versão for lançada. Quando o modelo é desativado, essas implantações param de funcionar.
  • Implantações definidas para atualizar quando a nova versão padrão ficar disponível serão automaticamente atualizadas para usar a nova versão padrão.
  • Implantações definidas como Quando a versão atual expira automaticamente são atualizadas quando a versão atual é desativada.

Por exemplo, uma implantação de gpt-4o pode ter como alvo a versão 2024-08-06. Quando a versão 2024-11-20 estiver disponível, as implantações configuradas para atualização automática mudarão para a nova versão automaticamente.

Para verificar a versão atual de uma implantação, use um dos seguintes métodos:

  • Portal Foundry: Acesse sua implantação no Portal Foundry e abra a guia Detalhes para ver a versão atual do modelo.
  • API REST: consulte o ponto de extremidade de implantação do seu recurso. A resposta inclui a versão do modelo para cada implantação.

Versão da API usada para consumir uma implantação de modelo

A versão da API indica o contrato que você usa para interagir com o modelo no código. Ao usar APIs REST, você indica a versão da API usando o parâmetro api-versionde consulta. SDK do Azure versões geralmente são emparelhadas com versões de API específicas, mas você pode especificar a versão da API que deseja usar.

Uma determinada implantação de modelo pode dar suporte a várias versões de API. O lançamento de uma nova versão de modelo nem sempre exige que você atualize para uma nova versão da API, como é o caso quando há uma atualização para os pesos do modelo. Azure mantém a versão principal anterior de um modelo até a data de desativação para que você possa retornar a ela, se necessário.

atualizações de modelo do Azure OpenAI

Azure trabalha em estreita colaboração com o OpenAI para lançar novas versões de modelo. Quando uma nova versão de um modelo é lançada, você pode testá-la imediatamente em novas implantações. Azure publica quando novas versões de modelos são lançadas e notifica os clientes pelo menos duas semanas antes de uma nova versão se tornar a versão padrão do modelo. Azure também mantém a versão principal anterior do modelo até a data de desativação, para que os clientes possam retornar a ela, caso desejem.

Preparar-se para atualizações de versão do modelo do Azure OpenAI

Como cliente de Azure modelos OpenAI, você pode notar algumas alterações no comportamento e compatibilidade do modelo após uma atualização de versão. Essas alterações podem afetar seus aplicativos e fluxos de trabalho que dependem dos modelos. Aqui estão algumas dicas para ajudá-lo a se preparar para atualizações de versão e minimizar o impacto:

  • Leia as novidades e os modelos para entender as alterações e os novos recursos.
  • Leia a documentação sobre como implantar modelos do Foundry e atualizações de versão para entender como trabalhar com versões de modelo.
  • Teste seus aplicativos e fluxos de trabalho com a nova versão do modelo após o lançamento.
  • Atualize seu código e configuração para usar os novos recursos e funcionalidades da nova versão do modelo.

Uma atualização de modelo ocorrerá se a nova versão do modelo ainda não estiver disponível nessa região?

Sim, mesmo nos casos em que a versão mais recente do modelo ainda não está disponível em uma região, Azure atualiza automaticamente as implantações durante a janela de atualização agendada. Nossa equipe de engenharia inicia a distribuição da nova versão do modelo a partir da data de atualização anunciada. Por exemplo, se gpt-35-turbo-0125 ainda não estiver disponível no Leste do Japão, a equipe de engenharia da Azure implantará gpt-35-turbo-0125 no Leste do Japão para atualizar versões mais antigas de modelo como parte do processo padrão de atualização de versão do modelo.

Atualizações de modelo de parceiro

Azure trabalha em estreita colaboração com provedores de modelos para lançar novas versões de modelo. Quando uma nova versão de um modelo é lançada, você pode testá-la imediatamente em novas implantações.

Novas versões de modelo podem resultar na publicação de uma nova ID do modelo. Por exemplo, Meta-Llama-3-70B-Instruct e Meta-Llama-3.1-70B-Instruct ambos foram desativados em favor de Llama-3.3-70B-Instruct. Cada geração usa uma ID de modelo diferente. Em alguns casos, todas as versões de modelo podem estar disponíveis na mesma versão da API. Em outros casos, talvez você também precise ajustar a versão da API usada para consumir o modelo, pois o contrato de API pode ter sido alterado de um modelo para outro.

O que acontece quando os modelos são desativados

Quando uma versão do modelo atinge sua data de desativação, o que acontece a seguir depende da política de atualização configurada para essa implantação:

  • Recusar atualizações automáticas de versão do modelo: a implantação para de aceitar solicitações e retorna erros depois que o modelo é desativado. Atualize a implantação para uma versão de modelo com suporte antes da data de desativação para evitar a interrupção do serviço.
  • Atualizar quando a nova versão padrão ficar disponível: a implantação é atualizada automaticamente para a versão padrão atual. Nenhuma ação é necessária.
  • Depois que a versão atual expira: a implantação é atualizada automaticamente para a próxima versão disponível quando a versão atual expira.

Azure notifica você sobre as próximas desativações por email para proprietários e colaboradores da assinatura, alertas do Integridade do Serviço do Azure e nas tabelas de próximas desativações em Desativação e retirada de modelos para Microsoft Modelos da Fundição.