Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
A cota fornece a flexibilidade para gerenciar ativamente a alocação de limites de taxa entre as implantações na sua assinatura. Azure atribui cota por assinatura, por região e por modelo em unidades de tokens por minuto (TPM). Diferentes tipos de implantação, como Standard e Provisionado, têm diferentes mecânicas de cotas. Para obter detalhes completos sobre limites padrão e camadas de cota, consulte as cotas e os limites do Azure OpenAI.
Este artigo explica o processo de gerenciamento de cotas para seus modelos de Microsoft Foundry desenvolvidos no seu projeto Foundry, incluindo como visualizar alocações atuais e solicitar aumentos.
Pré-requisitos
- Uma assinatura Azure. Crie um gratuitamente.
- Um projeto do Foundry.
- Função Leitor de usos dos Serviços Cognitivos no nível da assinatura, para visualizar as alocações de cota.
- Função Proprietário ou Colaborador na assinatura, para solicitar aumentos de cotas.
- Função colaborador dos Serviços Cognitivos combinada com Leitor de Uso de Serviços Cognitivos, para editar alocação de cotas no portal Foundry.
Cota compartilhada do Foundry
A Foundry fornece um pool de cota compartilhada que diferentes usuários em várias regiões podem usar simultaneamente. Dependendo da disponibilidade, os usuários podem acessar temporariamente a cota do pool compartilhado e usar a cota para executar testes por um período limitado de tempo. A duração do tempo específica depende do caso de uso. Usando temporariamente a cota do pool de cotas, você não precisa mais registrar um tíquete de suporte para um aumento de cota de curto prazo ou aguardar que sua solicitação de cota seja aprovada antes de continuar com sua carga de trabalho.
Você pode usar o pool de cotas compartilhadas para testar a inferência dos Modelos da Fábrica no catálogo de modelos. Use a cota compartilhada apenas para criar pontos de extremidade de teste temporários, não pontos de extremidade de produção. No caso de pontos de extremidade na produção, você deve solicitar cota dedicada. A cobrança da cota compartilhada é baseada em uso.
Exibir e solicitar cotas no portal do Foundry
Use cotas para gerenciar a alocação de cota de modelo entre vários projetos do Foundry na mesma assinatura.
-
Entre no Microsoft Foundry. Verifique se o interruptor da Nova Fundição está ativado. Essas etapas referem-se ao Foundry (versão nova).
Os projetos ajudam a organizar seu trabalho. O projeto no qual você está trabalhando aparece no canto superior esquerdo. Se você quiser criar um novo projeto, selecione o nome do projeto e , em seguida, crie um novo projeto.
Selecione Operar na navegação no canto superior direito.
Selecione Cota no painel à esquerda para acessar o painel Cota. A visualização de cotas tem duas abas.
- Token por minuto – exibir e gerenciar alocações de cota de tokens por minuto (TPM) para implementações padrão.
- Unidade de taxa de transferência provisionada — Visualize e gerencie alocações de unidades de taxa de transferência provisionadas (PTU) para implantações provisionadas, incluindo ferramentas de estimativa de capacidade.
Selecione qualquer uma das implantações na lista para abrir seu painel de detalhes no lado direito. O painel de detalhes mostra a alocação atual da cota da implantação, o uso e as implantações afiliadas.
No painel de detalhes da implantação, vá para a seção Implantações afiliadas usando cota compartilhada. Selecione o ícone de lápis na coluna Ações da tabela para editar a alocação de cota para a implantação e liberar a cota não usada ou aumentar a alocação conforme necessário.
Selecione o botão Solicitar cota no canto superior direito para solicitar aumentos de cota para o tipo de implantação padrão.
Nota
Depois de editar uma alocação de cota ou enviar uma solicitação, permita até 15 minutos para que as alterações sejam propagadas. Atualize a página Cota para verificar a alocação atualizada.
Solucionando problemas
Se você encontrar problemas ao exibir ou solicitar cotas, experimente estas soluções:
| Questão | Solução |
|---|---|
| A página de cota está vazia ou não mostra alocações | Verifique se você tem a função Leitor de Usos dos Serviços Cognitivos no nível da assinatura. Verifique se você está exibindo a assinatura correta no portal. |
| O botão Solicitar cota está desabilitado | Verifique se você tem a função Proprietário ou Colaborador na assinatura. Algumas combinações de modelo e região podem não dar suporte a aumentos de cota. |
| Alteração de cota não refletida após aprovação | As alterações de cotas podem levar até 15 minutos para se propagarem. Atualize a página Quota. Se o problema persistir após 24 horas, entre em contato com Suporte do Azure. |
| Não é possível localizar cota para um modelo específico | Verifique a disponibilidade regional. Nem todos os modelos estão disponíveis em todas as regiões. Consulte o suporte à Região. |