Planeie e gere custos para a Microsoft Foundry

Este artigo mostra-lhe como estimar despesas antes da implementação, acompanhar os gastos em tempo real e configurar alertas para evitar surpresas orçamentais.

Pré-requisitos

Antes de começar, certifique-se de que tem:

  • Subscrição Azure: Uma subscrição ativa do Azure com os recursos que pretende monitorizar.
  • Controlo de acesso baseado em funções (RBAC): Um ou ambos os seguintes papéis/funções a nível de subscrição ou grupo de recursos:
  • Tipo de conta Azure suportado: Um dos tipos de conta suportados para a Gestão de Custos.
  • Verificação da disponibilidade da região e modelo: Confirme a disponibilidade necessária de modelos e funcionalidades nas suas regiões de destino antes da implementação. Para mais detalhes, consulte Disponibilidade de funcionalidades em regiões cloud.
  • Consciência da topologia de recursos: Saiba se as suas vistas de custos estão englobadas para subscrição, grupo de recursos ou recurso, e mantenha o mesmo âmbito ao comparar estimativa com custo real.
  • Reportar a expectativa de latência: Os registos de custos e utilização podem aparecer com atraso, dependendo do momento de ingestão do serviço. Use janelas de tendências em vez de comparações minuto a minuto para reconciliação.

Se precisar de conceder estas funções a membros da equipa, consulte Atribuir acesso a dados de Gestão de Custos e funções RBAC na Foundry.

Use este mapeamento tarefa para função como ponto de partida:

  • Ver dados de Gestão de Custos:Leitor de Gestão de Custos.
  • Ver recursos do Foundry e contexto de utilização relacionado:Azure AI User.
  • Criar ou modificar funções personalizadas:Proprietário no âmbito pretendido.

Nota

O Foundry não tem uma página dedicada no calculador de preços do Azure porque o Foundry é composto por vários serviços opcionais do Azure. Este artigo mostra como usar a calculadora para estimar os custos destes serviços.

Estimar os custos antes de usar a Foundry

Use a calculadora de preços Azure para estimar custos antes de adicionar recursos da Foundry.

  1. Vai à calculadora de preços Azure.
  2. Pesquise e selecione um produto, como Azure Speech no Foundry ou Azure Language no Foundry.
  3. Selecione produtos adicionais para estimar os custos de múltiplos serviços. Por exemplo, adicione o Pesquisa de IA do Azure para incluir custos potenciais de pesquisa.
  4. À medida que adiciona recursos ao seu projeto, volte à calculadora e atualize as estimativas.

Valide o seu plano de custos antes do lançamento

Antes de lançar para produção, valide o seguinte:

  1. Os modelos e serviços necessários estão disponíveis nas suas regiões de destino. Veja Disponibilidade de funcionalidades entre regiões cloud.
  2. Os mesmos escopos de recursos usados nas suas estimativas (subscrição, grupo de recursos e recurso) são usados nas vistas de Gestão de Custos.
  3. A distribuição de custos ao nível do medidor corresponde aos serviços e implementações esperados na sua arquitetura.
  4. Funções incorporadas ou funções personalizadas necessárias para visibilidade de custos são atribuídas a utilizadores de operações e finanças.

Exemplo resolvido: estimar e verificar

Use este fluxo de trabalho leve para reduzir surpresas de faturação:

  1. Faça um orçamento no calculador de preços do Azure para os serviços na sua arquitetura.
  2. Implementar uma pequena carga de trabalho de teste e gerar tráfego representativo.
  3. Na Gestão de Custos, agrupa os custos por Recurso e depois por Medidor.
  4. Compare as taxas reais dos contadores com as suas estimativas e ajuste o seu orçamento base.

Resultado esperado: Pode mapear cada suposição principal de estimativa para um ou mais contadores de faturação observados e explicar qualquer desvio significativo antes da implementação na produção.

Reconciliar estimativas com custos reais

Use esta lista de verificação após cada ciclo de teste:

  1. Confirme que o âmbito da avaliação (subscrição, grupo de recursos ou recurso) corresponde ao âmbito utilizado na sua estimativa.
  2. Exportar ou visualizar as tarifas ao nível do contador para o mesmo intervalo de datas usado durante o tráfego de teste.
  3. Verifique se as etiquetas necessárias estão presentes e aplicadas de forma consistente aos recursos participantes.
  4. Compare as suposições de estimativas com os medidores observados e registre a variância por serviço.
  5. Atualize orçamentos e limiares de alerta apenas depois de validar pelo menos uma tendência completa do ciclo de faturação.

Referência:Azure calculadora de preços

Custos associados à Fundição

Quando cria um recurso Foundry, paga pelos serviços Azure que utiliza, como Azure OpenAI, Azure Speech no Foundry, Content Safety, Azure Vision no Foundry, Azure Document Intelligence e Azure Language no Foundry. Os custos variam consoante o serviço e a funcionalidade. Para mais detalhes, consulte a página de preços da Foundry Tools.

Compreenda os modelos de faturação da Foundry

Os recursos do Foundry operam na infraestrutura do Azure e acumulam custos quando são implementados. Quando cria ou utiliza recursos Foundry, é cobrado com base nos serviços que utiliza.

Abordagens comuns de faturação incluem:

  • Pay-as-you-go (API serverless): É faturado de acordo com a utilização de cada serviço Azure.
  • Níveis de compromisso: Compromete-se a utilizar funcionalidades de serviço mediante uma taxa fixa, proporcionando custos previsíveis. Para mais detalhes, consulte Preços de nível de compromisso.

Nota

Se usar o recurso acima da quota prevista pelo plano de compromisso, paga pelo uso extra conforme descrito no valor excedente no portal do Azure quando compra um plano de compromisso.

Compreenda o modelo de faturação dos modelos Foundry

Preços baseados em tokens

Os modelos de linguagem e visão processam as entradas dividindo-as em tokens. Cargas de trabalho de texto, imagem e áudio podem todas usar medição baseada em tokens. A unidade de faturação e a tarifa podem variar consoante o modelo, tipo de implementação e contador. Consulte a página de preços para os nomes e unidades exatos dos medidores para a sua implantação. Para as taxas atuais, consulte a página de preços Azure OpenAI.

Modelos vendidos diretamente pela Azure

Os modelos vendidos diretamente pela Azure (incluindo o Azure OpenAI) são faturados pela Microsoft. Na Gestão de Custos, estas cobranças normalmente aparecem como medidores relacionados com modelos associados aos seus recursos implementados.

Modelos afinados

Os modelos finamente ajustados do Azure OpenAI são cobrados de três formas:

  • Formação: Cobrado por token ou por hora, dependendo do modelo.
  • Apresentação: Custo horário por modelo implementado (aplica-se mesmo que o modelo não seja utilizado).
  • Inferência: Por cada 1.000 tokens (entrada e saída) quando o modelo é invocado.

O modelo alojado por monitores ajustou cuidadosamente os custos para evitar cobranças inesperadas. Para as taxas atuais, consulte a página de preços Azure OpenAI.

Importante

Implantações finamente ajustadas incorrem em custos de alojamento durante a implementação, mesmo durante períodos de baixa utilização. Remove ou reduz as implementações que não precisas. Para detalhes sobre o ciclo de vida da implementação e políticas de limpeza, consulte a documentação de ajuste fino.

Código de resposta de erro HTTP e estado de faturação

Os códigos de estado HTTP sozinhos não determinam se o uso é faturado. As cobranças dependem de se ocorreu processamento faturável para a requisição e do comportamento do contador específico.

Use os dados de contadores e métricas de serviço da Gestão de Custos para conciliar o consumo faturado, e trate os seus registos de faturas e contadores como fonte de verdade.

Monitorizar custos

Acompanhe os seus gastos na Foundry usando ferramentas de análise de custos. Pode visualizar custos por dia, mês ou ano, comparar com orçamentos e identificar tendências de despesa.

Acede à informação de custos através do portal Microsoft Foundry ou do portal Azure. Referência:Análise de custos

Importante

Os custos da sua Foundry são apenas um subconjunto dos custos globais da sua aplicação ou solução. Precisa de monitorizar os custos de todos os recursos do Azure usados na sua aplicação ou solução.

Configurar permissões para visualizar custos

Para visualizar os custos da fundição, atribua funções com base na tarefa e no âmbito. Para relatórios de custos, atribuir a função de Leitor de Gestão de Custos no âmbito exigido. Atribuir o papel Azure Utilizador de IA quando os utilizadores também precisam de inspecionar os recursos e o contexto de utilização do Foundry.

Se os papéis incorporados não corresponderem às tuas necessidades, podes criar um papel personalizado com permissões de privilégio mínimo. Valide as ações de funções no seu ambiente, pois as ações disponíveis podem evoluir ao longo do tempo.

Exemplos de permissões de leitura:

  • Microsoft.Consumption/*/read
  • Microsoft.CostManagement/*/read
  • Microsoft.Resources/subscriptions/read
  • Microsoft.CognitiveServices/accounts/AIServices/usage/read

Nota

Precisa da função Proprietário no âmbito da subscrição ou no âmbito do grupo de recursos para criar funções personalizadas nesse âmbito.

Para criar um papel personalizado, use um dos seguintes artigos:

Para mais informações sobre funções personalizadas, consulte Azure funções personalizadas.

Para criar um papel personalizado, constrói um ficheiro JSON de definição de função que especifique permissões e âmbito para o cargo. O exemplo seguinte é um ponto de partida ilustrativo para um papel personalizado de Leitor de Custos da Fundição:

{
    "Name": "Foundry Cost Reader",
    "IsCustom": true,
    "Description": "Can see cost metrics in Foundry",
    "Actions": [
        "Microsoft.Consumption/*/read",
        "Microsoft.CostManagement/*/read",
        "Microsoft.Resources/subscriptions/read",
        "Microsoft.CognitiveServices/accounts/AIServices/usage/read"
    ],
    "NotActions": [],
    "DataActions": [],
    "NotDataActions": [],
    "AssignableScopes": [
        "/subscriptions/<subscriptionId>/resourceGroups/<resourceGroupName>/providers/Microsoft.CognitiveServices/accounts/<foundryResourceName>"
    ]
}

Substitua <subscriptionId>, <resourceGroupName>, e <foundryResourceName> pelos seus valores reais.

Nota

Valide definições de papéis personalizadas num ambiente não produtivo antes da implementação ampla e verifique cada ação em relação às operações suportadas pelo seu inquilino com o fornecedor de recursos.

Nota

Este exemplo de função personalizada não concede acesso a recursos da Foundry por si só. Atribua um papel adicional como Azure Utilizador de IA caso os utilizadores também precisem de visibilidade dos recursos do Foundry.

Portal do monitor na fundição

  1. Iniciar sessão no Microsoft Foundry. Certifica-te de que a opção New Foundry está ativada. Estes passos referem-se à Foundry (nova).
  2. Use as secções abaixo para monitorizar os custos.

Nota

As etiquetas dos portais da fundição e a navegação podem variar ligeiramente consoante o inquilino e a onda de lançamento. Se não vir um rótulo exato neste artigo, use vistas de custos equivalentes no mesmo âmbito do projeto.

Nota

As estimativas não refletem descontos ou preços contratados que possam aparecer na sua fatura final. As estimativas cobrem apenas os custos padrão de implementação e não o débito provisionado.

Custos do agente

  1. Selecionar Operar no canto superior direito da navegação.
  2. Selecione Visão Geral no painel esquerdo.
  3. No topo da página, selecione a subscrição, um ou mais projetos e um intervalo de datas.
  4. O painel de custo estimado mostra as estimativas de custo de todos os agentes para o(s) projeto(s) selecionado(s) nas datas selecionadas. Estas estimativas não incluem custos rápidos de agentes e não-agentes da Foundry.

Captura de ecrã do separador Agentes em Ativos, mostrando a coluna de Custos Estimados com estimativas mensais de custos para cada agente com base na configuração e utilização.

Para orçamentos individuais de agentes:

  1. Selecione Assets no painel esquerdo.
  2. Selecione o separador Agentes .
  3. A coluna Custos Estimados mostra estimativas mensais baseadas na configuração e nos padrões de utilização do agente.

Referência:Conceitos de agente

Captura de ecrã do separador Agentes mostrando uma lista de agentes com colunas para Nome, Estado e Custos Estimados. A coluna Custos estimados mostra os valores mensais.

Para ver os custos detalhados dos agentes:

  1. Selecione Construir no canto superior direito da navegação.
  2. Selecione Agentes no painel esquerdo.
  3. Escolha um agente.
  4. Selecione a aba Monitor.
  5. Defina o intervalo de datas no canto superior direito.
  6. Consulte os custos e métricas de utilização dos tokens para a faixa selecionada.

Referência:Métricas de monitorização de agentes

Captura de ecrã do separador Monitor de um agente, mostrando métricas operacionais incluindo custo total do token, utilização do token, latência média de inferência, gráfico de execuções do agente, e métricas de execuções e tokens.

Custos de implementação do modelo

  1. Selecione Construir no canto superior direito da navegação.
  2. Selecione Modelos no painel esquerdo.
  3. Escolhe um modelo.
  4. Selecione a aba Monitor.
  5. Defina o intervalo de datas no canto superior direito. Vê o custo total e um gráfico estimado de custos para o intervalo selecionado.

Referência:Modelos de monitores

Captura de ecrã do portal Azure mostrando o separador Monitor com o gráfico de custos totais e estimados para um modelo selecionado e período de datas.

Quando seleciona Ver Mais Detalhes ou Gestão de Custos do Azure, é encaminhado para a secção Gestão de Custos do portal Azure. Os custos no portal do Azure podem mostrar encargos agregados para o âmbito da conta correspondente, não apenas para modelos individuais.

Nota

Os gráficos de tokens e pedidos podem diferir temporariamente do custo estimado devido ao tempo de ingestão e às diferenças de agregação. Utilize Custo estimado para monitorização quase em tempo real, e utilize o Gestão de Custos do Azure e os encargos faturados para reconciliação financeira.

Monitorizar no portal do Azure

  1. Inicie sessão no portal Azure.

  2. Veja os custos do seu grupo de recursos ou recurso individual da Foundry.

    Dica

    Para abrir o seu recurso Foundry no portal Azure:

    1. Iniciar sessão no Microsoft Foundry. Certifica-te de que a opção New Foundry está ativada. Estes passos referem-se à Foundry (nova).
    2. Selecione Operar no canto superior direito da navegação.
    3. Selecionar Administrador.
    4. Selecione o link do recurso principal na segunda coluna.
    5. Selecione Gerir este recurso no portal Azure sob o título Ver recurso no canto superior direito.
  3. No portal Azure, selecione Análise de custos em Gestão de Custos (para o seu grupo de recursos ou recurso da Foundry).

  4. Consulte a visão geral dos custos. Opcionalmente, adicione filtros (etiquetas de implementação, etiquetas definidas pelo utilizador) para segmentar custos por modelo de implementação:

    Captura de ecrã da visão geral de custos que mostra o filtro de etiquetas ao nível de implementação.

  5. Selecione Custos por recurso>Recursos para ver a divisão dos custos de recursos da Foundry em várias implementações de modelos.

    Captura de ecrã da divisão do custo dos recursos da Foundry entre as implementações dos modelos.

Compreenda a distribuição de custos por medidor

Use a ferramenta de Análise de Custos para visualizar os custos agrupados por contador de faturação:

  1. Inicia sessão no portal Azure e seleciona o teu grupo de recursos.

  2. Selecione Análise de custos em Gestão de Custos.

  3. Por padrão, a análise de custos é delimitada ao grupo de recursos selecionado.

    Importante

    Âmbito de Análise de Custos para o grupo de recursos onde desenvolveu o recurso da Foundry. Os medidores de custos associados a Modelos de Parceiros e Comunidade são apresentados sob o grupo de recursos em vez de aparecerem como recurso da Foundry.

  4. Modificar Agrupar por para Medidor. Agora pode ver que, para este grupo de recursos em particular, a origem dos custos provém de diferentes séries de modelos.

    Captura de ecrã de como ver o custo por cada medidor no grupo de recursos.

Modelos vendidos diretamente pela Azure

Os modelos vendidos diretamente pela Azure (incluindo o Azure OpenAI) são faturados diretamente pela Microsoft. Quando inspeciona a sua fatura, normalmente vê medidores que têm em conta a utilização de entrada e saída do modelo.

Captura de ecrã do painel de análise de custos com o âmbito restringido ao grupo de recursos onde o recurso Foundry está implantado, destacando os contadores para os modelos Azure OpenAI e Phi. O custo é agrupado por contador.

Monitorizar custos por recurso

Pode obter informações de faturação mais detalhadas agrupando custos por recurso:

  1. Em Análise de Custos, selecione Ver>Custo por recurso.

    Captura de ecrã de como ver o custo de cada recurso no grupo de recursos.

  2. Agora pode ver os recursos que geram cada um dos contadores de faturação. Para compreender a divisão do que compõe esse custo, pode ajudar a modificar Agrupar por para Medição e mudar o tipo de gráfico para Linha.

  3. Os modelos OpenAI do Azure e da Microsoft são exibidos como medidores em cada recurso da Foundry.

  4. Os modelos de alguns fornecedores são exibidos como medidores em Recursos globais. A palavra Globalnão está relacionada com o SKU da implementação do modelo (por exemplo, padrão Global). Se tiver vários recursos da Foundry, a sua fatura contém uma entrada para cada modelo e cada recurso da Foundry. Os medidores de recursos têm o formato model-name-GUID, onde o GUID é um identificador associado a um determinado recurso da Foundry. Repara que os contadores de faturação contabilizam entradas e saídas para cada modelo que consumiu.

    A captura de ecrã do painel de análise de custos concentrado no grupo de recursos onde o recurso da Foundry é implementado, destacando os medidores para modelos faturados no Azure Marketplace. O custo é agrupado por recurso.

É importante compreender o âmbito ao avaliar os custos associados aos recursos da Foundry. Se os seus recursos pertencerem ao mesmo grupo de recursos, pode definir a Análise de Custos a esse nível para compreender o efeito nos custos. Se os seus recursos estiverem distribuídos por vários grupos de recursos, pode definir o escopo a um nível de subscrição.

Quando analisado a um nível mais elevado, muitas vezes é necessário adicionar mais filtros para focar no uso do Azure OpenAI. Quando analisado ao nível da subscrição, pode ver muitos outros recursos que pode não lhe interessar no contexto da gestão de custos do Azure OpenAI. Quando definir o escopo ao nível da subscrição, navegue até à ferramenta completa de análise de custos no serviço Gestão de Custos.

Aqui está um exemplo de como usar a ferramenta de análise de custos para ver os seus custos acumulados para uma subscrição ou grupo de recursos:

  1. Procure por Gestão de Custos no topo da barra de pesquisa Azure para navegar para a experiência de serviço completo, que inclui mais opções, como a criação de orçamentos.
  2. Se necessário, selecione alterar se o Scope: não estiver a apontar para o grupo de recursos ou subscrição que pretende analisar.
  3. À esquerda, selecione Reportagem + análise>Análise de custos.
  4. No separador Todas as visualizações , selecione Custos acumulados.

Captura de ecrã do painel de análise de custos que mostra como aceder aos custos acumulados.

O painel de análise de custos mostra os custos acumulados que são analisados dependendo do que especificou para o Âmbito.

Captura de ecrã do painel de análise de custos com o âmbito definido para subscrição.

Se tentares adicionar um filtro por serviço, não consegues encontrar o Azure OpenAI na lista. Esta situação ocorre porque a utilização do Azure OpenAI aparece sob a classificação mais ampla de Serviços Cognitivos na gestão de custos. Se quiser focar-se na utilização Azure OpenAI numa subscrição, use nível de serviço: Azure OpenAI:

Captura de ecrã do painel de análise de custos com o nível de serviço destacado.

Criar orçamentos

Evite sobrecustos com alertas automáticos.Crie orçamentos que acompanhem os seus limites de despesa e configure alertas para o notificar quando os custos se aproximarem ou ultrapassarem os limites.

Melhores práticas: Criar orçamentos e alertas para subscrições Azure e grupos de recursos como parte de uma estratégia global de monitorização de custos.

Cria orçamentos com filtros para recursos ou serviços específicos no Azure se quiseres mais detalhe na monitorização. Os filtros ajudam a garantir que não cria acidentalmente novos recursos que custam mais dinheiro. Para saber mais sobre as opções de filtro quando cria um orçamento, consulte Grupos e opções de filtro.

Importante

Embora a OpenAI tenha uma opção para limites rígidos que impedem que ultrapasse o orçamento, o Azure OpenAI atualmente não oferece esta funcionalidade. Pode iniciar automação a partir de grupos de ação como parte das notificações do orçamento para realizar ações mais avançadas, mas esta funcionalidade requer desenvolvimento personalizado adicional.

Dados de custos de exportação

Pode exportar os seus dados de custos para uma conta de armazenamento. Exportar dados é útil quando se necessita realizar análises adicionais de dados para análise de custos. Por exemplo, as equipas financeiras podem analisar os dados usando Excel ou Power BI. Pode exportar os seus custos num calendário diário, semanal ou mensal e definir um intervalo de datas personalizado. Exportar dados de custos é a forma recomendada de recuperar conjuntos de dados de custos.

Outros custos que possam surgir

Permitir funcionalidades como enviar dados para o Azure Monitor Logs e alertar acarretam custos adicionais para esses serviços. Estes custos são visíveis sob esses outros serviços e ao nível de subscrição, mas não são visíveis quando o escopo é limitado apenas ao seu recurso da Foundry.

Utilização do Azure Prepayment

Pode pagar pelos encargos de modelos vendidos diretamente pelo Azure com o seu crédito de pré-pagamento do Azure (anteriormente chamado de compromisso monetário). No entanto, não pode usar o crédito de pré-pagamento do Azure para pagar as cobranças de outros modelos de fornecedores porque são faturadas através do Azure Marketplace.

Para mais informações, consulte Azure calculadora de preços.

Resolução de problemas de análise de custos comuns

  • Os custos não correspondem à sua estimativa: Confirme que todos os recursos dependentes (por exemplo, armazenamento, redes e recursos do Marketplace) estão incluídos no seu âmbito de Gestão de Custos.
  • Não consigo ver dados de custos: Confirme que tem permissões de visibilidade de custos e permissões de acesso ao Foundry no âmbito correto.
  • Cobranças inesperadas do contador: Utilize o agrupamento por Contador e Recurso para identificar qual serviço gerou a cobrança, depois compare com os padrões de implantação e tráfego.
  • Variação de custos de implementação regional: Valida a disponibilidade de regiões/modelos antes da implementação e verifica novamente as suposições se implementares em regiões diferentes.
  • Os filtros de etiquetas devolvem resultados incompletos: Verifique se as etiquetas necessárias são aplicadas a todos os recursos participantes e herdadas consistentemente do seu processo de implementação.
  • Os alertas orçamentais são ruidosos ou atrasados: Recalibre os limiares de alerta após observar o uso normal durante toda a janela de tendência, separando depois os limiares de aviso e críticos.
  • Alterações de política ou desvios de âmbito afetam a visibilidade dos custos: Confirme que o âmbito e as atribuições de políticas selecionadas ainda incluem todos os recursos utilizados pela carga de trabalho.
  • Os dados parecem atrasados após os testes: Espere pela latência de ingestão e depois verifique novamente a mesma janela de tempo antes de concluir que há uma discrepância na faturação.