Taxas de faturamento e gerenciamento

Este artigo descreve as taxas para os diferentes recursos e funcionalidades usados em agentes que o Copilot Studio cobra por meio do medidor de pagamento conforme o uso ou pacotes de Crédito do Copilot. Essas taxas se aplicam a todos os modelos de linguagem que Copilot Studio fornece. Eles excluem as configurações "bring-your-own-model", incluindo modelos do Azure Foundry, que são cobrados separadamente.

Importante

Copilot Credits são uma unidade de medida para o uso dos agentes. Você calcula o custo total com base na soma dos créditos Copilot que sua organização usa. O número de créditos Copilot que um agente consome depende do design do agente, da frequência com que os clientes interagem com ele e dos recursos que eles usam.

Ao comprar uma licença Copilot Studio, você obtém um número específico de créditos Copilot cobrados. Você agrupa essa capacidade para todo o ambiente do cliente.

taxas de cobrança dos créditos do Copilot

A tabela a seguir mostra as diferentes taxas de cobrança:

Recurso do agente Taxa de cobrança Usado por Microsoft 365 Copilot usuário licenciado1
Resposta clássica Crédito Copilot: 1 Frete gratuito
Resposta generativa 2 2 créditos de Copilot Frete gratuito
Ação do agente 5 Créditos de Copilot Frete gratuito
Base ou Contextualização do Grafo de Tenant para mensagens 10 Créditos Copilot Frete gratuito
Ações de fluxo do agente por 100 ações3 13 créditos de Copilot Frete gratuito
Ferramentas de IA
- Ferramentas de texto e IA generativa (básicas) por cada 10 respostas Crédito Copilot: 1 Frete gratuito
- Ferramentas de texto e IA generativa (padrão) por 10 respostas 15 Créditos Copilot Frete gratuito
- Ferramentas de texto e IA generativa (premium) por 10 respostas 100 Créditos Copilot Frete gratuito
- Ferramentas de processamento de conteúdo por página 8 Créditos do Copilot Frete gratuito

1 Cenários de uso voltados para funcionários (Business to Employee) de agentes do Copilot Studio, assim como as ferramentas e recursos do Copilot Studio que esses agentes invocam, são incluídos na USL Microsoft 365 Copilot quando o usuário do agente possui licença do Microsoft 365 Copilot, e o agente opera usando a identidade do usuário autenticada na USL do Microsoft 365 Copilot. O uso é limitado a limites de uso justo. A Microsoft se reserva o direito de atualizar os limites conforme o produto evolui e novos padrões de uso surgem.

2 Agentes incorrem em custos para respostas generativas, a menos que o agente seja criado pelo Construtor de Agentes do Microsoft 365 e a resposta não utilize a fundamentação de Graph do locatário.

3 Quando a capacidade pré-paga é esgotada, o controle de fluxo do agente bloqueia novas execuções em vez de desabilitar o agente. Saiba mais em controle de fluxo do agente.

  • Respostas clássicas: estes eventos são respostas predefinidas criadas manualmente por criadores de agente. Eles são estáticos e não mudam a menos que sejam atualizados manualmente. Use onde quiser respostas precisas e controladas, que são as únicas que o agente gera.

  • Respostas generativas: estes eventos são gerados dinamicamente usando modelos de IA, como Transformadores pré-treinados generativos (GPTs). Eles podem se adaptar e mudar com base no contexto e nas fontes de conhecimento às quais estão conectados. Eles são úteis para lidar com uma ampla gama de tópicos e fornecer interações mais flexíveis e naturais.

  • Embasamento do Graph do locatário para Créditos do Copilot: esses eventos fornecem um embasamento de maior qualidade para seus agentes usando RAG (geração aumentada de recuperação) em todo o seu Microsoft Graph em todo o locatário, incluindo dados externos sincronizados no Microsoft Graph por meio de conectores. Esta capacidade acarreta respostas mais relevantes e aprimoradas e garante que as informações de embasamento estejam atualizadas. Esse recurso é opcional e você pode ativá-lo ou desativá-lo para cada agente. Saiba mais no Turn on Work IQ.

  • Agent actions: as ações do agente referem-se a etapas como gatilhos, raciocínio profundo e transições de tópico que aparecem no mapa de atividades no Copilot Studio ao testar um agente. Além disso, Agentes que Utilizam Computador também são cobrados na taxa de ação do agente.

  • Ferramentas de texto e IA generativa: as ferramentas de prompt incorporadas em um agente permitem ao criador direcionar o modelo subjacente para realizar tarefas inteligentes de processamento de documentos e imagens, comportar-se de maneira específica da tarefa ou gerar saídas específicas do cenário. Os três tipos de ferramentas (básica, padrão e premium) são baseados no modelo de linguagem subjacente dos prompts. O texto premium e as ferramentas de IA generativa cobram por recursos de raciocínio avançado em agentes. Para obter mais informações, consulte prompt builder licensing in Microsoft Copilot Studio e Prompt Tokens.

  • Ações de fluxo de agentes: Este item cobra pelo uso de fluxos de agentes que aprimoram os agentes de IA, com sequências predefinidas de ações de fluxo para executar tarefas repetitivas rapidamente, sem exigir raciocínio e orquestração dos agentes em cada etapa. Para obter mais informações, consulte Visão geral de fluxos do agente.

Cada interação com um agente pode usar vários tipos de funcionalidades ao mesmo tempo. Por exemplo, um agente fundamentado em um gráfico de locatário poderia usar 12 Créditos do Copilot (10 Créditos do Copilot para embasamento do Graph do locatário e 2 Créditos do Copilot para respostas generativas) para responder a um único prompt complexo de um usuário.

Modelo de cobrança de taxas de raciocínio

Quando um agente usa um modelo de linguagem compatível com raciocínio, o Copilot Studio efetua a cobrança usando dois medidores: taxa por recurso e texto e ferramentas de IA gerativas (premium).

A taxa de características cobre a ação central que o agente realiza, como respostas generativas, execução de ações em fluxos ou realização de ações do agente. Essa taxa sempre se aplica, independentemente do modelo utilizado.

A tarifa de ferramentas de texto e IA generativa (premium) se aplica quando o agente utiliza um modelo de raciocínio. Essa taxa premium cobre os recursos computacionais extras necessários para raciocínio profundo, planejamento e inferência em múltiplas etapas. É cobrado como Texto e ferramentas de IA gerativa (premium) para cada 10 respostas, custando 100 créditos Copilot.

O cálculo de custo para uma operação que utiliza um modelo de raciocínio é o seguinte:

Custo total = taxa de recurso para a operação + texto e ferramentas de IA generativa (premium) para o uso de token do modelo de raciocínio.

Por exemplo, uma resposta generativa que utiliza um modelo de raciocínio é apresentada como a seguinte fórmula:

Custo total = taxa de recursos para respostas generativas + texto e ferramentas de IA generativa (premium) por 10 respostas.

Exemplos de cobrança

Os exemplos de cobrança a seguir mostram como um agente pode incorrer em cobranças, com base em sua configuração.

Agente de suporte ao cliente

Você tem um agente de suporte ao cliente no seu site que responde perguntas com base nas políticas de devolução do cliente e nos manuais de produtos que você forneceu ao agente como fonte de conhecimento.

Uma execução média inclui quatro respostas clássicas para questões relacionadas a devoluções e duas respostas generativas para questões de resolução de problemas. A média é de 900 clientes por dia. O custo estimado por dia baseia-se no seguinte cálculo: [(4x1)+(2x2)] x 900 customers = 7200 Copilot Credits.

Agente de Performance de Vendas

Você tem um agente ancorado no grafo de locatário no Microsoft 365 Copilot Chat. Esse agente responde a perguntas de funcionários com base em dados de vendas conectados a Microsoft Graph usando conectores de dados do Graph.

Uma execução média inclui quatro respostas geradas e quatro Créditos do Copilot baseados em grafos de locatário. A média é de 50 usuários licenciados Microsoft 365 Copilot e 100 usuários sem licença. O custo estimado por dia baseia-se no seguinte cálculo: [(4x2)+(4x10)] x 100 users = 4,800 Copilot Credits.

Agente do processamento da ordem

Um agente interno é disparado de maneira autônoma sempre que um novo pedido é recebido pela organização. O agente usa uma única fonte de conhecimento para obter detalhes do produto sobre os itens solicitados e dispara quatro chamadas de ação para confirmar a disponibilidade do produto, exibir os prazos de envio, aprovar o pedido e enviar um email ao cliente com todos os detalhes. Ações e tópicos são ações do agente no modo de orquestração generativa. O custo estimado por dia baseia-se no seguinte cálculo: [(4x5)] = 20 Copilot Credits.

Aplicação de Sobretaxa

Quando o consumo excede a capacidade disponível, o meio ambiente está em excesso. Microsoft permite que algum nível de consumo excessivo, semelhante a um período de carência, evite bloquear processos empresariais.

Se o ambiente não tiver mais capacidade, você terá as seguintes opções:

  • Realoque a capacidade existente no nível da organização (inquilino) ou do ambiente.

  • Compre mais capacidade e a disponibilize para o ambiente.

  • Configure um medidor de consumo ou um medidor pré-pago para lidar com o excedente.

Política de imposição

Aplica-se a todos os inquilinos que operam no plano de capacidade pré-paga do Copilot Studio para uso de agentes personalizados (de conversação e ativados de forma autônoma).

Limite de uso

A execução é ativada quando um inquilino atinge 125% de sua capacidade pré-paga.

Ação sobre excedente (125%)

Os agentes personalizados estão desabilitados. Desabilitar um agente não interrompe uma conversa em andamento. Todas as tentativas subsequentes de invocar o agente são rejeitadas até que a capacidade seja aumentada ou redefinida.

Mecanismo de notificação

Uma notificação por email é enviada ao administrador designado do locatário e a notificação também é postada no centro de administração do Power Platform.

Comportamento do agente pós-imposição

Depois que a imposição é disparada e a conversa atual é concluída, o agente é desabilitado. Quando os usuários finais tentam interagir com o agente após a imposição, eles recebem uma das seguintes respostas:

  • "Há um problema de cobrança."
  • "Este agente está indisponível no momento. Ele atingiu seu limite de uso."

Exemplo de imposição

Se o cliente aloca ou reserva capacidade em um ambiente, o sistema honra essa capacidade. Considere o exemplo a seguir de um cliente que possui quatro ambientes diferentes e como sua capacidade de crédito Copilot é aplicada.

Um cliente tem 25.000 Copilot Créditos e usa a seguinte estrutura de alocação:

  • O Ambiente A tem 10.000 Créditos do Copilot alocados.
  • O ambiente B não tem alocação.
  • O ambiente C não tem alocação.
  • O Ambiente D tem uma alocação de 500 créditos Copilot e usa o modelo de pagamento conforme o uso.

A alocação de locatário restante é de 14.500 Créditos Copilot. O Ambiente B e o Ambiente C desenham e consomem em relação aos 14.500 Créditos do Copilot restantes. Se o consumo de Créditos do Copilot do Ambiente B e do Ambiente C exceder 125% dos 14.500 Créditos do Copilot, a imposição de excedente será chamada.

Se o Ambiente A utiliza ou consome créditos Copilot de sua alocação de 10.000 créditos Copilot, o cenário a seguir se aplica. Quando os 10.000 Créditos do Copilot são consumidos, o Ambiente A pode consumir do inquilino.

Se o Ambiente A consome do locatário, ele se junta aos Ambientes B e C no consumo da capacidade do locatário. Se o locatário atingir 125% do consumo de Crédito Copilot, a aplicação será invocada.

Se o locatário já estiver em 125% do consumo de Crédito do Copilot por causa dos Ambientes B e C, a imposição não é feita sobre os agentes no Ambiente A, desde que o Ambiente A tenha capacidade restante na alocação de 10.000 Créditos do Copilot.

No Ambiente D, quando o locatário está em excedente, esse ambiente não é afetado. Como uma vez que o Ambiente D atinge seu limite de 500 Créditos do Copilot, o medidor de pagamento conforme o uso é chamado.

Imposição de fluxo do agente

O controle do fluxo do agente aplica-se especificamente aos fluxos do agente e opera de maneira distinta do controle geral do agente.

Quando a capacidade pré-paga do Copilot Studio de um locatário é totalmente consumida, novas execuções de fluxos de agentes são bloqueadas. Ao contrário da imposição de excedente de limite, que desabilita agentes personalizados ao atingir 125% da capacidade, a imposição de fluxo de agentes visa apenas a execução do processo de fluxo. O agente pai continua funcionando normalmente para todas as interações que não são de fluxo, como respostas clássicas, respostas generativas e ações de agente.

Comportamento de aplicação

Quando o controle de fluxo do agente estiver ativo:

  • Novas execuções de fluxo do agente não podem ser iniciadas. As tentativas de ativar um fluxo de agente são rejeitadas.
  • Execuções de fluxo do agente que já estão em andamento são concluídas normalmente.
  • O agente permanece disponível para interações sem fluxo.
  • Os autores de fluxo veem um alerta em tempo de design no editor do Copilot Studio indicando que a capacidade foi esgotada.
  • A aplicação das regras é redefinida mensalmente quando os créditos de Copilot pré-pagos são renovados.

Exemptions

Os seguintes cenários não são afetados pelo controle de fluxo do agente.

  • Usuários licenciados do Microsoft 365 Copilot: as ações de fluxo de agente invocadas por usuários licenciados com o Microsoft 365 Copilot não consomem capacidade pré-paga e não estão sujeitas à imposição. Saiba mais sobre o uso incluído para usuários do Microsoft 365 Copilot.
  • Execuções de teste: testar o fluxo de um agente no designer de fluxo ou no chat de teste do agente não consome capacidade para ações do fluxo do agente. As execuções de teste não são bloqueadas pela imposição.

Resolver o controle do fluxo de operações do agente

Se a imposição de fluxo do agente estiver ativa em seu ambiente, você terá as seguintes opções:

  • Realocar a capacidade existente de outros ambientes em seu locatário. No centro de administração do Power Platform, acesse o Licensing>Copilot Studio e selecione Gerenciar créditos do Copilot.
  • Compre mais Créditos copilot e atribua-os ao ambiente afetado.
  • Habilite a cobrança conforme o uso vinculando um plano de cobrança da assinatura do Azure ao ambiente. Com o pagamento conforme o uso, a aplicação de restrições não se aplica porque o excedente é cobrado na sua assinatura do Azure.

Para monitorar o consumo de crédito do fluxo do agente, acesse Licensing>Copilot Studio>Environments, selecione o ambiente afetado e examine as Ações de fluxo do agente na grade de Detalhes de consumo de crédito do Copilot. Saiba mais sobre como gerenciar créditos e capacidade do Copilot Studio.

Dica

Você pode definir limites de consumo mensais para agentes individuais no centro de administração do Power Platform. Vá para Licensing>Copilot Studio>Manage Agents para limitar o uso de crédito antes que a imposição seja disparada.

Exibir o consumo de crédito Copilot

Você pode exibir o relatório de consumo de crédito do Copilot no Centro de Administração do Power Platform.