Tarifas de faturação e gestão

Este artigo descreve as taxas para as diferentes funcionalidades e capacidades utilizadas em agentes que o Copilot Studio fatura através do medidor pay as you go ou de pacotes de Crédito do Copilot. Estas tarifas aplicam-se a todos os modelos de linguagem fornecidos pelo Copilot Studio. Excluem as configurações de "traga-o-seu-próprio-modelo", incluindo os modelos do Azure Foundry, que são faturados separadamente.

Importante

  • Para obter informações mais completas e atualizadas sobre licenciamento e faturação do Copilot Studio, consulte o Guia de Licenciamento Microsoft Copilot Studio.
  • Preveja o volume de Créditos de Copilot do seu agente usando o estimador de utilização do Microsoft Copilot Studio. Crie estimativas e impactos potenciais no consumo selecionando entre o tipo de agente, tráfego, orquestração, conhecimento e ferramentas.

Créditos de Copilot são a unidade que mede a utilização do agente. Calcula o custo total com base na soma dos Créditos Copilot que a sua organização utiliza. O número de Créditos Copilot que um agente consome depende do design do agente, da frequência com que os clientes interagem com ele e das funcionalidades que utiliza.

Quando compra uma licença do Copilot Studio, recebe um número específico de Créditos Copilot faturados. Agrupe esta capacidade em todo o inquilino.

Tarifas de faturação de créditos do Copilot

A tabela seguinte mostra as diferentes taxas de faturação:

Funcionalidade de agente Tarifa de faturação Usado por Microsoft 365 Copilot utilizador licenciado1
Resposta clássica 1 Crédito Copilot Grátis
Resposta generativa 2 2 Créditos como Copilot Grátis
Ação do agente 5 Créditos Copilot Grátis
Fundamentação do gráfico do inquilino para mensagens 10 Créditos do Copilot Grátis
Ações de fluxo de agentes por 100 ações3 13 Créditos do Copilot Grátis
Ferramentas de IA
- Ferramentas de texto e IA generativa (básicas) por 10 respostas
     0,1 crédito do Copilot por 1K tokens
1 Crédito Copilot Grátis
- Ferramentas de texto e IA generativa (standard) por 10 respostas
     1,5 créditos do Copilot por 1.000 tokens
15 Créditos do Copilot Grátis
- Ferramentas de texto e IA generativa (premium) por 10 respostas
     10 Créditos Copilot por cada 1K tokens
Copilot: 100 créditos Grátis
- Ferramentas de processamento de conteúdos por página 8 Créditos do Copilot Grátis
Escalões de Voz Taxa de faturação por voz por minuto Atividade principal dos agentes
(Resposta Clássica, Resposta Gerativa, Ação do Agente)
Voz Básica - Orquestração clássica 10 Crédito Copilot Included
Voz Padrão - Orquestração generativa 35 Créditos Copilot Included
Voz Premium - Tempo Real 75 Créditos Copilot Included

1 Cenários de utilização direcionados para funcionários (Business to Employee) de agentes do Copilot Studio e as funcionalidades e ferramentas que estes agentes invocam estão incluídos no Microsoft 365 Copilot USL quando o utilizador do agente está licenciado com o Microsoft 365 Copilot e o agente opera usando a identidade do utilizador autenticado do Microsoft 365 Copilot USL. O uso está limitado a limites de uso justo. A Microsoft reserva-se o direito de atualizar os limites à medida que o produto evolui e surgem novos padrões de utilização.

2 Os agentes incorrem em custos para respostas generativas, a menos que o agente seja criado no Construtor de Agentes no Microsoft 365 e a resposta não tira partido do fundamento do grafo de inquilinos.

3 Quando a capacidade pré-paga se esgota, a imposição do fluxo de agentes bloqueia novas execuções em vez de desativar o agente. Saiba mais sobre fiscalização do fluxo de agentes.

  • Respostas clássicas: esses eventos são respostas predefinidas criadas manualmente pelos criadores de agentes. Eles são estáticos e não mudam, a menos que sejam atualizados manualmente. Usa-as onde quiseres respostas precisas e controladas, que são as únicas que o agente gera.

  • Respostas generativas: Esses eventos são gerados dinamicamente usando modelos de IA, como transformadores pré-treinados generativos (GPTs). Podem adaptar-se e mudar consoante o contexto e as fontes de conhecimento a que estão ligados. São úteis para processar uma grande variedade de tópicos e proporcionam interações mais flexíveis e naturais.

  • Fundamento do gráfico de inquilinos para Créditos do Copilot: estes eventos fornecem fundamento de maior qualidade para os seus agentes usando geração aumentada de obtenção (RAG) sobre o Microsoft Graph em todo o inquilino, incluindo dados externos sincronizados no Microsoft Graph através de conectores. Esta capacidade resulta em respostas mais pertinentes e aprimoradas, garantindo que as informações fundamentais estejam atualizadas. Esse recurso é opcional e você pode ativá-lo ou desativá-lo para cada agente. Saiba mais em Ativar o QI do Trabalho.

  • Ações do agente: As ações do agente referem-se a etapas como gatilhos, raciocínio avançado e transições de tópicos que aparecem no mapa de atividades no Copilot Studio ao testar um agente. Além disso, os Agentes que Utilizam Computadores também são faturados pela taxa de ação do agente.

  • Ferramentas de texto e de IA generativa: as ferramentas de pedido incorporadas num agente permitem que o criador direcione o modelo subjacente para executar tarefas inteligentes de processamento de documentos e imagens, agir de forma específica para a tarefa ou gerar resultados específicos do cenário. Os três tipos de ferramentas (básica, padrão e premium) baseiam-se no modelo de linguagem subjacente dos prompts. O texto premium e as ferramentas de IA generativa cobram o raciocínio avançado nos agentes. Para mais informações, consulte licenciamento do criador de prompts no Microsoft Copilot Studio e Prompt Tokens.

  • Ações de fluxo de agente: este item cobra pelos fluxos de agente que melhoram agentes de IA através de fluxos de agente, que são sequências predefinidas de ações de fluxo para executar tarefas repetitivas rapidamente, sem exigir o raciocínio e a orquestração do agente em cada passo. Para obter mais informações, consulte Visão geral dos fluxos do agente.

Cada interação com um agente pode usar vários tipos de funcionalidades ao mesmo tempo. Por exemplo, um agente baseado num grafo de inquilinos pode usar 12 Créditos Copilot (10 Créditos Copilot para fundamentação do grafo de inquilinos, e 2 Créditos Copilot para respostas geradas) para responder a um único pedido complexo de um utilizador.

Modelo de justificação das taxas de faturação

Quando um agente utiliza um modelo de linguagem com capacidade de raciocínio, o Copilot Studio cobra com base em dois medidores de faturação: taxa de funcionalidade e texto e ferramentas de IA generativa (premium).

A taxa de funcionalidades cobre a ação central que o agente realiza, como respostas generativas, execução de ações em fluxos ou execução de ações do agente. Esta taxa aplica-se sempre, independentemente do modelo utilizado.

A tarifa para ferramentas de texto e IA generativa (premium) aplica-se quando o agente utiliza um modelo de raciocínio. Esta taxa premium cobre os recursos computacionais adicionais necessários para raciocínio profundo, planeamento e inferência em múltiplos passos. É faturado como Ferramentas de texto e IA generativa (premium) por cada 10 tokens, correspondendo a 100 créditos do Copilot.

O cálculo de custos para uma operação que utiliza um modelo de raciocínio é o seguinte:

Custo total = taxa de funcionalidade para a operação + texto e ferramentas de IA generativa (premium) para a utilização de tokens no modelo de raciocínio.

Por exemplo, uma resposta generativa que utiliza um modelo de raciocínio é apresentada como a seguinte fórmula:

Custo total = taxa de funcionalidade para respostas generativas + texto e ferramentas de IA generativa (premium) por 10 tokens.

Exemplos de faturação

Os exemplos de faturação seguintes mostram como um agente pode incorrer em faturação, com base na sua configuração.

Agente de suporte ao cliente

Tem um agente de apoio ao cliente no seu site que responde a perguntas com base nas políticas de devolução dos clientes e nos manuais de produtos que forneceu ao agente como fonte de conhecimento.

Um ciclo médio inclui quatro respostas clássicas para perguntas sobre devoluções e duas respostas geradoras para perguntas de resolução de problemas. A média é de 900 clientes por dia. O custo estimado por dia baseia-se no seguinte cálculo: [(4x1)+(2x2)] x 900 customers = 7200 Copilot Credits.

Agente de desempenho de vendas

Tem um agente de fundamentação de gráfico de inquilino no Microsoft 365 Copilot Chat. Esse agente responde às perguntas dos funcionários com base nos dados de vendas conectados ao Microsoft Graph usando conectores de dados do Graph.

Uma execução média compreende quatro respostas generativas e quatro Créditos do Copilot fundamentados no grafo de inquilinos. A média é de 50 utilizadores licenciados do Microsoft 365 Copilot e 100 utilizadores não licenciados. O custo estimado por dia baseia-se no seguinte cálculo: [(4x2)+(4x10)] x 100 users = 4,800 Copilot Credits.

Agente de processamento de pedidos

Um agente interno é acionado de forma autónoma sempre que uma nova encomenda é recebida pela organização. O agente usa uma única fonte de conhecimento para obter detalhes do produto sobre os itens solicitados e dispara 4 chamadas de ação para confirmar a disponibilidade do produto, visualizar os prazos de envio, aprovar o pedido e enviar um e-mail para o cliente com todos os detalhes. As ações e tópicos são ações de agentes em modo de orquestração generativa. O custo estimado por dia baseia-se no seguinte cálculo: [(4x5)] = 20 Copilot Credits.

Aplicação de penalidades por utilização excedida

Quando o consumo excede a capacidade disponível, o ambiente está em excesso. A Microsoft permite algum nível de consumo excedente, semelhante a um período de carência, para evitar bloquear processos empresariais.

Se o seu ambiente não tiver mais capacidade, você terá as seguintes opções:

  • Realoque a capacidade existente ao nível da organização (inquilino) ou do ambiente.

  • Adquira mais capacidade e disponibilize-a para o seu ambiente.

  • Configure um medidor de consumo ou um medidor pré-pago para gerir os excedentes.

Política de execução

Aplica-se a todos os clientes que operam sob o modelo de capacidade pré-pago do Copilot Studio para utilização de agentes personalizados (tanto conversacionais como ativados de forma autónoma).

Limite de utilização

A execução é acionada quando um inquilino atinge 125% da sua capacidade pré-paga.

Ação em utilização excedida (125%)

Os agentes personalizados estão desativados. Desativar um agente não interrompe uma conversação em curso. Todas as tentativas subsequentes de invocar o agente são rejeitadas até que a capacidade seja aumentada ou reiniciada.

Mecanismo de notificação

Uma notificação por e-mail é enviada ao administrador designado do locatário e a notificação também é publicada no centro de administração da Power Platform.

Comportamento do agente pós-execução

Depois de a imposição ser acionada e a conversação atual concluída, o agente é desativado. Quando os utilizadores finais tentam interagir com o agente após a imposição, recebem uma das seguintes respostas:

  • "Há um problema de faturação."
  • "Atualmente, este agente está indisponível. Atingiu o seu limite de utilização."

Exemplo de aplicação

Se o cliente aloca ou reserva capacidade num ambiente, o sistema honra essa capacidade. Considere o seguinte exemplo de um cliente com quatro ambientes diferentes e como é imposto o limite de crédito do Copilot.

Um cliente tem 25.000 créditos Copilot e utiliza a seguinte estrutura de alocação:

  • O Ambiente A tem 10.000 Créditos do Copilot atribuídos.
  • O ambiente B não tem alocação.
  • O ambiente C não tem alocação.
  • O Environment D tem uma alocação de 500 Créditos Copilot e utiliza o pay-as-you-go.

A alocação restante do inquilino é de 14.500 Créditos do Copilot. O Ambiente B e o Ambiente C retirarem e consumirem dos restantes 14.500 Créditos do Copilot. Se o consumo de Créditos do Copilot do Ambiente B e Ambiente C exceder 125% dos 14.500 Créditos do Copilot, a imposição excedentária é invocada.

Se o Ambiente A retirar ou consumir Créditos do Copilot contra a respetiva alocação de 10.000 Créditos do Copilot, aplica-se o cenário a seguir. Quando os 10.000 Créditos do Copilot são consumidos, o Ambiente A pode consumir do inquilino.

Se o Ambiente A consome da capacidade do inquilino, o Ambiente A junta-se ao Ambiente B e ao Ambiente C no consumo da capacidade do inquilino. Se o inquilino atingir 125% de consumo de Crédito do Copilot, a imposição é invocada.

Se o inquilino já estiver com 125% de consumo de Crédito do Copilot por causa do Ambiente B e do Ambiente C, a aplicação não será imposta aos agentes no Ambiente A, desde que o Ambiente A ainda tenha capacidade remanescente da sua alocação de 10.000 Créditos do Copilot.

Para o Ambiente D, quando o inquilino tem utilização excedida, este ambiente não é afetado. Porque, assim que o Ambiente D atingir o respetivo limite de 500 Créditos do Copilot, o medidor pay as you go é invocado.

Fiscalização do fluxo de agentes

A imposição do fluxo de agentes aplica-se especificamente aos fluxos de agentes e funciona de forma diferente da imposição geral de agentes.

Quando a capacidade pré-paga do Copilot Studio de um inquilino está totalmente esgotada, as novas execuções de fluxo de agentes são bloqueadas. Ao contrário da imposição geral de utilização excedida, que desativa agentes personalizados a 125% de capacidade, a imposição de fluxo de agentes visa apenas a execução de fluxo. O agente principal continua a funcionar normalmente para todas as interações que não envolvem fluxos, como respostas clássicas, respostas generativas e ações do agente.

Comportamento de fiscalização

Quando a imposição do fluxo de agentes está ativa:

  • Não podem ser iniciadas novas execuções de fluxo de agentes. As tentativas de desencadear um fluxo de agentes são rejeitadas.
  • As execuções de fluxo de agentes que já estão em curso são concluídas normalmente.
  • O agente mantém-se disponível para interações não de fluxo.
  • Os autores de fluxos veem um aviso de tempo de conceção no estruturador do Copilot Studio que indica que a capacidade está esgotada.
  • A fiscalização é reiniciada mensalmente quando os Créditos Copilot pré-pagos são renovados.

Isenções

Os seguintes cenários não são afetados pela fiscalização do fluxo de agentes:

  • Utilizadores licenciados Microsoft 365 Copilot: As ações de fluxo de agentes invocadas por utilizadores licenciados com Microsoft 365 Copilot não consomem capacidade pré-paga e não estão sujeitas a fiscalização. Saiba mais sobre o uso incluído para utilizadores do Microsoft 365 Copilot.
  • Execuções de teste: Testar um fluxo de agente no estruturador de fluxo ou a partir do chat de teste do agente não consome capacidade para ações de fluxo de agentes. Os testes não são bloqueados pela fiscalização.

Resolver a imposição do fluxo de agentes

Se a imposição do fluxo de agentes estiver ativa no seu ambiente, tem as seguintes opções:

  • Realoque a capacidade existente de outros ambientes no seu inquilino. No centro de administração da Power Platform, vá a Licensing>Copilot Studio e selecione Gerir créditos do Copilot.
  • Compre mais Créditos Copilot e atribua-os ao ambiente afetado.
  • Ative a faturação pay-as-you-go ligando um plano de subscrição Azure ao ambiente. Com pay as you go, a imposição não se aplica porque a utilização excedida é faturada na sua subscrição do Azure.

Para monitorizar o consumo de créditos de fluxo de agentes, aceda a Licenciamento>Copilot Studio>Ambientes, selecione o ambiente afetado e reveja a linha Ações de fluxo de agentes na grelha Detalhes do consumo de créditos do Copilot. Saiba mais sobre a gestão de créditos e capacidade do Copilot Studio.

Tip

Pode definir limites mensais de consumo para agentes individuais no centro de administração do Power Platform. Aceda a Licenciamento>Copilot Studio>Gerir Agentes para limitar a utilização de créditos antes de a imposição ser acionada.

Visualizar Consumo de Crédito Copilot

Pode visualizar os relatórios de consumo de crédito do Copilot no centro de administração da Power Platform.