Ferramenta LLM

Aviso

O desenvolvimento de recursos do Prompt Flow terminou em 20 de abril de 2026. O recurso será totalmente desativado em 20 de abril de 2027. Na data de desativação, o Fluxo de Prompt entra no modo somente leitura. Seus fluxos existentes continuarão a operar até essa data.

Recommended action: Migrar suas cargas de trabalho de Fluxo de Prompt para Microsoft Agent Framework antes de 20 de abril de 2027.

A ferramenta LLM (modelo de linguagem grande) no fluxo de prompt permite que você use modelos de linguagem grandes amplamente usados, como OpenAI, Azure OpenAI em Microsoft Modelos de Pesquisa ou qualquer modelo de linguagem compatível com a API de inferência de modelo de IA Azure para processamento de linguagem natural.

O fluxo de prompt fornece várias APIs de modelo de linguagem grandes:

Conclusão: os modelos de conclusão do OpenAI geram texto com base nos prompts fornecidos.
Chat: os modelos de chat do OpenAI e os modelos de chat Azure AI facilitam conversas interativas com entradas e respostas baseadas em texto.

A API embeddings não está disponível na ferramenta LLM. Use a ferramenta embedding para gerar inserções com OpenAI ou Azure OpenAI.

Note

A ferramenta LLM no fluxo de prompt não dá suporte a modelos de raciocínio (como OpenAI o1 ou o3). Para a integração de modelos de raciocínio, use a ferramenta Python para chamar as APIs de modelo diretamente. Para obter mais informações, consulte Call a reasoning model from the Python tool.

Pré-requisitos

Criar recursos do OpenAI:

OpenAI:
- Inscreva-se para obter uma conta no site do OpenAI.
- Entre e localize sua chave de API pessoal.
Azure OpenAI:
- Crie Azure recursos do OpenAI seguindo as instruções these. Use apenas caracteres ASCII em Azure nomes de grupo de recursos openai. O fluxo de prompt não dá suporte a caracteres não ASCII em nomes de grupo de recursos.
Modelos implantados em implantações padrão:
- Crie um ponto de extremidade com o modelo do catálogo desejado e implante-o com uma implantação padrão.
- Para usar modelos implantados na implantação padrão com suporte pela API de inferência de modelo de IA Azure, como Mistral, Cohere, Meta Llama ou Microsoft família de modelos (entre outros), create uma conexão em seu projeto com seu ponto de extremidade.

Conexões

Configure conexões para recursos provisionados no fluxo de prompt.

Tipo	Name	chave de API	Tipo de API	Versão da API
OpenAI	Obrigatório	Obrigatório	-	-
Azure OpenAI – Chave de API	Obrigatório	Obrigatório	Obrigatório	Obrigatório
Azure OpenAI – Microsoft Entra ID	Obrigatório	-	-	Obrigatório
Modelo sem servidor	Obrigatório	Obrigatório	-	-

Dica

Para usar Microsoft Entra ID tipo de autenticação para Azure conexão OpenAI, atribua a função Cognitive Services OpenAI User ou Cognitive Services OpenAI Contributor à identidade gerenciada atribuída pelo usuário ou pelo usuário.
Saiba mais sobre como especificar como usar a identidade do usuário para enviar a execução do fluxo.
Saiba mais sobre how to configure Azure OpenAI with managed identities.

Entradas

As seções a seguir mostram várias entradas.

Preenchimento de texto

Name	Tipo	Descrição	Obrigatório
solicitação	cadeia	Solicitação de texto para o modelo de idioma.	Sim
modelo, deployment_name	cadeia	Modelo de linguagem a ser usado.	Sim
número máximo de tokens	inteiro	Número máximo de tokens a serem gerados na conclusão. O padrão é 16.	No
Temperatura	derivar	Aleatoriedade do texto gerado. O padrão é 1.	No
Parar	lista	Sequência de interrupção para o texto gerado. O padrão é nulo.	No
Sufixo	cadeia	Texto acrescentado ao final da conclusão.	No
top_p	derivar	Probabilidade de usar a escolha superior dos tokens gerados. O padrão é 1.	No
logprobs	inteiro	Número de probabilidades de log a serem geradas. O padrão é nulo.	No
echo	booleano	Valor que indica se o prompt deve ser ecoado novamente na resposta. O padrão é false.	No
penalidade_de_presença	derivar	Valor que controla o comportamento do modelo para frases recorrentes. O padrão é 0.	No
frequency_penalty	derivar	Valor que controla o comportamento do modelo para gerar frases raras. O padrão é 0.	No
melhor_de	inteiro	Número de conclusões recomendadas a serem geradas. O padrão é 1.	No
logit_bias	dicionário	Viés de logit para o modelo de idioma. O padrão é um dicionário vazio.	No

Chat

Name	Tipo	Descrição	Obrigatório
solicitação	cadeia	Prompt de texto que o modelo de idioma usa para uma resposta.	Sim
modelo, deployment_name	cadeia	Modelo de linguagem a ser usado. Esse parâmetro não será necessário se o modelo for implantado em uma implantação padrão.	Sim*
número máximo de tokens	inteiro	Número máximo de tokens a serem gerados na resposta. O padrão é inf.	No
Temperatura	derivar	Aleatoriedade do texto gerado. O padrão é 1.	No
Parar	lista	Sequência de interrupção para o texto gerado. O padrão é nulo.	No
top_p	derivar	Probabilidade de usar a escolha superior dos tokens gerados. O padrão é 1.	No
penalidade_de_presença	derivar	Valor que controla o comportamento do modelo para frases recorrentes. O padrão é 0.	No
frequency_penalty	derivar	Valor que controla o comportamento do modelo para gerar frases raras. O padrão é 0.	No
logit_bias	dicionário	Viés de logit para o modelo de idioma. O padrão é um dicionário vazio.	No

Saídas

API	Tipo de retorno	Descrição
Completion	cadeia	Texto de uma conclusão prevista
Chat	cadeia	Texto de uma resposta da conversa

Usar a ferramenta LLM

Configure e selecione as conexões com recursos do OpenAI ou com uma implantação padrão.
Configure a API do modelo de linguagem grande e seus parâmetros.
Prepare o prompt com diretrizes.

Comentários

Esta página foi útil?

Last updated on 2026-06-01