Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Warning
Lo sviluppo delle funzionalità di Prompt Flow è terminato il 20 aprile 2026. La funzionalità verrà ritirata completamente il 20 aprile 2027. Alla data di ritiro, Prompt Flow passa alla modalità di sola lettura. I flussi esistenti continueranno a funzionare fino a tale data.
Recommended action: Eseguire la migrazione dei carichi di lavoro del flusso di richiesta a Microsoft Agent Framework prima del 20 aprile 2027.
Lo strumento LLM (Large Language Model) nel flusso di richiesta consente di usare modelli linguistici di grandi dimensioni ampiamente usati, ad esempio OpenAIAzure OpenAI in Microsoft Foundry Models o qualsiasi modello linguistico supportato dall'API di inferenza del modello di intelligenza artificiale Azure per l'elaborazione del linguaggio naturale.
Il flusso dei prompt offre diverse API del modello linguistico di grandi dimensioni:
- Completamento: i modelli di completamento di OpenAI generano testo in base alle richieste fornite.
- Chat: modelli di chat e Azure AI i modelli di chat facilitano conversazioni interattive con input e risposte basati su testo.
L'API Incorporamenti non è disponibile nello strumento LLM. Usare lo strumento di embedding per generare incorporamenti con OpenAI o Azure OpenAI.
Note
Lo strumento LLM nel flusso di richiesta non supporta i modelli di ragionamento( ad esempio OpenAI o1 o o3). Per l'integrazione del modello di ragionamento, usare lo strumento Python per chiamare direttamente le API del modello. Per altre informazioni, vedere Call a reasoning model from the Python tool.
Prerequisites
Creare risorse OpenAI:
OpenAI:
- Iscriversi per ottenere un account nel sito Web OpenAI.
- Accedere e trovare la chiave API personale.
Azure OpenAI:
Modelli distribuiti nelle distribuzioni standard:
- Creare un endpoint con il modello dal catalogo desiderato e distribuirlo con una distribuzione standard.
- Per usare i modelli distribuiti nella distribuzione standard supportata dall'API di inferenza del modello di intelligenza artificiale Azure, ad esempio Mistral, Cohere, Meta Llama o Microsoft famiglia di modelli (tra gli altri), creare una connessione nel progetto all'endpoint.
Connections
Configurare le connessioni alle risorse di cui è stato effettuato il provisioning nel flusso di richiesta.
| Type | Name | API key | API type | API version |
|---|---|---|---|---|
| OpenAI | Required | Required | - | - |
| Azure OpenAI - Chiave API | Required | Required | Required | Required |
| Azure OpenAI - Microsoft Entra ID | Required | - | - | Required |
| Serverless model | Required | Required | - | - |
Tip
- Per usare Microsoft Entra ID tipo di autenticazione per Azure connessione OpenAI, assegnare il ruolo
Cognitive Services OpenAI UseroCognitive Services OpenAI Contributorall'identità gestita assegnata dall'utente o dall'utente. - Altre informazioni su come specificare per usare l'identità utente per inviare l'esecuzione del flusso.
- Altre informazioni su come configurare Azure OpenAI con identità gestite.
Inputs
Le sezioni seguenti illustrano vari input.
Text completion
| Name | Type | Description | Required |
|---|---|---|---|
| prompt | string | Richiesta di testo per il modello linguistico. | Yes |
| model, deployment_name | string | Modello linguistico da usare. | Yes |
| max_tokens | integer | Numero massimo di token da generare nel completamento. Il valore predefinito è 16. | No |
| temperature | float | Casualità del testo generato. Il valore predefinito è 1. | No |
| stop | list | Sequenza di arresto per il testo generato. Il valore predefinito è Null. | No |
| suffix | string | Testo aggiunto alla fine del completamento. | No |
| top_p | float | Probabilità di usare la scelta principale dai token generati. Il valore predefinito è 1. | No |
| logprobs | integer | Numero di probabilità di log da generare. Il valore predefinito è Null. | No |
| echo | boolean | Valore che indica se eseguire l'eco del prompt nella risposta. Il valore predefinito è false. | No |
| presence_penalty | float | Valore che controlla il comportamento del modello per le frasi ripetute. Il valore predefinito è 0. | No |
| frequency_penalty | float | Valore che controlla il comportamento del modello per la generazione di frasi rare. Il valore predefinito è 0. | No |
| best_of | integer | Numero di completamento migliori da generare. Il valore predefinito è 1. | No |
| logit_bias | dictionary | Distorsione logit per il modello linguistico. Il valore predefinito è un dizionario vuoto. | No |
Chat
| Name | Type | Description | Required |
|---|---|---|---|
| prompt | string | Richiesta di testo usata dal modello linguistico per una risposta. | Yes |
| model, deployment_name | string | Modello linguistico da usare. Questo parametro non è obbligatorio se il modello viene distribuito in una distribuzione standard. | Yes* |
| max_tokens | integer | Numero massimo di token da generare nella risposta. Il valore predefinito è inf. | No |
| temperature | float | Casualità del testo generato. Il valore predefinito è 1. | No |
| stop | list | Sequenza di arresto per il testo generato. Il valore predefinito è Null. | No |
| top_p | float | Probabilità di usare la scelta principale dai token generati. Il valore predefinito è 1. | No |
| presence_penalty | float | Valore che controlla il comportamento del modello per le frasi ripetute. Il valore predefinito è 0. | No |
| frequency_penalty | float | Valore che controlla il comportamento del modello per la generazione di frasi rare. Il valore predefinito è 0. | No |
| logit_bias | dictionary | Distorsione logit per il modello linguistico. Il valore predefinito è un dizionario vuoto. | No |
Outputs
| API | Return type | Description |
|---|---|---|
| Completion | string | Testo di un completamento stimato |
| Chat | string | Testo di una risposta di conversazione |
Usare lo strumento LLM
- Configurare e selezionare le connessioni alle risorse OpenAI o a una distribuzione standard.
- Configurare l'API del modello linguistico di grandi dimensioni e i relativi parametri.
- Preparare il prompt con indicazioni.