Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Visualizzazione attuale:Versione del portale Foundry (versione classica) - Passa alla versione per il nuovo portale Foundry
Suggerimento
È disponibile un articolo alternativo sulla quota incentrata sull'hub: Gestire e aumentare le quote per le risorse dell'hub.
La quota offre la flessibilità necessaria per gestire attivamente l'allocazione dei limiti di capacità tra le distribuzioni all'interno della sottoscrizione. Azure assegna la quota per sottoscrizione, per area e per modello in unità di token al minuto (TPM). Diversi tipi di distribuzione, ad esempio Standard e Provisioning, hanno meccanismi di quota diversi. Per informazioni dettagliate sui limiti e i livelli di quota predefiniti, vedere limiti e quote di Azure OpenAI.
Questo articolo illustra il processo di gestione della quota per i modelli foundry Microsoft distribuiti in un progetto Foundry, tra cui come visualizzare le allocazioni correnti e gli aumenti delle richieste.
Prerequisiti
- Sottoscrizione Azure. Crearne uno gratuitamente.
- Progetto Foundry.
- Ruolo Lettore utilizzi dei servizi cognitivi a livello di sottoscrizione, per visualizzare le allocazioni delle quote.
- Ruolo di Proprietario o di Collaboratore sulla sottoscrizione per richiedere aumenti della quota.
- Ruolo Collaboratore servizi cognitivi combinato con Lettore utilizzi servizi cognitivi, per modificare le allocazioni delle quote nel portale di Foundry.
Quota condivisa Foundry
Foundry fornisce un pool di quote condivise che possono essere usate simultaneamente da utenti diversi in diverse aree. A seconda della disponibilità, gli utenti possono accedere temporaneamente alla quota dal pool condiviso e usare la quota per eseguire test per un periodo di tempo limitato. La durata specifica dipende dal caso d'uso. Usando temporaneamente la quota dal pool di quote, non è più necessario inviare un ticket di supporto per un aumento della quota a breve termine o attendere l'approvazione della richiesta di quota prima di poter procedere con il carico di lavoro.
È possibile utilizzare il pool di quote condivise per testare le inferenze dei modelli Foundry presenti nel catalogo dei modelli. Usare la quota condivisa solo per creare endpoint di test temporanei, non endpoint di produzione. Per gli endpoint nell'ambiente di produzione, è necessario richiedere una quota dedicata. La fatturazione per la quota condivisa è basata sull'utilizzo.
Visualizzare e richiedere quote nel portale foundry
Usare le quote per gestire l'allocazione della quota del modello tra più progetti Foundry nella stessa sottoscrizione.
-
Accedere a Microsoft Foundry. Assicurarsi che l'interruttore New Foundry sia disattivato. Questi passaggi fanno riferimento a Foundry (versione classica).
Selezionare Centro di gestione nella parte inferiore del riquadro sinistro.
Selezionare Quota nel riquadro sinistro per aprire la visualizzazione quota, in cui è possibile visualizzare la quota per i modelli in aree Azure specifiche.
Per richiedere la quota dalla vista delle quote, espandere uno dei raggruppamenti elencati nella colonna di distribuzioni fino a quando non si visualizzano le distribuzioni del modello e le relative informazioni associate.
- Utilizzare l'interruttore Mostra tutte le quote per visualizzare tutte le quote o solo la quota attualmente allocata.
- Usare l'elenco a discesa Raggruppa per per raggruppare l'elenco in base a Tipo di quota, Area e modello, oppure a Tipo di quota, Modello e area, oppure Nessuno. L'opzione Nessuno visualizza un elenco semplice di distribuzioni di modelli, anziché un elenco annidato.
- Nella voce di riga per una determinata distribuzione del modello selezionare l'icona a forma di matita nella colonna Allocazione quota per modificare l'allocazione della quota per la distribuzione del modello.
- Selezionare Richiedi quota nella colonna Richiedi quota per richiedere l'aumento della quota per il tipo di distribuzione standard.
- Usare i grafici sul lato della pagina per visualizzare altri dettagli sull'utilizzo delle quote. I grafici sono interattivi; passando il puntatore del mouse su una sezione del grafico vengono visualizzate altre informazioni e selezionando il grafico viene filtrato l'elenco dei modelli. La selezione della legenda del grafico filtra i dati visualizzati nel grafico.
- Usare il collegamento Capacità con provisioning per visualizzare le informazioni sui modelli con provisioning, incluso un calcolatore della capacità utile per stimare il numero di PTU necessari per il carico di lavoro.
Nota
Dopo aver modificato un'allocazione di quota o inviato una richiesta, attendere fino a 15 minuti per la propagazione delle modifiche. Aggiornare la pagina Quota per verificare l'allocazione aggiornata.
Risoluzione dei problemi
Se si verificano problemi durante la visualizzazione o la richiesta di quote, provare queste soluzioni:
| Problema | Soluzione |
|---|---|
| La pagina Quota è vuota o non mostra allocazioni | Verificare di avere il ruolo di Lettore utilizzi servizi cognitivi a livello di sottoscrizione. Verificare di visualizzare l'abbonamento corretto nel portale. |
| Il pulsante Richiedi quota è disabilitato | Verificare di avere il ruolo Proprietario o Collaboratore nella sottoscrizione. Alcune combinazioni di modelli e aree potrebbero non supportare l'aumento della quota. |
| Modifica della quota non riflessa dopo l'approvazione | La propagazione delle modifiche alla quota può richiedere fino a 15 minuti. Aggiornare la pagina Quota . Se il problema persiste dopo 24 ore, contattare supporto tecnico di Azure. |
| Impossibile trovare la quota per un modello specifico | Controllare la disponibilità a livello di area. Non tutti i modelli sono disponibili in tutte le aree. Vedere Supporto per l'area. |