Tipi di distribuzione per i modelli Foundry di Microsoft in Azure per enti pubblici

Quando si distribuisce un modello in Microsoft Foundry in Azure per enti pubblici, si sceglie un tipo di distribuzione che determina:

  • Posizione in cui vengono elaborati i dati (area dati o singola area)
  • Modalità di pagamento (pagamento per token o capacità riservata)
  • Caratteristiche delle prestazioni (varianza della latenza, limiti di velocità effettiva)

Il servizio offre due categorie principali: standard (con pagamento per token) e gestito sotto prenotazione (capacità riservata). All'interno di ogni categoria è possibile scegliere la zona dati o l'elaborazione a livello di area in base alle esigenze.

Screenshot della finestra di dialogo di distribuzione del portale Foundry che mostra la casella di selezione del tipo di distribuzione con l'opzione Standard globale selezionata.

Importante

Residenza dei dati per tutti i tipi di distribuzione: i dati archiviati inattivi rimangono nell'area di Azure designata. Tuttavia, l'elaborazione dei dati a fini inferenziali viene eseguita come segue:

  • USGov DataZone tipi: elaborati solo all'interno della zona dati USGov nel cloud di Azure per enti pubblici
  • Tipi standard/internazionali : elaborati nell'area di distribuzione

Confronto tra tipi di distribuzione

Tipo di distribuzione Codice SKU Elaborazione dei dati Fatturazione Migliore per
Zona Dati Standard DataZoneStandard All'interno dell'area dati Pagamento in base al token Conformità della zona dati USGov
Area dati configurata DataZoneProvisionedManaged All'interno dell'area dati PTU riservato Zona dati USGov + velocità effettiva prevedibile
Standard Standard Regione singola Pagamento in base al token Conformità regionale, volume basso
Provisionamento regionale ProvisionedManaged Regione singola PTU riservato Conformità regionale e capacità di trasmissione

Nota

Non tutti i modelli supportano tutti i tipi di distribuzione. Controllare Foundry Models venduto direttamente da Azure per la disponibilità del modello in base al tipo di distribuzione e all'area.

Nota

Le garanzie del contratto di servizio variano in base al tipo di distribuzione. I tipi di cui è stato effettuato il provisioning offrono una velocità effettiva garantita e una varianza di latenza inferiore. I tipi standard offrono un servizio al meglio delle possibilità. Per informazioni dettagliate, vedere il contratto di servizio Azure per Servizio Azure OpenAI.

Suggerimento

Per informazioni dettagliate sui prezzi, vedere Servizio Azure OpenAI prezzi.

Scegliere il tipo di distribuzione corretto

Usare i criteri seguenti per selezionare un tipo di distribuzione:

In base ai requisiti di residenza dei dati

  • zona dati USGov: Usare DataZone Standard o DataZone Provisionato in un'area Azure per enti pubblici
  • Solo area singola: usare provisioning standard o a livello di area

In base al modello di carico di lavoro

  • Traffico variabile, a scatti: Utilizzare Standard o DataZone (con pagamento per token)
  • Volume coerente elevato: utilizzare tipi provisionati (capacità riservata)

Per requisito di latenza

  • Richiesta bassa varianza di latenza: usare tipi provisionati
  • Varianza di latenza accettabile: usare i tipi Standard

Implementazioni della Zona Dati

Per i tipi di distribuzione DataZone , le richieste e le risposte vengono elaborate solo all'interno dell'area dati specificata:

  • USGov: dati elaborati all'interno delle due aree Azure per enti pubblici (USGovArizona o USGovVirginia)

Per altre informazioni, vedere la sezione "Disponibilità dell'area del modello per tipo di distribuzione" di Modeloli diFoundry venduti direttamente da Azure.

Nota

Con i tipi di distribuzione Standard della zona dati, se l'area primaria subisce un'interruzione del servizio, tutto il traffico inizialmente indirizzato a questa area è interessato. Per altre informazioni, vedere la guida alla disponibilità elevata e al ripristino di emergenza.

Zona Dati Standard

  • Nome SKU nel codice: DataZoneStandard

Le distribuzioni Data Zone Standard instradano dinamicamente il traffico ai datacenter all'interno della datazone definita da Microsoft (USGov). Questo tipo di distribuzione fornisce quote predefinite superiori rispetto ai tipi di distribuzione basati su geografia mantenendo i dati all'interno della zona specificata.

I clienti con un volume coerente elevato potrebbero riscontrare una maggiore variabilità di latenza. La soglia viene impostata per modello. Per altre informazioni sulle quote Azure OpenAI in Azure per enti pubblici, vedere Quote e limiti in Azure OpenAI. Per i carichi di lavoro che richiedono una bassa varianza di latenza in un volume elevato, prendere in considerazione i tipi di distribuzione preconfigurati.

Zona dati provisionata

  • Nome SKU nel codice: DataZoneProvisionedManaged

Le distribuzioni con provisioning della zona dati instradano dinamicamente il traffico all'interno della zona dati specificata da Microsoft (USGov) fornendo contemporaneamente capacità riservata di elaborazione del modello. Questo tipo di distribuzione combina la conformità della zona di dati con throughput elevato e prevedibile.

Standard

  • Nome SKU nel codice: Standard

Le distribuzioni standard usano la fatturazione con pagamento in base al token. Si paga solo per ciò che si consuma. I modelli disponibili in ciascuna regione e la capacità potrebbero essere limitati.

Le distribuzioni standard sono adatte per carichi di lavoro con volumi da bassi a medi e con picchi di attività elevati. I clienti con un volume coerente elevato potrebbero riscontrare una maggiore variabilità di latenza.

Provvigionamento regionale

  • Nome SKU nel codice: ProvisionedManaged

Le distribuzioni con provisioning regionale consentono di specificare la quantità di throughput necessaria in una distribuzione. Il servizio alloca quindi la capacità di elaborazione del modello necessaria e garantisce che sia pronta per l'utente. Il throughput è definito in termini di unità di throughput fornite (PTU), che è un modo standardizzato per rappresentare il throughput per la tua implementazione. Ogni coppia di versioni del modello richiede quantità diverse di PTU da distribuire e fornisce quantità diverse di velocità effettiva per PTU. I requisiti PTU minimi variano in base al modello. Per i minimi correnti e la capacità disponibile, vedere Concetti relativi alla velocità effettiva con provisioning.

Risoluzione dei problemi di distribuzione

Problemi comuni durante la creazione o l'uso delle distribuzioni:

Problema Causa Risoluzione
Tipo di distribuzione non disponibile Il modello non supporta il tipo selezionato Controllare la disponibilità del modello in base al tipo di distribuzione
Quota superata Limite di sottoscrizione raggiunto per i token al minuto Richiedi l'aumento della quota su Azure per enti pubblici AOAI Quota o utilizza un'altra area
Area non disponibile Modello non distribuito nell'area selezionata Selezionare un'area dall'elenco di disponibilità del modello
Capacità provisionata non disponibile Nessuna capacità PTU nell'area Provare una regione diversa o usare DataZone Provisioned per una maggiore disponibilità

Per i limiti di quota di Azure OpenAI per tipo di distribuzione in Azure per enti pubblici, consultare Quote e limiti in Azure OpenAI.

Monitoraggio degli abusi in Azure per enti pubblici

Non tutte le funzionalità di Monitoraggio dell'abuso sono abilitate per le distribuzioni di Azure OpenAI in Azure per enti pubblici. L'utente è responsabile dell'implementazione di misure tecniche e operative ragionevoli per rilevare e attenuare qualsiasi utilizzo del servizio in violazione delle condizioni del prodotto. La classificazione e il filtro dei contenuti automatizzati rimangono abilitati per impostazione predefinita per Azure per enti pubblici. Se sono necessari filtri di contenuto modificati, rivolgersi a Azure per enti pubblici Applicazione del Filtro Modificato.