architettura Microsoft Foundry (versione classica)

Visualizzazione attuale:Versione del portale Foundry (versione classica) - Passa alla versione per il nuovo portale Foundry

Nota

I collegamenti in questo articolo potrebbero aprire contenuto nella nuova documentazione di Microsoft Foundry anziché nella documentazione di Foundry (versione classica) visualizzata.

Microsoft Foundry organizza i carichi di lavoro di intelligenza artificiale tramite un'architettura a più livelli: una risorsa Foundry di primo livello per la governance, i progetti per l'isolamento dello sviluppo e i servizi di Azure connessi per l'archiviazione, la ricerca e la gestione dei segreti.

Questo articolo fornisce ai team IT operazioni e sicurezza con informazioni dettagliate sulla risorsa Foundry e sull'architettura del servizio Azure sottostante, i relativi componenti e la relativa relazione con altri tipi di risorse Azure. Usare queste informazioni come guida per personalizzare la distribuzione di Foundry in base ai requisiti dell'organizzazione. Per altre informazioni su come implementare Foundry nell'organizzazione, vedere Foundry Rollout.

Quando usare questa architettura

Prendere in considerazione il modello di risorsa Foundry quando lo scenario prevede:

  • Configurazione per la prima volta: si sta avviando un nuovo progetto di intelligenza artificiale e si vuole una singola risorsa che aggrega l'accesso al modello, l'hosting dell'agente e gli strumenti di valutazione.
  • Accesso multi-team: più team necessitano di progetti isolati con distribuzioni di modelli condivise e governance centralizzata.
  • Design guidato dalla conformità: l'organizzazione richiede rete privata, crittografia gestita dal cliente o Azure RBAC sia a livello di risorsa che di progetto.
  • Azure OpenAI migrazione: si sta passando da una risorsa Azure OpenAI autonoma e si vogliono mantenere i criteri aziendali e i ruoli RBAC esistenti mentre si aggiungono funzionalità di agente e di valutazione.

Per l'esplorazione a singolo sviluppatore, una risorsa Foundry con un progetto è l'impostazione predefinita consigliata. Se il carico di lavoro richiede solo i completamenti Azure OpenAI senza l'hosting o la valutazione dell'agente, potrebbe essere sufficiente una risorsa Azure OpenAI autonoma.

Tipi di risorse di intelligenza artificiale e provider di Azure

All'interno della famiglia di prodotti di intelligenza artificiale Azure è possibile usare questi provider di risorse Azure che supportano le esigenze degli utenti a livelli diversi nello stack.

Fornitore di risorse Scopo Servizi supportati
Microsoft. Servizi cognitivi Supporta lo sviluppo di applicazioni Agentic e GenAI che compongono e personalizzano modelli predefiniti. Fonderia; Azure OpenAI; Azure Speech negli strumenti di Fonderia; Azure Language negli strumenti di Fonderia; Azure Vision negli strumenti di Fonderia
Microsoft.Ricerca Supporta il recupero di conoscenze dai tuoi dati Azure AI Search

Per la maggior parte degli scenari di sviluppo di intelligenza artificiale, inclusi i flussi di lavoro di compilazione, distribuzione di modelli e valutazione dell'agente, la risorsa Foundry è il punto di partenza consigliato. Le risorse fonderia condividono lo spazio dei nomi del provider Microsoft.CognitiveServices con servizi quali Azure OpenAI, Speech, Vision e Linguaggio. Questo spazio dei nomi del provider condiviso consente di allineare le API di gestione, i modelli di controllo di accesso, la rete e il comportamento dei criteri tra le risorse di intelligenza artificiale correlate.

Usare la tabella seguente per identificare il tipo di risorsa corrispondente al carico di lavoro. Mostra i tipi di risorse e le funzionalità specifici all'interno del provider Microsoft.CognitiveServices.

Tipo di risorsa Provider di risorse e tipo Tipo Funzionalità supportate
Microsoft Foundry Microsoft.CognitiveServices/accounts AIServices Agenti, valutazioni, Azure OpenAI, Riconoscimento vocale, Visione, Lingua e Comprensione del contenuto
Progetto Foundry Microsoft.CognitiveServices/accounts/projects AIServices Sottorisorsa a quanto sopra
Azure Servizio Vocale negli strumenti Foundry Microsoft.CognitiveServices/accounts Speech Discorso
Azure Language in Foundry Tools Microsoft.CognitiveServices/accounts Language Lingua
Azure Vision negli strumenti di Foundry Microsoft.CognitiveServices/accounts Vision Visione

I tipi di risorse nello stesso spazio dei nomi del provider condividono le stesse API di gestione e usano azioni simili di Azure controllo degli accessi basato sui ruoli (Azure RBAC), configurazioni di rete e alias per la configurazione di Criteri di Azure. Se si esegue l'aggiornamento da Azure OpenAI a Foundry, i criteri di Azure personalizzati esistenti e le azioni di controllo degli accessi in base al ruolo Azure continuano a essere applicate.

Gerarchia delle risorse di foundry

Il diagramma seguente mostra una risorsa Foundry con distribuzioni di modelli, impostazioni di sicurezza, connessioni e due progetti. I servizi di Azure connessi, ad esempio Archiviazione, Key Vault e Azure AI Search sono risorse separate Azure ai propri limiti di governance:

Diagramma che mostra la gerarchia delle risorse foundry con un limite di governance contenente distribuzioni di modelli, impostazioni di sicurezza, connessioni e due progetti. Le risorse connesse come Archiviazione, Key Vault e Azure AI Search vengono visualizzate come limiti di governance separati.

Importante

Le risorse connesse, ad esempio Archiviazione, Key Vault e Azure AI Search, sono risorse indipendenti Azure con i propri limiti di governance. È possibile gestire le impostazioni di rete, criteri di accesso e conformità per queste risorse separatamente dalla risorsa Foundry.

Usare questo modello durante la pianificazione dell'architettura e dei limiti di accesso:

  • risorsa Foundry: risorsa di Azure di primo livello in cui si gestiscono impostazioni di governance come rete, sicurezza e distribuzioni di modelli.
  • Project: limite di sviluppo all'interno della risorsa Foundry in cui i team compilano e valutano i casi d'uso. I progetti consentono ai team di creare prototipi all'interno di un ambiente preconfigurato, riutilizzando distribuzioni e connessioni di modelli esistenti senza ripetere la configurazione IT.
  • Asset di progetto: file, agenti, valutazioni e artefatti correlati nell'ambito del progetto.
  • Risorse connesse: servizi Azure come Archiviazione, Key Vault e Azure AI Search a cui fa riferimento la risorsa Foundry tramite connessioni. Queste risorse hanno limiti di governance separati, quindi è possibile gestire i criteri di rete e di accesso in modo indipendente.

Questa separazione consente ai team IT di applicare controlli centralizzati a livello di risorsa mentre i team di sviluppo lavorano entro i limiti a livello di progetto.

Nota

La maggior parte delle nuove API è disponibile nell'ambito del progetto. Tuttavia, alcune funzionalità originariamente supportate a livello di account tramite Azure i servizi OpenAI, Speech, Vision e Language sono disponibili solo a livello di risorsa Foundry, non nell'ambito del progetto. Ad esempio, l'API Translator è disponibile solo a livello di risorsa Foundry. Pianificare la struttura di distribuzione in base agli ambiti API necessari per i carichi di lavoro.

Separazione degli ambiti guidata dalla sicurezza

Foundry applica una netta separazione tra le operazioni di gestione e sviluppo per garantire carichi di lavoro di intelligenza artificiale sicuri e scalabili.

Governance delle risorse di primo livello

Le operazioni di gestione delle risorse Foundry di livello superiore, come la configurazione della sicurezza, la definizione della connettività con altri servizi Azure, e la gestione delle distribuzioni. I contenitori di progetti dedicati isolano le attività di sviluppo e forniscono limiti per il controllo di accesso, i file, gli agenti e le valutazioni.

Controllo degli accessi in base al ruolo

Azure azioni di controllo degli accessi in base al ruolo riflettono questa separazione delle preoccupazioni. Le azioni del livello di controllo, ad esempio la creazione di distribuzioni e progetti, sono distinte dalle azioni del livello dati, ad esempio la creazione di agenti, l'esecuzione di valutazioni e il caricamento di file. È possibile definire l'ambito delle assegnazioni RBAC (controllo degli accessi in base al ruolo) sia a livello di risorsa di primo livello che a livello di singolo progetto. Assegnare identità gestite in entrambi gli ambiti per supportare l'automazione sicura e l'accesso al servizio. Per altre informazioni, vedere Controllo degli accessi in base al ruolo per Microsoft Foundry.

Gli incarichi iniziali comuni per l'inserimento con privilegi minimi includono:

  • Azure Utente di intelligenza artificiale per ogni entità utente sviluppatore nell'ambito della risorsa Foundry.
  • Utente di Azure AI per ogni identità gestita del progetto nell'ambito delle risorse di Foundry.

Per le definizioni dei ruoli e le indicazioni sulla pianificazione dell'ambito, vedere Controllo degli accessi in base al ruolo per Microsoft Foundry.

Monitoraggio e osservabilità

Monitoraggio di Azure suddivide le metriche in base all'ambito. È possibile visualizzare le metriche di gestione e utilizzo nella risorsa di primo livello, mentre le metriche specifiche del progetto, ad esempio le prestazioni di valutazione o l'attività dell'agente, hanno come ambito i singoli contenitori di progetto.

Le principali funzionalità di monitoraggio includono:

  • Metriche a livello di risorsa: consumo di token, latenza del modello, conteggi delle richieste e percentuali di errore in tutti i progetti.
  • Metriche a livello di progetto: risultati delle esecuzioni di valutazione, conteggi delle chiamate dell'agente e attività delle operazioni sui file.
  • Registrazione diagnostica: Abilitare le impostazioni di diagnostica per indirizzare i log verso Log Analytics, Archiviazione o Hub eventi per l'analisi e la conservazione.

Per altre informazioni, vedere panoramica Monitoraggio di Azure.

Infrastruttura di calcolo

Foundry gestisce l'infrastruttura di calcolo per l'hosting del modello, l'esecuzione dell'agente e l'elaborazione batch.

Tipi di distribuzione del modello

La distribuzione standard nelle risorse foundry fornisce l'architettura di hosting del modello.

Calcolo gestito per agenti e valutazioni

Gli agenti, le valutazioni e i processi batch funzionano come elaborazione del contenitore gestito, completamente gestiti da Microsoft. Le valutazioni richiamano gli endpoint del modello e confrontano gli output con i criteri di classificazione. Foundry archivia i risultati nell'ambito del progetto, accessibile tramite il portale o l'SDK.

Integrazione della rete virtuale

Quando gli agenti si connettono con sistemi esterni, è possibile isolare il traffico di rete usando iniezione del contenitore, in cui la piattaforma inserisce una subnet nella rete virtuale, abilitando la comunicazione locale con le risorse Azure all'interno della stessa rete virtuale.

Foundry supporta due modelli di rete per l'isolamento in uscita:

Modello Come funziona Compromesso
Rete virtuale gestita dal cliente (BYO) Devi fornire la VNet e una subnet dedicata delegata a Microsoft.App/environments. La piattaforma si integra nella tua subnet, consentendo la comunicazione locale con le tue risorse Azure private. Controllo completo sulla configurazione di rete; richiede una gestione di rete personalizzata.
Rete virtuale gestita (anteprima) Foundry gestisce la rete virtuale per conto dell'utente. Configurazione più semplice; limita le opzioni di personalizzazione. Per informazioni dettagliate, vedere Configurare la rete virtuale gestita.

Nota

Alcuni scenari isolati dalla rete richiedono l'SDK o l'interfaccia della riga di comando anziché il portale. Ad esempio, le distribuzioni con endpoint privati che bloccano tutti gli accessi pubblici non sono configurabili tramite l'interfaccia utente del portale. Per informazioni dettagliate, vedere Come configurare un collegamento privato per Foundry.

Isolamento del tenant

Microsoft-managed compute esegue carichi di lavoro in ambienti isolati logicamente per ogni progetto. Il codice del cliente non condivide i contenitori di runtime con altri tenant.

Sicurezza dei contenuti e protezioni

Foundry integra i controlli di sicurezza dei contenuti nella pipeline di inferenza del modello e dell'agente. Le guardrail definiscono i rischi da rilevare, i punti di intervento da esaminare (input utente, output, chiamate agli strumenti (anteprima) e risposte degli strumenti (anteprima)), e le azioni di risposta quando viene rilevato un rischio. I filtri contenuto vengono eseguiti in linea con le richieste di modello e possono essere configurati per ogni implementazione. Per altre informazioni, vedere Cenni preliminari su guardrail e controlli, e Livelli di gravità del filtro del contenuto.

Scalabilità

Le risorse di calcolo gestite per agenti e valutazioni vengono ridimensionate automaticamente in base alla richiesta di carico di lavoro. L'hosting di modelli viene ridimensionato in base alla configurazione della distribuzione.

Disponibilità regionale

Le capacità di calcolo variano in base alla regione di Azure. Disponibilità del modello, opzioni del tipo di distribuzione e supporto delle funzionalità, ad esempio agenti o valutazioni, possono variare in diverse aree. Verificare che l'area di destinazione supporti le funzionalità necessarie prima del provisioning. Per la disponibilità corrente, vedere Disponibilità delle funzionalità tra aree cloud.

Archiviazione dei dati

Foundry offre opzioni di archiviazione dei dati flessibili e sicure per supportare un'ampia gamma di carichi di lavoro di intelligenza artificiale.

Archiviazione gestita per il caricamento di file

Nella configurazione predefinita, Foundry usa account di archiviazione gestiti Microsoft che sono separati logicamente e supportano i caricamenti diretti dei file per i casi d'uso selezionati, ad esempio modelli OpenAI e agenti, senza richiedere un account di archiviazione fornito dal cliente.

Porta il tuo dispositivo di archiviazione

Facoltativamente, è possibile connettere i propri account Archiviazione di Azure. Gli strumenti foundry, come le valutazioni e l'elaborazione batch, possono leggere gli input da questi account e scrivere output verso questi account. Per informazioni dettagliate sugli scenari supportati, vedere Bring-your-own resources with the Agent service.

Archiviazione dello stato dell'agente

  • Con la configurazione dell'agente basic, il servizio Agent archivia thread, messaggi e file nell'archiviazione multi-tenant gestita Microsoft, con separazione logica.
  • Con la configurazione dell'agente standard, è possibile usare risorse Azure personalizzate per tutti i dati dei clienti, inclusi file, conversazioni e archivi vettoriali. In questa configurazione i dati vengono isolati dal progetto all'interno degli account di archiviazione.

Crittografia della chiave gestita dal cliente

Per impostazione predefinita, i servizi di Azure crittografano i dati a riposo e in transito usando chiavi gestite da Microsoft con crittografia AES a 256 bit conforme allo standard FIPS 140-2. Non sono necessarie modifiche al codice.

Per usare le chiavi personalizzate, verificare invece questi prerequisiti prima di abilitare le chiavi gestite dal cliente per Foundry:

  • Key Vault viene distribuito nella stessa area Azure della risorsa Foundry.
  • L'eliminazione temporanea e la protezione dalla rimozione definitiva sono abilitate in Key Vault.
  • Le identità gestite dispongono delle autorizzazioni di chiave necessarie, ad esempio il ruolo Utente Crypto di Key Vault quando si usa Azure Controllo degli Accessi in Base al Ruolo.

Crea il tuo Key Vault

Per impostazione predefinita, Foundry archivia tutti i segreti di connessione basati su chiavi API in un Azure Key Vault gestito. Se preferite gestire i segreti manualmente, collegate il vostro Vault delle chiavi alla risorsa Foundry. Una connessione Azure Key Vault gestisce tutti i segreti di connessione a livello di progetto e risorsa. Per altre informazioni, vedere come configurare una connessione Azure Key Vault a Foundry.

Per altre informazioni sulla crittografia dei dati, vedere Chiavi gestite dal cliente per la crittografia con Foundry.

Residenza e conformità dei dati

Foundry archivia tutti i dati inattivi nell'area geografica Azure designata. I dati di inferenza (richieste e completamenti) vengono elaborati in base al tipo di distribuzione: le distribuzioni globali potrebbero instradare verso qualsiasi area Azure, le distribuzioni di zone dati rimangono all'interno dell'area Stati Uniti o dell'UE, e le distribuzioni standard o regionali vengono elaborate nell'area di distribuzione. Per informazioni dettagliate, vedere Tipi di distribuzione. Foundry non supporta il failover automatico tra regioni. Se l'organizzazione richiede la disponibilità in più aree, distribuire risorse Foundry separate in ogni area di destinazione e gestire la sincronizzazione e il routing dei dati a livello di applicazione. Per informazioni dettagliate sulla certificazione di conformità, vedere Azure documentazione sulla conformità.

Convalidare le decisioni relative all'architettura

Prima dell'implementazione, convalidare quanto segue per l'ambiente di destinazione: