Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Gli elementi contrassegnati (anteprima) in questo articolo sono attualmente in anteprima pubblica. Questa anteprima viene fornita senza un contratto di servizio e non è consigliabile per i carichi di lavoro di produzione. Alcune funzionalità potrebbero non essere supportate o potrebbero avere funzionalità limitate. Per altre informazioni, vedere Condizioni supplementari per l'utilizzo delle anteprime di Microsoft Azure.
Grazie all'integrazione con Fireworks AI, i clienti Microsoft Foundry possono:
- Experimenta con i modelli open source più recenti spesso prima che siano disponibili direttamente da Azure.
- Importare e distribuire pesi del modello personalizzati (bring your own model o BYOM) nell'infrastruttura supportata dalla GPU su richiesta di Fireworks. Per altre informazioni, vedere Importare modelli personalizzati in Microsoft Foundry with Fireworks.
- Aumentare le prestazioni usando la velocità effettiva con provisioning.
Tutte queste funzionalità sono disponibili direttamente all'interno del progetto Foundry, con Azure governance, controlli di accesso e gestione dei progetti incorporati.
Prerequisiti
- Sottoscrizione Azure. Se non ne hai uno, crea un account gratuito.
- Risorsa Foundry con un progetto Foundry.
- Un'identità di Azure con il ruolo di Proprietario dell'abbonamento o di Contributore dell'abbonamento per abilitare la funzionalità di anteprima.
- Per distribuire i modelli, è necessario il ruolo Proprietario di Azure AI nel progetto Foundry. Per ulteriori informazioni, vedere ruoli predefiniti di Azure.
Disponibilità dell'area
Le distribuzioni standard dei modelli tramite Fireworks su Foundry nella Data Zone sono disponibili nelle seguenti aree Azure:
- Stati Uniti orientali (eastus)
- Stati Uniti orientali 2 (eastus2)
- Stati Uniti centrali (centralus)
- Stati Uniti centro-settentrionali (northcentralus)
- Stati Uniti occidentali (westus)
- Stati Uniti occidentali 3 (westus3)
Le distribuzioni globali del throughput con provisioning di modelli di base e personalizzati sono disponibili in tutte le regioni globali di Azure, ad eccezione degli ambienti cloud di Azure per enti pubblici.
Abilitare Fuochi d'artificio su Foundry
Importante
Fuochi d'artificio su Foundry è attualmente escluso dagli impegni relativi ai limiti dei dati dell'UE.
FedRAMP non è realizzato per Fuochi d'artificio su Foundry. Se l'organizzazione richiede FedRAMP, prima dell'uso, rivolgersi al funzionario dell'autorizzazione per determinare se è consentito l'uso di Fuochi d'artificio su Foundry.
Payment Card Industry (PCI) Data Security Standard (DSS) non è applicabile a Fireworks on Foundry. Non dovresti usare Fireworks su Foundry per archiviare, elaborare o trasmettere dati di pagamento e dati dei titolari di carta.
Durante l'anteprima, Fireworks richiede un amministratore per abilitare la funzionalità di anteprima all'interno della sottoscrizione Azure.
Accedere al portale Azure.
Nella casella di ricerca immettere sottoscrizioni e selezionare Sottoscrizioni.
Selezionare il collegamento per il nome della sottoscrizione.
Nel menu a sinistra, in Impostazioni selezionare Funzionalità di anteprima.
Cercare e selezionare la funzionalità di anteprima Fireworks.EnableDeploy.
Esaminare le condizioni fornite nella sezione Descrizione e privacy dei dati in questa documentazione.
Se non si accettano i termini, selezionare Chiudi e non continuare. In caso contrario, selezionare Registra.
Selezionare OK. La schermata Anteprima funzionalità viene aggiornata e viene visualizzato lo stato della funzionalità di anteprima. L'abilitazione della funzionalità per la sottoscrizione potrebbe richiedere fino a 30 minuti.
Suggerimento
Per verificare la registrazione, aggiornare la pagina Delle funzionalità di anteprima e verificare che la colonna Stato mostri Registrato per la funzionalità Fuochi d'artificio in Foundry .
Distribuire i modelli di Fireworks dal portale Foundry
Dopo aver abilitato la funzionalità, è possibile distribuire i modelli Fireworks dal catalogo dei modelli Foundry. Per ottenere un endpoint live per i completamenti della chat, segui questi passaggi. Esplorare i modelli disponibili nella sezione Modelli di catalogo disponibili oppure importare un modello personalizzato.
Nella home page del portale, selezionare Scopri nella navigazione in alto a destra.
Nel riquadro sinistro selezionare Modelli per aprire il catalogo modelli.
Selezionare il modello di Fuochi d'artificio desiderato per visualizzarne i dettagli nella pagina del modello:
Nella pagina del modello selezionare Distribuisci. Per altre informazioni sulle opzioni di distribuzione, vedere Distribuire modelli Foundry nel portale.
Nella finestra di distribuzione configurare le impostazioni seguenti:
- Nome distribuzione: mantenere il nome predefinito o immettere un nome personalizzato per identificare la distribuzione.
- Tipo di distribuzione: Selezionare Data Zone Standard o Global provisioned throughput. Per altre informazioni, vedere Tipi di distribuzione.
- Impostazioni della versione del modello: selezionare la versione del modello per la distribuzione.
- Limite di velocità per token al minuto: impostare un limite personalizzato per il numero di token al minuto per gestire i costi e controllare l'utilizzo. Il valore predefinito si basa sul profilo tipico di prestazioni e costi del modello.
- Guardrails: selezionare DefaultV2 o Default guardrail configuration ( Configurazione di protezione predefinita ). I modelli usano il Microsoft. DefaultV2 guardrail a meno che non venga specificato un valore diverso. Per altre informazioni, vedere Usare protezioni per impostare i limiti sugli output del modello.
Selezionare Distribuisci. Il processo di distribuzione può richiedere fino a 30 minuti.
Al termine della distribuzione, usare l'endpoint e la chiave forniti per inviare richieste di inferenza al modello. Per testare rapidamente la distribuzione, usare Playground nel progetto Foundry.
Suggerimento
Per verificare la distribuzione, passare alla pagina Distribuzioni del progetto e verificare che lo stato della distribuzione sia Completato.
Modelli di catalogo disponibili
I modelli di Fuochi d'artificio seguenti sono disponibili nel catalogo dei modelli Foundry:
| Provider di modelli | Nome modello | ID modello | Digitare | Offerte supportate | Descrizione |
|---|---|---|---|---|---|
| DeepSeek | DeepSeek v3.1 | FW-DeepSeek-v3.1 |
Completamenti della chat | PTU | Modello generico per attività di chat e ragionamento con peso aperto. |
| DeepSeek | DeepSeek v3.2 | FW-DeepSeek-v3.2 |
Completamenti della chat | Per-Token e PTU | Modello ottimizzato per il ragionamento aperto per attività complesse. |
| Minimax | MiniMax 2.5 | FW-MiniMax-2.5 |
Completamenti della chat | Per-Token e PTU | Modello generico per attività di conversazione e compiti di esecuzione delle istruzioni. |
| Intelligenza artificiale Moonshot | Kimi K2 Instruct 0905 | FW-Kimi-K2-Instruct-0905 |
Completamenti della chat | PTU | Modello ottimizzato basato su istruzioni per i carichi di lavoro di chat. |
| Intelligenza artificiale Moonshot | Kimi K2 Thinking | FW-Kimi-K2-Thinking |
Completamenti della chat | PTU | Modello incentrato sul ragionamento per la risoluzione dei problemi in più passaggi. |
| Intelligenza artificiale Moonshot | Kimi K2.5 | FW-Kimi-K2.5 |
Completamenti della chat | Per-Token e PTU | Modello multimodale con potenti funzionalità di contesto a lungo raggio. |
| OpenAI | gpt-oss-120b | FW-gpt-oss-120b |
Completamenti della chat | Per-Token e PTU | Modello su larga scala con pesi aperti per ampie attività generative. |
| Qwen | Qwen3.5 122B A10B | FW-Qwen3.5-122B-A10B |
Completamenti della chat | PTU | Modello generico per attività di chat e ragionamento con peso aperto. |
| Qwen | Qwen3.5 397B A17B | FW-Qwen3.5-397B-A17B |
Completamenti della chat | PTU | Modello generico per attività di chat e ragionamento con peso aperto. |
| Zhipu AI | GLM-4.7 | FW-GLM-4.7 |
Completamenti della chat | PTU | Modello bilingue per le attività di chat e ragionamento. |
| Zhipu AI | GLM-5 | FW-GLM-5 |
Completamenti della chat | Per-Token e PTU | Modello bilingue ad alte prestazioni per interazioni e ragionamenti. |
Tutti i modelli di catalogo supportano l'API OpenAI/v1 per i completamenti chat e l'endpoint Foundry SDK per accedere all'API delle Risposte.
Modelli personalizzati (porta il tuo modello)
Oltre ai modelli di catalogo, Fireworks on Foundry supporta l'importazione e la distribuzione di pesi personalizzati del modello. Questa funzionalità BYOM consente di eseguire modelli proprietari o a pesi aperti e ottimizzati all'interno dell'ecosistema Foundry, con inferenza fornita dal cloud Fireworks ottimizzato.
Architetture di modelli supportate
I modelli personalizzati devono essere basati su una delle architetture supportate seguenti:
- DeepSeek (V3.1, V3.2)
- Kimi (K2, K2.5)
- GLM (4.7)
- OpenAI (gpt-oss-120b)
- Qwen (qwen3-14b, qwen3.5-397B-A17B, qwen3.5-122B-A10B)
Limitazioni
- Solo modelli a peso pieno. I modelli basati su loRA e adattatori non sono supportati.
-
Flusso di lavoro prioritario su CLI. Il processo di importazione usa l'interfaccia della riga di comando Azure Developer (
azd). Il portale foundry supporta la registrazione, la visualizzazione e la distribuzione di modelli dopo il caricamento. - Fireworks Agents e i flussi di lavoro di Agent Builder non rientrano nell'ambito di questa anteprima.
Per istruzioni dettagliate, vedere Importare modelli personalizzati in Foundry.
Privacy dei dati
Quando si usa Fireworks on Foundry, i dati vengono condivisi tra Microsoft e l'intelligenza artificiale di Fuochi d'artificio e verranno applicate regole di conformità e gestione dei dati diverse. Per informazioni dettagliate, vedere di seguito. I clienti sono responsabili della valutazione se la condivisione dei dati tra Microsoft e Fireworks è appropriata per i requisiti di conformità delle organizzazioni.
Fuochi d'artificio su Foundry è attualmente escluso dagli impegni relativi ai limiti dei dati dell'UE.
FedRAMP non è realizzato per Fuochi d'artificio su Foundry. Se l'organizzazione richiede FedRAMP, prima dell'uso, rivolgersi al funzionario dell'autorizzazione per determinare se è consentito l'uso di Fuochi d'artificio su Foundry.
Payment Card Industry (PCI) Data Security Standard (DSS) non è applicabile a Fireworks on Foundry. Non dovresti usare Fireworks su Foundry per archiviare, elaborare o trasmettere dati di pagamento e dati dei titolari di carta.
Nota sulla trasparenza
Fireworks on Foundry consente ai clienti di distribuire e gestire modelli di intelligenza artificiale aperti e di terze parti usando Microsoft servizi della piattaforma Foundry.
- Microsoft non sviluppa, addestra, affina o valuta le caratteristiche di sicurezza, protezione o di IA Responsabile dei modelli distribuiti tramite Fireworks su Foundry.
- Microsoft non esegue alcuna rappresentazione relativa al comportamento, alle prestazioni o al profilo di rischio di questi modelli.
- I clienti sono esclusivamente responsabili della valutazione dell'idoneità di qualsiasi modello per l'uso previsto, inclusa l'esecuzione di eventuali valutazioni di sicurezza, conformità e IA responsabile, prima di distribuire modelli nelle applicazioni di produzione o rivolte ai clienti.
Foundry fornisce gli strumenti e le procedure consigliate per eseguire valutazioni di rischio e sicurezza dei modelli.
Domande frequenti
Fireworks nella piattaforma Foundry è disponibile in Azure per il governo degli Stati Uniti?
No, attualmente il servizio Fireworks on Foundry non è disponibile per Azure per enti pubblici utenti cloud.
Come è possibile ottenere la quota per le distribuzioni di modelli Fireworks?
Usare il modulo di richiesta di quota per richiedere la quota aggiunta per Fireworks on Foundry.
Ho un account Fireworks AI. È possibile usare le distribuzioni di Fuochi d'artificio esistenti?
No, devi creare nuove distribuzioni in Foundry. Se vuoi spostare il consumo a Azure, contatta il team dell'account Fireworks per assistenza.
È possibile distribuire modelli basati su loRA o adattatori?
No, l'anteprima corrente supporta solo modelli personalizzati a peso intero. I modelli basati su adattatori e LoRA non sono attualmente supportati.
L'anteprima di Fireworks è adatta per i carichi di lavoro di produzione?
No. Come anteprima pubblica, Fireworks on Foundry non include un accordo sul livello di servizio (SLA) per la produzione. L'anteprima è destinata a test, sperimentazione e convalida iniziali.
Come si importa e si distribuisce un modello personalizzato?
L'importazione di modelli personalizzati usa un flusso di lavoro incentrato sull'interfaccia della riga di comando Azure Developer CLI. Per istruzioni dettagliate, vedere Importare modelli personalizzati in Foundry.
Come vengono fatturati fuochi d'artificio su Foundry?
I modelli di fuochi d'artificio distribuiti tramite Foundry supportano sia offerte con pagamento per token che throughput assegnato.
Come si disabilita Fuochi d'artificio nel progetto Foundry?
I fuochi d'artificio possono essere disabilitati a livello di sottoscrizione Azure. Seguire la procedura per annullare la registrazione delle funzionalità di anteprima nella sottoscrizione di Azure.
Come si usa l'API delle Risposte?
L'API Risposte è supportata tramite l'API Foundry Projects e l'SDK. Assicurarsi di puntare il client all'endpoint API del progetto o di usare Foundry SDK.
Risoluzione dei problemi di Fireworks su Foundry
Usare le indicazioni seguenti per risolvere i problemi comuni relativi a Fuochi d'artificio su Foundry.
| Problema | Risoluzione |
|---|---|
| La registrazione in anteprima rimane in stato di "registrazione" | La registrazione può richiedere fino a 30 minuti. Aggiornare la pagina Funzionalità di anteprima per controllare lo stato corrente. Se lo stato non cambia dopo 30 minuti, provare a annullare la registrazione e registrare nuovamente la funzionalità. |
| I modelli di fuochi d'artificio non vengono visualizzati nel catalogo dei modelli | Verificare che lo stato della funzionalità di anteprima sia Registrato per l'abbonamento. Verificare di lavorare in un'area supportata. |
| La distribuzione fallisce a causa di un errore di quota | Usare il modulo di richiesta di quota per richiedere capacità aggiuntiva per Fuochi d'artificio su Foundry. |
| "Forbidden" o "Accesso negato" durante la distribuzione | Verificare che la tua identità abbia il ruolo Azure AI Developer o superiore nel progetto Foundry. I ruoli di livello di sottoscrizione da soli non sono sufficienti per la distribuzione. |
| L'endpoint del modello restituisce errori dopo la distribuzione | Verificare che lo stato della distribuzione sia Completato nella pagina Distribuzioni del progetto. Verificare di usare l'URI di destinazione e la chiave corretti nei dettagli della distribuzione. |
Per altre query, vedere la sezione domande frequenti .
Contenuto correlato
- Importare modelli personalizzati in Foundry
- Distribuire e implementare i modelli Foundry nel portale
- Modelli di fonderia provenienti da partner e comunità
- Panoramica del catalogo modelli Foundry
- Tipi di distribuzione
- Concetti relativi alla velocità effettiva con provisioning
- Azure ruoli predefiniti
- funzionalità di anteprima Azure
- Fireworks AI Trust Center