Novità di Azure Content Understanding in Foundry Tools?

Il servizio Content Understanding Azure in Foundry Tools viene aggiornato in modo continuativo. Aggiungere un segnalibro a questa pagina per rimanere aggiornati con le note sulla versione, i miglioramenti delle funzionalità e la nuova documentazione.

Nota

Content Understanding è ora un servizio disponibile a livello generale con la versione dell'API 2025-11-01 .

Importante

Versioni API di anteprima 2025-05-01-preview e 2024-12-01-preview verranno ritirate entro il 15 luglio 2026. Se si usa ancora un'API di anteprima, aggiornare il codice per specificare come destinazione la versione 2025-11-01 (GA)più recente dell'API .

Maggio 2026

Content Understanding Studio nuove aree di supporto GPT-5.2

Content Understanding Studio supporta ora GPT-5.2 oltre la regione East US 2 originale, consentendo una copertura più ampia a livello regionale per la creazione di risorse e distribuzioni. Sono ora supportate le aree seguenti:

  • Stati Uniti orientali 2
  • Stati Uniti orientali
  • Australia orientale
  • Giappone orientale
  • Europa settentrionale
  • Stati Uniti centro-meridionali
  • Asia sud-orientale
  • Svezia centrale
  • Regno Unito meridionale
  • Europa occidentale
  • Stati Uniti occidentali
  • Stati Uniti occidentali 3

Per l'elenco completo dei modelli e delle aree supportate, vedere la tabella dell'area modelli Foundry.

Aprile 2026

Supporto del modello GPT-5.2 e aggiornamenti della distribuzione dei modelli

Content Understanding supporta ora il modello GPT-5.2 come modello di completamento consigliato. GPT-5.2 offre prestazioni e qualità migliori rispetto alle generazioni precedenti. Per l'elenco completo dei modelli e delle opzioni di distribuzione supportati, vedere Opzioni di distribuzione del modello per gli analizzatori di Analisi del contenuto.

Integrazione di LangChain

Il caricatore di documenti Content Understanding per LangChain è ora disponibile nel langchain-azure-ai pacchetto. Usarlo per caricare ed elaborare documenti tramite Content Understanding direttamente dalle pipeline LangChain. Per una procedura dettagliata sull'utilizzo, vedere il notebook demo .

integrazione del framework dell'agente di intelligenza artificiale Azure (anteprima)

Content Understanding è ora disponibile come pacchetto per il framework dell'agente di intelligenza artificiale Azure. Installare agent-framework-azure-contentunderstanding da PyPI per aggiungere le funzionalità di Comprensione del Contenuto agli agenti. Vedere gli esempi per l'utilizzo di esempio.

Aggiornamenti dell'SDK: to_llm_input() helper (anteprima)

Una nuova funzione di supporto to_llm_input() è disponibile nei vari linguaggi SDK. Formatta i risultati dell'estrazione dei campi di Content Understanding in markdown con frontmatter YAML, rendendo più semplice passare l'output strutturato direttamente ai modelli linguistici.

Lingua Versione del pacchetto Esempio
Python azure-ai-contentunderstanding 1.2.0b1 sample_to_llm_input.py
.NET Azure.AI.ContentUnderstanding 1.2.0-beta.1 samples
JavaScript/TypeScript @azure/ai-content-understanding 1.2.0-beta.1 JS · TS
Java azure-ai-contentunderstanding samples

Aggiornamenti del portale foundry

Il portale Foundry include ora un playground per esplorare gli analizzatori predefiniti e le funzionalità di Comprensione del Contenuto senza scrivere codice. È anche possibile creare e configurare analizzatori personalizzati direttamente nel portale di Foundry. Per un confronto tra gli elementi disponibili in Foundry e Content Understanding Studio, vedere Scegliere lo strumento Foundry appropriato per l'elaborazione dei documenti.

Marzo 2026

Le librerie client di Content Understanding SDK sono ora disponibili a livello generale

Le librerie client native SDK per Content Understanding sono ora disponibili per Python, .NET, Java e JavaScript/TypeScript, destinate alla versione dell'API 2025-11-01 GA. Gli SDK offrono modelli fortemente tipizzati, polling predefinito per le operazioni a lungo termine, integrazione dell'autenticazione Azure, tentativi ripetuti e coerenza completa con le linee guida per la progettazione Azure SDK design guidelines. Per le applicazioni di produzione, è consigliabile usare gli SDK ufficiali sulle chiamate REST non elaborate.

Lingua Pacchetto Esempi di SDK Installare Repository SDK
Python azure-ai-contentunderstanding samples pip install azure-ai-contentunderstanding azure-sdk-for-python
.NET Azure.AI.ContentUnderstanding samples dotnet add package Azure.AI.ContentUnderstanding azure-sdk-for-net
Java azure-ai-contentunderstanding samples Vedere Maven Central azure-sdk-for-java
Javascript @azure/ai-content-understanding samples npm install @azure/ai-content-understanding azure-sdk-for-js
TypeScript @azure/ai-content-understanding samples npm install @azure/ai-content-understanding azure-sdk-for-js

Suggerimento

Introduzione all'avvio rapido di Content Understanding e per altri dettagli, vedere i collegamenti alle risorse.

Supporto interregionale BYOC (Bring Your Own Capacity)

Bring Your Own Capacity (BYOC) supporta ora distribuzioni di modelli tra aree. I clienti possono utilizzare qualsiasi distribuzione di Azure OpenAI di cui sono proprietari indipendentemente dalla risorsa o dalla regione. Per informazioni dettagliate, vedere Porta la tua capacità di risorse in Comprensione dei Contenuti.

Aggiornamenti di Content Understanding Studio

  • Selezione di modelli GPT-4.1-mini: Studio supporta ora la selezione del modello GPT-4.1-mini, offrendo opzioni più flessibili per bilanciare qualità e costi.
  • Supporto di input testo normale (.txt): è ora possibile elaborare i documenti di testo normale direttamente in Studio.
  • Analizzatori RAG nella scheda Individua: la scheda Individua include ora analizzatori RAG, semplificando l'esplorazione e la prova direttamente dall'interfaccia utente.

Aggiornamenti dell'analizzatore

  • Supporto per analizzatori di dimensioni maggiori: per i tipi di documenti complessi (ad esempio moduli di grandi dimensioni o contratti dettagliati), è ora possibile definire schemi di estrazione completi, abilitando un'acquisizione dei dati più completa in un unico passaggio.
  • Maggiore profondità dello schema annidata: la profondità massima di annidamento per gli analizzatori di estrazione dei documenti è stata aumentata da 5 a 7. Ciò supporta composizioni di analizzatori più complesse consentendo due livelli aggiuntivi di analizzatori annidati, sfruttando scenari come flussi di lavoro fiscali e di controllo.

Gennaio 2026

  • Disponibilità di Foundry (nuovo): i nuovi modelli di lettura e layout sono ora disponibili direttamente nel portale Foundry (nuovo).
  • Analizzatori ricompilati di lettura e layout: i modelli predefiniti Read e Layout non richiedono più la specifica di un modello (LLM). Non richiedono più che la risorsa Foundry sia configurata con un modello. Content Understanding può usarli anche se non è definito alcun modello in contentunderstanding/defaults.
  • Esempi aggiornati di GitHub: Sono ora disponibili nuovi esempi aggiornati, inclusi quelli di Python e .NET. Sono stati aggiornati anche altri esempi.

Dicembre 2025

Aggiornamento di lettura e layout

  • I modelli predefiniti Read e Layout non richiedono più di specificare un modello (LLM). Non richiedono più che la risorsa Foundry sia configurata con un modello. Content Understanding li esegue anche se non è definito alcun modello in contentunderstanding/defaults.

Esempi GitHub aggiornati

  • Sono ora disponibili esempi nuovi e aggiornati, inclusi gli esempi aggiornati Python e .NET. Sono stati aggiornati anche altri esempi.

Nuova disponibilità di Foundry

  • I modelli di analizzatore predefiniti Read e Layout sono ora disponibili direttamente nel portale Foundry (nuovo).

Novembre 2025

Azure Content Understanding in Foundry Tools è ora disponibile a livello generale con versione API 2025-11-01. La versione offre prontezza per la produzione e miglioramenti guidati dai clienti per la scelta del modello, la gestione e la sicurezza.

Flessibilità per scegliere il modello di intelligenza artificiale generativo appropriato per ogni carico di lavoro

  • Collega Content Understanding a una distribuzione di modelli Microsoft Foundry per l'intelligenza artificiale generativa, in modo da poter controllare qualità, latenza e costi. È possibile scegliere distribuzioni con opzione 'pay-as-you-go' o PTU (Provisioned Throughput Unit) per il modello Foundry. Vedere quali modelli sono attualmente supportati. Per provare, vedere Come creare un analizzatore personalizzato in Content Understanding Studio.
  • La selezione del modello offre la flessibilità necessaria per ottimizzare la distribuzione del modello Foundry con impostazioni come il tipo (Global, DataZone o Regional) e le unità elaborate con provisioning (PTU) per riservare la capacità per carichi di lavoro prevedibili e con volumi elevati. Per dettagli, vedere Tipi di distribuzione per i modelli Foundry.
  • Il modello di determinazione prezzi trasparente offre una chiara visibilità sui costi nell'estrazione del contenuto, nella contestualizzazione e nell'utilizzo di modelli generativi. Content Understanding addebita solo per l'estrazione dei contenuti (per pagina/minuto) e la contestualizzazione. Le funzionalità generative usano direttamente l'implementazione del modello Foundry e comportano addebiti standard basati su token. Altre informazioni sono disponibili in Spiegazione prezzi.

Aggiornamenti dell'analizzatore

  • Ottimizzare le prestazioni e ridurre i costi con un controllo granulare sull'estrazione dei campi. Abilitare i punteggi di attendibilità e il grounding di origine solo per i campi in cui è necessaria la convalida e la tracciabilità usando l'impostazione estimateSourceAndConfidence di configurazione. Questo approccio selettivo riduce le dimensioni del payload della risposta e riduce i costi di elaborazione e la latenza calcolando le metriche di attendibilità solo quando necessario. I punteggi di attendibilità sono supportati solo per i file di documento.
  • La classificazione è ora integrata con l'API analizzatore, che supporta la classificazione usando la contentCategories proprietà . Il numero di categorie supportate si espande da 50 a 200, consentendo una classificazione e un routing precisi di tipi di file diversi all'interno di un singolo analizzatore, senza un classificatore separato necessario. Per un esempio, vedere Creare una soluzione di automazione dei processi robotici .
  • Le API del ciclo di vita dell'analizzatore si estendono per supportare la copia, l'eliminazione e la sostituzione per offrire il controllo completo sulle versioni dell'analizzatore. Per indicazioni, vedere Eseguire la migrazione di progetti dall'anteprima alla disponibilità generale .
  • Eliminare i risultati dell'analisi: è ora possibile eliminare in modo esplicito i risultati dell'analizzatore dopo averli recuperati, offrendo il controllo sulla conservazione dei dati per i requisiti di conformità e privacy. Vedere Eliminare la risposta di analisi.

Analizzatori RAG

Gli analizzatori RAG sono ottimizzati per scenari di generazione con recupero aumentato. Estraggono il contenuto in formato markdown ed eseguono l'analisi semantica per migliorare la qualità del recupero per le applicazioni a valle.

  • Documenti: prebuilt-documentSearch estrae paragrafi, tabelle e descrizioni delle figure dai documenti. Consente descrizioni testuali di immagini, grafici e diagrammi. Acquisisce annotazioni scritte a mano, genera riepiloghi di contenuto e supporta un'ampia gamma di formati di file , tra cui PDF, immagini, documenti di Office e file di testo.
  • Supporto multimodale: estende a video, immagini e audio con prebuilt-videoSearch per l'estrazione di trascrizioni e i riepiloghi basati su segmenti con rilevamento automatico della scena, prebuilt-imageSearch per descrizioni e approfondimenti sul contenuto visivo e prebuilt-audioSearch per la trascrizione della conversazione con la diarizzazione del parlante e il supporto multilingue.

Esaminare il catalogo completo dell'analizzatore in Analizzatori predefiniti in Informazioni sul contenuto.

Analizzatori predefiniti specifici per domini per carichi di lavoro del settore

Gli analizzatori predefiniti specifici del dominio sono personalizzati per gli scenari di settore. Consentono l'estrazione automatizzata di dati strutturati da tipi di documenti specializzati senza training personalizzato.

  • Finanza e imposta: estrarre dati chiave da rendiconti finanziari, moduli fiscali, W-2, 1099 e altri documenti fiscali con schemi ottimizzati che acquisisce importi, date, identificatori fiscali e entità finanziarie. Vedere finanza e imposte.
  • Approvvigionamento e contratti: elaborare ordini di acquisto, contratti e documenti di approvvigionamento per estrarre informazioni fornitore, articoli, prezzi, termini e obblighi contrattuali. Vedere documenti legali e aziendali.
  • Mutui e prestiti: automatizzare l'estrazione da richieste ipotecarie, documenti di prestito e moduli di finanziamento, acquisizione dei dettagli del mutuatario, informazioni sulle proprietà, condizioni di prestito e dichiarazioni finanziarie. Vedere mutui e prestiti.
  • Verifica dell'identità: elaborare passaporti, patenti di guida, carte ID e altri documenti di identità con prebuilt-idDocument, estrarre informazioni personali, numeri di documento e dettagli di verifica. La Categorizzazione consente di inviare sezioni specifiche, ad esempio pagine passport, agli analizzatori creati appositamente durante una singola esecuzione. Vedere documenti di identità.
  • Utilità, fatturazione e altro: estrarre dati strutturati da bollette, fatture ed estratti conto in tutti i settori, acquisire informazioni sul conto, dettagli di utilizzo e dati di pagamento.

Esplora la lineup di analizzatori specifici per il dominio e le linee guida sull'uso in Analizzatori predefiniti in Comprensione del contenuto.

Estrazione del contenuto

  • Annotazioni di contenuto - digital PDF gli input supportano gli annotazioni per fornire ulteriori metadati nel documento. I metadati possono identificare intervalli di contenuto con annotazioni come evidenziazione, sottolineatura, barrato e altro ancora.
  • Tabelle a più pagine e formati di output : è possibile scegliere il formato di output della tabella tra HTML o Markdown per allinearsi alle esigenze dell'applicazione. Le tabelle sono anche a più pagine per impostazione predefinita. Il servizio restituisce tabelle a più pagine come singolo oggetto tabella.
  • Estrazione di collegamenti ipertestuali : il servizio estrae ora i collegamenti ipertestuali incorporati all'interno dei documenti come URL.
  • Estrazione di figure : il servizio può ora estrarre figure e grafici come chart.js o mermaid.js sintassi a seconda dei tipi, insieme alla relativa descrizione.

Estrazione di campi

  • I punteggi di attendibilità sono ora disponibili in modo coerente in tutti i metodi di estrazione per i documenti, sia che si usi l'estrazione, la generazione o la classificazione, offrendo metriche di qualità uniformi indipendentemente dal modo in cui si elaborano i campi. I punteggi di attendibilità sono supportati solo per la modalità documento. Scopri come abilitare i punteggi di attendibilità nell'estrazione dei campi.
  • Definizione dello schema semplificata con impostazioni predefinite intelligenti e flussi di lavoro semplificati. Il metodo di estrazione è ora facoltativo. Content Understanding seleziona automaticamente l'approccio migliore per ogni campo, riducendo la complessità della configurazione. Questo comportamento intelligente semplifica la compilazione e la gestione degli analizzatori senza una conoscenza approfondita delle tecniche di estrazione.
  • Aggiunta del supporto per tipi complessi come oggetti: definire un oggetto, ad esempio un oggetto cliente con campi contenuti di nome, indirizzo e telefono.

Sicurezza e governance aziendali

  • La disponibilità generale include Microsoft Entra ID, identità gestite, chiavi gestite dal cliente, reti virtuali ed endpoint privati.
  • Questi controlli mantengono il contenuto sensibile nel limite Azure e consentono di soddisfare i requisiti di conformità. Per ulteriori informazioni, vedere Accesso sicuro alla comprensione dei contenuti.

Altri miglioramenti

  • prebuilt-read gli analizzatori e prebuilt-layout ora portano le principali funzionalità di Analisi dei documenti alla comprensione dei contenuti. Vedere Analizzatori predefiniti.
  • prebuilt-layoutWithFigures estende l'estrazione del layout con il rilevamento e l'analisi delle figure, l'estrazione e il riepilogo di grafici, diagrammi e immagini con il relativo contesto. Vedere Analizzatori predefiniti.
  • Quando si analizza il contenuto, è ora possibile fornire un intervallo di pagine per analizzare solo pagine specifiche del documento di input.
  • La segmentazione e la classificazione (contentCategories) consentono di inviare sezioni agli analizzatori creati appositamente durante una singola esecuzione. Ad esempio, prebuilt-idDocument classifica le pagine e le indirizza a analizzatori specifici (ad esempio gli analizzatori delle licenze di passport e driver), ognuno con i propri schemi, tutti all'interno di una singola esecuzione.

Espansione e disponibilità dell'area

  • Content Understanding è ora supportato in 14 aree in tutto il mondo, offrendo una maggiore copertura geografica e opzioni di residenza dei dati migliorate. Per un elenco dettagliato delle aree disponibili, vedere la documentazione relativa al supporto di lingue e aree geografiche.
  • Content Understanding è disponibile in Content Understanding Studio e tramite l'API REST per l'accesso a livello di codice.

Modifiche di rilievo

  • La capacità gestita per i modelli generativi di anteprima viene ritirata. Per utilizzare Content Understanding, devi sempre portare il tuo modello linguistico Foundry di grandi dimensioni e le tue distribuzioni di incorporamento.
  • Le API del classificatore dedicato sono deprecate perché la classificazione ora si trova all'interno dell'API analizzatore come funzionalità contentCategories.
  • La segmentazione video può ora essere eseguita usando la contentCategories funzionalità , unificando l'API per la suddivisione dei file tra analizzatori di documenti e video.
  • L'API di anteprima (2025-05-01-preview) non supporta la modalità Pro per l'analisi cross-file o la directory delle persone con l'integrazione di Face API.

Ottobre 2025

La versione di anteprima di Content Understanding introduce gli aggiornamenti seguenti:

  • Content Understanding ora ha aumentato il supporto del numero di campi (1.000) per tutte le modalità.
  • Il corpo della risposta dell'API include ora token di input, output e contestualizzazione utilizzati come parte dell'oggetto token. Per altre informazioni, vedere l'articolo di avvio rapido.

Maggio 2025

L'API REST Azure Content Understanding 2025-05-01-preview è ora disponibile. Questo aggiornamento introduce gli aggiornamenti e le funzionalità avanzate seguenti:

Modalità di elaborazione

Con la 2025-05-01-preview versione vengono introdotte due modalità: standard e pro. La modalità predefinita per tutti gli analizzatori è standard.

Content Understanding pro mode aggiunge ragionamento, supporto per più documenti di input e la possibilità di configurare una Knowledge Base esterna per il collegamento, l'arricchimento e la convalida. Queste funzionalità automatizzano attività complesse estendendo le funzionalità di estrazione dei campi per coprire gli scenari che in precedenza richiedevano codice personalizzato o lavoro umano.

La pro modalità (anteprima) è attualmente limitata ai documenti come input, con il supporto per altri tipi di contenuto presto disponibile. Le problematiche comuni che la modalità pro risolve l'aggregazione di uno schema tra contenuto da file di input diversi, la convalida dei risultati nei documenti e l'uso di conoscenze esterne per generare uno schema di output. Altre informazioni sulla modalità Pro (anteprima).

Esperienza nella fonderia

Con questa versione, gli aggiornamenti seguenti sono ora disponibili per l'esperienza Content Understanding in Microsoft Foundry:

  • Aggiunto supporto per la creazione di attività in modalità standard e modalità pro nell'esperienza di Comprensione del contenuto esistente. Usando ora la modalità pro, è possibile inserire i propri dati di riferimento e creare un'attività che esegue il ragionamento a più passaggi sui dati. Per altre informazioni sui due diversi tipi di attività, vedere Creare attività Standard e Pro di Content Understanding nel portale foundry (versione classica).
  • Le esperienze di prova sono ora disponibili per l'analisi generale dei documenti e l'analisi delle fatture. Provare queste funzionalità predefinite sui propri dati e iniziare a ottenere informazioni dettagliate senza dover creare un'attività personalizzata.

Classificazione e suddivisione dei documenti

Questa versione introduce una nuova API di classificazione. Questa API supporta la classificazione e la suddivisione logica di un singolo file contenente più documenti con routing facoltativo agli analizzatori di estrazione dei campi. È possibile creare un classificatore personalizzato per suddividere e classificare un file in più documenti logici e indirizzare i singoli documenti a un modello di estrazione di campi downstream in una singola chiamata API.

Miglioramenti all'elaborazione dei documenti

Miglioramenti all'elaborazione video

  • Aggiunta del supporto per campi video completi. Altre informazioni sui miglioramenti dell'elaborazione video.
  • Aggiunta del supporto per i capitoli video tramite segmentazione. Altre informazioni sui miglioramenti dell'elaborazione video.
  • Aggiunto supporto per il riconoscimento facciale sulle miniature dei volti estratti. L'identità migliora la descrizione e le attività downstream, ad esempio la ricerca e il recupero.
  • Aggiunto supporto per la disabilitazione dell'offuscamento del viso nella configurazione dell'analizzatore. Altre informazioni sui miglioramenti dell'elaborazione video.

Miglioramenti all'elaborazione audio

Face API (versione di anteprima)

Questa versione aggiunge nuove funzionalità di rilevamento e riconoscimento dei visi a Content Understanding. È possibile creare una directory di volti e persone. Utilizzare la directory per riconoscere i volti nei dati elaborati. Altre informazioni sul rilevamento e sul riconoscimento dei visi.

Aprile 2025

Anteprima 2024-12-01 L'API REST introduce gli aggiornamenti e le funzionalità avanzate seguenti:

  • Miglioramenti generali. Per richiedere un aumento dei limiti correnti per tutte le modalità, contattare cu_contact@microsoft.com.
  • Modello di fattura predefinito. Il modello di fattura è ora personalizzabile. Dopo aver selezionato il modello di fattura, è possibile accedere a un elenco predefinito di campi che è possibile personalizzare in base alle esigenze specifiche aggiungendo o rimuovendo i campi.
  • Campi generativi e di classificazione
    • I campi generativi e di classificazione sono ora supportati per la modalità documenti.
    • È ora possibile usare l'endpoint REST o Studio per definire campi generativi e di classificazione con output zero-shot per i documenti. Questa funzionalità consente di generare riepiloghi, dedurre i risultati e classificare singoli documenti in più file.
    • È possibile richiamare più analizzatori per elaborare singoli file.
  • Modalità video
    • Riduzione della latenza per l'elaborazione video, con una diminuzione del 50% della latenza.
    • Tipi di output espansi per aggiungere il supporto per Object e Arrays.
    • Aggiunta del supporto per i file video forniti tramite l'inserimento di URL prefirmato S3.
    • Miglioramento della segmentazione video per segmentare semanticamente in particolare quando non sono presenti modifiche di ripresa nel video.
  • Modalità audio
    • L'API supporta ora il tipo di campo: group.
  • Modalità testo
    • Supporto API per il tipo di campo: group.
  • Miglioramenti dell'esperienza utente
    • Aggiunta di funzionalità per scaricare e caricare le configurazioni dello schema durante la definizione dello schema.
    • Processi avanzati per l'etichettatura dei file e la compilazione dell'analizzatore.
    • Aggiunta di esempi di codice di download per la configurazione rapida.

Novembre 2024

Benvenuto! La versione dell'API Azure Content Understanding 2024-12-01-preview è ora disponibile in anteprima pubblica. Questa versione consente di generare una rappresentazione strutturata del contenuto su misura per attività specifiche da diverse modalità o formati. Content Understanding usa uno schema definito per estrarre il contenuto adatto per l'elaborazione da modelli linguistici di grandi dimensioni e applicazioni successive.