Migliora le risposte dell'IA utilizzando la Generazione Aumentata di Recupero

Il RAG (Retrieval Augmented Generation) in Microsoft Copilot Studio combina le capacità di ragionamento dei modelli linguistici con conoscenze attendibili specifiche dell'organizzazione. Consente agli agenti di produrre risposte accurate, contestuali e fondate basate sui contenuti dell'impresa, invece di affidarsi esclusivamente alla memoria del modello.

In questo articolo vengono illustrate le operazioni seguenti:

Capire come RAG migliora l'affidabilità e la stabilità dell'IA.
Descrivere come Copilot Studio recupera e sintetizza le conoscenze.
Identifica le fonti di conoscenza supportate e i loro vincoli.
Riconosci le considerazioni di governance, conformità e sicurezza dell'IA.
Applica i concetti RAG quando progetti agenti in ambienti aziendali.

Introduzione a RAG

RAG è un pattern di progettazione che migliora la precisione dell'IA combinando due capacità:

Recupero delle informazioni: Ricerca nelle fonti di dati aziendali.
Generazione di testo: Sintesi delle informazioni recuperate utilizzando un modello linguistico.

Questo approccio riduce informazioni errate, aumenta la fiducia e genera risposte radicate in contenuti organizzativi reali.

L'architettura RAG di Copilot Studio

la pipeline RAG di Copilot Studio si basa su Servizi di Azure AI e si integra strettamente con i limiti di attendibilità, conformità e sicurezza di Microsoft.

Componenti principali:

Copilot Studio runtime: gestisce la pipeline conversazionale
Motore di ottimizzazione delle query: Riscrive e interpreta le query
Fornitori di ricerca: Bing, SharePoint, Graph, Dataverse, Azure AI Search
Motore di riassunto: Crea risposte fondate e citate
Livelli di moderazione: Valida messaggi e riassunti
Archivio stato: Memoria a breve termine (meno di 30 giorni; non utilizzato per l'addestramento)
Archivi di telemetria e feedback: Fornisce approfondimenti e supervisione

Funzionamento di RAG in Copilot Studio

Rag in Copilot Studio segue un processo in quattro passaggi:

Riscrittura delle query
Recupero dei contenuti
Sintesi e generazione di risposte
Validazione della sicurezza e della governance

1. Riscrittura delle query

Copilot Studio ottimizza la domanda dell'utente prima della ricerca:

Chiarisce il significato
Aggiunge segnali contestuali (ultimi 10 turni)
Migliora l'abbinamento delle parole chiave
Genera query ottimizzate per la ricerca.

Questo processo aumenta la qualità del recupero e riduce i risultati irrilevanti.

2. Recupero di contenuti

Dopo aver riscritto la query, il sistema la esegue con tutte le fonti di conoscenza che hai impostato. Copilot Studio ottiene i primi tre risultati da ogni origine, bilanciando la pertinenza con le prestazioni. Il comportamento di ciascuna fonte di conoscenza varia a seconda di fattori come autenticazione, indicizzazione, formati di file e vincoli di archiviazione.

La tabella seguente riassume tutte le fonti di conoscenza supportate e le loro capacità, vincoli e requisiti di autenticazione:

Origine delle conoscenze	Description	Autenticazione	Capacità chiave, limiti e vincoli
Dati pubblici (siti web)	Siti web indicizzati da Bing	Nessuno	I siti web devono essere indicizzati da Bing. Bing non può essere limitato a una regione. Confermare la proprietà del sito web porta a risultati migliori. Siti pubblici: profondità massima di due sottopagine (/en/help/), nessuna pagina diretta. Ricerca personalizzata Bing: un solo ID di configurazione, ma può essere impostato usando una formula, i costi di Azure sono coperti da Microsoft, fino a 400 URL, opzioni di classificazione personalizzate, profondità massima di due pagine secondarie (/en/help/), supporta l'accesso diretto alle pagine.
SharePoint/OneDrive	Contenuti aziendali interni (solo interni)	Microsoft Entra ID autentificazione delegata	Richiede che l'utente sia autenticato con Microsoft Entra ID per effettuare chiamate delegate. I file corrispondenti (massimo 15 MB) vengono recuperati per ottenere estratti dettagliati da riassumere. Filtraggio di sicurezza: I risultati restituiti includono solo contenuti a cui l'utente ha diritti di lettura. La funzionalità premium "Risultati della ricerca avanzata" utilizza l'arrotondamento di Microsoft Graph a livello di tenant per i messaggi, migliorando la qualità dei risultati e aumentando la dimensione massima dei file (200 MB).
File caricati	File caricati nella memoria Dataverse	Nessuno	I file (massimo 512 MB) sono archiviati in archiviazione file Dataverse, con un massimo di 500 file per agente. I file sono indicizzati in Dataverse Search e beneficiano del riconoscimento di immagini/tabelle nei PDF. Per impostazione predefinita, le citazioni non contengono un link al file, ma questo link può essere aggiunto con personalizzazioni.
Tabelle Dataverse	Registri aziendali strutturati (solo interni)	Microsoft Entra ID autentificazione delegata	Le tabelle Dataverse (massimo 15) possono essere configurate con sinonimi e un glossario per migliorare la ricerca. Le query in linguaggio naturale vengono trasformate in query analitiche su dati strutturati.
Connettori a grafo	App aziendali indicizzate in Microsoft Graph (solo interno)	Microsoft Entra ID autentificazione delegata	Richiede l'autenticazione dell'utente tramite Microsoft Entra ID per effettuare chiamate delegate. Connettersi ad altre origini di informazioni aziendali indicizzate nell'indice Microsoft Graph, ad esempio ServiceNow KB, Confluence, dati di siti Web aziendali personalizzati e altro ancora. La funzionalità di livello premium "Risultati della ricerca avanzata" utilizza il contesto di tenant in Microsoft Graph.
Connettori in tempo reale	Dati in tempo reale provenienti da sistemi come Salesforce, Zendesk, SQL (solo interni)	L'utente deve essere loggato	I connettori Copilot recuperano dati strutturati da Salesforce, ServiceNow, Zendesk e Azure SQL. L'utente connesso deve creare connessioni con i sistemi di destinazione.
Ricerca di intelligenza artificiale di Azure	Ricerca semantica basata su vettori	Endpoint configurato	Restituisce i risultati da un indice Azure AI Search collegato vettorializzato. La connessione non è delegata: nessuna limitazione della sicurezza, nessun requisito di autenticazione per l'utente.
Dati personalizzati	I dati forniti tramite API, flussi o logica personalizzata	Nessuno	Richiede un passaggio precedente per interrogare la sorgente (ad esempio, usando flussi cloud, connettori o richieste HTTP). I risultati vengono passati come input alle risposte generative per riassumere una risposta alla query. I dati di input devono essere in formato tabella, con tre proprietà: `Content` (tipicamente frammenti di contenuti rilevanti), `ContentLocation` (opzionale, tipicamente un URL) e `Title` (opzionale).

3. Riassunto e generazione delle risposte

L'IA sintetizza contenuti recuperati
Applica istruzioni personalizzate per tono, formattazione, sicurezza o brevità
Genera citazioni ai dati sottostanti
Personalizza le risposte utilizzando il contesto dell'utente (come lingua, dipartimento o regione)

4. Validazione della sicurezza e della governance

Ogni risposta passa attraverso livelli di validazione automatici:

Moderazione di risposte dannose, malevole, non conformi o protette da copyright
Validazione della messa a terra e rimozione di informazioni errate

Nessun dato dei clienti allena i modelli linguistici.

Considerazioni chiave nell'uso di RAG

RAG funziona meglio per domande e risposte fattuali, non per analisi approfondite di documenti.

RAG è ideale per:

Rispondere a domande da base di conoscenza
Riassuntione delle politiche, delle FAQ e dei contenuti procedurali
Recupero di fatti specifici da file o sistemi interni

RAG non è pensato per:

Confronto completo dei documenti
Valutazione della conformità alle politiche
Ragionamento complesso su lunghi documenti non strutturati

Considerazioni sulla sicurezza e conformità dell'IA generativa

Le funzionalità di intelligenza artificiale generative in Microsoft Copilot Studio sono progettate per offrire potenti funzionalità di conversazione e ragionamento mantenendo al contempo controlli avanzati di sicurezza, privacy e conformità.

Modelli di fondazione e hosting

Copilot Studio si basa su modelli fondamentali addestrati da OpenAI.
Copilot Studio usa uno dei modelli OpenAI più recenti per le risposte generative.
I modelli vengono eseguiti interamente sui servizi Azure AI Foundry interni, allineati al limite di Attendibilità dei servizi Microsoft.
Ogni utilizzo del modello rispetta i principi e le politiche di Microsoft Responsible AI .

Istruzioni personalizzate

I creatori possono fornire istruzioni personalizzate per modellare il comportamento del modello, influenzare il tono o aggiungere regole di formattazione. Queste istruzioni aiutano a personalizzare le risposte generative alle esigenze dell'organizzazione, rispettando però i filtri di sicurezza e i controlli di conformità.

Archiviazione ed elaborazione dei dati

Data storage and processing in Copilot Studio potrebbe spostare i dati attraverso i confini regionali quando l'hosting del modello locale non è disponibile.
Quando questo spostamento dei dati non è consentito, gli amministratori possono usare le impostazioni dell'ambiente per disabilitare funzionalità specifiche, ad esempio Azure modelli linguistici o Ricerca Bing.
Copilot Studio non raccoglie o usa dati dei clienti per i modelli linguistici di training.

Gestione operativa dei dati

Durante il funzionamento, il sistema memorizza temporaneamente le conversazioni in uno store sicuro gestito da Microsoft.
L'accesso autorizzato al personale Microsoft è limitato tramite le Secure Access Workstations (SAW) con controlli Just-In-Time (JIT).
Le organizzazioni possono ulteriormente controllare l'accesso tramite Customer Lockbox, richiedendo un'approvazione esplicita prima che gli ingegneri di supporto Microsoft possano visualizzare i dati.

Risoluzione dei problemi di telemetria

Le funzionalità di IA generativa generano dati aggiuntivi di risoluzione dei problemi, ma solo per azioni avviate dal creatore nel pannello di Test, in particolare quando il creatore dà un pollice in su o in basso a una risposta.
Non vengono registrati dati aggiuntivi dei clienti al di fuori di questo esplicito ciclo di feedback.

Monitoraggio degli abusi e sicurezza

Poiché più livelli di sicurezza proteggono già le funzionalità di intelligenza artificiale generative, Copilot Studio disabilita Azure il monitoraggio degli abusi di intelligenza artificiale per evitare di registrare ulteriormente i dati dei clienti.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-05-01