Condividi tramite


Migliora le risposte dell'IA utilizzando la Generazione Aumentata di Recupero

La Generazione Aumentata tramite Recupero (RAG) in Microsoft Copilot Studio combina le capacità di ragionamento dei modelli linguistici con conoscenze attendibili specifiche dell'organizzazione. Consente agli agenti di produrre risposte accurate, contestuali e fondate basate sui contenuti dell'impresa, invece di affidarsi esclusivamente alla memoria del modello.

In questo articolo vengono illustrate le operazioni seguenti:

  • Capire come RAG migliora l'affidabilità e la stabilità dell'IA.
  • Descrivere come Copilot Studio recupera e sintetizza le conoscenze.
  • Identifica le fonti di conoscenza supportate e i loro vincoli.
  • Riconosci le considerazioni di governance, conformità e sicurezza dell'IA.
  • Applica i concetti RAG quando progetti agenti in ambienti aziendali.

Introduzione a RAG

RAG è un pattern di progettazione che migliora la precisione dell'IA combinando due capacità:

  • Recupero delle informazioni: Ricerca nelle fonti di dati aziendali.
  • Generazione di testo: Sintesi delle informazioni recuperate utilizzando un modello linguistico.

Questo approccio riduce informazioni errate, aumenta la fiducia e genera risposte radicate in contenuti organizzativi reali.

Architettura RAG in Copilot Studio

la pipeline RAG di Copilot Studio si basa su Azure AI services e si integra strettamente con i limiti di attendibilità, conformità e sicurezza di Microsoft.

Componenti principali:

  • Copilot Studio runtime: gestisce la pipeline conversazionale
  • Motore di ottimizzazione delle query: Riscrive e interpreta le query
  • Provider di ricerca: Bing, SharePoint, Graph, Dataverse, Azure AI Search
  • Motore di riassunto: Crea risposte fondate e citate
  • Livelli di moderazione: Valida messaggi e riassunti
  • Archivio stato: Memoria a breve termine (meno di 30 giorni; non utilizzato per l'addestramento)
  • Archivi di telemetria e feedback: Fornisce approfondimenti e supervisione

Diagramma del flusso di lavoro RAG di Copilot Studio che mostra la moderazione dei messaggi, l'ottimizzazione delle query, il recupero, il riepilogo e i passaggi di convalida.

Funzionamento di RAG in Copilot Studio

Rag in Copilot Studio segue un processo in quattro passaggi:

  1. Riscrittura delle query
  2. Recupero dei contenuti
  3. Sintesi e generazione di risposte
  4. Validazione della sicurezza e della governance

1. Riscrittura delle query

Copilot Studio ottimizza la domanda dell'utente prima della ricerca:

  • Chiarisce il significato
  • Aggiunge segnali contestuali (ultimi 10 turni)
  • Migliora l'abbinamento delle parole chiave
  • Genera query ottimizzate per la ricerca.

Questo processo aumenta la qualità del recupero e riduce i risultati irrilevanti.

2. Recupero di contenuti

Dopo aver riscritto la query, il sistema la esegue con tutte le fonti di conoscenza che hai impostato. Copilot Studio ottiene i primi tre risultati da ogni origine, bilanciando la pertinenza con le prestazioni. Il comportamento di ciascuna fonte di conoscenza varia a seconda di fattori come autenticazione, indicizzazione, formati di file e vincoli di archiviazione.

La tabella seguente riassume tutte le fonti di conoscenza supportate e le loro capacità, vincoli e requisiti di autenticazione:

Fonte di conoscenza Description Authentication Capacità chiave, limiti e vincoli
Dati pubblici (siti web) Siti web indicizzati da Bing None
  • I siti web devono essere indicizzati da Bing.
  • Bing non può essere limitato a una regione.
  • Confermare la proprietà del sito web porta a risultati migliori.
  • Siti pubblici: profondità massima di due sottopagine (/en/help/), nessuna pagina diretta.
  • Ricerca personalizzata Bing: un ID di configurazione, ma può essere impostato usando una formula, i costi di Azure coperti da Microsoft, fino a 400 URL, opzioni di classificazione personalizzate, profondità massima di due pagine secondarie (/en/help/), supporta direttamente le pagine.
SharePoint/OneDrive Contenuti aziendali interni (solo interni) Microsoft Entra ID autentificazione delegata
  • Richiede che l'utente sia autenticato con Microsoft Entra ID per effettuare chiamate delegate.
  • I file corrispondenti (massimo 15 MB) vengono recuperati per ottenere estratti dettagliati da riassumere.
  • Filtraggio di sicurezza: I risultati restituiti includono solo contenuti a cui l'utente ha diritti di lettura.
  • La funzionalità Premium 'Enhanced Search Results' usa tenant Microsoft Graph base per i messaggi, aumentando la qualità dei risultati e le dimensioni massime dei file (200 MB).
File caricati File caricati nella memoria Dataverse None
  • I file (massimo 512 MB) sono archiviati in archiviazione file Dataverse, con un massimo di 500 file per agente.
  • I file sono indicizzati in Dataverse Search e beneficiano del riconoscimento di immagini/tabelle nei PDF.
  • Per impostazione predefinita, le citazioni non contengono un link al file, ma questo link può essere aggiunto con personalizzazioni.
Tabelle Dataverse Registri aziendali strutturati (solo interni) Microsoft Entra ID autentificazione delegata
  • Le tabelle Dataverse (massimo 15) possono essere configurate con sinonimi e un glossario per migliorare la ricerca.
  • Le query in linguaggio naturale vengono trasformate in query analitiche su dati strutturati.
Connettori a grafo App aziendali indicizzate in Microsoft Graph (solo interno) Microsoft Entra ID autentificazione delegata
  • Richiede l'autenticazione dell'utente tramite Microsoft Entra ID per effettuare chiamate delegate.
  • Connettersi ad altre origini di informazioni aziendali indicizzate nell'indice Microsoft Graph, ad esempio ServiceNow KB, Confluence, dati di siti Web aziendali personalizzati e altro ancora.
  • La funzionalità Premium 'Enhanced Search Results' usa tenant Microsoft Graph base.
Connettori in tempo reale Dati in tempo reale provenienti da sistemi come Salesforce, Zendesk, SQL (solo interni) L'utente deve essere loggato
  • Connettori di Copilot recuperano dati strutturati da Salesforce, ServiceNow, Zendesk, Azure SQL.
  • L'utente connesso deve creare connessioni con i sistemi di destinazione.
Azure AI Search Ricerca semantica basata su vettori Endpoint configurato
  • Restituisce i risultati da un indice Azure AI Search collegato vettorializzato.
  • La connessione non è delegata: nessuna limitazione della sicurezza, nessun requisito di autenticazione per l'utente.
Dati personalizzati I dati forniti tramite API, flussi o logica personalizzata None
  • Richiede un passaggio precedente per interrogare la sorgente (ad esempio, usando flussi cloud, connettori o richieste HTTP).
  • I risultati vengono passati come input alle risposte generative per riassumere una risposta alla query.
  • I dati di input devono essere in formato tabella, con tre proprietà: Content (tipicamente frammenti di contenuti rilevanti), ContentLocation (opzionale, tipicamente un URL) e Title (opzionale).

3. Riassunto e generazione delle risposte

  • L'IA sintetizza contenuti recuperati
  • Applica istruzioni personalizzate per tono, formattazione, sicurezza o brevità
  • Genera citazioni ai dati sottostanti
  • Personalizza le risposte utilizzando il contesto dell'utente (come lingua, dipartimento o regione)

4. Validazione della sicurezza e della governance

Ogni risposta passa attraverso livelli di validazione automatici:

  • Moderazione di risposte dannose, malevole, non conformi o protette da copyright
  • Validazione della messa a terra e rimozione di informazioni errate

Nessun dato dei clienti allena i modelli linguistici.

Considerazioni chiave nell'uso di RAG

RAG funziona meglio per domande e risposte fattuali, non per analisi approfondite di documenti.

RAG è ideale per:

  • Rispondere a domande da base di conoscenza
  • Riassuntione delle politiche, delle FAQ e dei contenuti procedurali
  • Recupero di fatti specifici da file o sistemi interni

RAG non è pensato per:

  • Confronto completo dei documenti
  • Valutazione della conformità alle politiche
  • Ragionamento complesso su lunghi documenti non strutturati

Considerazioni sulla sicurezza e conformità dell'IA generativa

Le funzionalità di intelligenza artificiale generative in Microsoft Copilot Studio sono progettate per offrire potenti funzionalità di conversazione e ragionamento mantenendo al contempo controlli avanzati di sicurezza, privacy e conformità.

Modelli di fondazione e hosting

  • Copilot Studio si basa su modelli di base addestrati da OpenAI.
  • Copilot Studio usa uno dei modelli OpenAI più recenti per le risposte generative.
  • I modelli vengono eseguiti interamente sui servizi Azure AI Foundry interni, allineati al limite di Attendibilità dei servizi Microsoft.
  • Ogni utilizzo del modello rispetta i principi e le politiche di Microsoft Responsible AI .

Istruzioni personalizzate

I creatori possono fornire istruzioni personalizzate per modellare il comportamento del modello, influenzare il tono o aggiungere regole di formattazione. Queste istruzioni aiutano a personalizzare le risposte generative alle esigenze dell'organizzazione, rispettando però i filtri di sicurezza e i controlli di conformità.

Archiviazione ed elaborazione dei dati

  • Data storage and processing in Copilot Studio potrebbero spostare i dati tra i limiti internazionali quando l'hosting del modello locale non è disponibile.
  • Quando questo spostamento dei dati non è consentito, gli amministratori possono usare le impostazioni dell'ambiente per disabilitare funzionalità specifiche, ad esempio Azure modelli linguistici o Ricerca Bing.
  • Copilot Studio non raccoglie o usa dati dei clienti per i modelli linguistici di training.

Gestione operativa dei dati

  • Durante il funzionamento, il sistema memorizza temporaneamente le conversazioni in uno store sicuro gestito da Microsoft.
  • L'accesso autorizzato al personale Microsoft è limitato tramite le Secure Access Workstations (SAW) con controlli Just-In-Time (JIT).
  • Le organizzazioni possono ulteriormente controllare l'accesso tramite Customer Lockbox, richiedendo un'approvazione esplicita prima che gli ingegneri di supporto Microsoft possano visualizzare i dati.

Risoluzione dei problemi di telemetria

  • Le funzionalità di IA generativa generano dati aggiuntivi di risoluzione dei problemi, ma solo per azioni avviate dal creatore nel pannello di Test, in particolare quando il creatore dà un pollice in su o in basso a una risposta.
  • Non vengono registrati dati aggiuntivi dei clienti al di fuori di questo esplicito ciclo di feedback.

Monitoraggio degli abusi e sicurezza

Poiché più livelli di sicurezza proteggono già le funzionalità di intelligenza artificiale generative, Copilot Studio disabilita Azure il monitoraggio degli abusi di intelligenza artificiale per evitare di registrare ulteriormente i dati dei clienti.