Condividi tramite


Modelli di ricerca e recupero

Gli agenti moderni necessitano di capacità sofisticate di ricerca e recupero per accedere e elaborare efficacemente le informazioni provenienti da fonti di dati diverse. Questo articolo esamina quattro modelli principali per implementare ricerca e recupero nelle architetture degli agenti: le capacità di ricerca integrate di Microsoft, le query strutturate nel database, l'indicizzazione semantica personalizzata e gli approcci ibridi a più passi.

Ogni pattern offre vantaggi e compromessi distinti in termini di sforzo da sviluppatore, granularità del controllo e caratteristiche prestazionali. Comprendere questi modelli aiuta gli architetti di soluzioni a scegliere l'approccio ottimale in base ai loro casi d'uso specifici, all'infrastruttura esistente e ai requisiti di prestazioni.

Considerazioni chiave trattate:

Le sezioni seguenti dettagliano l'architettura di ogni pattern, le considerazioni di implementazione e i casi d'uso ottimali per guidare le tue decisioni strategiche di ricerca e recupero.

Capacità di ricerca integrate

Le funzionalità di ricerca predefinite di Microsoft offrono l'approccio più basso per lo sviluppatore usando gli indici predefiniti gestiti dall'infrastruttura Microsoft 365. Queste funzionalità includono connettori Copilot, SharePoint knowledge base e funzionalità di ricerca Web.

Diagramma dell'architettura che mostra il flusso di ricerca integrato di Microsoft attraverso i connettori Copilot, la conoscenza di SharePoint e la ricerca web con una configurazione minima richiesta per gli sviluppatori.

Questo modello offre una perfetta integrazione con gli ecosistemi Microsoft 365, ma limita il controllo sulle proprietà indicizzate, sugli intervalli di indicizzazione e sui tipi di file supportati per le funzionalità offerte dalla piattaforma. La sequenza e la classifica delle ricerche rimangono fuori dal controllo degli sviluppatori, rendendo questo approccio adatto a scenari di ricerca generica ma potenzialmente limitante per esigenze specializzate.

Annotazioni

Gli indici semantici restituiscono frammenti (brevi estratti) di dati, rendendoli poco adatti a scenari che richiedono un'analisi completa di documenti o tabelle. I casi d'uso che richiedono informazioni da più pagine in documenti lunghi o da più tabelle all'interno di fogli di calcolo non sono ottimali per questo tipo di ricerca.

Interrogazioni strutturate su database

Le architetture di query strutturate utilizzano la capacità dei modelli linguistici di generare stringhe di linguaggio di query per l'esecuzione contro sistemi di database esistenti. Questo approccio ottimizza i flussi di lavoro che richiedono valori calcolati o derivati già risolti all'interno dei sistemi di archiviazione di database.

Diagramma che illustra un flusso di query strutturato in cui i modelli linguistici estraggono entità dagli input dell'utente e generano query SQL o KQL per l'esecuzione del database.

Questo modello eccelle quando gli agenti devono accedere a dati strutturati tramite linguaggi di query consolidati come SQL, KQL e DAX (Data Analysis Expressions). Viste ottimizzate del database possono migliorare ulteriormente le prestazioni precalcolando i modelli di query comuni e semplificando l'accesso ai dati per i modelli linguistici.

Annotazioni

Gli sviluppatori dovrebbero fornire una documentazione completa e descrizioni dei campi per consentire ai modelli linguistici di creare query appropriate. Sebbene i modelli linguistici siano fluenti nei linguaggi di interrogazione, richiedono un contesto dettagliato sulla struttura dei dati e sulle relazioni per generare query efficaci.

Indicizzazione semantica personalizzata

L'indicizzazione semantica personalizzata richiede agli sviluppatori di creare indici ospitati esternamente con configurazioni personalizzate di parsing, ranking, dizionario e dimensione di snippet. Questo approccio fornisce un controllo dettagliato sui risultati di ricerca e consente un'ottimizzazione specializzata per tipi di contenuto e casi d'uso specifici.

Diagramma architettonico che mostra implementazione personalizzata dell'indice semantico con hosting esterno, analisi personalizzata e controllo dettagliato dei risultati di ricerca.

Poiché gli indici semantici personalizzati sono presenti come strumenti esterni per Microsoft 365 agenti ospitati, abilitano cicli di ragionamento iterativi e operazioni di ricerca multistep complesse. Questa flessibilità supporta scenari di ricerca sofisticati che richiedono ottimizzazione specifica per dominio o elaborazione specializzata dei contenuti.

Approcci ibridi a più turni

Gli approcci ibridi combinano una ricerca strutturata o semantica per l'identificazione iniziale dei file con flussi multi-turn per un'analisi completa dei contenuti. Questo schema fornisce un ragionamento più profondo su tutto il contenuto del file, gestendo al contempo le implicazioni sulle prestazioni di un'analisi completa.

Diagramma che mostra un approccio di ricerca ibrida usando la ricerca iniziale per identificare i file, seguito da flussi a più turni per l'estrazione completa del contenuto e il ragionamento.

Annotazioni

I flussi a più turni richiedono un tempo di elaborazione aggiuntivo a causa delle più chiamate di servizio necessarie per generare risposte complete. Questo approccio offre completezza a scapito dei tempi di risposta, rendendolo adatto a scenari in cui un'analisi completa supera i requisiti di velocità.

Passo successivo

Decidi come il tuo agente interagisce con i sistemi esterni e come compie azioni oltre il semplice recupero di informazioni.