Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Gli agenti moderni necessitano di capacità sofisticate di ricerca e recupero per accedere e elaborare efficacemente le informazioni provenienti da fonti di dati diverse. Questo articolo esamina quattro modelli principali per implementare ricerca e recupero nelle architetture degli agenti: le capacità di ricerca integrate di Microsoft, le query strutturate nel database, l'indicizzazione semantica personalizzata e gli approcci ibridi a più passi.
Ogni pattern offre vantaggi e compromessi distinti in termini di sforzo da sviluppatore, granularità del controllo e caratteristiche prestazionali. Comprendere questi modelli aiuta gli architetti di soluzioni a scegliere l'approccio ottimale in base ai loro casi d'uso specifici, all'infrastruttura esistente e ai requisiti di prestazioni.
Considerazioni chiave trattate:
- Le capacità di ricerca integrate di Microsoft: sforzo di sviluppo minimo con limitazioni della piattaforma
- Query strutturate: Accesso diretto al database per valori calcolati e derivati
- Indicizzazione personalizzata: controllo massimo con maggiore complessità di implementazione
- Approcci ibridi: analisi completa con compromessi sulle prestazioni
Le sezioni seguenti dettagliano l'architettura di ogni pattern, le considerazioni di implementazione e i casi d'uso ottimali per guidare le tue decisioni strategiche di ricerca e recupero.
Capacità di ricerca integrate
Le funzionalità di ricerca predefinite di Microsoft offrono l'approccio più basso per lo sviluppatore usando gli indici predefiniti gestiti dall'infrastruttura Microsoft 365. Queste funzionalità includono connettori Copilot, SharePoint knowledge base e funzionalità di ricerca Web.
Questo modello offre una perfetta integrazione con gli ecosistemi Microsoft 365, ma limita il controllo sulle proprietà indicizzate, sugli intervalli di indicizzazione e sui tipi di file supportati per le funzionalità offerte dalla piattaforma. La sequenza e la classifica delle ricerche rimangono fuori dal controllo degli sviluppatori, rendendo questo approccio adatto a scenari di ricerca generica ma potenzialmente limitante per esigenze specializzate.
Annotazioni
Gli indici semantici restituiscono frammenti (brevi estratti) di dati, rendendoli poco adatti a scenari che richiedono un'analisi completa di documenti o tabelle. I casi d'uso che richiedono informazioni da più pagine in documenti lunghi o da più tabelle all'interno di fogli di calcolo non sono ottimali per questo tipo di ricerca.
Interrogazioni strutturate su database
Le architetture di query strutturate utilizzano la capacità dei modelli linguistici di generare stringhe di linguaggio di query per l'esecuzione contro sistemi di database esistenti. Questo approccio ottimizza i flussi di lavoro che richiedono valori calcolati o derivati già risolti all'interno dei sistemi di archiviazione di database.
Questo modello eccelle quando gli agenti devono accedere a dati strutturati tramite linguaggi di query consolidati come SQL, KQL e DAX (Data Analysis Expressions). Viste ottimizzate del database possono migliorare ulteriormente le prestazioni precalcolando i modelli di query comuni e semplificando l'accesso ai dati per i modelli linguistici.
Annotazioni
Gli sviluppatori dovrebbero fornire una documentazione completa e descrizioni dei campi per consentire ai modelli linguistici di creare query appropriate. Sebbene i modelli linguistici siano fluenti nei linguaggi di interrogazione, richiedono un contesto dettagliato sulla struttura dei dati e sulle relazioni per generare query efficaci.
Indicizzazione semantica personalizzata
L'indicizzazione semantica personalizzata richiede agli sviluppatori di creare indici ospitati esternamente con configurazioni personalizzate di parsing, ranking, dizionario e dimensione di snippet. Questo approccio fornisce un controllo dettagliato sui risultati di ricerca e consente un'ottimizzazione specializzata per tipi di contenuto e casi d'uso specifici.
Poiché gli indici semantici personalizzati sono presenti come strumenti esterni per Microsoft 365 agenti ospitati, abilitano cicli di ragionamento iterativi e operazioni di ricerca multistep complesse. Questa flessibilità supporta scenari di ricerca sofisticati che richiedono ottimizzazione specifica per dominio o elaborazione specializzata dei contenuti.
Approcci ibridi a più turni
Gli approcci ibridi combinano una ricerca strutturata o semantica per l'identificazione iniziale dei file con flussi multi-turn per un'analisi completa dei contenuti. Questo schema fornisce un ragionamento più profondo su tutto il contenuto del file, gestendo al contempo le implicazioni sulle prestazioni di un'analisi completa.
Annotazioni
I flussi a più turni richiedono un tempo di elaborazione aggiuntivo a causa delle più chiamate di servizio necessarie per generare risposte complete. Questo approccio offre completezza a scapito dei tempi di risposta, rendendolo adatto a scenari in cui un'analisi completa supera i requisiti di velocità.
Passo successivo
Decidi come il tuo agente interagisce con i sistemi esterni e come compie azioni oltre il semplice recupero di informazioni.