Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
La memoria (anteprima) nel servizio agente Foundry e l'API di Memory Store (anteprima) vengono concesse in licenza all'utente come parte della sottoscrizione Azure e sono soggette ai termini applicabili alle "anteprime" nei Microsoft Product Terms e nel Microsoft Products and Services Data Protection Addendum, e i termini delle anteprime dei Servizi di Intelligenza Artificiale Generativa Microsoft nei Supplemental Terms of Use for Microsoft Azure Previews.
La memoria nel Microsoft Foundry Agent Service è una soluzione di memoria gestita a lungo termine. Consente la continuità dell'agente tra sessioni, dispositivi e flussi di lavoro. Creando e gestendo archivi di memoria, è possibile creare agenti che mantengono le preferenze utente, mantengono la cronologia delle conversazioni e offrono esperienze personalizzate.
Questo articolo offre una panoramica della memoria dell'agente, inclusi i concetti, i casi d'uso e le limitazioni. Per istruzioni sull'utilizzo, vedere Creare e usare la memoria nel servizio agente Foundry.
Che cos'è la memoria?
La memoria è una conoscenza persistente mantenuta da un agente tra le sessioni. In genere, la memoria dell'agente rientra in due categorie:
La memoria a breve termine tiene traccia della conversazione della sessione corrente e mantiene il contesto immediato per le interazioni in corso. "I framework di orchestrazione dell'Agente gestiscono in genere questa memoria come parte del contesto della sessione."
La memoria a lungo termine mantiene le conoscenze distillate attraverso le sessioni. Il modello può richiamare e compilare le interazioni utente precedenti nel tempo. La memoria a lungo termine richiede un sistema permanente che estrae, consolida e gestisce le conoscenze.
La memoria nel servizio agente Foundry è progettata per la memoria a lungo termine. Estrae informazioni significative dalle conversazioni, lo consolida in conoscenze durevoli e lo rende disponibile tra le sessioni.
Funzionamento della memoria
Dietro le quinte, i ricordi vengono archiviati come elementi in un archivio di memoria gestita. Il sistema può applicare la logica di consolidamento e risoluzione dei conflitti, se applicabile, ad esempio per unire informazioni sul profilo utente duplicate o sovrapposte.
Nota
Il comportamento di consolidamento può variare in base al tipo di memoria e può cambiare durante l'anteprima. Per il comportamento più recente, vedere Creare e usare la memoria nel servizio agente Foundry.
La memoria funziona nelle fasi seguenti:
Estrazione: Quando un utente interagisce con un agente, il sistema estrae attivamente informazioni chiave dalla conversazione, ad esempio preferenze utente, fatti e contesto pertinente. Ad esempio, le preferenze come "allergico al latte" e i riepiloghi delle attività recenti vengono identificate e archiviate.
Consolidamento: I ricordi estratti vengono consolidati per mantenere efficiente e pertinente l'archivio di memoria. Il sistema usa llms per unire argomenti simili o duplicati in modo che l'agente non archivii le informazioni ridondanti. Fatti in conflitto, come una nuova allergia, vengono risolti per mantenere una memoria accurata.
Recupero: Quando l'agente deve richiamare le informazioni, cerca i ricordi più rilevanti nell'archivio memoria. Ciò consente all'agente di individuare rapidamente il contesto corretto, rendendo le conversazioni naturali e informate. Per ottenere risultati ottimali, recuperare informazioni stabili sul profilo utente nelle prime fasi della conversazione in modo che l'agente possa personalizzare le risposte.
Ecco un esempio di come la memoria può migliorare e personalizzare le interazioni tra un agente ricetta e un utente che in precedenza ha espresso un'allergia alimentare:
Suggerimento
Serve aiuto per decidere quando usare la memoria? Prendere in considerazione queste linee guida:
- Usare la memoria per un contesto specifico dell'utente che persiste nel tempo.
- Usare una Knowledge Base di IQ Foundry per basare l'agente su contenuti aziendali curati.
- Usare lo strumento di ricerca file per cercare i documenti forniti dall'utente durante un'interazione.
Tipi di memoria
La memoria nel servizio foundry Agent estrae e archivia due tipi di memoria a lungo termine:
| Digitare | Descrizione | Configurazione |
|---|---|---|
| Memoria del profilo utente | Informazioni e preferenze relative all'utente, ad esempio il nome preferito, le restrizioni alimentari e le preferenze linguistiche. Questi ricordi sono considerati "statici" rispetto a una conversazione perché in genere non dipendono dal contesto di chat corrente. Recuperare i ricordi del profilo utente una volta all'inizio di ogni conversazione. | Specificare user_profile_details in una memoria di archiviazione. |
| Memoria riepilogativa chat | Riepilogo distillato di ogni argomento o thread trattato in una sessione di chat. Queste memorie consentono agli utenti di continuare le conversazioni o fare riferimento alle sessioni precedenti senza ripetere il contesto precedente. Recuperare i ricordi di riepilogo delle chat in base alla conversazione corrente per visualizzare i thread pertinenti. | Impostare chat_summary_enabled su true in un archivio di memoria. |
Uso della memoria
Esistono due modi per usare la memoria per le interazioni dell'agente:
Strumento di ricerca della memoria: Collegare lo strumento di ricerca della memoria a un agente di richiesta per abilitare la lettura e la scrittura nell'archivio memoria durante le conversazioni. Questo approccio è ideale per la maggior parte degli scenari perché semplifica la gestione della memoria. Per ulteriori informazioni, vedere Uso delle memorie tramite uno strumento agente.
API dell'archivio memoria: Interagire direttamente con l'archivio di memoria usando le API di basso livello. Questo approccio offre maggiore controllo e flessibilità per i casi d'uso avanzati. Per altre informazioni, vedere Usare memorie tramite LE API.
Casi d'uso
Gli esempi seguenti illustrano come la memoria può migliorare vari tipi di agenti.
Un agente del supporto tecnico che memorizza il nome, i problemi precedenti e le risoluzioni, i numeri di ticket e il metodo di contatto preferito (chat, posta elettronica o callback). Questa memoria consente di evitare di ripetere le informazioni, quindi le conversazioni sono più efficienti e soddisfacenti.
Assistente acquisti personale che ricorda le tue dimensioni in marchi specifici, colori preferiti, ritorni passati e acquisti recenti. L'agente può suggerire elementi pertinenti non appena si avvia una sessione ed evitare di consigliare prodotti già di proprietà.
Rischi per la sicurezza
Quando si lavora con la memoria nel servizio agente Foundry, il modello LLM (Large Language Model) estrae e consolida i ricordi in base alle conversazioni. Proteggere la memoria dalle minacce, come l'iniezione di prompt e la corruzione della memoria. Questi rischi si verificano quando i dati non corretti o dannosi vengono archiviati nella memoria dell'agente, influenzando potenzialmente le risposte e le azioni dell'agente.
Per attenuare i rischi di sicurezza, prendere in considerazione queste azioni:
Usare Sicurezza dei contenuti di Azure AI e il relativo prompt injection detection: Convalidare tutte le richieste di immissione o uscita dal sistema di memoria per evitare contenuti dannosi.
Eseguire attacchi e test antagonisti: Testare regolarmente l'agente per individuare le vulnerabilità di iniezione tramite esercizi antagonisti controllati.
Limitazioni e quote
Le limitazioni e le quote seguenti si applicano alla memoria nel servizio agente Foundry. Per limitazioni e quote più ampie, vedere limiti, quote e supporto regionale di Foundry Agent Service.
Limitazioni
- La memoria attualmente richiede modelli di chat e di incorporamento compatibili con Azure OpenAI. Per un elenco dei modelli supportati, vedere Foundry Models venduto direttamente da Azure.
- Per le API di memoria di basso livello, è necessario impostare
scopein modo esplicito in ogni richiesta. La risoluzione automatica dell'ambito dall'identità del chiamante è supportata solo quando si usa lo strumento di ricerca della memoria conscopeimpostato su{{$userId}}. Per altre informazioni, vedere Comprendere l'ambito.
Quote
- Ambiti massimi per ogni archivio di memoria: 100
- Memoria massima per ambito: 10.000
- Memorie di ricerca: 1.000 richieste al minuto
- Aggiornare i ricordi: 1.000 richieste al minuto
Disponibilità dell'area
La memoria è disponibile nelle aree seguenti:
- Australia orientale
- Brasile meridionale
- Canada orientale
- Stati Uniti orientali 2
- Francia centrale
- Italia settentrionale
- Giappone orientale
- Corea centrale
- Stati Uniti centro-settentrionali
- Norvegia orientale
- Sudafrica settentrionale
- India meridionale
- Svezia centrale
- Svizzera settentrionale
- Emirati Arabi Uniti settentrionali
- Regno Unito meridionale
- Stati Uniti occidentali
- Stati Uniti occidentali 2
- Stati Uniti occidentali 3
Tariffe
La memoria è attualmente disponibile in anteprima pubblica. I prezzi e la fatturazione per la memoria e l'API dell'archivio memoria possono cambiare durante l'anteprima.
Viene addebitato l'utilizzo dei modelli di chat ed embedding sottostanti che hai configurato. Per informazioni sui prezzi correnti, vedere Prezzi del servizio Foundry Agent.
Contenuto correlato
- Seguire la configurazione end-to-end: Creare e usare la memoria nel "Foundry Agent Service"
- Verificare la disponibilità del modello: modelli OpenAI di Azure e aree per il servizio agente Foundry
- Creare un agente completo: guida introduttiva Microsoft Foundry