Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Important
La mémoire (préversion) dans le Service de l’agent Foundry et l’API de magasin de mémoire (préversion) sont concédées sous licence dans le cadre de votre abonnement Azure et sont soumises aux conditions applicables des « Préversions » des Conditions des produits Microsoft et de l’Addendum sur la protection des données des produits et services Microsoft, ainsi qu’aux conditions des préversions des services d’IA générative Microsoft des Conditions supplémentaires pour les préversions Microsoft Azure.
La mémoire dans le service Microsoft Foundry Agent est une solution de mémoire gérée à long terme. Il permet la continuité de l’agent entre les sessions, les appareils et les flux de travail. En créant et en gérant des magasins de mémoire, vous pouvez créer des agents qui conservent les préférences utilisateur, conservent l’historique des conversations et fournissent des expériences personnalisées.
Cet article fournit une vue d’ensemble de la mémoire de l’agent, y compris ses concepts, ses cas d’usage et ses limitations. Pour obtenir des instructions d’utilisation, consultez Créer et utiliser la mémoire dans le service Agent Foundry.
Qu’est-ce que la mémoire ?
La mémoire est des connaissances persistantes conservées par un agent entre les sessions. En règle générale, la mémoire de l’agent se trouve dans deux catégories :
La mémoire à court terme suit la conversation de la session actuelle et maintient le contexte immédiat pour les interactions en cours. Les infrastructures d’orchestration d’agents gèrent généralement cette mémoire dans le contexte de session.
La mémoire à long terme conserve les connaissances distillées entre les sessions. Le modèle peut se rappeler et s’appuyer sur les interactions utilisateur précédentes au fil du temps. La mémoire à long terme nécessite un système persistant qui extrait, consolide et gère les connaissances.
La mémoire dans Service de l’agent Foundry est conçue pour une mémoire à long terme. Il extrait des informations significatives des conversations, les consolide en connaissances durables et les rend disponibles dans les sessions.
Fonctionnement de la mémoire
En coulisses, les souvenirs sont stockés en tant qu'éléments dans un magasin de mémoire géré. Le système peut appliquer la logique de consolidation et de résolution des conflits le cas échéant (par exemple, pour fusionner des informations de profil utilisateur en double ou en chevauchement).
Note
Le comportement de consolidation peut varier en fonction du type de mémoire et peut changer pendant la préversion. Pour connaître le comportement le plus récent, consultez Créer et utiliser la mémoire dans le service de l’Agent Foundry.
La mémoire fonctionne dans les phases suivantes :
Extraction: Lorsqu’un utilisateur interagit avec un agent, le système extrait activement les informations clés de la conversation, telles que les préférences utilisateur, les faits et le contexte pertinent. Par exemple, les préférences telles que « allergique aux produits laitiers » et les résumés des activités récentes sont identifiées et stockées.
Consolidation: Les mémoires extraites sont consolidées pour maintenir le magasin de mémoire efficace et pertinent. Le système utilise des llms pour fusionner des rubriques similaires ou dupliquées afin que l’agent ne stocke pas d’informations redondantes. Les faits contradictoires, tels qu’une nouvelle allergie, sont résolus pour maintenir l’exactitude de la mémoire.
Récupération: Lorsque l’agent doit rappeler des informations, il recherche les mémoires les plus pertinentes dans le magasin de mémoires. Cela permet à l’agent d’exposer rapidement le contexte approprié, ce qui rend les conversations naturelles et informées. Pour obtenir des résultats optimaux, récupérez les informations de profil utilisateur stables au début de la conversation afin que l’agent puisse personnaliser les réponses.
Voici un exemple de la façon dont la mémoire peut améliorer et personnaliser les interactions entre un agent de recette et un utilisateur qui a précédemment exprimé une allergie alimentaire :
Conseil
Vous avez besoin d’aide pour décider quand utiliser la mémoire ? Tenez compte de ces instructions :
- Utilisez la mémoire pour un contexte spécifique à l’utilisateur qui persiste au fil du temps.
- Utilisez une base de connaissances Foundry IQ pour ancrer votre agent sur un contenu organisationnel soigneusement organisé.
- Utilisez l’outil de recherche de fichiers pour rechercher des documents fournis par l’utilisateur pendant une interaction.
Types de mémoire
La mémoire de Service de l’agent Foundry extrait et stocke deux types de mémoire à long terme :
| Type | Description | Configuration |
|---|---|---|
| Mémoire du profil utilisateur | Informations et préférences sur l’utilisateur, telles que le nom préféré, les restrictions alimentaires et les préférences linguistiques. Ces souvenirs sont considérés comme « statiques » par rapport à une conversation, car ils ne dépendent généralement pas du contexte de conversation actuel. Récupérez des souvenirs de profil utilisateur une fois au début de chaque conversation. | Spécifiez user_profile_details dans un magasin de mémoire. |
| Mémoire récapitulative de conversation | Résumé distillé de chaque sujet ou thread abordé dans une session de conversation. Ces souvenirs permettent aux utilisateurs de poursuivre les conversations ou de référencer les sessions antérieures sans répéter le contexte antérieur. Récupérez les mémoires de synthèse de la conversation en cours pour exposer les threads pertinents. | Défini chat_summary_enabled sur true dans un magasin de mémoire. |
Utilisation de la mémoire
Il existe deux façons d’utiliser la mémoire pour les interactions de l’agent :
Outil de recherche de mémoire : attachez l’outil de recherche de mémoire à un agent de requête pour activer la lecture et l’écriture dans le stockage de mémoire pendant les conversations. Cette approche est idéale pour la plupart des scénarios, car elle simplifie la gestion de la mémoire. Pour plus d’informations, consultez Utiliser les mémoires via un outil d’agent.
API du magasin de mémoire : Interagissez directement avec le magasin de mémoire à l’aide des API de bas niveau. Cette approche offre davantage de contrôle et de flexibilité pour les cas d’usage avancés. Pour plus d’informations, consultez Utiliser des souvenirs via des API.
Cas d’usage
Les exemples suivants illustrent comment la mémoire peut améliorer différents types d’agents.
Agent de support client qui mémorise votre nom, vos problèmes et résolutions précédents, vos numéros de ticket et votre méthode de contact préférée (conversation, e-mail ou rappel). Cette mémoire vous permet d’éviter de répéter des informations, de sorte que les conversations sont plus efficaces et satisfaisantes.
Assistant commercial personnel qui mémorise votre taille dans des marques spécifiques, les couleurs préférées, les retours passés et les achats récents. L’agent peut suggérer des éléments pertinents dès que vous démarrez une session et éviter de recommander des produits que vous possédez déjà.
Risques de sécurité
Lorsque vous travaillez avec la mémoire dans le service Foundry Agent, le modèle de langage volumineux (LLM) extrait et consolide les souvenirs en fonction des conversations. Protégez la mémoire contre les menaces telles que l'injection de requêtes et l'altération de la mémoire. Ces risques surviennent lorsque des données incorrectes ou dangereuses sont stockées dans la mémoire de l’agent, ce qui peut influencer les réponses et les actions de l’agent.
Pour atténuer les risques de sécurité, tenez compte des actions suivantes :
Utilisez Azure AI Sécurité du Contenu et sa détection des injections de commandes : Vérifiez toutes les commandes pénétrant ou sortant du système de mémoire pour prévenir le contenu malveillant.
Effectuez des tests d'attaque et d'agression : Soumettez régulièrement votre agent à des tests de résistance pour des vulnérabilités d'injection à travers des exercices contradictoires contrôlés.
Limitations et quotas
Les limitations et quotas suivants s’appliquent à la mémoire dans le service Foundry Agent. Pour connaître les limitations et quotas plus larges, consultez Limites, quotas et support régional du service Foundry Agent.
Limitations
- Actuellement, la mémoire nécessite des déploiements compatibles de modèles de chat OpenAI sur Azure et de modèles d'intégration. Pour obtenir la liste des modèles pris en charge, consultez Foundry Models vendus directement par Azure.
- Pour les API mémoire de bas niveau, vous devez définir
scopeexplicitement dans chaque requête. La résolution de portée automatique à partir de l'identité de l'appelant est prise en charge uniquement lorsque vous utilisez l'outil de recherche de mémoire avecscopedéfini sur{{$userId}}. Pour plus d’informations, consultez Comprendre l’étendue.
Quotas
- Étendues maximales par magasin de mémoire : 100
- Mémoires maximales par portée : 10 000
- Mémoires de recherche : 1 000 requêtes par minute
- Mémoires de mise à jour : 1 000 requêtes par minute
Disponibilité de la région
La mémoire est disponible dans les régions suivantes :
- Australie Est
- Brésil Sud
- Canada Est
- Est des États-Unis 2
- France Central
- Italie Nord
- Japon Est
- Corée Centrale
- USA Centre Nord
- Norvège Est
- Afrique du Sud Nord
- Inde sud
- Suède Centre
- Suisse Nord
- Émirats arabes unis Nord
- Royaume-Uni Sud
- USA Ouest
- Ouest des États-Unis 2
- Ouest des États-Unis 3
Prix
Mémoire est actuellement en version préliminaire publique. La tarification et la facturation de la mémoire et de l’API du Magasin de mémoire peuvent changer pendant la préversion.
Vous êtes facturé pour l’utilisation des modèles de conversation sous-jacents et d’incorporation que vous configurez. Pour plus d’informations sur les tarifs actuels, consultez la tarification du service de l’agent Foundry.
Contenu connexe
- Suivez la configuration de bout en bout : Créer et utiliser la mémoire dans le service Foundry Agent
- Confirmer la disponibilité des modèles Azure OpenAI et des régions pour le service de l’agent Foundry
- Créer un agent complet : démarrage rapide Microsoft Foundry