Mémoire dans le service Microsoft Foundry Agent (préversion)

Important

La mémoire (préversion) dans le Service de l’agent Foundry et l’API de magasin de mémoire (préversion) sont concédées sous licence dans le cadre de votre abonnement Azure et sont soumises aux conditions applicables des « Préversions » des Conditions des produits Microsoft et de l’Addendum sur la protection des données des produits et services Microsoft, ainsi qu’aux conditions des préversions des services d’IA générative Microsoft des Conditions supplémentaires pour les préversions Microsoft Azure.

La mémoire dans le service Microsoft Foundry Agent est une solution de mémoire gérée à long terme. Il permet la continuité de l’agent entre les sessions, les appareils et les flux de travail. En créant et en gérant des magasins de mémoire, vous pouvez créer des agents qui conservent les préférences utilisateur, conservent l’historique des conversations et fournissent des expériences personnalisées.

Cet article fournit une vue d’ensemble de la mémoire de l’agent, y compris ses concepts, ses cas d’usage et ses limitations. Pour obtenir des instructions d’utilisation, consultez Créer et utiliser la mémoire dans le service Agent Foundry.

Qu’est-ce que la mémoire ?

La mémoire est des connaissances persistantes conservées par un agent entre les sessions. En règle générale, la mémoire de l’agent se trouve dans deux catégories :

La mémoire à court terme suit la conversation de la session actuelle et maintient le contexte immédiat pour les interactions en cours. Les infrastructures d’orchestration d’agents gèrent généralement cette mémoire dans le contexte de session.
La mémoire à long terme conserve les connaissances distillées entre les sessions. Le modèle peut se rappeler et s’appuyer sur les interactions utilisateur précédentes au fil du temps. La mémoire à long terme nécessite un système persistant qui extrait, consolide et gère les connaissances.

La mémoire dans Service de l’agent Foundry est conçue pour une mémoire à long terme. Il extrait des informations significatives des conversations, les consolide en connaissances durables et les rend disponibles dans les sessions.

Fonctionnement de la mémoire

En coulisses, les souvenirs sont stockés en tant qu'éléments dans un magasin de mémoire géré. Le système peut appliquer la logique de consolidation et de résolution des conflits le cas échéant (par exemple, pour fusionner des informations de profil utilisateur en double ou en chevauchement).

Note

Le comportement de consolidation peut varier en fonction du type de mémoire et peut changer pendant la préversion. Pour connaître le comportement le plus récent, consultez Créer et utiliser la mémoire dans le service de l’Agent Foundry.

La mémoire fonctionne dans les phases suivantes :

Extraction: Lorsqu’un utilisateur interagit avec un agent, le système extrait activement les informations clés de la conversation, telles que les préférences utilisateur, les faits et le contexte pertinent. Par exemple, les préférences telles que « allergique aux produits laitiers » et les résumés des activités récentes sont identifiées et stockées.
Consolidation: Les mémoires extraites sont consolidées pour maintenir le magasin de mémoire efficace et pertinent. Le système utilise des llms pour fusionner des rubriques similaires ou dupliquées afin que l’agent ne stocke pas d’informations redondantes. Les faits contradictoires, tels qu’une nouvelle allergie, sont résolus pour maintenir l’exactitude de la mémoire.
Récupération: Lorsque l’agent doit rappeler des informations, il recherche les mémoires les plus pertinentes dans le magasin de mémoires. Cela permet à l’agent d’exposer rapidement le contexte approprié, ce qui rend les conversations naturelles et informées. Pour obtenir des résultats optimaux, récupérez les informations de profil utilisateur stables au début de la conversation afin que l’agent puisse personnaliser les réponses.

Voici un exemple de la façon dont la mémoire peut améliorer et personnaliser les interactions entre un agent de recette et un utilisateur qui a précédemment exprimé une allergie alimentaire :

Conseil

Vous avez besoin d’aide pour décider quand utiliser la mémoire ? Tenez compte de ces instructions :

Utilisez la mémoire pour un contexte spécifique à l’utilisateur qui persiste au fil du temps.
Utilisez une base de connaissances Foundry IQ pour ancrer votre agent sur un contenu organisationnel soigneusement organisé.
Utilisez l’outil de recherche de fichiers pour rechercher des documents fournis par l’utilisateur pendant une interaction.

Types de mémoire

La mémoire de Service de l’agent Foundry extrait et stocke deux types de mémoire à long terme :

Type	Description	Configuration
Mémoire du profil utilisateur	Informations et préférences sur l’utilisateur, telles que le nom préféré, les restrictions alimentaires et les préférences linguistiques. Ces souvenirs sont considérés comme « statiques » par rapport à une conversation, car ils ne dépendent généralement pas du contexte de conversation actuel. Récupérez des souvenirs de profil utilisateur une fois au début de chaque conversation.	Spécifiez `user_profile_details` dans un magasin de mémoire.
Mémoire récapitulative de conversation	Résumé distillé de chaque sujet ou thread abordé dans une session de conversation. Ces souvenirs permettent aux utilisateurs de poursuivre les conversations ou de référencer les sessions antérieures sans répéter le contexte antérieur. Récupérez les mémoires de synthèse de la conversation en cours pour exposer les threads pertinents.	Défini `chat_summary_enabled` sur `true` dans un magasin de mémoire.

Utilisation de la mémoire

Il existe deux façons d’utiliser la mémoire pour les interactions de l’agent :

Outil de recherche de mémoire : attachez l’outil de recherche de mémoire à un agent de requête pour activer la lecture et l’écriture dans le stockage de mémoire pendant les conversations. Cette approche est idéale pour la plupart des scénarios, car elle simplifie la gestion de la mémoire. Pour plus d’informations, consultez Utiliser les mémoires via un outil d’agent.
API du magasin de mémoire : Interagissez directement avec le magasin de mémoire à l’aide des API de bas niveau. Cette approche offre davantage de contrôle et de flexibilité pour les cas d’usage avancés. Pour plus d’informations, consultez Utiliser des souvenirs via des API.

Cas d’usage

Les exemples suivants illustrent comment la mémoire peut améliorer différents types d’agents.

Agent de support client qui mémorise votre nom, vos problèmes et résolutions précédents, vos numéros de ticket et votre méthode de contact préférée (conversation, e-mail ou rappel). Cette mémoire vous permet d’éviter de répéter des informations, de sorte que les conversations sont plus efficaces et satisfaisantes.
Assistant commercial personnel qui mémorise votre taille dans des marques spécifiques, les couleurs préférées, les retours passés et les achats récents. L’agent peut suggérer des éléments pertinents dès que vous démarrez une session et éviter de recommander des produits que vous possédez déjà.

Risques de sécurité

Lorsque vous travaillez avec la mémoire dans le service Foundry Agent, le modèle de langage volumineux (LLM) extrait et consolide les souvenirs en fonction des conversations. Protégez la mémoire contre les menaces telles que l'injection de requêtes et l'altération de la mémoire. Ces risques surviennent lorsque des données incorrectes ou dangereuses sont stockées dans la mémoire de l’agent, ce qui peut influencer les réponses et les actions de l’agent.

Pour atténuer les risques de sécurité, tenez compte des actions suivantes :

Utilisez Azure AI Sécurité du Contenu et sa détection des injections de commandes : Vérifiez toutes les commandes pénétrant ou sortant du système de mémoire pour prévenir le contenu malveillant.
Effectuez des tests d'attaque et d'agression : Soumettez régulièrement votre agent à des tests de résistance pour des vulnérabilités d'injection à travers des exercices contradictoires contrôlés.

Limitations et quotas

Les limitations et quotas suivants s’appliquent à la mémoire dans le service Foundry Agent. Pour connaître les limitations et quotas plus larges, consultez Limites, quotas et support régional du service Foundry Agent.

Limitations

Actuellement, la mémoire nécessite des déploiements compatibles de modèles de chat OpenAI sur Azure et de modèles d'intégration. Pour obtenir la liste des modèles pris en charge, consultez Foundry Models vendus directement par Azure.
Pour les API mémoire de bas niveau, vous devez définir scope explicitement dans chaque requête. La résolution de portée automatique à partir de l'identité de l'appelant est prise en charge uniquement lorsque vous utilisez l'outil de recherche de mémoire avec scope défini sur {{$userId}}. Pour plus d’informations, consultez Comprendre l’étendue.

Quotas

Étendues maximales par magasin de mémoire : 100
Mémoires maximales par portée : 10 000
Mémoires de recherche : 1 000 requêtes par minute
Mémoires de mise à jour : 1 000 requêtes par minute

Disponibilité de la région

La mémoire est disponible dans les régions suivantes :

Australie Est
Brésil Sud
Canada Est
Est des États-Unis 2
France Central
Italie Nord
Japon Est
Corée Centrale
USA Centre Nord
Norvège Est
Afrique du Sud Nord
Inde sud
Suède Centre
Suisse Nord
Émirats arabes unis Nord
Royaume-Uni Sud
USA Ouest
Ouest des États-Unis 2
Ouest des États-Unis 3

Prix

Mémoire est actuellement en version préliminaire publique. La tarification et la facturation de la mémoire et de l’API du Magasin de mémoire peuvent changer pendant la préversion.

Vous êtes facturé pour l’utilisation des modèles de conversation sous-jacents et d’incorporation que vous configurez. Pour plus d’informations sur les tarifs actuels, consultez la tarification du service de l’agent Foundry.

Suivez la configuration de bout en bout : Créer et utiliser la mémoire dans le service Foundry Agent
Confirmer la disponibilité des modèles Azure OpenAI et des régions pour le service de l’agent Foundry
Créer un agent complet : démarrage rapide Microsoft Foundry

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-04-30