Améliorer les réponses de l’IA en utilisant la génération augmentée par récupération

La génération augmentée par récupération (RAG) dans Microsoft Copilot Studio combine les capacités de raisonnement des modèles linguistiques en combinaison avec des connaissances fiables et spécifiques à l’organisation. Il permet aux agents de produire des réponses précises, contextuelles et ancrées, basées sur le contenu de l’entreprise plutôt que de se reposer uniquement sur la mémoire du modèle.

Dans cet article, vous allez apprendre à :

  • Comprenez comment RAG améliore la fiabilité et la stabilité de l’IA.
  • Décrivez comment Copilot Studio récupère et synthétise les connaissances.
  • Identifiez les sources de connaissances supportées et leurs contraintes.
  • Reconnaissez les considérations de gouvernance, de conformité et de sécurité de l’IA.
  • Appliquer les concepts RAG lors de la conception d’agents dans des environnements d’entreprise.

Présentation de RAG

RAG est un modèle de conception qui améliore la précision de l’IA en combinant deux capacités :

  • Recherche d’information : recherche dans les sources de données d’entreprise.
  • Génération de texte : Synthétiser les informations récupérées à l’aide d’un modèle de langage.

Cette approche réduit les informations incorrectes, augmente la confiance et génère des réponses ancrées dans un contenu organisationnel réel.

Architecture RAG dans Copilot Studio

La pipeline RAG de Copilot Studio repose sur les services Azure AI et s'intègre étroitement dans le cadre de confiance, de conformité et de sécurité de Microsoft.

Composants principaux :

  • Copilot Studio runtime : gère le pipeline conversationnel
  • Moteur d’optimisation des requêtes : Réécrit et interprète les requêtes
  • fournisseurs de recherche : Bing, SharePoint, Graph, Dataverse, Recherche Azure AI
  • Moteur de synthèse : Crée des réponses ancrées et citées
  • Couches de modération : Valide les messages et les résumés
  • Mémoire d’État : mémoire à court terme (moins de 30 jours ; non utilisée pour la formation)
  • Magasins de télémétrie et de retours : Fournit des perspectives et un contrôle

Diagram de flux de travail COPILOT Studio RAG montrant la modération des messages, l’optimisation des requêtes, l’extraction, la synthèse et les étapes de validation.

Fonctionnement de RAG dans Copilot Studio

RAG dans Copilot Studio suit un processus en quatre étapes :

  1. Réécriture des requêtes
  2. Récupération de contenu
  3. Résumé et génération de réponses
  4. Validation de la sécurité et de la gouvernance

1. Réécriture des requêtes

Copilot Studio optimise la question de l'utilisateur avant de rechercher :

  • Clarifie le sens
  • Ajoute des signaux contextuels (les 10 derniers tours)
  • Améliore la correspondance par mots-clés
  • Génère des requêtes adaptées à la recherche

Ce processus améliore la qualité de la récupération et réduit les résultats non pertinents.

2. Récupération de contenu

Après réécriture de la requête, le système l’exécute sur toutes les sources de connaissances que vous avez configurées. Copilot Studio obtient les trois premiers résultats de chaque source, en équilibrant la pertinence avec les performances. Le comportement de chaque source de connaissances varie selon des facteurs tels que l’authentification, l’indexation, les formats de fichiers et les contraintes de stockage.

Le tableau suivant résume toutes les sources de connaissances prises en charge ainsi que leurs capacités, contraintes et exigences d’authentification :

Source de connaissances Description Authentification Capacités clés, limites et contraintes
Données publiques (sites web) Sites indexés par Bing Aucun
  • Les sites web doivent être indexés par Bing.
  • Bing ne peut pas être limité à une région.
  • Confirmer la propriété du site web donne de meilleurs résultats.
  • Sites publics : profondeur maximale de deux sous-pages (/en/help/), pas de pages directes.
  • Recherche personnalisée Bing : Un ID de configuration, mais il peut être défini à l’aide d’une formule, les coûts Azure sont couverts par Microsoft, jusqu’à 400 URLs, options de classement personnalisées, profondeur maximale de deux sous-pages (/en/help/), prend en charge les pages directes.
SharePoint / OneDrive Contenu interne de l’entreprise (uniquement interne) Microsoft Entra ID authentification par délégation
  • Exige que l’utilisateur soit authentifié avec Microsoft Entra ID pour effectuer des appels délégués.
  • Les fichiers correspondants (maximum 15 Mo) sont récupérés pour obtenir des extraits détaillés à résumer.
  • Filtrage de sécurité : Les résultats retournés incluent uniquement le contenu auquel l’utilisateur a un accès en lecture.
  • La fonctionnalité Premium « Résultats de la recherche améliorée » utilise Microsoft Graph client pour les messages, augmentant la qualité des résultats et la taille maximale des fichiers (200 Mo).
Fichiers téléchargés Fichiers téléchargés dans le stockage Dataverse Aucun
  • Les fichiers (maximum 512 Mo) sont stockés dans le stockage de fichiers Dataverse, avec un maximum de 500 fichiers par agent.
  • Les fichiers sont indexés dans Dataverse Search et bénéficient de la reconnaissance d’images/tables dans les PDF.
  • Par défaut, les citations ne contiennent pas de lien vers le fichier, mais ce lien peut être ajouté avec des personnalisations.
Tables Dataverse Dossiers d’entreprise structurés (uniquement internes) Microsoft Entra ID authentification par délégation
  • Les tableaux Dataverse (maximum 15) peuvent être configurés avec des synonymes et un glossaire pour améliorer la recherche.
  • Les requêtes en langage naturel sont transformées en requêtes analytiques sur des données structurées.
Connecteurs graphiques Applications d’entreprise indexées en Microsoft Graph (internes uniquement) Microsoft Entra ID authentification par délégation
  • Exige que l’utilisateur soit authentifié à l’aide de Microsoft Entra ID pour effectuer des appels délégués.
  • Connectez-vous à d’autres sources de connaissances d’entreprise indexées dans l’index Microsoft Graph, comme ServiceNow KB, Confluence, les données de site web d’entreprise personnalisées, etc.
  • La fonctionnalité Premium « Résultats de recherche améliorés » utilise la base du Microsoft Graph tenant.
Connecteurs temps réel Données en direct provenant de systèmes comme Salesforce, Zendesk, SQL (uniquement en interne) L’utilisateur doit être connecté
  • Copilot connecteurs récupèrent des données structurées à partir de Salesforce, ServiceNow, Zendesk, Azure SQL.
  • L’utilisateur connecté doit créer des connexions avec les systèmes cibles.
Recherche Azure AI Recherche sémantique basée sur le vecteur Point de terminaison configuré
  • Retourne les résultats d’un index Recherche Azure AI vectorisé lié.
  • La connexion n’est pas déléguée : aucune suppression de sécurité, aucune exigence d’authentification pour l’utilisateur.
Données personnalisées Données fournies via des API, des flux ou une logique personnalisée Aucun
  • Nécessite une étape préalable pour interroger la source (par exemple, en utilisant des flux cloud, des connecteurs ou des requêtes HTTP).
  • Les résultats sont transmis en entrée aux réponses génératives pour résumer une réponse à la requête.
  • Les données d’entrée doivent être sous forme de tableau, avec trois propriétés : Content (généralement des extraits de contenu pertinent), ContentLocation (optionnel, généralement une URL), et Title (optionnel).

3. Synthèse et génération de réponses

  • L’IA synthétise le contenu récupéré
  • Applique des instructions personnalisées pour le ton, la mise en forme, la sécurité ou la concision
  • Génère des citations des données sous-jacentes
  • Personnalise les réponses en utilisant le contexte utilisateur (comme la langue, le département ou la région)

4. Validation de la sécurité et de la gouvernance

Chaque réponse passe par des couches de validation automatisées :

  • Modération des réponses nuisibles, malveillantes, non conformes ou protégées par le droit d’auteur
  • Validation de base et suppression des informations incorrectes

Aucune donnée client ne forme les modèles de langage.

Considérations clés lors de l’utilisation de RAG

RAG fonctionne mieux pour des questions et réponses factuelles, pas pour une analyse documentaire approfondie.

RAG est idéal pour :

  • Répondre aux questions issues de bases de connaissances
  • Résumé des politiques, des FAQ et du contenu procédural
  • Récupérer des faits spécifiques à partir de fichiers ou de systèmes internes

RAG n’est pas destiné à :

  • Comparaison complète des documents
  • Évaluation de la conformité aux politiques
  • Raisonnement complexe sur de longs documents non structurés

Considérations de sécurité et de conformité en IA générative

Les fonctionnalités d’IA générative dans Microsoft Copilot Studio sont conçues pour fournir des fonctionnalités de conversation et de raisonnement puissantes tout en conservant des contrôles de sécurité, de confidentialité et de conformité forts.

Modèles de fondation et hébergement

  • Copilot Studio s’appuie sur des modèles de base entraînés par OpenAI.
  • Copilot Studio utilise l’un des derniers modèles OpenAI pour les réponses génératives.
  • Les modèles s’exécutent entièrement sur les services internes d'Azure AI Foundry, alignés sur le périmètre de confiance des services Microsoft.
  • Toute utilisation des modèles respecte les principes et politiques de Microsoft Responsible AI .

Instructions personnalisées

Les créateurs peuvent fournir des instructions personnalisées pour façonner le comportement du modèle, influencer le ton ou ajouter des règles de mise en forme. Ces instructions aident à adapter les réponses génératives aux besoins de l’organisation tout en respectant les filtres de sécurité et les contrôles de conformité.

Traitement et stockage de données

  • Data storage and processing dans Copilot Studio peut déplacer des données entre les limites régionales lorsque l'hébergement de modèle local n'est pas disponible.
  • Lorsque ce déplacement de données n'est pas autorisé, les administrateurs peuvent utiliser les paramètres d'environnement pour désactiver des fonctionnalités spécifiques telles que Azure modèles linguistiques ou Recherche Bing.
  • Copilot Studio ne collecte ni n'utilise aucune donnée client pour les modèles de langage d'apprentissage.

Gestion des données opérationnelles

  • Pendant le fonctionnement, le système stocke temporairement les conversations dans un magasin sécurisé exploité par Microsoft.
  • L’accès du personnel autorisé Microsoft est restreint via des stations de travail d’accès sécurisé (SAW) avec contrôles Just-In-Time (JIT).
  • Les organisations peuvent également contrôler l’accès via Customer Lockbox, nécessitant une approbation explicite avant que les ingénieurs du support Microsoft puissent consulter les données.

Dépannage de la télémétrie

  • Les fonctionnalités d’IA générative génèrent des données supplémentaires de dépannage, mais uniquement pour les actions initiées par le créateur dans le panneau de Test, notamment lorsque le créateur donne un pouce levé ou un pouce baissé à une réponse.
  • Aucune donnée client supplémentaire n’est enregistrée en dehors de cette boucle de rétroaction explicite.

Surveillance des abus et sécurité

Étant donné que plusieurs couches de sécurité protègent déjà les fonctionnalités d'intelligence artificielle générative, Copilot Studio désactive la surveillance des abus d'IA d'Azure pour éviter la journalisation supplémentaire des données client.