Verbeter AI-antwoorden door gebruik te maken van Retrieval Augmented Generation

Retrieval Augmented Generation (RAG) in Microsoft Copilot Studio combineert de redeneercapaciteiten van taalmodellen met betrouwbare, organisatiespecifieke kennis. Het stelt agenten in staat om nauwkeurige, contextuele en onderbouwde antwoorden te produceren op basis van de inhoud van het bedrijf, in plaats van uitsluitend te vertrouwen op modelgeheugen.

In dit artikel leert u het volgende:

  • Begrijp hoe RAG de betrouwbaarheid en aarding van AI verbetert.
  • Beschrijf hoe Copilot Studio kennis ophaalt ensynthetiseert.
  • Identificeer de ondersteunde kennisbronnen en hun beperkingen.
  • Erken governance-, compliance- en AI-veiligheidsoverwegingen.
  • Pas RAG-concepten toe bij het ontwerpen van agenten in bedrijfsomgevingen.

Inleiding tot RAG

RAG is een ontwerppatroon dat de nauwkeurigheid van AI verbetert door twee mogelijkheden te combineren:

  • Informatieopvraging: Doorzoeken van bedrijfsgegevensbronnen.
  • Tekstgeneratie: Het synthetiseren van de opgehaalde informatie door gebruik te maken van een taalmodel.

Deze aanpak vermindert onjuiste informatie, vergroot het vertrouwen en genereert antwoorden die gebaseerd zijn op echte organisatorische inhoud.

RAG-architectuur in Copilot Studio

de RAG-pijplijn van Copilot Studio is gebaseerd op Azure AI-services en kan nauw worden geïntegreerd met de vertrouwens-, nalevings- en beveiligingsgrenzen van Microsoft.

Kerncomponenten:

  • Copilot Studio Runtime: Beheert de gesprekspijplijn
  • Query-optimalisatiemotor: Herschrijft en interpreteert queries
  • Zoekproviders: Bing, SharePoint, Graph, Dataverse, Azure AI Zoeken
  • Samenvattingsmotor: Maakt gefundeerde antwoorden met bronvermelding
  • Moderatielagen: Valideert berichten en samenvattingen
  • State store: Kortetermijngeheugen (minder dan 30 dagen; niet gebruikt voor training)
  • Telemetrie- en feedbackopslagplaatsen: Biedt inzicht en toezicht

Diagram van Copilot Studio RAG-werkstroom met berichtbeheer, queryoptimalisatie, ophalen, samenvatting en validatiestappen.

Hoe RAG werkt in Copilot Studio

RAG in Copilot Studio volgt een vierstapsproces:

  1. Query herschrijven
  2. Inhoudsopvraging
  3. Samenvatting en generatie van reacties
  4. Veiligheid en governance validatie

1. Queryherschrijving

Copilot Studio optimaliseert de vraag van de gebruiker voordat u gaat zoeken:

  • Verduidelijkt betekenis
  • Voegt contextuele signalen toe (laatste 10 beurten)
  • Verbetert trefwoordmatching
  • Genereert zoekvriendelijke zoekopdrachten

Dit proces verhoogt de opsporingskwaliteit en vermindert irrelevante resultaten.

2. Inhoudsopvraging

Na het herschrijven van de query draait het systeem deze tegen alle kennisbronnen die je hebt ingesteld. Copilot Studio krijgt de drie belangrijkste resultaten van elke bron, waarbij de relevantie wordt afgestemd op prestaties. Het gedrag van elke kennisbron varieert afhankelijk van factoren zoals authenticatie, indexering, bestandsformaten en opslagbeperkingen.

De volgende tabel vat alle ondersteunde kennisbronnen samen en hun mogelijkheden, beperkingen en authenticatievereisten:

Kennisbron Beschrijving Verificatie Belangrijke mogelijkheden, limieten en beperkingen
Publieke gegevens (websites) Websites geïndexeerd door Bing Geen
  • Websites moeten door Bing worden geïndexeerd.
  • Bing kan niet beperkt worden tot een regio.
  • Het bevestigen van het eigendom van de website leidt tot betere resultaten.
  • Openbare websites: Maximaal twee subpagina's diepte (/en/help/), geen directe pagina's.
  • Bing aangepaste zoekopdrachten: één configuratie-id, maar deze kan worden ingesteld met behulp van een formule, Azure kosten die worden gedekt door Microsoft, maximaal 400 URL's, aangepaste classificatieopties, maximaal twee subpagina's diepte (/en/help/), ondersteunt directe pagina's.
SharePoint / OneDrive Interne enterprise-inhoud (alleen intern) Microsoft Entra ID gedelegeerde authenticatie
  • Vereist dat de gebruiker wordt geverifieerd met Microsoft Entra ID om gedelegeerde aanroepen te maken.
  • Overeenkomende bestanden (maximaal 15 MB) worden opgehaald om gedetailleerde fragmenten samen te vatten.
  • Beveiligingstrimming: Teruggegeven resultaten bevatten alleen inhoud waartoe de gebruiker leestoegang heeft.
  • De premiumfunctie 'Verbeterde zoekresultaten' maakt gebruik van de Tenant Microsoft Graph basis voor berichtenverwerking, waardoor de kwaliteit van de resultaten wordt verbeterd en de maximale bestandsgrootte (200 MB) wordt verhoogd.
Geüploade bestanden Bestanden geüpload naar Dataverse-opslag Geen
  • Bestanden (maximaal 512 MB) worden opgeslagen in Dataverse-bestandsopslag, met een maximum van 500 bestanden per agent.
  • Bestanden worden geïndexeerd in Dataverse Search en profiteren van beeld-/tabelherkenning in PDF's.
  • Standaard bevatten citaties geen link naar het bestand, maar deze link kan wel worden toegevoegd met aanpassingen.
Dataverse-tabellen Gestructureerde bedrijfsdocumenten (alleen intern) Microsoft Entra ID gedelegeerde authenticatie
  • Dataverse-tabellen (maximaal 15) kunnen worden geconfigureerd met synoniemen en een woordenlijst om de zoekopdracht te verbeteren.
  • Natuurlijke taalqueries worden omgezet in analytische queries over gestructureerde data.
Graafconnectoren Enterprise-apps geïndexeerd in Microsoft Graph (alleen intern) Microsoft Entra ID gedelegeerde authenticatie
  • Vereist dat de gebruiker wordt geverifieerd met behulp van Microsoft Entra ID om gedelegeerde aanroepen uit te voeren.
  • Maak verbinding met andere zakelijke kennisbronnen die zijn geïndexeerd in de Microsoft Graph-index, zoals ServiceNow KB, Confluence, aangepaste ondernemingswebsitegegevens en meer.
  • De premium-functie 'Verbeterde zoekresultaten' maakt gebruik van Tenant Microsoft Graph grounding.
Real-time connectors Live data van systemen zoals Salesforce, Zendesk, SQL (alleen intern) De gebruiker moet ingelogd zijn
  • Copilot connectors gestructureerde gegevens ophalen uit Salesforce, ServiceNow, Zendesk, Azure SQL.
  • De ingelogde gebruiker moet verbindingen maken met de doelsystemen.
Azure AI Zoeken Vectorgebaseerde semantische zoekopdracht Geconfigureerd eindpunt
  • Retourneert resultaten van een gekoppelde vectorized Azure AI Zoeken index.
  • Verbinding wordt niet gedelegeerd: geen beveiligingstrim, geen authenticatievereiste voor de gebruiker.
Aangepaste gegevens Data geleverd via API's, flows of aangepaste logica Geen
  • Vereist een voorafgaande stap om de bron te bevragen (bijvoorbeeld door cloud flows, connectors of HTTP-verzoeken te gebruiken).
  • Resultaten worden als invoer doorgegeven aan de generatieve antwoorden om een antwoord voor de query samen te vatten.
  • Invoergegevens moeten in tabelformaat zijn, met drie eigenschappen: Content (meestal fragmenten van relevante inhoud), ContentLocation (optioneel, meestal een URL) en Title (optioneel).

3. Samenvatting en responsgeneratie

  • AI synthetiseert opgehaalde inhoud
  • Past aangepaste instructies toe voor toon, opmaak, veiligheid of beknoptheid
  • Genereert citaties naar de onderliggende data
  • Personaliseert antwoorden door gebruik te maken van gebruikerscontext (zoals taal, afdeling of regio).

4. Veiligheid en governance validatie

Elke reactie gaat door geautomatiseerde validatielagen:

  • Moderatie van schadelijke, kwaadaardige, niet-conforme of auteursrechtelijk beschermde antwoorden
  • Grondvalidatie en verwijdering van onjuiste informatie

Geen klantdata traint taalmodellen.

Belangrijke overwegingen bij het gebruik van RAG

RAG werkt het beste voor feitelijke vragen en antwoorden, niet voor diepgaande documentanalyse.

RAG is ideaal voor:

  • Vragen beantwoorden uit kennisbanken
  • Samenvatting van beleid, veelgestelde vragen en procedurele inhoud
  • Specifieke feiten ophalen uit bestanden of interne systemen

RAG is niet bedoeld voor:

  • Volledige documentvergelijking
  • Evaluatie van beleidsnaleving
  • Complex redeneren over lange, ongestructureerde documenten

Generatieve AI-beveiligings- en compliance-overwegingen

Generatieve AI-functies in Microsoft Copilot Studio zijn ontworpen om krachtige gespreks- en redeneringsmogelijkheden te bieden met behoud van sterke beveiliging, privacy en nalevingscontroles.

Stichtingsmodellen en hosting

  • Copilot Studio is afhankelijk van basismodellen die OpenAI traint.
  • Copilot Studio maakt gebruik van een van de nieuwste OpenAI-modellen voor generatieve antwoorden.
  • Modellen worden volledig uitgevoerd op interne Azure AI Foundry-services, afgestemd op de grens van Microsoft Services Trust.
  • Al het gebruik van het model volgt de principes en beleidsregels van Microsoft Responsible AI .

Aangepaste instructies

Makers kunnen aangepaste instructies geven om modelgedrag te vormen, toon te beïnvloeden of opmaakregels toe te voegen. Deze instructies helpen de generatieve antwoorden af te stemmen op de behoeften van de organisatie, terwijl ze toch veiligheidsfilters en nalevingscontroles respecteren.

Gegevens opslaan en verwerken

  • Gegevensopslag en -verwerking in Copilot Studio kan gegevens verplaatsen over regionale grenzen wanneer het hosten van lokale modellen niet beschikbaar is.
  • Wanneer deze gegevensverplaatsing niet is toegestaan, kunnen beheerders omgevingsinstellingen gebruiken om specifieke functies zoals Azure taalmodellen of Bing Search uit te schakelen.
  • Copilot Studio verzamelt of gebruikt geen klantgegevens voor trainingstaalmodellen.

Operationele gegevensverwerking

  • Tijdens de werking slaat het systeem gesprekken tijdelijk op in een beveiligde, door Microsoft beheerde opslag.
  • Geautoriseerde toegang voor Microsoft-personeel is beperkt via Secure Access Workstations (SAWs) met Just-In-Time (JIT) besturing.
  • Organisaties kunnen de toegang verder controleren via Customer Lockbox, waarbij expliciete goedkeuring vereist is voordat Microsoft-supportingenieurs de gegevens kunnen bekijken.

Probleemoplossing voor telemetrie

  • Generatieve AI-functies genereren extra probleemoplossingsgegevens, maar alleen voor door de maker geïnitieerde acties in het Testpaneel, specifiek wanneer de maker een duim omhoog of omlaag geeft op een reactie.
  • Er worden geen extra klantgegevens geregistreerd buiten deze expliciete feedbackloop.

Misbruikmonitoring en veiligheid

Omdat meerdere veiligheidslagen al generatieve AI-functies beschermen, schakelt Copilot Studio's generatieve AI Azure AI-misbruikbewaking uit om verdere logboekregistratie van klantgegevens te voorkomen.