Del via


Forbedr AI-svar ved at bruge Retrieval Augmented Generation

Hentning af Augmented Generation (RAG) i Microsoft Copilot Studio kombinerer ræsonneringsfunktionerne i sprogmodeller med pålidelig organisationsspecifik viden. Det gør det muligt for agenter at producere nøjagtige, kontekstuelle og jordnære svar baseret på virksomhedens indhold i stedet for udelukkende at stole på modelhukommelse.

I denne artikel lærer du, hvordan du:

  • Forstå, hvordan RAG forbedrer AI's pålidelighed og jordforbindelse.
  • Beskriv, hvordan Copilot Studio henter og syntetiserer viden.
  • Identificer de understøttede videnskilder og deres begrænsninger.
  • Anerkend governance, compliance og AI-sikkerhedshensyn.
  • Anvend RAG-koncepter, når du designer agenter i virksomhedsmiljøer.

Introduktion til RAG

RAG er et designmønster, der forbedrer AI's nøjagtighed ved at kombinere to funktioner:

  • Informationssøgning: Søgning i virksomhedens datakilder.
  • Tekstgenerering: Syntetisere den hentede information ved brug af en sprogmodel.

Denne tilgang reducerer forkert information, øger tilliden og genererer svar, der er forankret i reelt organisatorisk indhold.

RAG-arkitektur i Copilot Studio

Copilot Studios RAG-pipeline er bygget på Azure AI services og integreres tæt med Microsofts tillid, overholdelse af angivne standarder og sikkerhedsgrænser.

Kernekomponenter:

  • Copilot Studio runtime: Administrerer samtalepipelinen
  • Forespørgselsoptimeringsmotor: Omskriver og fortolker forespørgsler
  • Søgeudbydere: Bing, SharePoint, Graph, Dataverse, Azure AI Search
  • Opsummeringsmotor: Skaber jordnære, citerede svar
  • Modereringslag: Validerer beskeder og resuméer
  • State store: Korttidshukommelse (mindre end 30 dage; ikke brugt til træning)
  • Telemetri- og feedback-lagre: Giver indsigt og tilsyn

Diagram over Copilot Studio RAG-arbejdsproces, der viser meddelelsesindstilling, forespørgselsoptimering, hentning, opsummering og valideringstrin.

Sådan fungerer RAG i Copilot Studio

RAG i Copilot Studio følger en firetrinsproces:

  1. Omskrivning af forespørgsel
  2. Indholdssøgning
  3. Opsummering og responsgenerering
  4. Validering af sikkerhed og styring

1. Omskrivning af forespørgslen

Copilot Studio optimerer brugerens spørgsmål, før der søges:

  • Præciserer betydningen
  • Tilføjer kontekstuelle signaler (sidste 10 sving)
  • Forbedrer søgeordsmatchning
  • Genererer søgevenlige forespørgsler

Denne proces øger udhentningskvaliteten og reducerer irrelevante resultater.

2. Indholdssøgning

Efter at have omskrevet forespørgslen, kører systemet den mod alle de videnskilder, du har sat op. Copilot Studio får de tre vigtigste resultater fra hver kilde, så relevansen afstemmes med ydeevnen. Adfærden for hver videnskilde varierer afhængigt af faktorer som autentificering, indeksering, filformater og lagringsbegrænsninger.

Følgende tabel opsummerer alle understøttede videnskilder samt deres kapaciteter, begrænsninger og autentificeringskrav:

Videnskilde Beskrivelse Godkendelse Nøglekapaciteter, begrænsninger og begrænsninger
Offentlige data (hjemmesider) Websites indekseret af Bing Ingen
  • Hjemmesider skal indekseres af Bing.
  • Bing kan ikke begrænses til en region.
  • At bekræfte ejerskab af hjemmesiden fører til bedre resultater.
  • Offentlige hjemmesider: Maksimalt to undersider i dybden (/en/help/), ingen direkte sider.
  • Brugerdefineret Bing-søgning: Ét konfigurations-id, men det kan angives ved hjælp af en formel, Azure omkostninger, der dækkes af Microsoft, op til 400 URL-adresser, brugerdefinerede rangeringsindstillinger, maksimum to undersiders dybde (/en/hjælp/), understøtter direkte sider.
SharePoint/OneDrive Internt virksomhedsindhold (kun internt) Microsoft Entra ID uddelegeret godkendelse
  • Kræver, at brugeren godkendes med Microsoft Entra ID for at foretage delegerede opkald.
  • Matchende filer (maksimalt 15 MB) hentes for at få detaljerede uddrag til opsummering.
  • Sikkerhedstrimning: Returnerede resultater inkluderer kun indhold, som brugeren har læseadgang til.
  • Premiumfunktionen "Forbedrede søgeresultater" bruger lejer Microsoft Graph jordforbindelse til meddelelser, hvilket øger kvaliteten af resultaterne og den maksimale filstørrelse (200 MB).
Uploadede filer Filer uploadet til Dataverse-lagring Ingen
  • Filer (maksimalt 512 MB) gemmes i Dataverse-fillager, med maksimalt 500 filer pr. agent.
  • Filer indekseres i Dataverse Search og drager fordel af billed-/tabelgenkendelse i PDF'er.
  • Som standard indeholder citater ikke et link til filen, men dette link kan tilføjes med tilpasninger.
Dataverse-tabeller Strukturerede forretningsdokumenter (kun interne) Microsoft Entra ID uddelegeret godkendelse
  • Dataverse-tabeller (maksimalt 15) kan konfigureres med synonymer og en ordliste for at forbedre søgningen.
  • Forespørgsler i naturligt sprog omdannes til analytiske forespørgsler over strukturerede data.
Grafforbindelser Virksomhedsapps, der er indekseret i Microsoft Graph (kun interne) Microsoft Entra ID uddelegeret godkendelse
  • Kræver, at brugeren godkendes ved hjælp af Microsoft Entra ID til at foretage delegerede opkald.
  • Opret forbindelse til andre videnkilder til virksomheder, der er indekseret i Microsoft Graph-indekset, f.eks. ServiceNow KB, Confluence, brugerdefinerede virksomhedswebstedsdata med mere.
  • Premiumfunktionen "Forbedrede søgeresultater" bruger Tenant Microsoft Graph som base.
Realtidsforbindelser Live data fra systemer som Salesforce, Zendesk, SQL (kun internt) Brugeren skal være logget ind
  • Copilot connectors henter strukturerede data fra Salesforce, ServiceNow, Zendesk Azure SQL.
  • Den indloggede bruger skal oprette forbindelser til målsystemerne.
Azure AI Search Vektorbaseret semantisk søgning Konfigureret endpoint
  • Returnerer resultater fra et sammenkædet vektoriseret Azure AI Search indeks.
  • Forbindelsen delegeres ikke: Ingen sikkerhedstrimning, ingen krav om autentificering for brugeren.
Brugerdefinerede data Data leveret gennem API'er, flows eller brugerdefineret logik Ingen
  • Kræver et forudgående trin for at forespørge kildekoden (for eksempel ved at bruge cloud flows, connectors eller HTTP-forespørgsler).
  • Resultaterne sendes som input til de generative svar for at opsummere et svar på forespørgslen.
  • Inputdata skal være i tabelformat med tre egenskaber: Content (typisk uddrag af relevant indhold), ContentLocation (valgfrit, typisk en URL) og Title (valgfrit).

3. Opsummering og responsgenerering

  • AI syntetiserer hentet indhold
  • Anvender brugerdefinerede instruktioner for tone, formatering, sikkerhed eller kortfattethed
  • Genererer citater til de underliggende data
  • Personliggør svar ved at bruge brugerkontekst (som sprog, afdeling eller region)

4. Sikkerhed og validering af governance

Hvert svar gennemgår automatiserede valideringslag:

  • Moderering af skadelige, ondsindede, ikke-kompatible eller ophavsretligt beskyttede svar
  • Validering af jordforbindelse og fjernelse af forkerte oplysninger

Ingen kundedata træner sprogmodeller.

Vigtige overvejelser ved brug af RAG

RAG fungerer bedst til faktuelle spørgsmål og svar, ikke til dybdegående dokumentanalyse.

RAG er ideelt til:

  • Besvarelse af spørgsmål fra vidensbaser
  • Opsummering af politikker, FAQ'er og proceduremæssigt indhold
  • Hentning af specifikke fakta fra filer eller interne systemer

RAG er ikke beregnet til:

  • Fuld dokumentsammenligning
  • Evaluering af politikoverholdelse
  • Kompleks ræsonnement over lange, ustrukturerede dokumenter

Generativ AI-sikkerhed og overholdelsesovervejelser

Generative AI-funktioner i Microsoft Copilot Studio er designet til at levere effektive samtale- og ræsonneevner, samtidig med at du bevarer stærke kontrolelementer til sikkerhed, beskyttelse af personlige oplysninger og overholdelse af angivne standarder.

Fundamentmodeller og hosting

  • Copilot Studio er afhængig af basismodeller, som OpenAI træner.
  • Copilot Studio bruger en af de nyeste OpenAI-modeller til generative svar.
  • Modeller kører udelukkende på interne Azure AI Foundry tjenester, der er justeret efter grænsen for Microsoft Services Trust.
  • Al modelbrug følger Microsoft Responsible AI-principper og -politikker.

Brugerdefinerede instruktioner

Skabere kan levere brugerdefinerede instruktioner til at forme modeladfærd, påvirke tone eller tilføje formateringsregler. Disse instruktioner hjælper med at tilpasse de generative svar til organisationens behov, samtidig med at sikkerhedsfiltre og overholdelseskontroller respekteres.

Datalagring og -behandling

  • Datalager og -behandling i Copilot Studio kan flytte data på tværs af regionale grænser, når lokal modelhosting ikke er tilgængelig.
  • Når denne dataflytning ikke er tilladt, kan administratorer bruge miljøindstillinger til at deaktivere bestemte funktioner, f.eks. Azure sprogmodeller eller Bing Search.
  • Copilot Studio indsamler eller bruger ikke kundedata til oplæring af sprogmodeller.

Operationel datahåndtering

  • Under driften gemmer systemet midlertidigt samtaler i en sikret, Microsoft-drevet butik.
  • Autoriseret Microsoft-personales adgang er begrænset gennem Secure Access Workstations (SAWs) med Just-In-Time (JIT)-kontroller.
  • Organisationer kan yderligere kontrollere adgangen via Customer Lockbox, hvilket kræver eksplicit godkendelse, før Microsoft-supportingeniører kan se data.

Fejlfinding af telemetri

  • Generative AI-funktioner genererer ekstra fejlfindingsdata, men kun for skaberinitierede handlinger i Testpanelet, specifikt når producenten giver tommelfinger op eller ned til et svar.
  • Der logges ingen ekstra kundedata uden for denne eksplicitte feedback-loop.

Overvågning af misbrug og sikkerhed

Da flere sikkerhedslag allerede beskytter generative AI-funktioner, deaktiverer Copilot Studios generative AI Azure overvågning af ai-misbrug for at undgå yderligere logføring af kundedata.