Concepten van Fabric data-agent

Gegevensagent in Microsoft Fabric is een algemeen beschikbare functie waarmee u uw eigen gespreksgestuurde Q&A-systemen kunt bouwen met behulp van generatieve AI. Een Fabric-gegevensagent maakt gegevensinzichten toegankelijker en bruikbaarder voor iedereen in uw organisatie. Door een Fabric gegevensagent te gebruiken, kan uw team gesprekken voeren, met gewone vragen in het Engels, over de gegevens die uw organisatie heeft opgeslagen in Fabric OneLake en vervolgens relevante antwoorden ontvangen. Op deze manier kunnen zelfs mensen zonder technische expertise in AI of een grondige kennis van de gegevensstructuur nauwkeurige en contextrijke antwoorden krijgen. Binnen bredere agentische toepassingsarchitecturen op Microsoft Fabric fungeren gegevensagenten als het conversationele analyseonderdeel, waarbij verbinding wordt gemaakt met beheerde gegevens in OneLake via lakehouses, magazijnen, semantische modellen en KQL-databases in oplossingen met meerdere agents.

U kunt ook organisatiespecifieke instructies, voorbeelden en richtlijnen toevoegen om de Fabric gegevensagent aan te passen. Deze aanpak zorgt ervoor dat antwoorden aansluiten op de behoeften en doelstellingen van uw organisatie, zodat iedereen effectiever kan communiceren met gegevens. Fabric gegevensagent bevordert een cultuur van gegevensgestuurde besluitvorming, omdat het obstakels voor inzichttoegankelijkheid verlaagt, samenwerking vergemakkelijkt en uw organisatie meer waarde uit de gegevens helpt halen.

Vereiste voorwaarden

Vereisten voor governance

Als uw tenant of werkruimte wordt beheerd door Microsoft Purview beleid, moeten agents binnen dit beleid werken. Met de volgende Purview-beleidsregels kunt u de toegang van agenten en de resultaten die zij retourneren beperken, op basis van gevoeligheid en beleidsconfiguratie.

  • Purview DLP-beleid in Fabric Data Warehouse (algemeen beschikbaar): DLP-beleid kan de toegang tot gevoelige gegevens in magazijnactiva detecteren en beperken die door de agent worden opgevraagd.
  • Access-beperkingsbeleid (preview) voor Fabric KQL-database, Fabric SQL Database en Fabric Data Warehouse: Met dit beleid kan worden voorkomen dat de agent toegang heeft tot of resultaten retourneert van assets die als gevoelig zijn geclassificeerd.

Hoe de Fabric-gegevensagent werkt

De Fabric gegevensagent maakt gebruik van GROTE taalmodellen (LLM's) om gebruikers op natuurlijke wijze te helpen met hun gegevens te communiceren. De Fabric gegevensagent past Azure OpenAI Assistant API's toe en gedraagt zich als een agent. Het verwerkt gebruikersvragen, bepaalt de meest relevante gegevensbron (Lakehouse, Warehouse, Power BI gegevensset, KQL-databases, ontologie of Microsoft Graph) en roept het juiste hulpprogramma aan om query's te genereren, valideren en uitvoeren. Gebruikers kunnen vervolgens vragen stellen in gewone taal en gestructureerde, door mensen leesbare antwoorden ontvangen. Deze aanpak elimineert de noodzaak om complexe query's te schrijven en zorgt voor nauwkeurige en veilige gegevenstoegang.

Dit werkt als volgt in detail:

Vraag parseren en valideren: De Fabric gegevensagent past Azure API's van OpenAI Assistant toe als onderliggende agent om vragen van gebruikers te verwerken. Deze aanpak zorgt ervoor dat de vraag voldoet aan beveiligingsprotocollen, verantwoordelijk AI-beleid (RAI) en gebruikersmachtigingen. De Fabric-gegevensagent respecteert ook Microsoft Purview besturingselementen voor governance die zijn toegepast op de onderliggende Fabric gegevensbronnen, waaronder preventie van gegevensverlies (DLP) en beleid voor toegangsbeperking. Het afdwingen van beleid kan voorkomen dat bepaalde query's worden uitgevoerd of dat specifieke gegevens in reacties worden weergegeven. De Fabric gegevensagent dwingt strikt alleen-lezentoegang af, waarbij alleen-lezengegevensverbindingen met alle gegevensbronnen worden onderhouden.

Enforcement-mechanismen: De Fabric gegevensagent past verschillende beveiligingslagen toe tijdens de verwerking. Hierbij worden de referenties en machtigingen van de gebruiker gebruikt om toegang met minimale bevoegdheden af te dwingen, zodat elke interactie alleen gegevens bereikt die de gebruiker mag bekijken. De agent evalueert aanvragen op basis van tenant- en werkruimtebeleidsinstellingen voordat een actie wordt uitgevoerd. Beveiligingsregels beperken het aanroepen en de uitvoer van tools tot gegevenbronnen binnen het toegestane bereik, waardoor query's geen toegang hebben tot resources buiten het geconfigureerde bereik. U kunt eventueel Azure AI Content Safety integreren om inhoudsrisicocontroles toe te passen die helpen schadelijke of niet-beleidsreacties te verminderen.

Gegevensbronidentificatie: De Fabric-gegevensagent gebruikt de referenties van de gebruiker om toegang te krijgen tot het schema van de gegevensbron. Deze aanpak zorgt ervoor dat het systeem gegevensstructuurgegevens ophaalt die de gebruiker heeft gemachtigd om te bekijken. De agent evalueert vervolgens de vraag van de gebruiker op basis van alle beschikbare gegevensbronnen, waaronder relationele databases (Lakehouse en Warehouse), Power BI gegevenssets (Semantische modellen), KQL-databases, ontologieën en Microsoft Graph. Het kan ook verwijzen naar instructies van de door de gebruiker verstrekte gegevensagent om de meest relevante gegevensbron te bepalen. Voor Power BI semantische modellen gebruikt de agent de leesmachtiging van de gebruiker op het model om schema's en metagegevens op te halen voor het genereren van query's; bouwmachtiging is niet vereist voor door de agent gestuurde query's.

Tool-aanroep en querygeneratie: Zodra de juiste gegevensbron of bronnen zijn geïdentificeerd, wordt met de Fabric gegevensagent de vraag voor duidelijkheid en structuur opnieuw geformuleerd en wordt vervolgens het bijbehorende hulpprogramma aangeroepen om een gestructureerde query te genereren:

  • Natuurlijke taal voor SQL (NL2SQL) voor relationele databases (Lakehouse/Warehouse).
  • Natuurlijke taal voor DAX (NL2DAX) voor Power BI gegevenssets (Semantische modellen).
  • Natuurlijke taal naar KQL (NL2KQL) voor KQL-databases. NL2KQL kan KQL door de gebruiker gedefinieerde functies (UDF's) gebruiken wanneer deze beschikbaar zijn in de geselecteerde databases.
  • Microsoft Graph query's voor organisatiegegevens die toegankelijk zijn via Microsoft Graph.

Het geselecteerde hulpprogramma genereert een query op basis van het opgegeven schema, de metagegevens en de context die de onderliggende agent van de Fabric gegevensagent doorgeeft.

Queryvalidatie: Het hulpprogramma voert validatie uit om ervoor te zorgen dat de query correct is gevormd en voldoet aan zijn eigen beveiligingsprotocollen en RAI-beleid.

Query-uitvoering en -antwoord: Na validatie voert de Fabric gegevensagent de query uit op de gekozen gegevensbron. De resultaten worden opgemaakt in een door mensen leesbare reactie, waaronder gestructureerde gegevens, zoals tabellen, samenvattingen of belangrijke inzichten.

Door deze methode te gebruiken, kunnen gebruikers met hun gegevens communiceren met behulp van natuurlijke taal. De Fabric gegevensagent verwerkt de complexiteit van het genereren, valideren en uitvoeren van query's. Gebruikers hoeven zelf geen SQL, DAX of KQL te schrijven.

Beveiliging en governance met Microsoft Purview

Microsoft Purview biedt governance- en risicocontroles voor Fabric gegevensagenten. Deze functies zijn momenteel beschikbaar als preview-versie en helpen organisaties bij het onderhouden van naleving bij het gebruik van agents voor toegang tot Fabric gegevens. Tot de belangrijkste mogelijkheden behoren:

  • Risicodiscovery en -audit: Prompts en antwoorden van Fabric-gegevensagenten kunnen worden onderworpen aan Purview-risicodiscovery en -audit, waardoor beveiligingsteams inzicht krijgen in de wijze waarop agenten met organisatorische gegevens omgaan.
  • DSPM-gegevensrisicobeoordelingen: DSPM-gegevensrisicobeoordelingen (Data Security Posture Management) kunnen gevoelige gegevensrisico's aan het licht brengen in de gegevensbronnen die agents gebruiken, zodat u potentiële blootstellingen kunt identificeren en aanpakken.
  • Insider Risk Management: Purview Insider Risk Management kan riskante AI-gebruikspatronen detecteren met betrokkenheid van agents, zoals ongebruikelijke queryvolumes of toegang tot gevoelige gegevens.
  • Audit, eDiscovery en retentie: Purview-controle, eDiscovery en bewaarbeleid zijn van toepassing op interactie en uitvoer van agents in ondersteunde Fabric workloads. Niet-compatibele gebruiksdetectie kan ook agentactiviteit markeren die in strijd is met het organisatiebeleid.

Zie Use Microsoft Purview to govern Microsoft Fabric voor meer informatie over hoe Microsoft Purview integreert met Fabric.

configuratie van Fabric gegevensagent

Het configureren van een Fabric gegevensagent is vergelijkbaar met het bouwen van een Power BI rapport. U begint met het ontwerpen en verfijnen om ervoor te zorgen dat deze voldoet aan uw behoeften en deze vervolgens publiceert en deelt met collega's, zodat ze met de gegevens kunnen communiceren. Het instellen van een Fabric gegevensagent omvat:

Selecteren van gegevensbronnen: Een Fabric gegevensagent ondersteunt maximaal vijf gegevensbronnen in elke combinatie, waaronder lakehouses, magazijnen, KQL-databases, Power BI semantische modellen, ontologieën en Microsoft Graph. Een geconfigureerde Fabric gegevensagent kan bijvoorbeeld vijf Power BI semantische modellen bevatten. Het kan bestaan uit een combinatie van twee Power BI semantische modellen, één lakehouse en één KQL-database. U hebt veel beschikbare opties.

Choosing Relevante Tabellen: Nadat u de gegevensbronnen hebt geselecteerd, voegt u ze één voor één toe en definieert u de specifieke tabellen uit elke bron die de Fabric Data Agent gebruikt. Deze stap zorgt ervoor dat de Fabric gegevensagent nauwkeurige resultaten ophaalt door alleen te focussen op relevante gegevens. Voor lakehouses betekent deze stap het selecteren van lakehouse-tabellen (niet afzonderlijke lakehouse-bestanden). Als uw gegevens worden gestart als bestanden (bijvoorbeeld CSV of JSON), maakt u deze beschikbaar voor de agent door deze op te nemen in tabellen of op een andere manier weer te geven via tabellen.

Adding Context: Als u de nauwkeurigheid van de Fabric gegevensagent wilt verbeteren, geeft u meer context door middel van Fabric instructies en voorbeeldquery's van gegevensagenten. Als de onderliggende agent voor de Fabric gegevensagent helpt de context de Azure OpenAI Assistant-API beter geïnformeerde beslissingen te nemen over het verwerken van gebruikersvragen en bepalen welke gegevensbron het meest geschikt is om ze te beantwoorden.

  • Data-agentinstructies: Voeg instructies toe om de agent te begeleiden die ten grondslag aan de Fabric gegevensagent past, bij het bepalen van de beste gegevensbron om specifieke typen vragen te beantwoorden. U kunt ook aangepaste regels of definities opgeven die de terminologie van de organisatie of specifieke vereisten verduidelijken. Deze instructies kunnen meer context of voorkeuren bieden die van invloed zijn op de wijze waarop de agent gegevensbronnen selecteert en opvraagt. Stel vragen over financiële metrische gegevens aan een Power BI-semantisch model, wijs query's met betrekking tot verkenning van ruwe gegevens toe aan het lakehouse, en routeer vragen waarvoor log-analyse nodig is naar de KQL-database.

  • Voorbeeldvragen: Voeg voorbeeld-vraag-en-query-paren toe om te laten zien hoe de Fabric data-agent zou moeten reageren op veelvoorkomende vragen. Deze voorbeelden dienen als richtlijn voor de agent, waarmee het inzicht krijgt in het interpreteren van vergelijkbare vragen en het genereren van nauwkeurige antwoorden.

Notitie

Het toevoegen van voorbeeldquery-/vraagparen wordt momenteel niet ondersteund voor Power BI semantische modelgegevensbronnen.

Door duidelijke AI-instructies en relevante voorbeeldquery's te combineren, kunt u de Fabric gegevensagent beter afstemmen op de gegevensbehoeften van uw organisatie, zodat u nauwkeurigere en contextbewuste antwoorden kunt krijgen.

Belangrijk

Instructies en voorbeeldquery's van de door ontwikkelaars geleverde gegevensagent moeten werken binnen beperkingen op basis van organisaties en rollen. Als instructies of prompts conflicteren met beleid (bijvoorbeeld pogingen om alleen-lezengedrag te omzeilen of toegang te krijgen tot bronnen buiten het bereik), weigert of leidt de agent de aanvraag om volgens het prioriteitsmodel dat in de volgende sectie wordt beschreven.

Governance- en intentielagen

Wanneer u een Fabric-gegevensagent configureert, kunnen meerdere intentielagen van invloed zijn op het gedrag van de agent. Deze lagen, weergegeven van hoogste tot laagste prioriteit, definiëren wat de agent mag doen:

  1. Organisatieintentie: tenantbrede beleidsregels en nalevingsvereisten die zijn ingesteld door de beheerders van uw organisatie. Deze beperkingen hebben de hoogste prioriteit en kunnen niet worden overschreven door een andere laag.
  2. Op rollen gebaseerde intentie: instellingen voor werkruimtebeheer en machtigingsgrenzen die van toepassing zijn op specifieke rollen of groepen. Met deze instellingen worden toegangsbeheer en beperkingen voor gegevensbereik afgedwongen.
  3. Intentie van ontwikkelaars: aangepaste instructies, voorbeeldquery's en configuraties van gegevensbronnen die u opgeeft wanneer u de gegevensagent bouwt.
  4. Gebruikersintentie: vragen en prompts die eindgebruikers indienen tijdens gesprekken met de agent.

Wanneer er conflicten optreden tussen lagen, worden lagere lagen met een hogere prioriteit overschreven. Organisatiebeleid en instellingen voor werkruimtebeheer overschrijven bijvoorbeeld altijd instructies voor ontwikkelaars en gebruikersprompts. Dit prioriteitsmodel zorgt ervoor dat de agent binnen goedgekeurde grenzen werkt, ongeacht hoe deze is geconfigureerd of gevraagd.

Verschil tussen een Fabric gegevensagent en een copilot

Hoewel zowel Fabric gegevensagenten als Fabric copilots generatieve AI gebruiken om gegevens te verwerken en te redeneren, bestaan er belangrijke verschillen in hun functionaliteit en gebruiksvoorbeelden:

Flexiteit van configuratie: u kunt Fabric gegevensagents sterk configureren. U kunt aangepaste instructies en voorbeelden opgeven om hun gedrag aan te passen aan specifieke scenario's. Fabric copiloten daarentegen, zijn vooraf geconfigureerd en bieden dit aanpassingsniveau niet aan.

Scope en use case: Fabric copilots helpen bij taken binnen Microsoft Fabric, zoals het genereren van notebookcode- of magazijnquery's. Fabric gegevensagenten zijn daarentegen zelfstandige configureerbare artefacten die gegevens kunnen opvragen in OneLake en semantische modellen. Fabric gegevensagenten kunnen ook worden geïntegreerd met Microsoft 365 Copilot om inzichten in natuurlijke taal rechtstreeks binnen Microsoft 365 apps te verkrijgen. Wanneer agents worden geopend via Microsoft 365 Copilot, zijn Microsoft Purview governancebeleidsregels nog steeds van toepassing op de onderliggende gegevensbronnen. Daarnaast kunnen Fabric gegevensagents verbinding maken met externe systemen, zoals Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams of andere hulpprogramma's buiten Fabric. Externe orchestrators en runtimes met meerdere agents kunnen Fabric gegevensagenten aanroepen ter ondersteuning van end-to-end agentische werkstromen, terwijl de gegevensagenten gericht blijven op alleen-lezen, beheerde gegevenstoegang.

Evaluatie van de Fabric-gegevensagent

Het productteam heeft de kwaliteit en veiligheid van antwoorden van Fabric gegevensagent grondig geëvalueerd:

Benchmark Testing: Het productteam heeft Fabric gegevensagenten getest in een reeks openbare en persoonlijke gegevenssets om te zorgen voor hoogwaardige en nauwkeurige reacties.

Enhanced Harm Mitigations: Het productteam heeft beveiligingsmaatregelen geïmplementeerd om ervoor te zorgen dat Fabric gegevensagentuitvoer gericht blijft op de context van geselecteerde gegevensbronnen, waardoor het risico op irrelevante of misleidende antwoorden wordt verminderd.

Governance en beveiliging

Microsoft Purview-integratie biedt besturingselementen voor governance voor Fabric gegevensagenten. Wanneer u een gegevensagent configureert, is Purview-governancebeleid van toepassing op de onderliggende gegevensbronnen die de agent kan benaderen. Deze integratie zorgt ervoor dat gegevenstoegang via agents dezelfde nalevings- en classificatieregels volgt als directe toegang.

Microsoft Purview-beleid: Purview-beleid, zoals besturingselementen voor gegevenstoegang en vertrouwelijkheidslabels, zijn van toepassing op gegevensbronnen waarop agents query's uitvoeren. Als een Purview-beleid de toegang tot een lakehouse of magazijn beperkt, respecteert de agent die beperking bij het verwerken van gebruikersquery's.

Uitgaande toegangsbeveiliging: Fabric-gegevensagents werken binnen de grenzen van uitgaande toegangsbeveiliging van werkruimten. Werkruimtebeheerders kunnen toegestane uitgaande verbindingen beheren via de werkruimte-instellingen om te bepalen welke externe eindpunten de gegevensagent kan bereiken.

Microsoft 365 Copilot-integratie: wanneer Fabric gegevensagenten worden weergegeven via Microsoft 365 Copilot, blijft het Purview-governancebeleid van toepassing. Gebruikers hebben alleen toegang tot gegevens die hun referenties en Purview-beleid toestaan, ongeacht het toegangspunt.

ALM en DevOps voor gegevensagenten

Fabric gegevensagenten ondersteunen alm-mogelijkheden (Application Lifecycle Management) waarmee u agentconfiguraties kunt beheren in ontwikkel-, test- en productieomgevingen.

Diagnostische gegevens: gebruik ingebouwde diagnostische gegevens om het gedrag van agents te bewaken, problemen met het genereren van query's te identificeren en de kwaliteit van de reactie op te lossen. Diagnostische gegevens bieden inzicht in de wijze waarop de agent vragen verwerkt en gegevensbronnen selecteert.

Git-integratie: U kunt uw agentconfiguraties versiebeheer met Git-integratie. Verbind uw Fabric werkruimte met een Git-opslagplaats om wijzigingen in agentinstructies, voorbeeldquery's en selecties van gegevensbronnen in de loop van de tijd bij te houden.

Deployment-pijplijnen: Gebruik Fabric implementatiepijplijnen om gegevensagents in werkruimten te promoten (bijvoorbeeld van ontwikkeling naar productie). Met deze ondersteuning kunt u wijzigingen in een faseringsomgeving testen voordat u ze beschikbaar maakt voor eindgebruikers.

Operationeel toezicht

Houd rekening met deze operationele procedures voor uw Fabric gegevensagent om de continue afstemming van kwaliteit en beleid te behouden:

  • Logboekregistratie en controle: bewaak de interacties van agents via de beschikbare mogelijkheden voor logboekregistratie en controle. Door querypatronen en responskwaliteit te controleren, kunt u onverwacht gedrag vroegtijdig identificeren.
  • Human-in-the-loop-escalatie: Escalatiepaden instellen voor gevoelige of aanvragen met grote impact. Voor scenario's waarbij geautomatiseerde antwoorden niet voldoende zijn, definieert u processen die vragen routeren naar gekwalificeerde revisoren.
  • Periodieke controle: controleer regelmatig de instructies van uw gegevensagent en voorbeeldquery's om ervoor te zorgen dat ze worden afgestemd op het huidige organisatiebeleid en gegevensstructuren. Wanneer uw gegevensbronnen of bedrijfsvereisten veranderen, werkt u de agentconfiguratie dienovereenkomstig bij.

Beperkingen

  • De Fabric gegevensagent genereert alleen SQL-, DAX- en KQL-leesquery's. Er worden geen SQL-, DAX- of KQL-query's gegenereerd waarmee gegevens worden gemaakt, bijgewerkt of verwijderd.
  • De Fabric-gegevensagent biedt geen ondersteuning voor ongestructureerde gegevens, zoals .pdf, .docxof .txt bestanden. U kunt de Fabric gegevensagent niet gebruiken voor toegang tot ongestructureerde gegevensbronnen.
  • Voor lakehouse-gegevensbronnen beantwoordt de Fabric gegevensagent vragen met behulp van de lakehouse-tabellen die u selecteert. Zelfstandige Lakehouse-bestanden (bijvoorbeeld CSV- of JSON-bestanden) worden niet rechtstreeks gelezen, tenzij ze worden opgenomen of weergegeven als tabellen.
  • De Fabric gegevensagent biedt momenteel geen ondersteuning voor niet-Engelse talen. Voor optimale prestaties geeft u vragen, instructies en voorbeeldquery's in het Engels.
  • U kunt de LLM die door de Fabric gegevensagent wordt gebruikt, niet wijzigen.
  • Gespreksgeschiedenis in de Fabric gegevensagent blijft mogelijk niet altijd bestaan. In bepaalde gevallen, zoals wijzigingen in de back-endinfrastructuur, service-updates of modelupgrades, kan de geschiedenis van het vorige gesprek opnieuw worden ingesteld of verloren gaan.
  • De Fabric gegevensagent kan geen query's uitvoeren wanneer de werkruimtecapaciteit van de gegevensbron zich in een andere regio bevindt dan de werkruimtecapaciteit van de gegevensagent. Een lakehouse met capaciteit in Noord-Europa faalt bijvoorbeeld als de capaciteit van de data-agent zich in Frankrijk Centraal bevindt.
  • Gebruikers kunnen maximaal 100 voorbeeldquery's per gegevensbron opgeven in hun gegevensagent.
  • Fabric Gegevensagenten zijn momenteel ontworpen voor gespreksinzichten in plaats van voor het retourneren van volledige gegevenssets. Om beknopte en efficiënte antwoorden te garanderen, worden de geretourneerde gegevens automatisch beperkt en/of samengevat. Op dit moment worden antwoorden beperkt tot maximaal 25 rijen en 25 kolommen. Houd er rekening mee dat eerdere chatgeschiedenis invloed kan hebben op volgende antwoorden. Als u bijvoorbeeld vraagt om alle rijen voor dit jaar weer te geven, retourneert de agent nog steeds maximaal 25 rijen. Vervolgvragen kunnen vervolgens worden beantwoord op basis van deze al beperkte context, wat van invloed kan zijn op het resultaat. In dergelijke gevallen wordt het starten van een nieuwe chatsessie aanbevolen.
  • Agentreacties kunnen worden afgekapt of geblokkeerd als Microsoft Purview DLP- of toegangsbeperkingsbeleid van toepassing is op de onderliggende gegevensbronnen. Het specifieke gedrag is afhankelijk van de beleidsconfiguratie van uw organisatie.
  • Assets die zijn gemarkeerd als gevoelig door Purview-beleid, zijn mogelijk niet toegankelijk voor de agent, wat kan leiden tot onvolledige antwoorden of een onmogelijkheid om query's uit te voeren op bepaalde gegevensbronnen.
  • Agentinteracties kunnen worden geregistreerd en gedetecteerd via Microsoft Purview Audit en eDiscovery. Organisaties moeten deze beheeropties overwegen bij het implementeren van agents voor gevoelige workloads.
  • Toegang tot Power BI semantische modellen via een gegevensagent wordt beheerd door leesmachtigingen voor het model en vereist geen toegang op werkruimteniveau. Row-Level Security (RLS) en Column-Level Security (CLS) zijn nog steeds van toepassing.