Een Fabric-gegevensagent maken

Met een gegevensagent in Microsoft Fabric kunt u conversationele AI-ervaringen maken die vragen beantwoorden over gegevens die zijn opgeslagen in lakehouses, magazijnen, Power BI semantische modellen, KQL-databases, ontologieën en Microsoft Graph in Fabric. Uw collega's kunnen vragen stellen in het Engels en gegevensgestuurde antwoorden ontvangen, zelfs als ze geen AI-experts zijn of diep vertrouwd zijn met de gegevens.

Vereiste voorwaarden

Verificatie en tokens

U hoeft geen Azure OpenAI-sleutel of een toegangstoken te maken of op te geven om een Fabric gegevensagent te gebruiken. Fabric maakt gebruik van een door Microsoft beheerde Azure OpenAI Assistant en verwerkt verificatie voor u.

  • Gegevenstoegang wordt uitgevoerd onder uw Microsoft Entra ID gebruikersidentiteit en uw werkruimte-/gegevensmachtigingen. De agent leest schema's en voert SQL/DAX/KQL alleen uit als u toegang hebt. Hoewel de meeste databronnen de machtigingen van de werkruimte respecteren, worden Power BI semantisch modelinteracties via gegevensagenten beheerd door leesmachtigingen op modelniveau en is er geen lidmaatschap van een werkruimterol vereist.
  • Als u een Power BI semantisch model als gegevensbron wilt toevoegen, hebt u leesmachtiging voor dat model nodig (Schrijven is niet vereist). Leestoegang is ook voldoende om vragen te stellen op basis van bronnen die u kunt openen. Zie Gegevensset- en semantische modelbeveiliging voor meer informatie over semantische modelmachtigingen. Bij gebruik van gegevensagenten is leesmachtiging voldoende voor het uitvoeren van query's; Schrijven is alleen vereist voor het wijzigen van het semantische model of het inschakelen van functies zoals Voorbereiding voor AI.
  • Als uw organisatie een Power BI Premium per capaciteit (P1 of hoger) gebruikt in plaats van een F-SKU, moet u ervoor zorgen dat Microsoft Fabric is ingeschakeld voor die capaciteit.
  • Service-principals en API-tokens zijn niet vereist voor de chatervaring in het product. Automatisering met service-principals is een afzonderlijk scenario en wordt hier niet behandeld.

Beveiliging en governance

Fabric gegevensagenten respecteren Microsoft Purview governancebeleid. Wanneer Purview-beleid de toegang tot een gegevensbron beperkt (bijvoorbeeld via toegangsbeheer of vertrouwelijkheidslabels), respecteert de agent deze beperkingen bij het verwerken van gebruikersquery's.

Uitgebreide uitgaande toegangsbeveiliging is van toepassing op agentoperaties. Uitgaande verbindingen van agents zijn onderworpen aan het netwerk en de toegangsregels van de tenant die zijn geconfigureerd in de Fabric-beheerportal. Beheerders kunnen bepalen welke externe eindpunten toegankelijk zijn voor agents.

Machtigingen voor semantische modellen via gegevensagents

Interactie met Power BI semantische modellen via een Fabric gegevensagent vereist alleen leesmachtigingen voor het semantische model. Werkruimtetoegang (rollen lid of inzender) en bouwtoestemming zijn niet vereist voor het toevoegen van het model aan de agent of vragen te stellen via de agent. Deze uitzondering geldt alleen voor interacties tussen gegevensagenten; voor andere toegangspunten (bijvoorbeeld Analyseren in Excel of direct rapportauteurschap) is mogelijk nog steeds een samenstellingsmachtiging vereist.

Schrijfmachtiging is alleen nodig om het semantische model te wijzigen of om mogelijkheden te gebruiken, zoals Voorbereiding voor AI.

Gegevenstoegang tussen tenants

Wanneer uw werkruimte gegevens bevat die zijn gedeeld vanuit een andere tenant via OneLake externe gegevens delen, kan de Fabric gegevensagent een query uitvoeren op die gegevens via de OneLake-snelkoppeling die tijdens de acceptatie van de share is gemaakt. Er is geen extra verificatieconfiguratie vereist; toegang wordt uitgevoerd onder uw bestaande Entra ID identiteits- en werkruimtemachtigingen. Het governancebeleid van de consumententenant is van toepassing op alle gedeelde gegevens.

End-to-end stroom voor het maken en gebruiken van Fabric gegevensagenten

In deze sectie worden de belangrijkste stappen beschreven voor het maken, valideren en delen van een Fabric gegevensagent in Fabric, waardoor deze toegankelijk is voor gebruik. De agent werkt op beheerde, live data in OneLake, inclusief tabellen die worden ondersteund door OneLake-snelkoppelingen en cross-tenant shares.

Het proces is eenvoudig en u kunt binnen enkele minuten beginnen met het testen van de Fabric gegevensagentbronnen.

Een nieuwe Fabric-gegevensagent maken

Als u een nieuwe Fabric-gegevensagent wilt maken, gaat u eerst naar uw werkruimte en selecteert u vervolgens de knop + Nieuw item. Zoek op het tabblad Alle items naar Fabric gegevensagent om de juiste optie te vinden, zoals wordt weergegeven in deze schermopname:

Schermafbeelding van het maken van een Fabric data-agent.

Zodra deze optie is geselecteerd, wordt u gevraagd een naam op te geven voor uw Fabric gegevensagent, zoals wordt weergegeven in deze schermopname:

Schermafbeelding waarin wordt getoond hoe u de naam opgeeft voor de Fabric gegevensagent.

Raadpleeg de opgegeven schermopname voor een visuele handleiding over het benoemen van de Fabric gegevensagent. Nadat u de naam hebt ingevoerd, gaat u verder met de configuratie om de Fabric gegevensagent af te stemmen op uw specifieke vereisten.

Uw gegevens selecteren

Nadat u een Fabric gegevensagent hebt gemaakt, kunt u maximaal vijf gegevensbronnen toevoegen, waaronder lakehouses, magazijnen, Power BI semantische modellen, KQL-databases, ontologieën en Microsoft Graph, in elke combinatie (maximaal vijf totalen). U kunt bijvoorbeeld vijf Power BI semantische modellen toevoegen of twee Power BI semantische modellen, één lakehouse en één KQL-database.

Notitie

De OneLake-catalogus kan tabellen bevatten die beschikbaar zijn via OneLake-snelkoppelingen. Fabric gegevensagenten kunnen rechtstreeks query's uitvoeren op deze tabellen met snelkoppelingen, zonder gegevens naar de werkruimte te kopiëren.

Wanneer u voor het eerst een Fabric gegevensagent maakt en een naam opgeeft, wordt de OneLake-catalogus automatisch weergegeven, zodat u gegevensbronnen kunt toevoegen. Als u een gegevensbron wilt toevoegen, selecteert u deze in de catalogus, zoals wordt weergegeven op het volgende scherm en selecteert u Vervolgens Toevoegen. Elke gegevensbron moet afzonderlijk worden toegevoegd. U kunt bijvoorbeeld een lakehouse toevoegen, Toevoegen selecteren en vervolgens doorgaan met het toevoegen van een andere gegevensbron. Als u de gegevensbrontypen wilt filteren, selecteert u het filterpictogram en selecteert u vervolgens het gewenste type. U kunt filteren op gegevensbrontype om bronnen gemakkelijker te vinden, inclusief items die worden gedeeld over organisatiegrenzen via het delen van gegevens in meerdere tenants.

Zodra u de gegevensbron hebt toegevoegd, wordt de Explorer in het linkerdeelvenster van de pagina Fabric gegevensagent gevuld met de beschikbare tabellen in elke geselecteerde gegevensbron, waar u de selectievakjes kunt gebruiken om tabellen beschikbaar te maken of niet beschikbaar te maken voor de AI, zoals wordt weergegeven in de volgende schermopname:

Schermopname die laat zien hoe u gegevensbronnen toevoegt.

Notitie

U hebt alleen leesmachtigingen nodig om een Power BI semantisch model toe te voegen als gegevensbron. De samenstellingsmachtiging is niet vereist en gebruikers hebben geen toegang nodig tot de werkruimte waarin het semantische model zich bevindt wanneer ze het gebruiken via een gegevensagent. Schrijfmachtiging is alleen nodig om het semantische model te wijzigen of om mogelijkheden te gebruiken, zoals Voorbereiding voor AI.

Voor volgende toevoegingen van gegevensbronnen gaat u naar de Explorer in het linkerdeelvenster van de pagina Fabric gegevensagent en selecteert u + Gegevensbron, zoals wordt weergegeven in deze schermopname:

Schermopname van het toevoegen van meer gegevensbronnen.

De OneLake-catalogus wordt opnieuw geopend en u kunt zo nodig naadloos meer gegevensbronnen toevoegen.

Hint

Zorg ervoor dat u beschrijvende namen gebruikt voor zowel tabellen als kolommen. Een tabel met de naam SalesData is duidelijker dan TableAen kolomnamen zoals ActiveCustomer of IsCustomerActive zijn duidelijker dan C1 of ActCu. Beschrijvende namen helpen de AI nauwkeurigere en betrouwbare query's te genereren.

Vragen stellen

Nadat u de gegevensbronnen hebt toegevoegd en de relevante tabellen voor elke gegevensbron hebt geselecteerd, kunt u beginnen met het stellen van vragen. Het systeem verwerkt vragen, zoals wordt weergegeven in deze schermopname:

Schermafbeelding met een vraag voor een Fabric gegevensagent.

Vragen die vergelijkbaar zijn met deze voorbeelden, moeten ook werken:

  • "Wat waren onze totale verkoop in Californië in 2023?"
  • "Wat zijn de 5 beste producten met de hoogste lijstprijzen en wat zijn hun categorieën?"
  • "Wat zijn de duurste artikelen die nooit zijn verkocht?"

Vragen zoals deze zijn geschikt omdat het systeem ze kan vertalen in gestructureerde query's (T-SQL, DAX of KQL), ze uitvoeren op databases en vervolgens concrete antwoorden retourneren op basis van opgeslagen gegevens.

Vragen zoals deze vallen echter buiten het bereik:

  • "Waarom is onze fabrieksproductiviteit lager in Q2 2024?"
  • "Wat is de hoofdoorzaak van onze verkooppieken?"

Deze vragen vallen momenteel buiten het bereik, omdat hiervoor complexe redenering, correlatieanalyse of externe factoren nodig zijn die niet rechtstreeks beschikbaar zijn in de database. De Fabric gegevensagent voert momenteel geen geavanceerde analyses, machine learning of causale deductie uit. Er worden eenvoudigweg gestructureerde gegevens opgehaald en verwerkt op basis van de query van de gebruiker.

Wanneer u een vraag stelt, gebruikt de Fabric gegevensagent de Azure OpenAI Assistant-API om de aanvraag te verwerken. De stroom werkt op deze manier:

Schematoegang met gebruikersinloggegevens

Het systeem gebruikt eerst de inloggegevens van de gebruiker om toegang te krijgen tot het schema van de gegevensbron (bijvoorbeeld een lakehouse, warehouse, PBI-sematisch model, KQL-databases of ontologie). Dit zorgt ervoor dat het systeem gegevensstructuurgegevens ophaalt die de gebruiker heeft gemachtigd om te bekijken.

Een prompt samenstellen

Het systeem combineert het volgende om de vraag van de gebruiker te interpreteren:

  1. Gebruikersquery: De vraag in natuurlijke taal van de gebruiker.
  2. Schemagegevens: metagegevens en structurele details van de gegevensbron die in de vorige stap zijn opgehaald.
  3. Voorbeelden en instructies: vooraf gedefinieerde voorbeelden (bijvoorbeeld voorbeeldvragen en antwoorden) of specifieke instructies bij het instellen van de Fabric gegevensagent. Deze voorbeelden en instructies helpen het begrip van de vraag te verfijnen en te bepalen hoe de AI communiceert met de gegevens.

Al deze informatie wordt gebruikt om een prompt samen te stellen. Deze prompt fungeert als invoer voor de Azure OpenAI Assistant-API, die zich gedraagt als een agent die de Fabric gegevensagent onderbouwt. Dit geeft in wezen de Fabric gegevensagent instructies over het verwerken van de query en het type antwoord dat moet worden geproduceerd.

Het aanroepen van tools op basis van querybehoeften

De agent analyseert de samengestelde prompt en bepaalt welk hulpprogramma moet worden aangeroepen om het antwoord op te halen:

  • Natuurlijke taal naar SQL (NL2SQL): Wordt gebruikt om SQL-query's te genereren wanneer de gegevens zich in een lakehouse of datamagazijn bevinden.
  • Natuurlijke taal voor DAX (NL2DAX): wordt gebruikt om DAX-query's te maken om te communiceren met semantische modellen in Power BI gegevensbronnen
  • Natuurlijke taal naar KQL (NL2KQL): wordt gebruikt om KQL-query's te maken om query's uit te voeren op gegevens in KQL-databases. NL2KQL kan KQL door de gebruiker gedefinieerde functies (UDF's) gebruiken wanneer deze beschikbaar zijn in de geselecteerde databases.
  • Microsoft Graph: Wordt gebruikt om query's uit te voeren op organisatiegegevens die toegankelijk zijn via Microsoft Graph

Het geselecteerde hulpprogramma genereert een query met behulp van het schema, de metagegevens en de context die de agent onder de Fabric gegevensagent levert. Vervolgens valideert het hulpprogramma de query, om de juiste opmaak en naleving van de bijbehorende beveiligingsprotocollen en zijn eigen verantwoordelijke AI-beleid (RAI) te garanderen.

Opbouw van de respons

De agent die onder de Fabric gegevensagent ligt, voert de query uit en zorgt ervoor dat het antwoord op de juiste wijze is gestructureerd en opgemaakt. De agent bevat vaak extra context om het antwoord gebruiksvriendelijk te maken. Ten slotte wordt het antwoord weergegeven aan de gebruiker in een gespreksinterface, zoals wordt weergegeven in de volgende schermopname:

Schermafbeelding met het antwoord op de vraag door een Fabric gegevensagent.

De agent geeft zowel het resultaat als de tussenliggende stappen weer die nodig zijn om het uiteindelijke antwoord op te halen. Deze aanpak verbetert de transparantie en maakt het mogelijk om deze stappen, indien nodig, te valideren. Gebruikers kunnen de vervolgkeuzelijst voor de stappen uitvouwen om alle stappen weer te geven die de Fabric gegevensagent heeft genomen om het antwoord op te halen, zoals wordt weergegeven in de volgende schermopname:

Schermafbeelding met de stappen die zijn uitgevoerd door een Fabric gegevensagent.

Daarnaast biedt de Fabric gegevensagent de gegenereerde code die wordt gebruikt om een query uit te voeren op de bijbehorende gegevensbron, wat meer inzicht biedt in de manier waarop het antwoord is samengesteld.

Deze query's zijn uitsluitend ontworpen voor het uitvoeren van query's op gegevens. Bewerkingen waarbij gegevens worden gemaakt, gegevensupdates, gegevensverwijderingen, elk type gegevenswijziging zijn niet toegestaan om de integriteit van uw gegevens te beschermen.

U kunt op elk gewenst moment de knop Chat wissen selecteren om de chat te wissen, zoals wordt weergegeven in de volgende schermopname:

Schermopname met de functie Chat wissen gemarkeerd.

De functie 'Chat wissen' verwijdert alle chatgeschiedenis en start een nieuwe sessie. Zodra u uw chatgeschiedenis hebt verwijderd, kunt u deze niet meer ophalen.

De gegevensbron wijzigen

Als u een gegevensbron wilt verwijderen, beweegt u de muisaanwijzer over de naam van de gegevensbron in de Explorer in het linkerdeelvenster van de pagina Fabric gegevensagent totdat het menu met drie punten wordt weergegeven. Selecteer de drie puntjes om de opties weer te geven en selecteer vervolgens Verwijderen om de gegevensbron te verwijderen, zoals wordt weergegeven in de volgende schermopname:

Schermopname die laat zien hoe u gegevensbronnen verwijdert of vernieuwt.

Als uw gegevensbron is gewijzigd, kunt u ook Vernieuwen selecteren in hetzelfde menu, zoals wordt weergegeven in de volgende schermopname:

Schermopname die laat zien hoe u een gegevensbron vernieuwt.

Dit zorgt ervoor dat updates van gegevensbronnen zowel worden weergegeven als correct zijn ingevuld in de verkenner om uw Fabric gegevensagent synchroon te houden met de meest recente gegevens.

configuratie van Fabric gegevensagent

De Fabric gegevensagent biedt verschillende configuratieopties waarmee gebruikers het gedrag van Fabric gegevensagent kunnen aanpassen, zodat ze beter aan de behoeften van uw organisatie voldoen. Naarmate de Fabric gegevensagent gegevens verwerkt en presenteert, bieden deze configuraties flexibiliteit die meer controle over de resultaten mogelijk maakt.

Instructies opgeven

U kunt specifieke instructies opgeven om het gedrag van ai te begeleiden. Selecteer Gegevensagentinstructies zoals weergegeven in de volgende schermopname om ze toe te voegen aan het deelvenster gegevensagentinstructies in Fabric.

Schermopname van de selectie van de knop Instructies voor de gegevensagent.

Hier kunt u maximaal 15.000 tekens schrijven in gewone Engelse tekst om de AI te instrueren over het afhandelen van query's.

U kunt bijvoorbeeld de exacte gegevensbron opgeven die moet worden gebruikt voor bepaalde typen vragen. Voorbeelden van keuzes voor gegevensbronnen kunnen betrekking hebben op het aansturen van de AI om deze te gebruiken.

  • Power BI semantische modellen voor financiële query's
  • een data lakehouse voor verkoopgegevens
  • een KQL-database voor operationele metrische gegevens

Deze instructies zorgen ervoor dat de AI de juiste query's genereert, ongeacht of SQL, DAX of KQL, op basis van uw richtlijnen en de context van de vragen.

Als uw AI-resource bepaalde woorden, acroniemen of termen consistent verkeerd interpreteert, kunt u proberen duidelijke definities in deze sectie op te geven om ervoor te zorgen dat de AI deze correct begrijpt en verwerkt. Dit wordt vooral handig voor domeinspecifieke terminologie of unieke zakelijke jargon.

Door deze instructies aan te passen en termen te definiëren, verbetert u het vermogen van AI om nauwkeurige en relevante inzichten te leveren, in volledige overeenstemming met uw gegevensstrategie en bedrijfsvereisten.

Voorbeeldquery's opgeven

U kunt de nauwkeurigheid van de reactie verbeteren door voorbeeldquery's op te geven die zijn afgestemd op elke ondersteunde gegevensbron (lakehouse, magazijn, KQL-database). Deze benadering, ook wel few-shot learning genoemd in generatieve AI, helpt de Fabric gegevens-agent om reacties te genereren die beter overeenstemmen met uw verwachtingen.

Wanneer u de AI van voorbeeldquery's en vraagparen voorziet, verwijst de AI naar deze voorbeelden om toekomstige vragen te beantwoorden. Door nieuwe query's te koppelen aan de meest relevante voorbeelden, kan de AI bedrijfsspecifieke logica opnemen en effectief reageren op veelgestelde vragen. Deze functionaliteit maakt het mogelijk om afzonderlijke gegevensbronnen af te stemmen en zorgt voor het genereren van nauwkeurigere SQL- of KQL-query's.

Power BI semantische modelgegevens bieden momenteel geen ondersteuning voor het toevoegen van voorbeeldquery-/vraagparen. Voor ondersteunde gegevensbronnen, zoals lakehouse-, magazijn- en KQL-databases, kan het bieden van meer voorbeelden het vermogen van AI om nauwkeurige query's te genereren aanzienlijk verbeteren wanneer de standaardprestaties moeten worden aangepast.

Hint

Een diverse set voorbeeldquery's verbetert de mogelijkheid van een Fabric gegevensagent om nauwkeurige en relevante SQL/KQL-query's te genereren. Voor KQL-databases kan NL2KQL ook gebruikmaken van door de gebruiker gedefinieerde KQL-functies (UDF's) die beschikbaar zijn in uw geselecteerde databases, dus overweeg om voorbeeldquery's op te nemen die verwijzen naar UDF's.

Als u voorbeeldquery's wilt toevoegen of bewerken, selecteert u de knop Voorbeeldquery's om het deelvenster Voorbeeldquery's te openen, zoals wordt weergegeven in de volgende schermopname:

Schermopname die laat zien waar u de voorbeelden kunt bewerken die u aan de AI verstrekt.

Dit deelvenster bevat opties voor het toevoegen of bewerken van voorbeeldquery's voor alle ondersteunde gegevensbronnen, behalve Power BI semantische modellen en ontologieën. Voor elke gegevensbron kunt u Voorbeeldquery's toevoegen of bewerken selecteren om de relevante voorbeelden in te voeren, zoals wordt weergegeven in de volgende schermopname:

Schermopname van de SQL-voorbeelden die u aan de AI verstrekt.

Notitie

De Fabric gegevensagent verwijst alleen naar query's die geldige SQL/KQL-syntaxis bevatten en die overeenkomen met het schema van de geselecteerde tabellen. De Fabric gegevensagent maakt geen gebruik van query's die de validatie niet hebben voltooid. Zorg ervoor dat alle voorbeeldquery's geldig en correct zijn afgestemd op het schema om ervoor te zorgen dat de Fabric gegevensagent deze effectief gebruikt.

Een Fabric-gegevensagent publiceren en delen

Nadat u de prestaties van uw Fabric gegevensagent hebt getest op verschillende vragen en u bevestigt dat er nauwkeurige SQL-, DAX- of KQL-query's worden gegenereerd, kunt u deze delen met uw collega's. Op dat moment selecteert u Publiceren, zoals wordt weergegeven in de volgende schermopname:

Schermafbeelding met publicatie van een Fabric gegevensagent.

Met deze stap opent u een venster met een beschrijving van de Fabric gegevensagent. Hier geeft u een gedetailleerde beschrijving van wat de Fabric gegevensagent doet. Deze details begeleiden uw collega's over de functionaliteit van de Fabric gegevensagent en helpen andere AI-systemen/orchestrators om de Fabric gegevensagent effectief aan te roepen.

Nadat u de Fabric gegevensagent hebt gepubliceerd, hebt u twee versies. Eén versie is de huidige conceptversie, die u kunt blijven verfijnen en verbeteren. De tweede versie is de gepubliceerde versie, die u kunt delen met uw collega's die een query willen uitvoeren op de Fabric gegevensagent om antwoord te krijgen op hun vragen. U kunt feedback van uw collega's opnemen in uw huidige conceptversie tijdens het ontwikkelen, om de prestaties van de Fabric gegevensagent verder te verbeteren.

ALM en implementatie

Fabric gegevensagenten ondersteunen mogelijkheden voor levenscyclusbeheer waarmee u agents in verschillende omgevingen kunt beheren.

  • Diagnostische gegevens: gebruik ingebouwde diagnostische gegevens om agentgedrag op te lossen en problemen met het genereren van query's te identificeren.
  • Git-integratie: Verbind uw Fabric werkruimte met een Git-opslagplaats met configuraties voor versiebeheeragents, inclusief instructies, voorbeeldquery's en selecties van gegevensbronnen.
  • Deployment-pijplijnen: Gebruik Fabric deployment-pijplijnen om data-agents te promoten van ontwikkelings- naar test- en productiewerkruimten.

Notitie

Consumenten die een query uitvoeren op een gegevensagent die gebruikmaakt van Power BI semantische modellen, hebben alleen leesmachtigingen nodig voor deze modellen en hebben geen werkruimtetoegang nodig. Voor het wijzigen van het semantische model of het gebruik van functies zoals Voorbereiding voor AI is schrijfmachtiging vereist.