Agent-gebaseerde werkstromen: Taaknaleving (preview)

Zorg ervoor dat uw AI-agents consistent zijn afgestemd op gebruikersinstructies en taakdoelstellingen. Het signaal voor Taaknauwkeurigheid identificeert verschillen, zoals misplaatste aanroepen van hulpprogramma's, onjuiste invoer of uitvoer van hulpprogramma's in relatie tot de bedoeling van de gebruiker, en inconsistenties tussen reacties en gebruikersinvoer. Deze functionaliteit stelt systeemontwikkelaars in staat om verkeerd uitgelijnde acties proactief te beperken door ze te blokkeren of het probleem te escaleren voor menselijke interventie.

De primaire doelstellingen van de functie Taakvolging zijn:

  • Hulpprogrammaacties detecteren die onjuist zijn afgestemd op gebruikersdoelen of invoerintentie, of onjuiste invoer/uitvoer van hulpprogramma's ten opzichte van gebruikersintentie, of inconsistenties tussen agentreacties en klantinvoer.
  • Als u redenering wilt opgeven wanneer hulpprogramma-aanroepen onjuist zijn uitgelijnd.
  • Om een signaal te geven voor de blokkering van het aanroepen van downstreamhulpprogramma's en escalatie naar een HITL-controle wanneer de uitlijning van taken risico loopt.
  • Om het vertrouwen van gebruikers in agentische systemen te bevorderen door gedragsconsistentie, transparantie en controle te versterken.

Voorwaarden

  • Een Azure-abonnement - Maak er gratis een
  • Zodra u uw Azure-abonnement hebt, maakt u een Content Safety-resource in de Azure-portal om uw sleutel en eindpunt op te halen. Voer een unieke naam in voor uw resource, selecteer uw abonnement en selecteer een resourcegroep, regio en ondersteunde prijscategorie. Selecteer Vervolgens Maken.
    • Het implementeren van de resource duurt enkele minuten. Nadat deze is voltooid, gaat u naar resource. Selecteer in het linkerdeelvenster onder Resourcebeheerde optie Abonnementssleutel en Eindpunt. Het eindpunt en een van de sleutels worden gebruikt om API's aan te roepen.
  • cURL geïnstalleerd.

Verzoek

Opmerking

Zie promptschilden voor een voorbeeld van een promptschild.

API-versie:2024-12-15-preview

Velden in de URL

Naam Vereist Beschrijving Type
Eindpunt Ja De basis-URL voor de Content Safety-API. Vervang <endpoint> door het eindpunt dat is opgegeven voor uw Azure-service. Tekenreeks
API-versie Ja De versie van de API die moet worden gebruikt. Voor deze functie is de versie 2024-12-15-preview. Voorbeeld: <endpoint>/contentsafety/agent:analyzeTaskAdherence?api-version=2024-12-15-preview Tekenreeks

Parameters in de verzoekbody

Naam Vereist Beschrijving Type
hulpmiddelen Ja Een lijst met hulpprogramma's waarmee functies worden gedefinieerd die in de taak moeten worden gebruikt. Elk hulpprogramma bevat een type (bijvoorbeeld 'functie') en details over de functie, inclusief de naam en beschrijving. Matrix van JSON-objecten
Berichten Ja Een lijst met berichten die worden uitgewisseld tussen de gebruiker, assistent en hulpprogramma's. Elk bericht bevat de bron (bijvoorbeeld 'Prompt', 'Voltooiing'), de rol (bijvoorbeeld 'Gebruiker', 'Assistent', 'Tool'), inhoud (berichttekst) en optioneel toolCalls of toolCallId. Matrix van JSON-objecten

Voorbeeld van het hoofdtekstschema van de aanvraag

De volgende tabellen zijn beschrijvingen van de sleutelvelden in de aanvraagbody:

gereedschapsveld
Naam Vereist Beschrijving Type
Type Ja Het type hulpprogramma dat wordt gebruikt. Voor deze functionaliteit is het 'functie' Tekenreeks
function.name Ja De naam van de functie. Bijvoorbeeld 'read_emails' Tekenreeks
functiebeschrijving Ja Een korte beschrijving van wat de functie doet. Bijvoorbeeld 'Leest de e-mailberichten van de gebruiker' Tekenreeks
berichtenveld
Naam Vereist Beschrijving Type
Bron Ja De oorsprong van het bericht. Mogelijke waarden: "Prompt", "Completion" Tekenreeks
Rol Ja De rol die aan het bericht is gekoppeld. Mogelijke waarden: "Gebruiker", "Assistent", "Tool" Tekenreeks
Inhoud Ja De inhoud van het bericht. Bijvoorbeeld 'Mijn e-mailberichten samenvatten' Tekenreeks of array
toolCalls Nee Een lijst met hulpprogramma-aanroepen die door de agent worden aangeroepen, inclusief het type (bijvoorbeeld 'functie'), function.name, function.arguments en een unieke id. Matrix van JSON-objecten
toolCallId Nee (Voor berichten van hulpprogramma's) De id van de aanroep van het hulpprogramma waar op wordt gereageerd. Komt overeen met de ID die is opgegeven in de aanroep van de agent. Tekenreeks

API-antwoord

Nadat u uw aanvraag hebt ingediend, ontvangt u JSON-gegevens die de analyse weerspiegelen die door taaknavolging wordt uitgevoerd. Met deze gegevens worden mogelijke beveiligingsproblemen in uw agentwerkstroom aangegeven. Hier ziet hoe een typisch resultaat eruitziet:

{
  "taskRiskDetected": true,
  "details": "Agent attempts to share a document externally without user request or confirmation."
}
Naam Beschrijving Type
taakRisicoGedetecteerd Bevat risicodetectieresultaten voor de invoer Booleaanse
Details Geeft redenering weer wanneer een risico wordt gedetecteerd Tekenreeks

Een waarde van true voor taskRiskDetected betekent een gedetecteerd risico, in dat geval raden we aan om het te controleren en actie te ondernemen, zoals het blokkeren van het verzoek om het hulpprogramma aan te roepen of menselijke tussenkomst en escalatie.

Voorwaarden

Een Azure-account. Als u er nog geen hebt, kunt u er gratis een maken. Een Azure AI-resource.

Naleving van taken instellen en gebruiken

Volg deze stappen om de pagina Content Safety uit te proberen :

  1. Ga naar Azure AI Foundry en navigeer naar uw project/hub. Selecteer vervolgens het tabblad Kaders en besturingselementen in het linkernavigatievenster en selecteer het tabblad Uitproberen.
  2. Op de pagina Uitproberen kunt u experimenteren met verschillende kaders en besturingselementen, zoals tekst- en afbeeldingsinhoud, met behulp van aanpasbare drempelwaarden om te filteren op schadelijke inhoud.
  3. Navigeer naar agentische werkstroom en selecteer Taaknavolging.
  4. U kunt een van de voorbeelden selecteren met uitgelijnde of verkeerd uitgelijnde agenthulpprogramma-aanroepen of uw eigen voorbeelden maken om de naleving van taken te testen.
  5. Selecteer Test uitvoeren. Taaknaleving geeft de risico-flag terug voor elke steekproef en detecteert het een risico, geeft het een reden terug.

Gebruikersscenario's

Klantenondersteuning

Scenario: Een klantenserviceassistent die is geïntegreerd in een bedrijfsplatform helpt gebruikers bij het controleren van het gegevensgebruik, het oplossen van problemen en het beheren van accountinstellingen. Om nauwkeurige automatisering te behouden, bevat het systeem taakafvolging om agentplannen te valideren voordat back-endhulpprogrammaaanroepen worden uitgevoerd.

Gebruiker: Eindgebruikers, ondersteuningsmedewerkers en teams voor klantervaringen.

Actie: Een gebruiker verzendt de chatbot: 'Kunt u controleren hoeveel gegevens ik deze maand heb gebruikt?' De assistent is van plan een change_data_plan() hulpprogramma aan te roepen. Taakvolging detecteert een onjuiste uitlijning tussen de intentie van de gebruiker (informatieaanvraag) en de voorgestelde actie (abonnementswijziging). De aanroep van het hulpprogramma kan worden geblokkeerd en het systeem stopt de uitvoering of vraagt de gebruiker om beoordeling.

Human Resources

Scenario: Een ondernemingsassistent automatiseert routinewerkstromen met betrekking tot HR, zoals boekingsverlof, het indienen van uitgaven en het controleren van beleidsdetails. Taaknaleving zorgt ervoor dat agentacties binnen het verwachte bereik blijven en geen onbedoelde omwegen nemen.

Gebruiker: Werknemers, HR-zakenpartners en werkstroomautomatiseringsteams.

Actie: Een werknemer typt: "Ik wil weten hoeveel jaarlijks verlof ik nog heb." De agent wil aanroepen apply_leave(). Taaknavolging identificeert een niet-overeenkomende taak: de gebruiker heeft om informatie gevraagd, niet om een proces te starten. De uitvoering wordt geblokkeerd; de agent herformuleert of vraagt om bevestiging.

Hulpprogramma's voor productiviteit

Scenario: Met een productiviteitsassistent die is ingesloten in een e-mailplatform, kunnen professionals verbinding maken met databases en berichten opstellen, beoordelen en verzenden. Taakvolging wordt gebruikt om onderscheid te maken tussen het schrijven van een concept en het uitvoeren van een verzendopdracht, met name in gevallen waarin de intentie van de gebruiker niet eenduidig is.

Gebruiker: Kenniswerkers, leidinggevenden en IT-complianceteams.

Actie: De gebruiker vraagt: "Schrijf een e-mail naar de client over de gemiste deadline." De agent genereert een bericht en is van plan om aan te roepen send_email(). Taakvolging markeert het plan als mogelijk voortijdig; er is geen expliciete instructie om te verzenden. Het systeem blokkeert in plaats daarvan de beoogde aanroep van het hulpprogramma en vraagt de gebruiker te controleren.

Naleving van taken: uitgelijnd versus niet-uitgelijnd gebruik van hulpprogramma's

Het API-signaal voor taakafvolging helpt ontwikkelaars en platformeigenaren te begrijpen wanneer de aanroep van een agent overeenkomt of afwijkt van de intentie van de gebruiker.

Voorbeelden

Indeling Beschrijving Voorbeeld
Uitgelijnd Agent haalt aangevraagde informatie op zonder onbedoelde actie te ondernemen. Gebruiker: "Kunt u mij mijn recente agendagebeurtenissen laten zien?"
Gepland hulpprogramma:get_calendar_events()
✅ Agent haalt gebeurtenissen op zoals gevraagd.

Output:
{ "taskRiskDetected": false }
Verkeerd uitgelijnd Agent probeert gebruikersinstellingen te wijzigen wanneer er alleen een informatieaanvraag is ingediend. Gebruiker: "Kunt u mij mijn recente agendagebeurtenissen laten zien?"
Gepland hulpprogramma:clear_calendar_events()
❌ Agent bereidt zich voor om gegevens te verwijderen.

Output:
{ "taskRiskDetected": true, "details": "Planned action deletes calendar events, but user only requested to view them."}
Uitgelijnd Agent begint een proces voor het maken van documenten nadat een gebruiker vraagt om een nieuw document te genereren. Gebruiker: "Maak een nieuw projectvoorsteldocument voor de klant."
Gepland hulpprogramma:create_document()
✅ Komt overeen met de taakaanvraag van de gebruiker.

Output:
{ "taskRiskDetected": false}
Verkeerd uitgelijnd Agent deelt het document met externe medewerkers zonder gebruikersinstructie. Gebruiker: "Maak een nieuw projectvoorsteldocument voor de klant."
Gepland hulpprogramma:share_document()
❌ Geen gebruikersinstructie om te delen.

Output:
{ "taskRiskDetected": true, "details": "Agent attempts to share a document externally without user request or confirmation."}

Beperkingen

Beschikbaarheid van taal

Naleving van taken is getest op tekst in het Engels; De functie kan echter in veel andere talen werken, hoewel de kwaliteit kan variëren. In alle gevallen raden we u aan om te testen voor uw use-case en toepassing om ervoor te zorgen dat deze geschikt is voor uw scenario's.

Beperking tekstlengte

Op dit moment heeft de API voor de naleving van taken beperkingen voor de invoerlengte. De maximale tekstlengte is 100.000 tekens. Als de invoerlengte deze beperking overschrijdt, krijgt u een foutmelding.

Beschikbaarheid en gegevensverwerking van regio's

Hoewel taakvolging kan worden ingeschakeld in alle Azure AI Content Veiligheid regio's, kunnen gegevens worden doorgestuurd naar en verwerkt in andere REGIO's in de VS en de EU buiten de opgegeven geografische regio's.