Condividi tramite


Ragionamento dell'agente nell'agente SRE di Azure

L'agente risolve i problemi ragionandoci piuttosto che seguire gli script. Poiché costruisce un contesto approfondito sulla codebase, su incidenti passati e sull'infrastruttura, analizza i tuoi sistemi, non quelli generici. Raccoglie prove, seleziona gli strumenti giusti, classifica le azioni in base al rischio e ne spiega il pensiero, tutti visibili nell'interfaccia della chat.

Ciclo di ragionamento

Ogni messaggio inviato passa attraverso lo stesso ciclo.

Screenshot del flusso di ragionamento dell'agente: comprendere la richiesta, raccogliere il contesto, il motivo, quindi agire o rispondere. Esegue un ciclo fino a 10 volte.

L'agente comprende innanzitutto la richiesta e identifica i dati necessari. Raccoglie quindi il contesto eseguendo query sulle origini dati in parallelo (log, metriche, stato delle risorse, cronologia della distribuzione, memoria). Successivamente, elabora i dati raccolti, identificando modelli e formando conclusioni. Infine agisce o risponde eseguendo azioni sicure, richiedendo l'approvazione per quelle rischiose o presentando risultati.

Se il problema richiede più lavoro, il ciclo scorre fino a 10 volte per turno. Successivamente, l'agente chiede se continuare.

Pensiero adattivo

Per problemi complessi, l'agente mostra il processo di ragionamento nella chat. Viene visualizzata una sezione Thinking collapsible con titoli descrittivi per ogni passaggio ( ad esempio "Esplorazione dei problemi di integrità di Azure" o "Analisi degli avvisi attivi") e tempo trascorso.

Screenshot del pensiero adattivo che mostra il passaggio di ragionamento.

L'agente regola automaticamente la profondità del ragionamento. Un controllo di stato ottiene una risposta rapida. Un'interruzione a più passaggi richiede una logica articolata con la correlazione delle prove.

Approccio profondo nel ragionamento

L'agente non inizia da zero. Si basa sul contesto profondo in ogni passaggio del ciclo di ragionamento. Deep Context ha tre pilastri che modellano il modo in cui l'agente pensa:

  • Analisi del codice: l'agente legge già i repository, quindi quando si verifica un evento imprevisto, sa dove risiede la logica di ripetizione dei tentativi e cosa è cambiato di recente.
  • Memoria persistente: le indagini precedenti, i passaggi di risoluzione e i runbook caricati informano ogni nuova conversazione.
  • Intelligenza in background: l'analisi della codebase, l'arricchimento dello schema di Kusto e la produzione di insight approfondiscono continuamente la comprensione dell'agente.

Memoria e conoscenza

All'inizio di ogni conversazione, l'agente cerca il contesto pertinente nella memoria .

Che cosa deriva da Come migliora il ragionamento
Informazioni dettagliate sulla sessione Apprende da tutte le conversazioni precedenti, incluse le indagini sugli eventi imprevisti, le sessioni di risoluzione dei problemi e i risultati delle attività pianificate
Modelli di sintomo simili Riconosce i modelli ricorrenti e individua le cause probabili più rapidamente.
I runbook e la documentazione caricati Segui le procedure del tuo team invece dei consigli generici
Preferenze utente Memorizza il contesto dell'ambiente e le preferenze di risposta

Più conoscenza fornisci, come runbook, documenti sull'architettura e procedure del team, più il ragionamento del tuo agente diventa rilevante. Per altre informazioni, vedere Memoria e conoscenze.

Selezione strumento

L'agente seleziona in modo strategico gli strumenti in base al problema. Inizia con tutti gli strumenti registrati nell'agente personalizzato corrente, quindi filtra per piattaforma, usando solo gli strumenti degli eventi imprevisti per la piattaforma degli eventi imprevisti connessi. Filtra ulteriormente in base all'elenco pubblicato per includere solo gli strumenti resi disponibili e si adatta man mano che emergono nuove informazioni durante la conversazione.

Ogni agente personalizzato ha un proprio set di strumenti. Quando l'agente delega a un agente personalizzato diverso, gli strumenti disponibili cambiano automaticamente.

Per altre informazioni sugli strumenti disponibili, vedere Strumenti.

Esecuzione parallela

Quando l'agente identifica le operazioni indipendenti, le azioni che non dipendono dall'output dell'altra, le rilascia contemporaneamente in un unico turno anziché eseguirle una alla volta.

Ad esempio, se l'agente deve controllare lo stato del pod, l'integrità del servizio e la cronologia di distribuzione, esegue tutti e tre i comandi in parallelo invece di attendere il completamento di ognuno prima di iniziare il successivo. Questo approccio riduce il numero di turni di ragionamento e accelera le indagini.

I prompt a livello di strumento guidano l'esecuzione parallela e indicano al modello: "Se i comandi sono indipendenti e possono essere eseguiti in parallelo, effettuare più chiamate di strumenti in un singolo messaggio".

Classificazione delle azioni

L'agente classifica ogni azione prima di eseguirla.

Classificazione Comportamento Examples
Sicuro Esegue immediatamente Eseguire query nei log, controllare lo stato delle risorse, elencare le distribuzioni
Prudente Esegue con una breve spiegazione Inviare messaggi di posta elettronica, pubblicare messaggi di Teams
Distruttivo Richiede la conferma Riavviare un'app, ridimensionare le risorse, modificare le configurazioni

Il modo in cui l'agente gestisce ogni tipo dipende dalla modalità di esecuzione.

Modalità di esecuzione Safe Prudente Distruttivo
Esamina Esegue Esegue Richiede l'approvazione
Autonoma Esegue Esegue Esegue

Gestione delle conversazioni

Diversi meccanismi mantengono le lunghe conversazioni produttive.

Meccanismo Funzionamento
Compattazione Quando le conversazioni si allungano, l'agente riepiloga il contesto precedente mantenendo i risultati chiave. È possibile attivare questa azione manualmente usando il /compact comando .
Ritenti automatici Se si verifica un'interruzione del servizio durante la risposta, l'agente ritenta in modo automatico.
Gestione errori Se un modello rileva un problema temporaneo, l'agente visualizza un messaggio descrittivo ("modello riscontra temporaneamente problemi") anziché un errore interno generico.

Annullamento

Quando si seleziona Arresta, l'agente interrompe immediatamente tutte le operazioni e impedisce di ritentare l'attività annullata. Il messaggio successivo viene avviato di nuovo, a meno che non si modifichi esplicitamente la richiesta annullata.

Boundaries

La tabella seguente riepiloga cosa fa e cosa non fa il ragionamento dell'agente.

Che cosa fa il ragionamento Cosa non fa
Raccoglie le prove da più origini in parallelo Garanzia di trovare una causa radice (l'evidenza potrebbe non essere sufficiente)
Classifica le azioni e rispetta la tua modalità di esecuzione Correzione automatica senza conferma in modalità revisione
Spiega il suo pensiero passo dopo passo Condividere la metodologia di indagine tra agenti separati
Regola la profondità del ragionamento in base alla complessità dei problemi Sostituire il giudizio umano per le decisioni critiche

Passo successivo