Merk
Tilgang til denne siden krever autorisasjon. Du kan prøve å logge på eller endre kataloger.
Tilgang til denne siden krever autorisasjon. Du kan prøve å endre kataloger.
Når du triage individuelle testtilfellefeil, kan du bruke løsninger og fortsatt se liten eller ingen forbedring i den generelle agentytelsen. Dette resultatet indikerer ofte et systemisk problem, ikke en samling av ikke-relaterte feil.
Mønsteranalyse hjelper deg med å se på flere mislykkede testtilfeller for å identifisere regelmessige signaler og delte årsaker. Bruk mønsteranalyse til å fokusere på endringer som adresserer grupper av feil samtidig i stedet for å løse hver feil isolert.
Viktig!
Bruk denne veiledningen etter at du har fullført feiltriage og bruk utbedringsendringer. Mønsteranalyse er mest nyttig etter at du triagerer minst fem feil.
Når du skal bruke mønsteranalyse
Mønsteranalyse er mest nyttig når du observerer én eller flere av følgende betingelser:
- Mange feil i det samme evalueringssettet.
- Gjentatte feil med lignende symptomer.
- Forbedringer i individuelle testtilfeller som ikke flytter totale poengsummer.
- Forbedringer i ett område som forårsaker regresjoner i et annet.
Det er ineffektivt å løse feil én etter én i disse situasjonene. Mønsteranalyse hjelper deg med å identifisere hvilke feil som har felles, slik at du kan løse den underliggende årsaken.
Konsentrasjonsanalyse
Når du har klassifisert individuelle feil, kan du se etter mønstre på tvers av hele settet.
| Mønster | Hva det indikerer | Anbefalt handling |
|---|---|---|
| 80% eller flere feil er problemer med evalueringsoppsettet | Evalueringsserien trenger kalibrering, ikke agentendringer | Stans agent-gjentakelse midlertidig. Overvåk og rett evalueringskvaliteten først, og kjør deretter på nytt for å få rent signal. |
| 80% eller flere feil er agentkonfigurasjonsproblemer i ett område (for eksempel alle kunnskapsrelaterte) | Systemisk agentkonfigurasjonsgap | Fokusutbedring på dette området. Dette problemet er ofte et arkitektonisk problem (for eksempel kunnskapskildestruktur), ikke individuelle testtilfeller. |
| 80% eller flere feil er plattformbegrensninger | Agenten når plattformgrenser | Revurdering av agentomfang. Eskalere til plattformteam. Juster terskler eller behandle berørte elementer som kjente begrensninger der det er aktuelt. |
| Feil spres jevnt over grunnårsakstyper | Ikke noe enkelt systemisk problem | Fortsett utbedringstilfelle etter sak ved hjelp av utbedringstilordning. |
Slik utfører du konsentrasjonsanalyse
Telle de klassifiserte feilene etter grunnårsakstype:
- Problemer med evalueringsoppsett
- Agentkonfigurasjonsproblemer
- Begrensninger for plattformen
- Uklassifisert
Beregne prosentandelen for hver type.
Hvis én enkelt type er 80% eller høyere, som angir et systemisk problem, kan du løse kategorien, ikke enkelttilfeller.
Hvis agentkonfigurasjonsproblemer konsentrerer seg i ett kvalitetssignal (for eksempel fem av seks er kunnskapsjording), peker dette mønsteret på en arkitektonisk grunnårsak.
Krysssignalmønstre
Når feil strekker seg over flere evalueringssett, peker de ofte på en delt grunnårsak. Se etter følgende mønstre:
| Mønster | Hva det sannsynligvis indikerer | Hva du skal undersøke |
|---|---|---|
| Faktanøyaktighet og kunnskapsgrunnlag svikter begge deler | Kunnskapskildeproblem (feil, manglende, utilgjengelig eller foreldet) | Kunnskapskonfigurasjon, indekseringsstatus og innholdsfriskhet |
| Både aktivering av verktøy og utløserruting mislykkes | Konfigurasjonsproblem for orkestrering – emner og verktøy er ikke riktig tilkoblet | Se gjennom hvordan emner rutes til verktøy. Se etter frakoblede eller feilkonfigurerte flyter. |
| Feil i tonen, men nøyaktigheten er godkjent | Agent får det riktige svaret, men leverer det dårlig | Fokuser på instruksjoner for ledetekststil; nøyaktighetsinfrastruktur er god. |
| Sikkerhet er godkjent, men nøyaktigheten svikter | Agenten kan være overbegrenset – for forsiktig, nekter å svare når den skal | Se gjennom sikkerhetsinstruksjoner for altfor brede restriksjoner som blokkerer legitime svar. |
| Alt som passerer bortsett fra kanttilfeller | Kjernevirkemåten er solid | Fokuser på å utvide robustheten ved margene. dette mønsteret er et godt tegn. |
| Forbedret nøyaktighet, men forringet tone | Instruksjonskonflikt – nye nøyaktighetsinstruksjoner kan være å fortrenge tonoanvisning | Se gjennom nylige ledetekstendringer, og husk «instruksjonsbudsjettet». |
| Flere evalueringssett forringes alle samtidig | Sannsynligvis én enkelt grunnårsak med bred innvirkning | Se etter nylige endringer i systemledeteksten, oppdateringer av kunnskapskilde eller plattformmodelloppdateringer. |
Hva du skal gjøre med krysssignalmønstre
- Identifiser den delte grunnårsaken: Hvis to signaler mislykkes sammen, deler de sannsynligvis en avhengighet, for eksempel en kunnskapskilde, ledetekstinndeling eller verktøykonfigurasjon.
- Løs den delte avhengigheten: Ikke rett opp hvert signal uavhengig av hverandre.
- Kjør begge evalueringssettene på nytt: Etter løsningen bekrefter du at begge settene forbedres.
- Hvis bare én blir bedre, deler ikke signalene en grunnårsak. Triage de gjenværende feilene uavhengig.
Trendanalyse på tvers av gjentakelser
Spor hvordan resultatene endres på tvers av gjentakelsessyklusene for å forstå om utbedringsstrategien fungerer.
| Trend | Tolkning | Handling |
|---|---|---|
| Resultater som forbedres på tvers av gjentakelser | Utbedring fungerer | Fortsett til terskler er oppfylt. |
| Scorer flatt til tross for endringer | Utbedring er ikke rettet mot den virkelige årsaken | Re-triage; grunnårsaksklassifiseringen kan være feil. |
| Forverring av resultater etter en endring | Regresjon – endringen brøt noe | Rull tilbake endringen. Undersøk hva som har tilbakefalt og hvorfor. |
| Et evalueringssett blir bedre, et annet blir dårligere. | Avveining – å fikse én dimensjon skader en annen | Undersøk koblinger, ofte forårsaket av instruksjonskonflikt (se Reise 3). |
| Poengsummer som varierer mellom gjennomføringer (mer enn +/-10% avvik) | Grader ustabilitet eller agent ikke-determinisme | Valider graderingspålitelighet først (se Grader-validering). Kjør minst tre ganger per gjentakelse. |
Bygge en trendvisning
Etter hver gjentakelse registrerer du:
- Dato
- Endring gjort
- Evalueringssett
- Poengsum før
- Poengsum etter
- Delta
Denne informasjonen hjelper deg:
- Bekreft at du konvergerer mot terskler
- Identifiser regresjoner raskt
- Finn platåer tidlig (Reise 2)
Dokumentfeil
Strukturerte feilposter bygger institusjonell kunnskap på tvers av gjentakelsessykluser. Uten dokumentasjon gjentar team ofte det samme undersøkelsesarbeidet.
Hvorfor dokumentfeil
- Øke hastigheten på fremtidig triage: Du gjenkjenner umiddelbart kjente feilmønstre.
- Bygg dokumentasjon for eskalering: Samle plattformbegrensningsregistreringer for å styrke sakene overfor plattformteamet.
- Aktiver teamlæring: Loggen bidrar til å forhindre duplikatundersøkelser når flere personer arbeider på samme agent.
- Spor kjente hull: Ikke glem å spore feil klassifisert som «løser ikke» eller «kjent begrensning».
Bruk malen for feillogg
Bruk malen for feillogg til å registrere feil i et lett eller detaljert format, avhengig av teamets størrelse og forfallsdato.
Hva du skal spille inn
I det minste kan du registrere følgende informasjon for hver triaged-feil:
- Hvilket testtilfelle som mislyktes.
- Hvilken grunnårsakstype du klassifiserte den som.
- Hva gikk galt spesifikt.
- Det du endret for å fikse det.
- Om løsningen fungerte.
For uløste feil registrerer du også:
- Det du har prøvd så langt.
- Hvorfor det forblir uløst.
- Når du skal revurdere (for eksempel «etter plattformoppdatering X»).
Arbeidsflyt for kontinuerlig forbedring
Bruk denne sjekklisten etter hver triage- og utbedringssyklus for å bekrefte at du har tatt opp resultatene og de neste trinnene.
Sjekkliste etter gjentakelse
| Gjort? | Oppgave |
|---|---|
| ✓ | Registrer alle feil i feilloggen. |
| ✓ | Identifiser og noter grunnårsakskonsentrasjoner. |
| ✓ | Kontroller mønstre på tvers av signaler. |
| ✓ | Registrer resultater for trendsporing. |
| ✓ | Dokument kjente begrensninger med midlertidige løsninger. |
| ✓ | Identifiser neste gjentakelsesprioriteringer basert på gjenværende feil. |
| ✓ | Angi tidsplan for gjennomføring på nytt (hvilke evalueringssett, når). |
Når du skal stoppe gjentakelse
Stopp gjentakelse når:
- Alle evalueringssett er over terskelverdier.
- Du dokumenterte kjente mellomrom.
- Resultatene er konsekvente (< 5% varians).
- Ingen konfigurasjonsproblemer for åpen agent for blokkering av signaler.
Ikke stopp iterasjonen når:
- Du undersøkte ikke vedvarende feil.
- Du fjernet harde testtilfeller for å treffe terskler.
- Du har ikke dokumentert plattformbegrensninger.
Finn ut mer i Bestem når gjentakelsen er fullført.
Neste trinn
- Se gjennom praktiske eksempler som viser hvordan rammelagene fungerer sammen i virkelige scenarier.
- Bruk malen for feillogg til å spore resultatene.