Overvåk evalueringsfeilene med strukturerte loggingsmaler

Dokumentering av evalueringsfeil bygger institusjonell kunnskap som akselererer fremtidige triage-økter. Når du støter på samme type feil på nytt, vet du allerede hva du skal sjekke først i stedet for å gjenoppdage de samme grunnårsakene.

Bruk disse strukturerte malene til å registrere feilanalyse fra triage-øktene. Velg versjonen som passer teamets behov og arbeidsflyt.

Viktig!

Fullfør feiltriage først. Dokumentfeil når du diagnostiserer dem.

Velg malversjonen som passer til teamet:

Lett versjon for små team som iterer på én enkelt agent
Detaljert versjon for større team eller når du bygger institusjonell kunnskap på tvers av agenter

Logg for lett feil

Den enkle feilloggen er ment for små team eller raske prioriteringsøkter.

Kopier denne tabellen, og fyll den ut under triage-økter. Legg til én rad per feil.

Testtilfelle	Grunnårsakstype	Problem observert	Endring brukt	Løst
___	Evalueringsoppsett, agentkonfigurasjon eller plattformbegrensning	___	___	Ja / Nei / Delvis
___	___	___	___	___
___	___	___	___	___

Eksempel (fylt ut)

Testtilfelle	Grunnårsakstype	Problem observert	Endring brukt	Løst
KG-003	Evalueringsoppsett	Forventet svar utdatert (gammel returpolicy – 30 dager, gjeldende policy er 15 virkedager)	Oppdatert forventet verdi til 15 virkedager	Ja
KG-005	Agentkonfigurasjon	Agenten har gitt garantidetaljer som ikke finnes i noen kunnskapskilde	Lagt til forankringsinstruksjon: «Bare svar fra kunnskapskilder»	Ja
TI-002	Plattformbegrensning	Hentingsrangering ignorerer nøyaktig dokumenttittel. Vanlige spørsmål som alltid hentes i stedet for produkthåndbok	Omstrukturerte dokumentoverskrifter som midlertidig løsning. eskalert til plattformteam	Partial
FA-019	Plattformbegrensning	Tvetydig spørring kan ikke hente riktig kilde på en pålitelig måte	Dokumentert som kjent begrensning. overvåking i produksjon	Ingen (kjent mellomrom)

Detaljert feillogg

Den detaljerte feilloggen er for team som må dele funn, spore status på tvers av sprinter eller bygge institusjonell kunnskap på tvers av flere agenter.

Bemerkning

Last ned en CSV-versjon av denne malen.

Registrering per feil

Felt	Verdi
Testtilfelle-ID	(fra evalueringssettet, for eksempel KG-003)
Evalueringssett	(hvilket evalueringssett denne posten tilhører)
Kvalitetssignal	(faktisk nøyaktighet, kunnskapsjording, verktøyaktivering osv.)
Grunnårsakstype	(Evalueringsoppsett, agentkonfigurasjon, plattformbegrensning, verktøyintegrering, uklassifisert)
Rotårsaksdetalj	(spesifikk undertype, for eksempel «utdatert forventet svar», «tvetydighet for verktøybeskrivelse»)
Problem observert	(hva agenten gjorde kontra hva det burde ha gjort)
Diagnosebane	(hvilke triage-spørsmål som førte til denne klassifiseringen, for eksempel «Trinn 1, 2. kvartal – forventet svar utdatert»)
Utbedringshandling	(hva som ble endret, spesifikke nok detaljer til å reprodusere)
Status	(Åpne, Pågår, Løst, Vil ikke løse)
Vil ikke fikse begrunnelse	(hvis vil ikke løse: hvorfor, og hvilken overvåking som er på plass)
Verifikasjon	(rerun result: pass or fail, date, iteration number)
Dato triagert	___
Kategorisert av	___

Eksempel (fylt ut)

Felt	Verdi
Testtilfelle-ID	KG-005
Evalueringssett	Kunnskapsjording
Kvalitetssignal	Kunnskapsjording
Grunnårsakstype	Agentkonfigurasjon
Rotårsaksdetalj	Feil informasjon, agentgenerert innhold som ikke finnes i noen kunnskapskilde
Problem observert	Agent hevdet "3-års utvidet garanti som dekker alle deler og arbeidskraft" når kilden sier "2-års standard garanti"
Diagnosebane	Trinn 1 passert (gyldig evaluering) → trinn 2, 2.4 (besvart uten kilde) + 2.5 (motsagt kilde)
Utbedringshandling	Lagt til i systemledeteksten: «Bare svar basert på informasjon som finnes i kunnskapskildene dine. Hvis informasjonen ikke er tilgjengelig, kan du si det.»
Status	Løst
Vil ikke fikse begrunnelse	I/T
Verifikasjon	Pass (gjentakelse 2, 15. februar)
Dato triagert	14. februar
Kategorisert av	[navn]

Sammendragslogg for iterasjon

Spor resultater og endringer på tvers av gjentakelser for trendanalyse.

Gjentakelse	Dato	Endring gjort	Evalueringssett berørt	Poengsum før	Poengsum etter	Delta	Merknader
1	___	Opprinnelig plan (ingen endringer)	Alle	—	___%	—	Første kjøring
2	___	___	___	___%	___%	___	___
3	___	___	___	___%	___%	___	___

Konsentrasjonssammendrag

Etter hver triage-økt, tell opp grunnårsakstyper for å finne konsentrasjonsmønstre.

Grunnårsakstype	Antall	% av total	Systemisk?
Evalueringsoppsett	___	___%	(80%+ = pause agentarbeid, rette opp evalueringer først)
Agentkonfigurasjon	___	___%	(80%+ i ett område = arkitektonisk problem)
Plattformbegrensning	___	___%	(80%+ = revurdere omfanget, eskalere)
Verktøy eller integrering	___	___%	(fix backend, ikke agent)
Uklassifisert	___	___%	(skjerm, kan bli klassifiserbar med mer data)
I alt	___	100 %

Anbefalte fremgangsmåter for vedlikehold av loggen

Oppdater i sanntid under triage. Ikke samle opp oppdateringer etter økten.
Registrere negative resultater også, for eksempel "prøvd X, hjalp ikke." Denne praksisen bidrar til å forhindre mislykkede fremgangsmåter på nytt.
Se gjennom før hver gjentakelse. Se etter mønstre før du adresserer individuelle feil.
Del på tvers av teamet. Del loggen med teamet slik at alle ser tidligere funn.
Arkiver, ikke slett. Behold løste oppføringer for mønsteranalyse. Flytt oppføringer til en arkivinndeling hvis den aktive loggen blir lang.

Neste trinn

Når du har dokumentert feilene dine:

Bruk lag 4: Analyser mønstre for å identifisere systemiske problemer.
Bruk lag 3: Tilordne feilmønstre til utbedringsstrategier for å bruke målrettede løsninger.
Fortsett med evalueringsarbeidsflyten for å opprettholde kontinuerlig forbedring.

Tilbakemeldinger

Var denne siden nyttig?

Last updated on 2026-05-01

Overvåk evalueringsfeilene med strukturerte loggingsmaler

Logg for lett feil

Eksempel (fylt ut)

Detaljert feillogg

Registrering per feil

Eksempel (fylt ut)

Sammendragslogg for iterasjon

Konsentrasjonssammendrag

Anbefalte fremgangsmåter for vedlikehold av loggen

Neste trinn

Tilbakemeldinger

Flere ressurser