Øvelse – Velg kolonner som skal returneres ved hjelp av prosjektoperatoren
Du kan bruke Kusto-spørringer til å filtrere data og returnere spesifikk informasjon.
Husk at du har sett på vilkårlige rader med data for å få en følelse av datastrukturen. I denne enheten lærer du hvordan du velger bestemte datakolonner som er relatert til stormtyper, plasseringer og skadelige effekter.
Bruk operatoren project
Hvis du husker, har eksemplet på meteorologiske data ganske mange kolonner. Ikke alle disse kolonnene er meningsfulle for denne utforskningen. Du velger bare noen få kolonner du vil vise. Du bruker operatoren project til å definere hvilke kolonner du vil se i utdataene. Kolonnenavn er atskilt med komma.
Kjør følgende spørring. Denne spørringen gir kolonnene navn til å returnere og rekkefølgen i
projectoperatoren.StormEvents | project EventType, State, DamageProperty, DamageCrops, InjuriesDirect, InjuriesIndirect | take 10Du bør få resultater som ser ut som følgende bilde:
Legg merke til at bare kolonnene nevnt i
project-operatoren vises i utdataene.
Gi nytt navn til og definer nye kolonner ved hjelp av project
For å forstå konsekvensene av stormer i amerikanske stater, ønsker du å få det totale antallet skader og den totale mengden skade. Med operatoren project kan du summere heltallsverdier fra forskjellige kolonner og returnere resultatene i en ny kolonne. Du kan også gi nytt navn til kolonner for å gjøre dem mer meningsfulle for analysen.
Det finnes for eksempel andre land/områder med delstater. Det kan være nyttig å gi nytt navn til delstatskolonnen, slik at det er klart at resultatene er for amerikanske delstater. La oss se hvordan du endrer den forrige spørringen slik at du får totalt antall skader og skademengde for amerikanske delstater.
Oppdater den forrige spørringen for å lage en ny kolonne som viser summen av InjuriesDirect- og InjuriesIndirect:
Injuries=InjuriesDirect+InjuriesIndirectGjør det samme for de to typene skadekolonner ved å tilføre sammen skade på avlinger og skade på eiendom:
Damage=DamageCrops+DamagePropertyHold pekeren over kolonnenavnet i redigeringsprogrammet for spørring for å se datatypen i kolonnene. Du kan bruke en numerisk operator til å legge til verdiene fordi disse kolonnene er av typen
int(heltall).
Gi kolonnen state nytt navn til US_State:
US_State=StateSe gjennom den oppdaterte spørringen, og kjør den. Den fullstendige spørringen inneholder beregninger for skader, beregninger for skader og gi nytt navn til kolonnen State.
StormEvents | project US_State=State, EventType, Injuries=InjuriesDirect+InjuriesIndirect, Damage=DamageCrops+DamageProperty | take 10Du bør få resultater som ser ut som følgende bilde:
Legg merke til at kolonnen state har fått nytt navn til US_State. Kolonnen Skader er ny, og er beregnet som summen av InjuriesDirect og InjuriesIndirect. Kolonnen Skade er også ny, og er beregnet som summen av DamageCrops og DamageProperty.
Bruk operatoren project-away
Hva om du vil fjerne noen få merkede kolonner? For denne utforskningen har du ingen bruk for ID-ene som er tilordnet hver episode og hendelse. Du kan fjerne bestemte kolonner ved hjelp av operatoren project-away, som angir hvilke kolonner som skal fjernes mens du forlater alle gjenværende kolonner. Du kan også bruke et jokertegn, for eksempel | project-away *Id, til å fjerne alle kolonner som slutter på ID-.
Kjør følgende spørring:
StormEvents | project-away EpisodeId, EventId | take 10Kontroller resultatene. Husk at kolonnene EpisodeId og EventId var mellom kolonnene EndTime og State. Hvilke av disse kolonnene ser du i utdataene?