Jaa


Rivien ryhmittely tai yhteenveto

Power Query:ssä voit ryhmitellä arvot eri riveillä yhdeksi arvoksi ryhmittelemällä rivit arvojen mukaan yhdessä tai useammassa sarakkeessa. Voit valita kahdentyyppisiä ryhmittelytoimintoja:

  • Sarake ryhmittelyt.

  • Rivien ryhmittelyt.

Tässä opetusohjelmassa käytetään seuraavaa esimerkkitaulukkoa.

alkuperäisen mallitaulukon.

Näyttökuva taulukosta, jossa on sarakkeita, joissa näkyvät Vuosi (2020), Maa (USA, Panama tai Kanada), tuote (paita tai shorts), myyntikanava (online tai jälleenmyyjä) ja yksiköt (eri arvot 55–7500)

Ryhmittelyperuste-painikkeen löytäminen

Voit Ryhmittelyperuste painikkeen kolmesta paikasta:

  • Valitse Home -välilehden Muunna -ryhmä.

    Kuvakaappaus Power Query-nauhasta, jossa

  • Muunna -välilehden Table -ryhmässä.

    Kuvakaappaus Power Query-nauhasta, jossa

  • Kun napsautat pikavalikosta sarakkeita hiiren kakkospainikkeella.

    Näyttökuva taulukosta, jossa pikavalikossa on korostettu Ryhmittelyperuste-valinta.

Koostefunktion käyttäminen ryhmittelyssä yhden tai useamman sarakkeen mukaan

Tässä esimerkissä tavoitteesi on tehdä yhteenveto maan ja myyntikanavan tasolla myytyjen yksiköiden kokonaismäärästä. Voit käyttää Country- ja Sales Channel -sarakkeita ryhmittelyperuste-toiminnon suorittamiseen.

  1. Valitse Ryhmittelyperuste-Aloitus -välilehdeltä.
  2. Valitse Lisäasetukset -vaihtoehto, jotta voit valita useita sarakkeita ryhmitelläksesi.
  3. Valitse Country -sarake.
  4. Valitse Lisää ryhmittely.
  5. Valitse myyntikanavansarake.
  6. Syötä Uusi sarakkeen nimi -Yksiköitä yhteensä -, valitse Toiminto-Summaja valitse Sarake-Units.
  7. Valitse OK

Kuvakaappaus ryhmästä dialogin kautta, jossa kootut sarakkeet täytetään.

Tämä toiminto antaa sinulle seuraavan taulukon.

Näyttökuva mallitulostetaulukosta, jossa on Maa-, Myyntikanava- ja Yksiköitä yhteensä -sarakkeet.

Käytettävissä olevat toiminnot

Käytettävissä olevat toiminnot voidaan Ryhmittelyperuste -ominaisuuden avulla kahdella tavalla:

  • Rivitason toiminto
  • Saraketason toiminto

Seuraavassa taulukossa kuvataan jokainen näistä toiminnoista.

Toiminnon nimi Luokka Kuvaus
Summa- Saraketoiminto Laskee yhteen kaikki sarakkeen arvot
keskiarvon Saraketoiminto Laskee keskiarvon sarakkeesta
mediaanin Saraketoiminto Laskee mediaaniarvon sarakkeesta
Min Saraketoiminto Laskee minimiarvon sarakkeesta
Max Saraketoiminto Laskee sarakkeen enimmäisarvon
prosenttipiste Saraketoiminto Laskee prosenttipisteen käyttämällä syötearvoa 0–100 sarakkeesta
Erillisten arvojen määrä Saraketoiminto Laskee sarakkeen erillisten arvojen määrän
Laske rivit - Rivitoiminto Laskee tietyn ryhmän rivien kokonaismäärän
Erillisten rivien määrä Rivitoiminto Laskee tietyn ryhmän erillisten rivien määrän
Kaikki rivit Rivitoiminto Tulostaa kaikki taulukon ryhmitellyt rivit ilman koosteita

Muistiinpano

Count -operaatiot erilliset arvot ja Percentile ovat saatavilla vain Power Query Onlinessa.

Suorita toiminto ryhmittelyssä yhden tai useamman sarakkeen mukaan

Alkuperäisestä mallista alkaen luot tässä esimerkissä sarakkeen, joka sisältää yksiköiden kokonaismäärän ja kaksi muuta saraketta, jotka antavat sinulle parhaiten suoriutuneen tuotteen nimen ja myydyt yksiköt maan ja myyntikanavan tasolla yhteenvedon mukaan.

Kuvakaappaus näytetulostaulusta operaatioineen.

  1. Käytä seuraavia sarakkeita ryhmittelyperusteena sarakkeissa:

    • Maa
    • Myyntikanava
  2. Luo kaksi uutta saraketta seuraavasti:

    1. Koosta Units -sarake Sum -toiminnolla. Anna tämän sarakkeen nimeksi Total units.
    2. Lisää uusi Productssarake käyttämällä Kaikki rivit -toimintoa.

    Kuvakaappaus ryhmästä dialogin avulla ei-aggregoidulla sarakkeella.

Kun tämä operaatio on suoritettu, huomaa, että Tuotteet-sarakkeessa on [Taulukko] arvoja jokaisessa solussa. Jokainen [Taulukko] -arvo sisältää kaikki rivit, jotka oli ryhmitelty alkuperäisen taulukon Maa- ja Myyntikanava-sarakkeiden mukaan. Voit valita solun sisällä olevan tyhjän tilan, jolloin valintaikkunan alareunassa olevan taulukon sisällön esikatselu tulee näkyviin.

Näyttökuva taulukon tietojen esikatseluruudusta.

Muistiinpano

Tietojen esikatseluruudussa ei välttämättä näy kaikkia ryhmittelyperuste-toiminnossa käytettyjä rivejä. Voit valita [Taulukko] -arvon nähdäksesi kaikki rivit, jotka liittyvät vastaavaan ryhmäkohtaiseen operaatioon.

Seuraavaksi sinun on purettava rivi, jolla on suurin arvo uuden Products -sarakkeessa olevien taulukoiden Units -sarakkeessa, ja kutsuttava kyseistä uutta saraketta Top performer -tuotteen.

Poimi tärkeimmät suorittajan tuotetiedot

Uudella Tuotteet-sarakkeella, jossa on [Taulukko] arvoja, luot uuden mukautetun sarakkeen menemällä nauhan Lisää sarakkeen välilehdelle ja valitsemalla Mukautettu sarakeYleisestä ryhmästä.

Kuvakaappaus Power Query-nauhasta, jossa on korostettu Mukautettu sarake -vaihtoehto Lisää sarakkeen välilehdellä.

Anna uudelle sarakkeelle nimi Top performer product. Syötä kaava Table.Max([Products], "Units" ) kohdassa Mukautettu sarakekaava.

Kuvakaappaus Mukautettu sarakkeen dialogista, jossa on Table.Maxin kaava syötetty.

Tämän kaavan tulos luo uuden sarakkeen, jossa on [Record] -arvot. Nämä tietuearvot ovat pohjimmiltaan taulukko, jossa on vain yksi rivi. Nämä tietueet sisältävät rivin, jossa on kunkin [Taulukon] arvon Units-sarakkeen maksimiarvo Tuotteet-sarakkeessa.

Kuvakaappaus mukautetun sarakekaavan tuloksesta Table.Maxilla.

Tässä uudessa Top Performer Product -sarakkeessa, joka sisältää [Record]-arvoja, voit valita laajennuskuvakkeen, valita Tuote- ja Yksiköt-kentät ja sitten valita OK.

Kuvakaappaus laajennusoperaatiosta ennätysarvolle Top Performer Product -sarakkeessa.

Kun poistat Products-sarakkeen ja asetat tietotyypit molemmille laajennetuille sarakkeille, tuloksesi muistuttaa seuraavaa kuvaa.

Kuvakaappaus lopullisesta taulukosta kaikkine muodonmuutoksineen.

Sumea ryhmittely

Muistiinpano

Seuraava ominaisuus on saatavilla vain Power Query Onlinessa.

Seuraavassa kuvassa näkyvä esimerkkitaulukko havainnollistaa, miten voit tehdä "sumean ryhmittelyn".

Näyttökuva taulukosta, jossa on yhdeksän riviä merkintöjä, jotka sisältävät eri kirjoitusasuja ja isoilla kirjaimilla nimeltä Miguel ja William.

Sumean ryhmittelyn tavoitteena on tehdä ryhmittelyperuste-toiminto, joka käyttää tekstimerkkijonojen likimääräistä vastaavuusalgoritmia. Power Query käyttää Jaccardin samankaltaisuusalgoritmia mittaamaan samankaltaisuutta instanssiparien välillä. Sitten se käyttää taajamallista hierarkkista klusterointia esiintymien ryhmittelemiseen yhteen. Seuraavassa kuvassa näet odotetun tuloksen, jossa taulukko ryhmitetään Person -sarakkeen mukaan.

Näyttökuva taulukosta, jossa näkyvät henkilön merkinnät Miguel ja Mike sekä Tiheys 3 ja 2.

Jos haluat tehdä sumean ryhmittelyn, suorita samat vaiheet, jotka kuvattiin aiemmin tässä artikkelissa. Ainoa ero on, että tällä kertaa valitset Ryhmittelyperuste -valintaikkunassa Käytä sumeaa ryhmittelyä -valintaruudun.

Kuvakaappaus Sumeasta ryhmittelyruudusta, joka korostetaan Ryhmää -valintaikkunassa.

Jokaiselle riviryhmälle Power Query valitsee yleisimmän instanssin "kanoniseksi" instanssiksi. Jos useita tapauksia esiintyy samalla tiheydellä, Power Query valitsee ensimmäisen. Kun valitset OKRyhmittely -valintaikkunasta, saat odottamasi tuloksen.

Näyttökuva sumean ryhmittelymallin lopullisesta taulukosta, ei muunnostaulukkoa.

Voit kuitenkin hallita sumeaa ryhmittelytoimintoa paremmin laajentamalla Sumea ryhmä -.

Kuvakaappaus ryhmästä dialogin kautta, jossa on Fuzzy-ryhmävaihtoehdot korostettu.

Sumean ryhmittelyn käytettävissä ovat seuraavat vaihtoehdot:

  • samanlaisuuskynnysarvon (valinnainen): Tämä asetus ilmaisee, miten samankaltaiset kaksi arvoa on ryhmiteltävä yhteen. Minimiasetus nolla (0) aiheuttaa sen, että kaikki arvot ryhmitellaan yhteen. Suurin asetus 1 sallii vain tarkalleen vastaavat arvot ryhmitellä yhteen. Oletusarvo on 0,8.
  • Ohita-tapauksen: Kun tekstimerkkijonoja verrataan, kirjainkoko ohitetaan. Tämä asetus on oletusarvoisesti käytössä.
  • Ryhmittely yhdistämällä tekstin osia: Algoritmi pyrkii yhdistämään tekstiosia (kuten yhdistämällä Micro ja softMicrosoft) ryhmittelemään arvoja.
  • Näytä samankaltaisuuspisteet: Näytä samankaltaisuuspisteet syötearvojen ja laskettujen edustavien arvojen välillä sumean ryhmittelyn jälkeen. Edellyttää, että toiminto kuten Kaikki rivit lisää näitä tietoja rivi riviltä -tason esittämiseksi.
  • Muunnostaulu (valinnainen): Voit valita muunnostaulun, joka yhdistää arvot (kuten MSFTMicrosoft) ryhmitelläksesi ne yhteen.

Tässä esimerkissä käytetään muunnostaulukkoa osoittamaan, miten arvoja voidaan yhdistää. Muunnostaulukossa on kaksi saraketta:

  • From: Taulukosta etsittävä merkkijono.
  • To: Tekstimerkkijono, jota käytetään korvaamaan tekstimerkkijono From -sarakkeessa.

Seuraavassa kuvassa näytetään tässä esimerkissä käytetty muunnostaulukko.

näyttökuva taulukosta, jossa näkyvät mikki- ja William-arvojen tiedot sekä Miguelin ja Billin arvot.

Tärkeä

On tärkeää, että muunnostaulukossa on samat sarakkeiden ja sarakkeiden nimet kuin edellisessä kuvassa (niille on merkittävä nimet "From" ja "To"). Muuten Power Query ei tunnista taulukkoa muunnostauluksi.

Palaa Ryhmä -valintaikkunaan , laajenna Sumeat ryhmävaihtoehdot, vaihda operaatio Laske rivit -tilasta Kaikkiin riveihin, ota käyttöön Näytä samankaltaisuuspisteet -vaihtoehto ja valitse sitten Muunnostaulun pudotusvalikko.

Kuvakaappaus sumeasta ryhmittelyesimerkkimuunnostaulukon pudotusvalikosta.

Kun olet valinnut muunnostaulukon, valitse OK. Toiminnon tulos antaa seuraavat tiedot:

Näyttökuva sumean ryhmittelymallin lopullisesta taulukosta muunnostaulukon kanssa.

Tässä esimerkissä Ignore case -vaihtoehto oli käytössä, joten muunnostaulun From-sarakkeen arvoja käytetään tekstimerkkijonon etsimiseen ottamatta huomioon merkkijonon sijaa. Tämä muunnostoiminto suoritetaan ensin, ja sitten suoritetaan sumea ryhmittelytoiminto.

Samankaltaisuuspisteet näytetään myös henkilö-sarakkeen vieressä olevassa taulukon arvossa, mikä kuvastaa tarkalleen sitä, miten arvot ryhmiteltiin ja miten ne vastaavat samankaltaisuuspisteitä. Voit tarvittaessa laajentaa tätä saraketta tai käyttää uusien Frequency-sarakkeiden arvoja muihin muunnoksiin.

Muistiinpano

Kun ryhmittelyä tehdään useiden sarakkeiden mukaan, muunnostaulukko suorittaa korvaustoiminnon kaikissa sarakkeissa, jos arvon korvaaminen kasvattaa samankaltaisuuspistemäärää.

Jos haluat lisätietoja muunnostaulukoiden toiminnasta, siirry kohtaan Muunnostaulukon ohjeet.