Jaa


Mikä on graafitietokanta?

Note

Tämä ominaisuus on tällä hetkellä julkisessa esikatselussa. Tämä esikatselu tarjotaan ilman palvelutasosopimusta, eikä sitä suositella tuotantokuormituksiin. Tiettyjä ominaisuuksia ei ehkä tueta tai niiden ominaisuudet voivat olla rajoitettuja. Lisätietoja löytyy Supplemental Terms of Use for Microsoft Azure Previews.

Graafitietokanta on tietokantatyyppi, joka esittää tiedon solmuina (entiteetteinä) ja reunoina (suhteina) taulukoiden ja rivien sijaan. Tämä rakenne tekee monimutkaisten yhteyksien ja kuvioiden tutkimisesta datassasi helppoa.

Yleisimmin käytetty graafitietokantatyyppi toteuttaa merkityn ominaisuusgraafin (LPG) mallin: entiteetit (solmut) ja suhteet (reunat) voivat olla tunnisteilla ja ominaisuuksilla (avain-arvoparit). Tämä joustava malli mahdollistaa sekä skeema-vapaaehtoiset että skeemapohjaiset suunnittelut, ja sen avulla voit ilmaista monimutkaisia suhteita. Koska yhteydet tallennetaan eksplisiittisesti reunoina, kyselyt kulkevat suhteiden läpi seuraamalla reunoja sen sijaan, että ne laskeisivat kalliita liitoksia kyselyn aikana.

Note

Tämän artikkelin esimerkit käyttävät sosiaalisen verkoston esimerkkikaaviodatasettiä.

Kaaviotietokannan ydinkäsitteet

Graafitietokanta järjestää datan kolmeen perustavanlaatuiseen rakennuspalikkaan:

  • Solmut edustavat entiteettejä, kuten ihmisiä, tuotteita tai paikkoja. Solmuilla voi olla otsikoita ja ominaisuuksia, jotka kuvaavat niiden määritteitä. Esimerkiksi Person solmulla voi olla ominaisuuksia kuten firstName, lastName, ja age.
  • Reunat kuvaavat, miten entiteetit ovat yhteydessä toisiinsa, esimerkiksi FRIENDS_WITH, PURCHASED, tai LOCATED_IN. Reunat voivat myös kantaa ominaisuuksia ja tunnisteita suhteiden metatietojen keräämiseksi.
  • Ominaisuudet liittävät tietoja solmuihin ja reunoihin (esimerkiksi henkilön nimi tai reunan päivämäärä).

Miten suhteiden kysely toimii?

Kaaviokyselyt hakevat yhdistettyä tietoa kulkemalla aloitussolmusta naapureilleen, sitten naapureilleen ja niin edelleen. Läpikäynnin hinta riippuu siitä, kuinka monta reunaa se koskettaa (paikallinen naapurusto), ei aineiston kokonaiskoosta. Tämä ominaisuus tekee kysymyksistä poluista, yhteyksistä ja kaavoista – kuten ystävien ystävistä, lyhyimmistä poluista tai monihyppäisriippuvuuksista – luonnollisia ja tehokkaita ilmaista.

Graafitietokannat käyttävät kaavapohjaisia kyselykieliä, kuten Graph Query Language (GQL), kuvaamaan näitä kulkuja tiiviisti. Sama kansainvälinen työryhmä, joka valvoo SQL:ää (ISO/IEC 39075), standardoi GQL:ää, mikä sovittaa graafikyselyt vakiintuneisiin tietokantastandardeihin.

Esimerkki (kuvion yhteensopivuus GQL:n kanssa):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

Tämä kuvio kuuluu näin: aloitetaan Annemarien Person-solmusta, seuraa :knows reunoja jokaiseen ystäväsolmuun ja seuraa :likes reunoja liittyviin :Comment solmuihin. Palauta 100 uusinta näistä kommenteista niiden luomispäivän mukaan.

Graafidatamalli ja skeeman joustavuus

Kaaviotietomallit ovat skeemavalinnaisia: voit käyttää kiinteää rakennetta, kun tarvitset vahvaa hallintoa, tai kehittää mallia, kun uusia solmutyyppejä, suhteita tai ominaisuuksia tulee näkyviin. Tämä lähestymistapa vähentää tietojen päällekkäisyyden tarvetta ja antaa tiimeille mahdollisuuden yhdistää tietoja useista lähteistä ilman raskasta etukäteissuunnittelua. Lisätietoja Microsoft Fabricin graafissa käytetystä tietomallista löytyy kohdasta Merkityt ominaisuusgraafit.

Kaaviotietokantojen yleiset käyttötarkoitukset

Graafitietokannat ovat tiiviisti linjassa niiden domainien kanssa, joilla yhteydet tuottavat arvoa, kuten:

  • Sosiaaliset verkostot — mallintavat ihmisten välisiä suhteita ja heidän vuorovaikutustaan
  • Tietograafit — yhdistävät käsitteitä, entiteettejä ja faktoja semanttista hakua ja päättelyä varten
  • Suositusjärjestelmät — käy läpi käyttäjän ja esineiden vuorovaikutuksia tuodaksesi esiin personoituja ehdotuksia
  • Petosten ja riskien verkostot — havaitse epäilyttäviä kuvioita tilien, tapahtumien ja laitteiden välillä
  • Verkko- ja IT-topologia — kartoita riippuvuuksia palvelimien, palveluiden ja infrastruktuurikomponenttien välillä
  • Toimitusketjun riippuvuusanalyysi — jäljitetään komponenttien alkuperää ja suhteita toimittajien välillä

Näissä skenaarioissa kysymykset eivät koske niinkään yksittäisiä tietueita vaan enemmän sitä, kuinka monta entiteettiä liittyy ja on vuorovaikutuksessa useiden hyppyjen aikana.

Milloin kannattaa harkita kaaviotietokantaa

Graafitietokanta sopii hyvin, kun ihmissuhteet ohjaavat ydinkysymyksiä, joihin sinun täytyy vastata. Valitse graafitietokanta, kun:

  • Pääkysymyksesi liittyvät polkuihin, naapurustoihin ja kuvioihin yhdistetyssä datassa.
  • Humalan määrä vaihtelee tai ei ole etukäteen tiedossa.
  • Sinun täytyy yhdistää ja navigoida suhteita eri tietoaineistojen välillä.

Jos kysyt tällaisia kysymyksiä säännöllisesti, graafimalli sopii luonnollisesti.

Miten Microsoft Fabricin graafi vertautuu itsenäisiin graafitietokantoihin

Datan esittäminen graafina ja sen tallentaminen erilliseen, itsenäiseen graafitietokantaan tuo usein mukanaan ETL:n (extract, transform, load) ja hallinnon ylikuormitusta. Sitä vastoin Microsoft Fabricin kaavio toimii suoraan OneLakessa, mikä vähentää tai poistaa erillisten ETL-putkien ja tietojen monistamisen tarpeen. Harkitse näitä kompromisseja:

  • Datan siirto ja päällekkäisyys: Itsenäiset graafitietokannat vaativat tyypillisesti datan poimimisen, muuntamisen ja lataamisen erilliseen tallennustilaan, mikä lisää monimutkaisuutta ja voi johtaa päällekkäisiin tietoaineistoihin. Graph toimii OneLakella, joten voit mallintaa ja kysyä yhdistettyä dataa ilman, että sitä siirretään.
  • Käyttökustannukset: Erilliset kaaviopinot toimivat erillisinä klustereina tai palveluina, ja niihin liittyy usein käyttämättömyysmaksuja. Graafissa työkuormat käyttävät yhdistettyjä kapasiteettiyksiköitä (CU) automaattisilla skaalaus- ja keskitetyillä mittareilla, mikä yksinkertaistaa toimintaa ja voi alentaa kustannuksia.
  • Skaalautuvuus: Jotkin erilliset kaaviotietokannat ovat riippuvaisia skaalauksesta tai toimittajakohtaisesta klusteroinnista. Graph on suunniteltu laajamittaisille graafeille ja käyttää skaalautuvaa shardingia useiden työntekijöiden kesken hallitakseen suurten datakuormien tehokkaasti.
  • Työkalut ja taidot: Toimittajakohtaiset graafijärjestelmät voivat vaatia erikoistuneita kieliä ja erillisiä analytiikkakehyksiä. Graph tarjoaa yhtenäisen mallinnuksen, standardipohjaisen kyselyn (GQL), sisäänrakennetut graafianalytiikkaalgoritmit, BI- ja tekoälyintegraation sekä low/no-code-tutkimustyökalut. Nämä ominaisuudet mahdollistavat laajemman käyttäjäjoukon työskentelyn yhdistetyn datan kanssa.
  • Hallinto ja turvallisuus: Erilliset graafien käyttöönotot vaativat itsenäisiä hallinta- ja turvallisuusratkaisuja. Graph käyttää OneLake-hallintaa, linjausta ja työtilan roolipohjaista käyttöoikeuksien hallintaa (RBAC), joten vaatimustenmukaisuus, auditointi ja käyttöoikeudet pysyvät yhdenmukaisina muun Fabric-ympäristösi kanssa.