Merk
Tilgang til denne siden krever autorisasjon. Du kan prøve å logge på eller endre kataloger.
Tilgang til denne siden krever autorisasjon. Du kan prøve å endre kataloger.
Azure Synapse Link tilbyr flere måter å skrive og lese dataene dine på, slik at de passer til ulike analytiske scenarier. Avhengig av ditt analytiske scenario kan du velge en bestemt konfigurasjon fra alternativene nedenfor.
| Scenario | Gjelder | Tilgjengelige konfigurasjonsalternativer |
|---|---|---|
| Driftsrapportering | Microsoft Dataverse-tabeller, økonomi- og operasjonstabeller og enheter. | Synapse Analytics med Delta Lake gir bedre svartider for spørringer, spesielt aktuelt for spørring av store mengder data. Mer informasjon: Synapse Link med alternativet Delta-innsjø |
| Driftsrapportering | Bare dataverse tabeller. | Synapse Link med "oppdatering på stedet" konfigurasjonsalternativet gir CSV-filer i datalake som oppdateres i nær sanntid. Dette er et eldre alternativ som er tilgjengelig for Dataverse-tabeller. Dette alternativet støttes ikke for tabeller fra finans- og driftsapper. |
| Dataintegrering | Dataverse tabeller og økonomi- og operasjonstabeller og enheter. | Alternativet "Bare tilføy gir CSV-filer som inneholder inkrementelle data. Du kan bygge pipeliner som bruker trinnvise data og fyller ut nedstrømssystemer Funksjonen Brukerspesifisert datapartisjon gjør det mulig å velge en egendefinert datapartisjoneringsstrategi spesielt for Dataverse-tabeller. Tabelldata for økonomi og drift partisjoneres av systemet basert på riktig partisjonsstrategi. Dette alternativet er ikke tilgjengelig for finans- og driftsapper. |
Bemerkning
Azure Synapse Link for Dataverse var tidligere kjent som "eksport til data lake". Microsoft endret navn til tjenesten i mai 2021. Tjenesten fortsetter å eksportere data til Azure Data Lake Storage samt Azure Synapse Analytics. Fra og med september 2023 gir Azure Synapse Link deg også mulighet til å velge data fra Dynamics 365 finans- og driftsprogrammer. Ikke alle integreringsmønstre støttes med økonomi- og driftsapper. Gå til Transition-veiledningen for å få veiledning om overgang fra eksport til datainnsjøfunksjon i finans- og driftsapper til Synapse Link.
Denne artikkelen dekker avanserte konfigurasjonsinnstillinger som er tilgjengelige for Dataverse-tabeller. Disse alternativene er ikke tilgjengelige for økonomi- og driftsapper.
- Direkte oppdateringer kontra kun tilføyelse-skrivinger.
- Brukerangitt datapartisjonering.
Direkte oppdateringer kontra kun tilleggsskrivinger
Når du skriver Dataverse-tabelldata til Azure datasjøen, basert på verdien createdOn, som er datoen og klokkeslettet da posten ble opprettet, finnes det to forskjellige innstillinger å velge mellom. De er Direkte oppdatering og Kun tillegg.
Standardinnstillingen (for tabeller der createdOn er tilgjengelig) er å gjøre en oppdatering eller upsert (oppdatering eller innsetting) av de trinnvise dataene i målet. Hvis endringen er ny og en korresponderende rad ikke finnes i sjøen, skannes målfilene i tilfelle oppretting, og endringene settes inn i den tilsvarende filpartisjonen i sjøen. Hvis endringen er en oppdatering og det finnes en rad i sjøen, oppdateres den tilsvarende filen i sjøen i stedet for å settes inn, med de trinnvise dataene. Med andre ord er standardinnstillingen for alle CUD-endringer (opprette, oppdatere, slette) i Dataverse-tabeller, der createdOn er tilgjengelig, å gjøre en in-place-oppdatering i målet, det vil si i Azure-datasjøen.
Du kan endre standardfunksjonaliteten for en oppdatering på stedet ved å bruke en valgfri innstilling som kalles Bare tilføy. I stedet for en Oppdatering på stedet, tilføyes trinnvise data i modusen Bare tilføy fra Dataverse tabeller i den tilsvarende filpartisjonen i sjøen. Dette er en innstilling per tabell og er tilgjengelig som en avmerkingsboks under Avansert>Vis avanserte konfigurasjonstillinger. For Dataverse tabeller der Bare tilføy er aktivert, legges alle CUD-endringene trinnvis til i de tilsvarende målfilene i sjøen. Når du velger dette alternativet, brukes År som standard partisjonsstrategi, og når data skrives til datasjøen, partisjoneres den årlig.
Bare tilføying er også standardinnstillingen for Dataverse-tabeller som ikke har createdOn-verdi.
Denne tabellen beskriver hvordan rader håndteres i sjøen mot CUD-hendelser for hver av skrivealternativene for data.
| Hendelse | Oppdatering på stedet | Bare tilføy |
|---|---|---|
| Opprett | Raden settes inn i partisjonsfilen og er basert på createdOn verdien på raden. |
Raden legges til på slutten av partisjonsfilen og er basert på createdOn oppføringens verdi. |
| Oppdatering | Hvis raden finnes i partisjonsfilen, erstattes eller oppdateres den med oppdaterte data. Hvis den ikke finnes, blir den satt inn i filen. | Raden, sammen med den oppdaterte versjonen, legges til på slutten av partisjonsfilen. |
| Slett | Hvis raden finnes i partisjonsfilen, fjernes den fra filen. | Raden legges til på slutten av partisjonsfilen med IsDelete column = True. |
Bemerkning
Når det gjelder dataverse tabeller der Tilføy bare er aktivert, slettes ikke eller fjernes ikke raden i innsjøen hvis du sletter en rad i kilden. I stedet føyes den slettede raden til som en ny rad i sjøen, og kolonnen isDeleted settes til Sann.
Uren lesing (ALLOW_INCONSISTENT_READS) for serverløs er aktivert for modus for bare tilføying.
ALLOW_INCONSISTENT_READS betyr at brukeren kan lese filene som kan endres kontinuerlig mens SELECT-spørringen kjører. Resultatene er konsekvente og tilsvarer å lese et øyeblikksbilde av filen. (Det tilsvarer ikke isolering av øyeblikksbilder av databaser på grunn av den forskjellige tiden for generering av øyeblikksbilder.)
Ikke alle CUD-endringer lagres bare i tilføying: Synapsekoblingen behandler endringer i data i grupper eller «grupper» før de publiseres til datasjøen. Hvis brukeren gjør endringer innen et kort tidsintervall, blir ikke alle CUD-endringer registrert i datasjøen.
Her er noen flere detaljer om når du kan bruke et av alternativene.
På stedet oppdateres (eldre): Dette alternativet er standardinnstillingen og anbefales bare hvis du vil koble direkte til dataene i sjøen og trenger gjeldende tilstand (ikke logg eller trinnvise endringer). Filen inneholder det fullstendige datasettet og kan brukes via Power BI eller ved å kopiere hele datasettet for ETL-datasamlebånd (Trekk ut, Overfør, Last inn).
Viktig!
På stedet er oppdatering en eldre modus og skaleres ikke godt med store datavolumer eller når endringene er hyppige. Hvis tabellen har en stor mengde data eller opplever en høy forekomst av opprettinger, oppdateringer eller slettinger, kan du bare bruke Tilføy i stedet for å sikre pålitelig og utførlig dataeksport.
Bare tilføy: Velg dette alternativet hvis du ikke kobler deg direkte til data i sjøen og vil trinnvis kopiere data til et annet mål ved hjelp av ETL-pipeliner. Med dette alternativet finner du en logg over endringer for å aktivere scenarier for AI og ML. Dette er det anbefalte alternativet for tabeller med store datavolumer eller hyppige dataendringer.
Du kan veksle mellom Vis avanserte konfigurasjonsinnstillinger under Advanced i Azure Synapse Link for Dataverse for å tilpasse strategien for datapartisjonen og velge alternativer for å skrive til Azure datasjøen.
Datapartisjonering
Når du skriver dataverse tabelldata til Azure Data Lake Storage ved hjelp av Azure Synapse Link, partisjoneres tabellene i innsjøen basert på createdOn verdien på hver rad i kilden. Standard partisjonsstrategi er etter måned, så data partisjoneres i Azure Data Lake på månedlig basis.
Basert på Dataverse-tabellvolumet og datadistribusjonen kan du velge å partisjonere dataene dine etter år. Med dette alternativet, når dataverse tabelldata skrives til Azure-datasjøen, partisjoneres den årlig basert på createdOn verdien på hver rad i kilden. For tabeller uten createdOn-kolonnen blir dataradene partisjonert i en ny fil hver 5000000 poster. Dette er en innstilling per tabell og er tilgjengelig som en avmerkingsboks under Avansert>Vis avanserte konfigurasjonstillinger.
Her er eksempler på hvordan data kan håndteres i sjøen med en årlig eller månedlig partisjonsstrategi.