Veelgestelde vragen over SQL Server-connector

Op deze pagina vindt u antwoorden op veelgestelde vragen over de SQL Server-connector in Databricks Lakeflow Connect.

Algemene veelgestelde vragen over beheerde connectors

De antwoorden in veelgestelde vragen over beheerde connectors zijn van toepassing op alle beheerde connectors in Lakeflow Connect. Lees verder voor veelgestelde vragen over connectors.

Als de pijplijn mislukt, wordt de opname hervat zonder gegevensverlies?

Ja. Databricks houdt bij wat de connector heeft geëxtraheerd uit de bron en toegepast op de bestemming. Als er iets gebeurt, kan Databricks op dat moment worden hervat zolang de logboeken op de brondatabase blijven staan. Dit kan worden beïnvloedt als de pijplijn niet wordt uitgevoerd voordat de logboekbewaarperiode afloopt en de logboeken verwijdert, waardoor een volledige vernieuwing van de doeltabellen nodig is.

Legt de connector tijdzones vast voor datum- en tijdkolommen?

Nee. Datum en tijd worden geïntegreerd in de UTC-indeling.

Kan ik het tijdschema van de ingangspoort aanpassen?

De opnamegateway moet in de continue modus draaien om te voorkomen dat wijzigingen worden verwijderd vanwege logboekretentie. Als er wijzigingen zijn verwijderd, is een volledige vernieuwing vereist voor alle tabellen.

Hoe verwerkt de connector een tabel zonder primaire sleutel?

De connector behandelt alle kolommen behalve grote objecten als een gebundelde primaire sleutel. Als er dubbele rijen in de brontabel staan, worden deze rijen opgenomen als één rij in de doeltabel.

Hoe vaak kan ik de opnamepijplijn laten draaien?

Er is geen limiet voor hoe vaak de opnamepijplijn kan worden gepland om te worden uitgevoerd. Databricks raadt echter ten minste vijf minuten tussen intervallen aan, omdat het enige tijd duurt voordat de serverloze berekening is opgestart. Databricks biedt geen ondersteuning voor het uitvoeren van de opnamepijplijn in continue modus.

Waarom zie ik niet alle rijen uit mijn database in de eerste pijplijnuitvoering?

De opnamegateway extraheert historische en CDC-gegevens zodra deze worden uitgevoerd. De verwerkingspijplijn kan worden uitgevoerd voordat al deze gegevens zijn geëxtraheerd, wat resulteert in een gedeeltelijke invoer van gegevens in doeltabellen. Het kan enkele executies van de opnamepijplijn duren voordat alle gegevens zijn geëxtraheerd en toegepast op de beoogde tabellen.

Mijn ingestion-gateway heeft lang nodig om op te starten. Hoe kan ik dit oplossen?

Gateways worden uitgevoerd op klassiek rekenproces en richten een virtuele machine (VM) in bij elke start. Als het opstarten langer duurt dan een paar minuten, kunt u het volgende overwegen:

  • Schakel over naar het huidige pijplijnkanaal. Dit is de meest voorkomende oplossing. Preview-kanaalversies hebben langere opstarttijden. U kunt dit wijzigen in de gebruikersinterface (in de geavanceerde instellingen van de pijplijn onder Kanaal), bundelresourcebestand of pijplijnspecificatie.
  • Start de gateway niet opnieuw op tussen opnameuitvoeringen. De gateway is ontworpen om continu te draaien. Het stoppen en opnieuw opstarten herconfigureert de virtuele machine bij elke herstart, met als risico dat wijzigingslogboeken ontbreken als de bron ze inkort terwijl de gateway offline is.

Als de gateway 15 minuten of langer in een startstatus blijft hangen, maakt u een supportticket aan.

Dit geldt alleen voor gateways. Opnamepijplijnen worden uitgevoerd op serverloze berekeningen en starten snel.

Kan ik opnemen vanuit een leesreplica of een secundair exemplaar?

Nee. Ondersteuning is beperkt tot primaire SQL Server-exemplaren. Dit komt doordat het bijhouden en vastleggen van wijzigingsgegevens niet worden ondersteund op leesreplica's of secundaire instanties.