Risolvere i problemi di inserimento di Confluence

Questa pagina descrive i problemi comuni relativi al connettore Confluence in Databricks Lakeflow Connect e come risolverli.

Risoluzione dei problemi generali di pipeline

Se durante l'esecuzione di una pipeline si verifica un errore, fare clic sul passaggio che ha avuto esito negativo e verificare se il messaggio di errore fornisce informazioni sufficienti sulla natura dell'errore.

Visualizzare i log eventi della pipeline nell'interfaccia utente

È anche possibile controllare e scaricare i log del cluster dalla pagina dei dettagli della pipeline facendo clic su Aggiorna dettagli nel pannello di destra e quindi su Log. Analizzare i log per individuare errori o eccezioni.

Visualizzare i dettagli dell'aggiornamento della pipeline nell'interfaccia utente

Errori di autenticazione

Errore:

The user does not have access to the specified site 'https://your-domain.atlassian.net' with the given token, or the URL is incorrect. Please verify the URL and the OAuth token's permissions.

Risoluzione:

  1. Controllare gli ambiti OAuth concessi nell'app OAuth.
  2. Verificare che l'URL dell'istanza di Confluence sia corretto e includa il dominio completo , ad esempio https://your-domain.atlassian.net.

Errori di limitazione della frequenza

Errore:

Confluence API rate limit exceeded.

Risoluzione:

  1. Il connettore Confluence esegue automaticamente nuovi tentativi con backoff esponenziale quando vengono rilevati limiti di velocità.
  2. Se gli errori relativi al limite di frequenza vengono mantenuti, valutare la possibilità di pianificare le esecuzioni della pipeline durante le ore di minore attività.
  3. Per le istanze di Confluence di grandi dimensioni, potrebbe essere necessario aumentare il tempo tra le esecuzioni della pipeline.
  4. Se è necessario aumentare i limiti di frequenza delle API, contattare il supporto di Atlassian.## Non sono stati trovati errori

Pagine mancanti o dati incompleti

Problema: alcune pagine non vengono visualizzate nei dati inseriti o i dati vengono visualizzati incompleti.

Risoluzione:

  1. Verificare che le pagine esistano nello spazio Difluence di origine e che non siano archiviate. Le pagine archiviate non sono supportate.
  2. Verificare che le pagine non siano in uno stato bozza. Vengono inserite solo le pagine pubblicate.
  3. Verificare che l'account utente abbia diritti di lettura su tutte le pagine nello spazio.
  4. Controllare i registri eventi della pipeline per eventuali avvisi o errori correlati a pagine specifiche.

Prestazioni lente di ingestion

Problema:

Le esecuzioni della pipeline richiedono più tempo di quanto previsto.

Risoluzione:

  1. Le esecuzioni iniziali della pipeline (snapshot completi) richiedono in genere più tempo rispetto alle esecuzioni incrementali.
  2. Le pagine di grandi dimensioni con contenuto esteso o molti allegati potrebbero rallentare l'inserimento.
  3. Controllare se si stanno raggiungendo i limiti di frequenza dell'API Confluence esaminando i log della pipeline.
  4. Se i problemi di prestazioni persistono, creare un ticket di supporto.

Scadenza del token di aggiornamento

Problema:

La pipeline funzionava, ma ha improvvisamente iniziato a fallire con errori di autenticazione.

Risoluzione:

  1. Controllare gli ambiti OAuth concessi nell'app OAuth.
  2. Aggiornare la connessione.
  3. Riprova la pipeline.

Selezione di colonne tramite bundle di automazione dichiarativa

Problema:

Non è possibile usare la funzionalità di selezione delle colonne quando si crea una pipeline di inserimento gestita usando bundle di automazione dichiarativi.

Risoluzione:

Verifica la versione dell'interfaccia della riga di comando di Databricks. Se la versione è inferiore alla versione 0.251.0, reinstallare l'interfaccia della riga di comando.

Serve ulteriore assistenza?

Se si verifica un problema non trattato in questa guida alla risoluzione dei problemi, creare un ticket di supporto.