Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Per migliorare le prestazioni e l'affidabilità, Dataflow Gen2 usa gli elementi di gestione temporanea per archiviare i dati intermedi durante la trasformazione dei dati. Questo articolo fornisce informazioni sugli elementi di gestione temporanea e su come gestire i dati al loro interno.
Che cosa sono gli elementi di staging?
Gli elementi di staging sono percorsi di archiviazione dati intermedi usati da Dataflow Gen2 per archiviare i dati durante la trasformazione dei dati. Questi elementi sono noti come "DataflowsStagingLakehouse" e "DataflowsStagingWarehouse". Gli elementi di staging vengono usati per archiviare i dati intermedi durante la trasformazione dei dati per migliorare le prestazioni. Questi elementi vengono creati automaticamente quando si crea il primo flusso di dati e vengono gestiti da Dataflow Gen2. Questi elementi sono nascosti dall'utente nell'area di lavoro, ma potrebbero essere visibili in altre esperienze, ad esempio Recupera dati o Esplora lakehouse. È consigliabile non accedere o modificare direttamente i dati negli elementi di staging perché potrebbero causare comportamenti imprevisti. Inoltre, l'archiviazione dei dati stessi negli elementi di staging non è supportata e potrebbe comportare la perdita di dati.
Dati negli elementi di staging
Gli elementi di staging non sono progettati per l'accesso diretto da parte degli utenti. Dataflow Gen2 gestisce i dati negli elementi di staging e garantisce che i dati siano in uno stato coerente. L'accesso diretto ai dati negli elementi di staging non è supportato perché non può essere garantito che i dati siano in uno stato coerente. Se è necessario accedere ai dati negli elementi di staging, è possibile usare il connettore del flusso di dati in Power BI, Excel o altri flussi di dati.
Importante
L'API interna che gestisce i dati di staging ai consumer downstream (ad esempio modelli semantici o altri flussi di dati che usano il connettore Flussi di dati) può riscontrare timeout intermittenti. Questi timeout possono causare errori di aggiornamento durante il consumo di elementi, spesso manifestandosi con l'errore "La chiave non corrisponde ad alcuna riga nella tabella". Questo errore non indica un problema di dati. Significa che il back-end non è riuscito a recuperare i risultati della fase di staging in tempo.
Soluzione alternativa consigliata: Configurare una destinazione dati (Lakehouse o Warehouse) per il flusso di dati e aggiornare gli elementi downstream per la lettura da tale destinazione direttamente tramite il connettore Lakehouse o Warehouse. In questo modo viene ignorata l'API di gestione temporanea interna e viene migliorata l'affidabilità dell'aggiornamento.
Per altre informazioni, vedere Limitazioni di Data Factory.
La rimozione dei dati dagli elementi di staging può essere forzata da una delle azioni seguenti:
- Disabilitare lo staging nel flusso di dati e aggiornarlo (dopo 30 giorni i dati vengono rimossi tramite il processo di Garbage Collection).
- Eliminare il flusso di dati (rimuove direttamente i dati).
- Eliminare l'area di lavoro (elimina direttamente StagingLakehouse e StagingWarehouse).
Implicazioni relative ai costi della gestione temporanea
Staging Lakehouse e staging Warehouse archiviano i dati intermedi come parte dell'elaborazione del flusso di dati. L'archiviazione utilizzata da questi elementi di staging viene fatturata come parte dell'archiviazione OneLake. Ciò significa che i dati archiviati negli elementi di staging vengono conteggiati per il consumo complessivo di archiviazione di OneLake e i costi associati.
Per gestire in modo efficace i costi di archiviazione:
- Monitorare l'utilizzo dell'archiviazione di staging: tenere presente che i dati di staging si accumulano con ogni aggiornamento del dataflow fino a quando non vengono recuperati automaticamente o rimossi esplicitamente.
- Disabilitare lo staging quando non è necessario: se le trasformazioni si integrano nel sistema di origine, potrebbe non essere necessario abilitare lo staging. La disabilitazione della gestione temporanea riduce il consumo di archiviazione.
- Pulire i flussi di dati inutilizzati: l'eliminazione di flussi di dati non più necessari rimuove immediatamente i dati di staging associati.
- Prendere in considerazione la frequenza di aggiornamento: gli aggiornamenti frequenti con la gestione temporanea abilitata possono causare un consumo di archiviazione più elevato. Bilanciare i vantaggi delle prestazioni rispetto ai costi di archiviazione.
Per ulteriori informazioni sui prezzi dell'archiviazione di OneLake, vedere Prezzi di Microsoft Fabric.