Condividi tramite


Guida rapida alla schedulazione della produzione

Questo articolo mira a fornire indicazioni chiare e autorevoli per la pianificazione della produzione. L'uso delle procedure consigliate consente di ridurre i costi, migliorare le prestazioni e rafforzare la sicurezza.

Procedure consigliate Impatto Documenti
Utilizzare il calcolo serverless per le attività Costo: i processi serverless non richiedono alcuna configurazione del cluster. Azure Databricks gestisce automaticamente il provisioning e il ridimensionamento.
Usare i Lakeflow Jobs per l'orchestrazione quando possibile Cost: non è necessario usare strumenti esterni per orchestrare se si orchestrano solo carichi di lavoro in Azure Databricks.
Usare i principali di servizio anziché gli account utente per eseguire processi di produzione Sicurezza: se i processi sono di proprietà di singoli utenti, quando gli utenti lasciano l'organizzazione, questi processi potrebbero interrompere l'esecuzione.
Per il calcolo classico: usare cluster di processi per flussi di lavoro automatizzati Costo: I cluster di job vengono fatturati a tariffe inferiori rispetto ai cluster interattivi.
Per il calcolo classico: riavviare i cluster a lungo termine Sicurezza: riavviare i cluster per sfruttare le patch e le correzioni di bug in Databricks Runtime.
Per il calcolo classico: usare la versione LTS più recente di Databricks Runtime Performance e costi: Azure Databricks migliora sempre Databricks Runtime per l'usabilità, le prestazioni e la sicurezza.
Per il calcolo classico: non archiviare i dati di produzione nella radice DBFS Sicurezza: quando i dati vengono archiviati nella radice DBFS, tutti gli utenti possono accedervi.