Compartilhar via


Guia rápido para agendamento de trabalhos de produção

Este artigo tem como objetivo fornecer diretrizes claras e opinativas para o agendamento de trabalhos de produção. O uso de melhores práticas pode ajudar a reduzir os custos, aprimorar o desempenho e reforçar a segurança.

Melhor Prática Impacto Documentos
Usar computação sem servidor para trabalhos Custo: trabalhos sem servidor não exigem nenhuma configuração de cluster. Azure Databricks gerencia o provisionamento e o dimensionamento automaticamente.
Utilize Trabalhos do Lakeflow para orquestração sempre que possível Cost: não é necessário usar ferramentas externas para orquestrar se você estiver orquestrando apenas cargas de trabalho no Azure Databricks.
Usar entidades de serviço em vez de contas de usuário para executar trabalhos de produção Segurança: se os trabalhos forem de propriedade de usuários individuais, quando esses usuários saírem da organização, os trabalhos poderão ter a execução interrompida.
Para computação clássica: usar clusters de trabalhos para fluxos de trabalho automatizados Custo: os clusters de trabalhos são cobrados a taxas mais baixas do que os clusters interativos.
Para computação clássica: reinicie clusters que estão em execução por um longo tempo Segurança: reinicie os clusters para aproveitar os patches e as correções de bugs no Databricks Runtime.
Para computação clássica: use a versão mais recente do LTS do Databricks Runtime Performance e custo: O Azure Databricks está constantemente aprimorando o Databricks Runtime para usabilidade, desempenho e segurança.
Para computação clássica: não armazene dados de produção na raiz do DBFS Segurança: quando os dados são armazenados na raiz do DBFS, todos os usuários podem acessá-los.