Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este artigo tem como objetivo fornecer diretrizes claras e opinativas para o agendamento de trabalhos de produção. O uso de melhores práticas pode ajudar a reduzir os custos, aprimorar o desempenho e reforçar a segurança.
| Melhor Prática | Impacto | Documentos |
|---|---|---|
| Usar computação sem servidor para trabalhos | Custo: trabalhos sem servidor não exigem nenhuma configuração de cluster. Azure Databricks gerencia o provisionamento e o dimensionamento automaticamente. | |
| Utilize Trabalhos do Lakeflow para orquestração sempre que possível | Cost: não é necessário usar ferramentas externas para orquestrar se você estiver orquestrando apenas cargas de trabalho no Azure Databricks. | |
| Usar entidades de serviço em vez de contas de usuário para executar trabalhos de produção | Segurança: se os trabalhos forem de propriedade de usuários individuais, quando esses usuários saírem da organização, os trabalhos poderão ter a execução interrompida. | |
| Para computação clássica: usar clusters de trabalhos para fluxos de trabalho automatizados | Custo: os clusters de trabalhos são cobrados a taxas mais baixas do que os clusters interativos. | |
| Para computação clássica: reinicie clusters que estão em execução por um longo tempo | Segurança: reinicie os clusters para aproveitar os patches e as correções de bugs no Databricks Runtime. | |
| Para computação clássica: use a versão mais recente do LTS do Databricks Runtime | Performance e custo: O Azure Databricks está constantemente aprimorando o Databricks Runtime para usabilidade, desempenho e segurança. | |
| Para computação clássica: não armazene dados de produção na raiz do DBFS | Segurança: quando os dados são armazenados na raiz do DBFS, todos os usuários podem acessá-los. |