Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Este artigo tem como objetivo fornecer orientações claras e opinativas para a criação de computação. Usando os tipos de computação certos para seu fluxo de trabalho, você pode melhorar o desempenho e economizar custos.
| Best Practice (Melhores Práticas) | Impacto | Documentos |
|---|---|---|
| Use computação serverless para a maioria das cargas de trabalho | O Azure Databricks gere automaticamente o dimensionamento, a escalabilidade e a infraestrutura. Não é necessária configuração de cluster. | |
| Para computação clássica: use o modo de acesso padrão, a menos que a funcionalidade necessária não seja suportada | A computação com modo de acesso padrão pode ser usada por vários usuários com isolamento de dados entre os usuários. | |
| Para computação clássica: comece por usar tipos de instâncias gerais e multiusos se for novo no Azure Databricks | A seleção do tipo de instância apropriado para a carga de trabalho resulta em maior eficiência. | |
| Para computação clássica: use os tipos de instância da geração mais recente se houver disponibilidade suficiente | A última geração de tipos de instância oferece o melhor desempenho e os recursos mais recentes. | |
| Para computação clássica: define o equilíbrio on-demand e instância spot com base na rapidez com que precisas que a tua carga de trabalho seja executada | As instâncias spot economizam custos, mas podem afetar o tempo de execução geral de uma operação se as instâncias spot forem recuperadas. | |
| Para a computação clássica: escolha o tamanho dos seus nós e o número de trabalhadores com base nos tipos de operações que a sua carga de trabalho realiza | Por exemplo, se se esperam muitas trocas, pode ser mais eficiente usar um único nó grande em vez de vários nós menores. | |
| Para computação clássica: executar o comando VACUUM num cluster com escalonamento automático definido para 1-4 processos, onde cada processo tem 8 núcleos. Selecione um driver com entre 8 e 32 núcleos. Aumente o tamanho do driver se você receber erros de falta de memória (OOM). |
As declarações de vácuo acontecem em duas fases, a segunda das quais é pesada. Se você não usar o cluster de tamanho correto, a operação pode causar uma lentidão e pode não ter êxito. | |
| Para computação clássica: avalie se o seu fluxo de trabalho em lote beneficiaria do Photon | O Photon fornece consultas mais rápidas e reduz o custo total por carga de trabalho. |