Partilhar via


Folha de truques de criação de computação

Este artigo tem como objetivo fornecer orientações claras e opinativas para a criação de computação. Usando os tipos de computação certos para seu fluxo de trabalho, você pode melhorar o desempenho e economizar custos.

Best Practice (Melhores Práticas) Impacto Documentos
Use computação serverless para a maioria das cargas de trabalho O Azure Databricks gere automaticamente o dimensionamento, a escalabilidade e a infraestrutura. Não é necessária configuração de cluster.
Para computação clássica: use o modo de acesso padrão, a menos que a funcionalidade necessária não seja suportada A computação com modo de acesso padrão pode ser usada por vários usuários com isolamento de dados entre os usuários.
Para computação clássica: comece por usar tipos de instâncias gerais e multiusos se for novo no Azure Databricks A seleção do tipo de instância apropriado para a carga de trabalho resulta em maior eficiência.
Para computação clássica: use os tipos de instância da geração mais recente se houver disponibilidade suficiente A última geração de tipos de instância oferece o melhor desempenho e os recursos mais recentes.
Para computação clássica: define o equilíbrio on-demand e instância spot com base na rapidez com que precisas que a tua carga de trabalho seja executada As instâncias spot economizam custos, mas podem afetar o tempo de execução geral de uma operação se as instâncias spot forem recuperadas.
Para a computação clássica: escolha o tamanho dos seus nós e o número de trabalhadores com base nos tipos de operações que a sua carga de trabalho realiza Por exemplo, se se esperam muitas trocas, pode ser mais eficiente usar um único nó grande em vez de vários nós menores.
Para computação clássica: executar o comando VACUUM num cluster com escalonamento automático definido para 1-4 processos, onde cada processo tem 8 núcleos.
Selecione um driver com entre 8 e 32 núcleos. Aumente o tamanho do driver se você receber erros de falta de memória (OOM).
As declarações de vácuo acontecem em duas fases, a segunda das quais é pesada. Se você não usar o cluster de tamanho correto, a operação pode causar uma lentidão e pode não ter êxito.
Para computação clássica: avalie se o seu fluxo de trabalho em lote beneficiaria do Photon O Photon fornece consultas mais rápidas e reduz o custo total por carga de trabalho.