Compartilhar via


Guia Rápido para Criação de Computação

Este artigo tem como objetivo fornecer diretrizes claras e opinativas para a criação de recursos computacionais. Usando os tipos de computação corretos para seu fluxo de trabalho, você pode melhorar o desempenho e economizar em custos.

Melhor Prática Impacto Documentos
Usar a computação sem servidor para a maioria das cargas de trabalho Azure Databricks gerencia o dimensionamento, a escalabilidade e a infraestrutura automaticamente. Nenhuma configuração de cluster é necessária.
Para computação clássica: use o modo de acesso padrão, a menos que a funcionalidade necessária não tenha suporte A computação com o modo de acesso padrão pode ser usada por vários usuários com isolamento de dados entre os usuários.
Para computação clássica: comece usando tipos gerais de instância de todas as finalidades se você for novo em Azure Databricks Selecionar o tipo de instância apropriado para a carga de trabalho resulta em maior eficiência.
Para computação clássica: use os tipos de instância de última geração se houver disponibilidade suficiente A última geração de tipos de instância fornece o melhor desempenho e os recursos mais recentes.
Para computação clássica: defina seu equilíbrio entre instâncias sob demanda e spot com base na urgência de execução da sua carga de trabalho. As instâncias spot oferecem economia de custo, mas podem afetar o tempo de execução geral de uma operação se as instâncias spot forem retomadas.
Para computação clássica: escolha o tamanho de seus nós e o número de trabalhadores com base nos tipos de operações que seu processamento de carga executa. Por exemplo, se você espera muitos embaralhamentos, pode ser mais eficiente usar um nó único grande em vez de vários nós menores.
Para computação clássica: execute o VACUUM em um cluster com autoescalonamento configurado para 1 a 4 workers, em que cada worker tem 8 núcleos.
Selecione um driver com entre 8 e 32 núcleos. Aumente o tamanho do driver se ocorrerem erros de falta de memória (OOM).
As instruções de vácuo ocorrem em duas fases, e a segunda é pesada para o driver. Se você não usar o cluster de tamanho certo, a operação poderá causar uma desaceleração e talvez não tenha êxito.
Para computação clássica: avaliar se o fluxo de trabalho em lote se beneficiaria do Photon O Photon fornece consultas mais rápidas e reduz o custo total por carga de trabalho.