Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este artigo tem como objetivo fornecer diretrizes claras e opinativas para a criação de recursos computacionais. Usando os tipos de computação corretos para seu fluxo de trabalho, você pode melhorar o desempenho e economizar em custos.
| Melhor Prática | Impacto | Documentos |
|---|---|---|
| Usar a computação sem servidor para a maioria das cargas de trabalho | Azure Databricks gerencia o dimensionamento, a escalabilidade e a infraestrutura automaticamente. Nenhuma configuração de cluster é necessária. | |
| Para computação clássica: use o modo de acesso padrão, a menos que a funcionalidade necessária não tenha suporte | A computação com o modo de acesso padrão pode ser usada por vários usuários com isolamento de dados entre os usuários. | |
| Para computação clássica: comece usando tipos gerais de instância de todas as finalidades se você for novo em Azure Databricks | Selecionar o tipo de instância apropriado para a carga de trabalho resulta em maior eficiência. | |
| Para computação clássica: use os tipos de instância de última geração se houver disponibilidade suficiente | A última geração de tipos de instância fornece o melhor desempenho e os recursos mais recentes. | |
| Para computação clássica: defina seu equilíbrio entre instâncias sob demanda e spot com base na urgência de execução da sua carga de trabalho. | As instâncias spot oferecem economia de custo, mas podem afetar o tempo de execução geral de uma operação se as instâncias spot forem retomadas. | |
| Para computação clássica: escolha o tamanho de seus nós e o número de trabalhadores com base nos tipos de operações que seu processamento de carga executa. | Por exemplo, se você espera muitos embaralhamentos, pode ser mais eficiente usar um nó único grande em vez de vários nós menores. | |
| Para computação clássica: execute o VACUUM em um cluster com autoescalonamento configurado para 1 a 4 workers, em que cada worker tem 8 núcleos. Selecione um driver com entre 8 e 32 núcleos. Aumente o tamanho do driver se ocorrerem erros de falta de memória (OOM). |
As instruções de vácuo ocorrem em duas fases, e a segunda é pesada para o driver. Se você não usar o cluster de tamanho certo, a operação poderá causar uma desaceleração e talvez não tenha êxito. |
|
| Para computação clássica: avaliar se o fluxo de trabalho em lote se beneficiaria do Photon | O Photon fornece consultas mais rápidas e reduz o custo total por carga de trabalho. |