Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Den här artikeln syftar till att ge tydlig och åsiktsorienterad vägledning för att skapa beräkning. Genom att använda rätt beräkningstyper för arbetsflödet kan du förbättra prestanda och spara på kostnaderna.
| Metodtips | Påverkan | Dokument |
|---|---|---|
| Använda serverlös beräkning för de flesta arbetsbelastningar | Azure Databricks hanterar storlek, skalning och infrastruktur automatiskt. Ingen klusterkonfiguration krävs. | |
| För klassisk beräkning: använd standardåtkomstläge om inte nödvändiga funktioner inte stöds | Beräkning med standardåtkomstläge kan användas av flera användare med dataisolering mellan användare. | |
| För klassisk beräkning: börja med att använda allmänna all-purpose-instanstyper om du är ny på Azure Databricks | Om du väljer lämplig instanstyp för arbetsbelastningen blir effektiviteten högre. | |
| För klassisk beräkning: Använd den senaste generationens instanstyper om det finns tillräckligt med tillgänglighet | Den senaste generationen av instanstyper ger bästa prestanda och de senaste funktionerna. | |
| För klassisk beräkning: ställ in balansen mellan on-demand och spot-instans baserat på hur snabbt du behöver köra din arbetsbelastning. | Spot-instanser sparar på kostnader men kan påverka den totala körtiden för en åtgärd om spot-instanserna återtas. | |
| För klassisk beräkning: välj storleken på dina noder och antalet arbetare baserat på de typer av åtgärder som din arbetsbelastning utför | Om du till exempel förväntar dig många blandningar kan det vara mer effektivt att använda en stor enskild nod i stället för flera mindre noder. | |
| För klassisk beräkning: kör vakuum på ett kluster med automatisk skalningsuppsättning för 1–4 arbetare, där varje arbetare har 8 kärnor. Välj en drivrutin med mellan 8 och 32 kärnor. Öka storleken på drivrutinen om du får minnesbrist (OOM-fel). |
Vakuumpåståenden sker i två faser, varav den andra fasen är starkt beroende av förare. Om du inte använder ett kluster av rätt storlek kan åtgärden leda till en avmattning och kanske inte lyckas. | |
| För klassisk beräkning: utvärdera om batcharbetsflödet skulle dra nytta av Photon | Photon ger snabbare frågor och minskar din totala kostnad per arbetsbelastning. |