Hantera basmiljöer för arbetsytor

Den här sidan förklarar hur du skapar och hanterar arbetsytebasmiljöer i en arbetsyta. Med basmiljöer för arbetsplatser kan arbetsplatsadministratörer skapa och hantera fördefinierade, cachelagrade miljöer för serverlösa anteckningsböcker.

Permissions

  • Endast arbetsyteadministratörer kan skapa och hantera en arbetsytas basmiljöer.
  • Alla arbetsyteanvändare har åtkomst till en arbetsytas basmiljöer.
  • Alla arbetsyteanvändare kan skapa anpassade serverlösa miljöspecifikationer.

Så här fungerar arbetsytebasmiljöer i Azure Databricks

I Azure Databricks är en basmiljö en delningsbar YAML-specifikation som definierar en serverlös miljöversion och en uppsättning ytterligare Python beroenden för serverlösa notebook-filer. Arbetsyteadministratörer skapar och hanterar basmiljöer så att användarna snabbt kan börja från en konsekvent, cachelagrad miljö och eventuellt lägga till sina egna bibliotek.

Använda arbetsytebasmiljöer

Användare kan välja en basmiljö för arbetsytan i listrutan Basmiljö på panelen Miljö . Basmiljöer för arbetsytor visas i listrutan tillsammans med andra alternativ som Standard, AI och Custom.

När du väljer en basmiljö för arbetsytan, laddas den förkonfigurerade och cachelagrade miljön in snabbt, vilket minskar starttiden för anteckningsböcker och jobb. För jobb förbättrar användning av arbetsytebasmiljöer prestanda eftersom beroendena redan har cachelagrats.

Anvisningar om hur du konfigurerar basmiljöer i en notebook-fil finns i Välj en basmiljö. Anvisningar om hur du använder hanterade basmiljöer i jobb finns i Hanterade basmiljöer i jobb.

Skapa och exportera en miljöspecifikation

Det enklaste sättet att skapa en giltig YAML-specifikation är att skapa miljön i panelen Miljö och sedan använda knappen Exportera miljö för att ladda ned YAML-filen.

  1. Öppna en notebook-miljö och anslut till serverlös datorkraft.
  2. Klicka på knappen Miljömiljöikonen i anteckningsbokens sidopanel.
  3. Under Basmiljö väljer du Standard eller Använder Mer för att välja en specifik miljöversion. Databricks rekommenderar att du använder den senaste serverlösa miljöversionen som stöds av din arbetsyta.
  4. I fältet Beroenden lägger du till de beroenden som du vill att basmiljön ska ha. Klicka på Lägg till beroende när du har angett varje beroende. Mer information om hur du lägger till beroenden finns i Lägga till beroenden i notebook-filen.
  5. Klicka på Använd längst ned på miljöpanelen för att se till att specifikationen är giltig.
  6. Klicka på menyikonen kebabmenyikonen. Klicka sedan på Exportera miljö längst ned i miljöpanelen.
  7. Ge YAML-filen ett namn och lägg till i en arbetsytemapp eller Unity Catalog-volym.

Exempel på miljöspecifikation

Följande exempel på YAML baseras på miljöspecifikationen för MLflow-projekt. Den definierar en basmiljö med några biblioteksberoenden:

environment_version: '5'
dependencies:
  - --index-url https://pypi.org/simple
  - -r "/Workspace/Shared/requirements.txt"
  - my-library==6.1
  - /Workspace/Shared/Path/To/simplejson-3.19.3-py3-none-any.whl
  - git+https://github.com/databricks/databricks-cli

Lägga till en basmiljö i din arbetsyta

Så här lägger du till miljöspecifikationen som en basmiljö på arbetsytan:

  1. Gå till Inställningar på arbetsytan.
  2. Under Arbetsyteadministratör väljer du Beräkning.
  3. Bredvid Basmiljöer för serverlös beräkning klickar du på Hantera.
  4. Klicka på Skapa ny miljö.
  5. Ge basmiljön ett namn. Det här är det namn som användarna ser i listrutan Basmiljö .
  6. Välj YAML-filen för miljöspecifikation med filväljaren. Du kan bläddra bland arbetsytefiler eller Unity Catalog-volymer.
  7. Klicka på Skapa.

Basmiljön börjar byggas. Kontrollera kolumnen Status i listan över basmiljöer. Den ändras till Redo att användas när den är klar.

Skapa för serverlös GPU-beräkning (AI Runtime)

Viktigt!

Den här funktionen finns i Beta. Arbetsyteadministratörer kan styra åtkomsten till den här funktionen från sidan Förhandsversioner . Se Hantera Azure Databricks förhandsversioner.

När du skapar en basmiljö kan du aktivera kryssrutan Skapa för serverlös GPU Compute för att aktivera miljön för GPU-arbetsbelastningar. Detta skapar en GPU-kompatibel version av basmiljön som visas på fliken GPU .

Hanteringssidan för basmiljöer har två flikar:

  • CPU: Visar en lista över basmiljöer för serverlös beräkning (icke-GPU-arbetsbelastningar).
  • GPU: Visar en lista över basmiljöer för AI Runtime. Den här fliken visar även AI-miljörader som motsvarar AI-basmiljöer. Mer information finns i Databricks AI-miljö.

Standard Latest avser den senaste stabila standardversion av basmiljön som tillhandahålls av Databricks.

Anmärkning

Användningsposter som är associerade med att skapa och uppdatera basmiljöer har kolumnen inställd på billing_origin_productBASE_ENVIRONMENTS. Dessutom fylls det specifika basmiljö-ID:t i usage_metadata.base_environment_id kolumnen.

Ange arbetsytans standardbasmiljö

Som standardinställning använder serverlösa anteckningsböcker i en arbetsyta ingen basmiljö. Arbetsyteadministratörer kan välja en basmiljö som ska tillämpas på alla nya notebook-filer som standard.

  1. Gå till Inställningar på arbetsytan.
  2. Under Arbetsyteadministratör väljer du Beräkning.
  3. Bredvid Basmiljöer för serverlös beräkning klickar du på Hantera.
  4. Klicka på stjärnikonen bredvid basmiljön för att ange den som standard.

Alla nya serverlösa notebooks kommer nu att använda den valda basmiljön som standard.

Uppdatera en basmiljö

Du kanske vill redigera basmiljöfilen för att uppdatera versionsnummer eller lägga till eller ta bort beroenden. Om du vill ändra miljöversionen eller beroendena redigerar du YAML-källfilen direkt.

I listan över basmiljöer klickar du på YAML-filsökvägen för den basmiljö som du vill uppdatera. Då öppnas filen på en ny flik. Du kan granska eller uppdatera filinnehållet där. Ändringar sparas automatiskt.

När du har uppdaterat YAML-specifikationen måste du uppdatera basmiljön så att notebook-filer och jobb hämtar den senaste konfigurationen.

  1. Bredvid den basmiljö som du vill uppdatera, klicka på menyikonen för kebabmenyn och välj sedan "Uppdatera".
  2. Klicka på Bekräfta.

Nya sessioner använder nu den uppdaterade basmiljön. Befintliga notebook-sessioner måste startas om för att hämta uppdateringarna.

Begränsningar

Basmiljöer har följande begränsningar:

  • Basmiljöer i jobb stöds endast för notebook-, Python-skript- och Python-wheel-aktivitetstyper. Andra aktivitetstyper stöds inte. Stöd för arbetsytebasmiljöer i jobb finns i Beta.
  • Lakeflow Spark deklarativa pipelines stöder inte grundmiljöer.
  • Endast Python beroenden under beroendelistan installeras vid körning.
  • Serverlös miljö version 1 stöds inte. Använd version 2 eller senare.
  • Basmiljöer är tillgängliga för alla arbetsyteanvändare.
  • Arbetsytor är begränsade till 10 basmiljöer.