Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
En Python-hjulfil är ett standard sätt att paketera och distribuera de filer som krävs för att köra ett Python-program. Med hjälp av Python-hjuluppgiften kan du säkerställa snabb och tillförlitlig installation av Python-kod i dina jobb. Den här artikeln innehåller ett exempel på hur du skapar en Python-hjulfil och ett jobb som kör programmet som paketeras i Python-hjulfilen. I det här exemplet kommer du att:
- Skapa Python-filerna som definierar ett exempelprogram.
- Paketera exempelfilerna i en Python-hjulfil.
- Skapa ett jobb för att köra Python-hjulfilen.
- Kör uppgiften och visa resultaten.
Innan du börjar
Du behöver följande för att slutföra det här exemplet:
Python3
Python
wheelochsetuptoolpaket. Du kan användapipför att installera dessa paket. Du kan till exempel köra följande kommando för att installera dessa paket:pip install wheel setuptools
Steg 1: Skapa en lokal katalog för exemplet
Skapa en lokal katalog för att lagra exempelkoden och genererade artefakter, till exempel databricks_wheel_test.
Steg 2: Skapa python-exempelskriptet
Följande Python-exempel är ett enkelt skript som läser indataargument och skriver ut argumenten. Kopiera det här skriptet och spara det till en sökväg som heter my_test_code/__main__.py i katalogen som du skapade i föregående steg.
"""
The entry point of the Python Wheel
"""
import sys
def main():
# This method will print the provided arguments
print('Hello from my func')
print('Got arguments:')
print(sys.argv)
if __name__ == '__main__':
main()
Steg 3: Skapa en metadatafil för paketet
Följande fil innehåller metadata som beskriver paketet. Spara detta i en sökväg som heter my_test_code/__init__.py i katalogen som du skapade i steg 1.
__version__ = "0.0.1"
__author__ = "Databricks"
Steg 4: Skapa Python-hjulfilen
Om du konverterar Python-artefakterna till en Python-hjulfil måste du ange paketmetadata, till exempel paketnamnet och startpunkterna. Följande skript definierar dessa metadata.
Anteckning
Den entry_points som definieras i det här skriptet används för att köra paketet i Azure Databricks-arbetsflödet. I varje värde i entry_pointsär värdet före = (i det här exemplet run) namnet på startpunkten och används för att konfigurera Python-hjulaktiviteten.
Spara skriptet i en fil med namnet
setup.pyi roten för katalogen som du skapade i steg 1:from setuptools import setup, find_packages import my_test_code setup( name='my_test_package', version=my_test_code.__version__, author=my_test_code.__author__, url='https://databricks.com', author_email='john.doe@databricks.com', description='my test wheel', packages=find_packages(include=['my_test_code']), entry_points={ 'group_1': 'run=my_test_code.__main__:main' }, install_requires=[ 'setuptools' ] )Ändra till den katalog som du skapade i steg 1 och kör följande kommando för att paketera koden i Python-hjuldistributionen:
python3 setup.py bdist_wheel
Det här kommandot skapar Python-hjulfilen och sparar den dist/my_test_package-0.0.1-py3.none-any.whl i filen i katalogen.
Steg 5. Skapa ett jobb för att köra Python-hjulfilen
På arbetsytan klickar du på
Jobb och pipelines i sidofältet.
Klicka Skapa, sedan Jobb.
Klicka på Python-hjulpanelen för att konfigurera den första uppgiften. Om Python-hjulpanelen inte är tillgänglig klickar du på Lägg till en annan aktivitetstyp och söker efter Python-hjul.
Du kan också ersätta namnet på jobbet, som standard är
New Job <date-time>, med jobbets namn.I Uppgiftsnamn anger du ett namn för aktiviteten.
Om det behövs väljer du Python-hjulet i listrutan Typ .
I Paketnamn anger du
my_test_package. Värdet Paketnamn är namnet på Python-paketet som ska importeras. I det här exemplet är paketnamnet det värde som tilldelats parameternnameisetup.py.Ange Startpunkt
run. Startpunkten är ett av de värden som anges i samlingenentry_pointsisetup.py-skriptet. I det här exempletrunär den enda startpunkten definierad.I Computeväljer du ett befintligt jobbkluster eller Lägg till nytt jobbkluster.
Ange din Python-hjulfil:
- I listrutan Miljö och bibliotek klickar du på
Bredvid Standard redigerar du den. Du kan också klicka på Lägg till ny miljö för att konfigurera en ny miljö.
- I dialogrutan Konfigurera miljö klickar du på Lägg till beroende.
- Klicka på
mappikonen för att öppna filwebbläsaren. Dra och släpp den hjulfil som du skapade i steg 4 i dialogrutan Välj ett beroende . - Klicka på Bekräfta.
- I listrutan Miljö och bibliotek klickar du på
I Parametrarväljer du Positionella argument eller Nyckelordsargument för att ange nyckeln och värdet för varje parameter. Både positions- och nyckelordsargument skickas till Python-hjulaktiviteten som kommandoradsargument.
- Ange positionella argument genom att ange parametrar som en JSON-formaterad matris med strängar, till exempel:
["first argument","first value","second argument","second value"]. - Om du vill ange nyckelordsargument klickar du på + Lägg till och anger en nyckel och ett värde. Klicka på + Lägg till igen för att ange fler argument.
- Ange positionella argument genom att ange parametrar som en JSON-formaterad matris med strängar, till exempel:
Klicka på Skapa uppgift.
Steg 6: Kör jobbet och visa jobbkörningsinformationen
Klicka
för att köra arbetsflödet. Om du vill visa information om körningen klickar du på fliken Körningar och klickar sedan på länken i kolumnen Starttid för körningen i jobbkörningsvyn .
När körningen slutförs visas utdata i panelen Utdata, inklusive argumenten som skickats till uppgiften.
Nästa steg
Mer information om hur du skapar och kör jobb finns i Lakeflow-jobb.