Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Use la tarea Python script para ejecutar un archivo Python.
Configuración de una tarea de script de Python
Antes de comenzar, debe cargar el script de Python en una ubicación accesible para el usuario que configura el trabajo. Databricks recomienda usar archivos de área de trabajo para scripts de Python. Consulte ¿Qué son los archivos del área de trabajo?
Note
La interfaz de usuario de trabajos muestra opciones dinámicamente basadas en otras opciones configuradas.
Databricks recomienda no almacenar código ni datos usando la raíz de DBFS o montajes. En su lugar, puede migrar scripts de Python a archivos o volúmenes del área de trabajo o usar URIs para acceder al almacenamiento de objetos en la nube.
Para iniciar el flujo de configuración de una tarea de Python script:
- Vaya a la pestaña Tareas de la interfaz de usuario de trabajos.
- Haga clic en Agregar tarea.
- Escriba un nombre en el campo Nombre de tarea.
- En el menú desplegable Type, seleccione
Python script.
Configuración del origen
En el menú desplegable Source, seleccione una ubicación para el script de Python mediante una de las siguientes opciones.
Workspace
Use Workspace para configurar un script de Python almacenado mediante archivos del área de trabajo.
- Haga clic en el campo Ruta de acceso. Aparece el cuadro de diálogo Seleccionar Archivo de Python.
- Vaya al script de Python, haga clic para resaltar el archivo y haga clic en Confirm.
Note
Puede usar esta opción para configurar una tarea en un script de Python almacenado en una carpeta de Git de Databricks. Databricks recomienda utilizar la opción proveedor de Git y un repositorio de Git remoto para versionar activos programados con trabajos.
DBFS/ADLS
Use DBFS/ADLS para configurar un script de Python almacenado en un volumen, una ubicación de almacenamiento de objetos en la nube o la raíz de DBFS.
Databricks recomienda almacenar scripts de Python en volúmenes de Unity Catalog o en almacenamiento de objetos en la nube.
En el campo Path, escriba el URI en el script de Python. Por ejemplo, dbfs:/path/to/script.py o abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py.
Proveedor de Git
Use Git provider para configurar un script de Python almacenado en un repositorio de Git remoto.
Las opciones mostradas por la interfaz de usuario dependen de si ya ha configurado o no un proveedor de Git en otro lugar. Solo se puede usar un repositorio Git remoto para todas las tareas de un trabajo. Consulte Uso de Git con trabajos de Lakeflow.
El campo Ruta de acceso aparece después de haber configurado una referencia de Git.
Escriba la ruta de acceso relativa del script de Python, por ejemplo, como etl/bronze/ingest.py.
Important
Al escribir la ruta de acceso relativa, no comience con / ni ./. Por ejemplo, si la ruta de acceso absoluta del código de Python al que desea acceder es /etl/bronze/ingest.py, escriba etl/bronze/ingest.py en el campo Path.
Configuración de las bibliotecas de cómputo y sus dependencias
- Use Compute para seleccionar o configurar un clúster que admita la lógica en el script.
- Si utiliza
Serverlesspara computación, use el campo Entorno y bibliotecas para seleccionar, editar o agregar un nuevo entorno. Consulte Configuración del entorno sin servidor. - Para todas las demás configuraciones de proceso, haga clic en + Agregar en Bibliotecas dependientes. Aparece el cuadro de diálogo Agregar biblioteca dependiente.
- Puede seleccionar una biblioteca existente o cargar una biblioteca nueva.
- Solo puede usar bibliotecas almacenadas en una ubicación compatible con las configuraciones de proceso. Consulte soporte de biblioteca de Python.
- Cada origen de biblioteca tiene un flujo diferente para seleccionar o cargar una biblioteca. Consulte Instalación de bibliotecas.
Finaliza la configuración del trabajo
- (Opcional) Configure Parameters como una lista de cadenas pasadas como argumentos de la CLI al script de Python. Consulte Configure task parameters (Configuración de parámetros de tarea).
- Haga clic en Guardar tarea.