Ingesta de datos en Lakeflow Designer

Importante

Esta característica está en versión preliminar pública.

En esta página se describen las opciones disponibles para incorporar datos a una preparación de datos visuales en el Diseñador de Lakeflow. El diseñador puede trabajar con los datos accesibles a través de Azure Databricks.

Toda la ingesta de datos en el Diseñador comienza con el operador Source . Al abrir el panel de configuración de un operador source, tiene las siguientes opciones.

Examinar tablas existentes

Haga clic en Examinar existente para abrir el selector de recursos, donde puede:

  • Examinar tablas y volúmenes en Unity Catalog.
  • Examine los archivos en el sistema de archivos del área de trabajo.

Use esta opción cuando los datos ya estén en Azure Databricks.

Arrastrar y soltar un archivo local

Arrastre un archivo CSV o Excel desde la máquina local directamente al lienzo. El diseñador carga el archivo en el sistema de archivos del área de trabajo y crea automáticamente un operador source.

Note

La función de arrastrar y colocar archivos Excel requiere que se habilite la compatibilidad con formato de archivo Excel. Consulte Leer archivos de Excel.

Creación de una tabla a partir de un archivo

Seleccione Crear tabla desde archivo en el panel de configuración de origen para cargar un archivo local de CSV o Excel y crear una tabla del Catálogo de Unity a partir de él. Use esta opción cuando desee que los datos se conserven como una tabla administrada en lugar de almacenarse como un archivo de área de trabajo. Además, para grandes cantidades de datos, esto proporciona el mejor rendimiento.

Importar desde Google Drive

Para importar un archivo desde Google Drive:

  1. En el panel Configuración de origen, seleccione Importar desde Google Drive.
  2. Seleccione una conexión de Catálogo de Unity que tenga acceso a Google Drive.
  3. Proporcione la dirección URL del archivo.

Esto requiere una conexión de Catálogo de Unity configurada para el acceso a Google Drive. Consulta Ingesta de archivos de Google Drive para obtener información sobre cómo configurar conexiones.

Importar desde SharePoint

Para importar un archivo desde SharePoint:

  1. En el panel Configuración de origen, seleccione Importar en SharePoint.
  2. Seleccione una conexión de Catálogo de Unity que tenga acceso al sitio de SharePoint.
  3. Proporcione el vínculo de archivo directo.

Warning

Para obtener la dirección URL correcta, haga clic con el botón derecho en el archivo en SharePoint, seleccione Preview y copie la dirección URL de la barra de direcciones del explorador. No use un vínculo para compartir.

Esto requiere una conexión de Unity Catalog configurada para acceso a SharePoint. Consulte Ingesta de archivos de SharePoint para obtener información sobre cómo configurar conexiones.

Uso de Lakeflow Connect para orígenes adicionales

Si un origen de datos no está disponible directamente en el Diseñador, compruebe Lakeflow Connect para un conector administrado. Lakeflow Connect admite la ingesta de aplicaciones SaaS (Salesforce, Workday, HubSpot, etc.), bases de datos, almacenamiento en la nube y orígenes de streaming. Después de ingerir datos con Lakeflow Connect en una tabla de catálogo de Unity, puede usarlo como origen en el Diseñador.

Pasos siguientes