Introducción a las integraciones de Azure Databricks

Databricks proporciona integraciones para conectarse a una variedad de orígenes de datos y herramientas de BI. Además, con las herramientas de desarrollo de Databricks puede conectarse a Databricks desde la máquina local para automatizar flujos de trabajo, crear soluciones personalizadas, etc.

Partner Connect

Partner Connect es una interfaz de usuario que permite que las soluciones validadas se integren de forma más rápida y sencilla con los clústeres de Databricks y los almacenes de SQL.

Para obtener más información, consulte ¿Qué es Databricks Partner Connect?.

Orígenes de datos

Databricks puede leer y escribir datos en una variedad de formatos de datos como CSV, Delta Lake, JSON, Parquet, XML y otros formatos, así como proveedores de almacenamiento de datos como Amazon S3, Google BigQuery y Cloud Storage, Snowflake y otros proveedores.

Consulte Ingesta de datos, Conexión a orígenes de datos y servicios externos y Opciones de formato de datos.

Herramientas de BI

Databricks ha validado las integraciones con sus herramientas de BI favoritas, como Power BI, Tableau y otros, lo que le permite trabajar con datos a través de clústeres de Databricks y almacenes de SQL, en muchos casos con experiencias de código bajo y sin código.

Para obtener una lista completa, con instrucciones de conexión, consulte BI y visualización.

Otras herramientas de ETL

Además del acceso a todo tipo de orígenes de datos, Databricks proporciona integraciones para herramientas ETL/ELT como dbt, Prophecy y Azure Data Factory; y herramientas de orquestación de canalización de datos, como Airflow; y herramientas de base de datos SQL, como DataGrip, DBeaver y SQL Workbench/J.

Para obtener instrucciones de conexión, consulte Preparación y transformación de datos yconectores, bibliotecas, controladores, API y herramientas de SQL.

Aplicaciones de Databricks

Databricks Apps permite a los desarrolladores compilar e implementar aplicaciones de inteligencia artificial y datos seguros directamente en la plataforma de Databricks, lo que elimina la necesidad de una infraestructura independiente. Las aplicaciones se ejecutan en la plataforma sin servidor e se integran con los servicios de plataforma clave, incluido el Catálogo de Unity para la gobernanza de datos, Databricks SQL para consultar datos y OAuth para la autenticación.

Para obtener más información, consulte Aplicaciones de Databricks.

Directorios Git

Las carpetas de Git de Databricks proporcionan integración de nivel de repositorio con sus proveedores de Git favoritos, por lo que puede desarrollar código en un cuaderno de Databricks y sincronizarlo con un repositorio de Git remoto. Consulte Carpetas de Git de Azure Databricks.

Herramientas para desarrolladores

Databricks ofrece herramientas de desarrollo como la CLI de Databricks y Databricks Connect que le permiten ejecutar flujos de trabajo mediante programación y acceder al proceso de Azure Databricks, incluidas las instancias de SQL Warehouse, y crear soluciones personalizadas que se integren con Databricks en su IDE favorito.

Para obtener una lista completa de las herramientas que admiten a los desarrolladores, consulte Desarrollo en Databricks.