Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Puede automatizar la configuración del catálogo de Unity mediante el proveedor de Terraform de Databricks. En este artículo se proporcionan vínculos a la guía de implementación del catálogo de Unity del proveedor de Terraform y a la documentación de referencia de recursos, junto con los requisitos ("Antes de comenzar") y las sugerencias de validación e implementación.
Antes de empezar
Para automatizar la configuración del catálogo de Unity mediante Terraform, debe tener lo siguiente:
- La cuenta de Azure Databricks debe estar en el plan Premium.
- En su entidad de Azure, debe tener los permisos necesarios para crear:
- Una cuenta de almacenamiento que se va a usar con Azure Data Lake Storage. Consulte Crear una cuenta de almacenamiento para usarla con Azure Data Lake Storage.
- Un nuevo recurso para mantener una identidad administrada asignada por el sistema. Esto requiere que sea
ContributoroOwnerde un grupo de recursos en cualquiera de las suscripciones del inquilino.
Para usar el proveedor de Terraform de Databricks para configurar un metastore para Unity Catalog, el almacenamiento para el metastore, cualquier almacenamiento externo y todas sus credenciales de acceso relacionadas, debe tener lo siguiente:
- Una cuenta de Azure.
- Un usuario administrador de nivel de cuenta en la cuenta de Azure.
- En su máquina de desarrollo local, debe tener:
La CLI de Terraform. Consulte la sección de descarga de Terraform del sitio web de Terraform.
El Azure CLI, se ha iniciado sesión mediante el comando
az logincon un usuario que posea derechos deContributoroOwnera su suscripción. Consulte Cómo instalar el Azure CLI. Para iniciar sesión con una cuenta de usuario o una entidad de servicio, consulte Iniciar sesión con Azure CLI.Nota:
Al autenticarse con herramientas, sistemas, scripts y aplicaciones automatizados, es un procedimiento recomendado de seguridad para iniciar sesión mediante el comando
az logincon una entidad de servicio de Microsoft Entra ID. Consulte Iniciar sesión con un principal de servicio y Autenticación con Azure Service Principal.
Para usar el proveedor de Terraform de Databricks para configurar todos los demás componentes de infraestructura del catálogo de Unity, debe tener lo siguiente:
- Un área de trabajo de Azure Databricks.
- En su máquina de desarrollo local, debe tener:
- La CLI de Terraform. Consulte la sección de descarga de Terraform del sitio web de Terraform.
- Uno de los siguientes:
La CLI de Databricks, versión 0.205 o posterior, configurada con tu token de acceso personal de Azure Databricks mediante la ejecución de
databricks configure --host <workspace-url> --profile <some-unique-profile-name>. Consulte Instalación o actualización de la CLI de Databricks y autenticación de token de acceso personal (heredado).Nota:
Como procedimiento recomendado de seguridad, al autenticarse con herramientas automatizadas, sistemas, scripts y aplicaciones, Databricks recomienda usar tokens de acceso personales que pertenecen a entidades de servicio en lugar de usuarios del área de trabajo. Para crear tokens para entidades de servicio, consulte Administrar tokens para una entidad de servicio.
Azure CLI, se ha iniciado sesión mediante el comando
az login. Consulte Cómo instalar el Azure CLI. Para iniciar sesión con una cuenta de usuario o una entidad de servicio, consulte Iniciar sesión con Azure CLI.Nota:
Al autenticarse con herramientas, sistemas, scripts y aplicaciones automatizados, es un procedimiento recomendado de seguridad para iniciar sesión mediante el comando
az logincon una entidad de servicio de Microsoft Entra ID. Consulte Iniciar sesión con un principal de servicio y Autenticación con Azure Service Principal.Las dos variables de entorno Azure Databricks siguientes:
-
DATABRICKS_HOST, se establece en el valor de la dirección URL de la instancia del área de trabajo, por ejemplohttps://dbc-1234567890123456.cloud.databricks.com -
DATABRICKS_TOKEN, configure el valor de su token de acceso personal de Azure Databricks o su token de Microsoft Entra ID (anteriormente Azure Active Directory). Consulte también Supervise y revoque tokens de acceso personal.
Para establecer estas variables de entorno, consulte la documentación del sistema operativo.
Nota:
Como procedimiento recomendado de seguridad, al autenticarse con herramientas automatizadas, sistemas, scripts y aplicaciones, Databricks recomienda usar tokens de acceso personales que pertenecen a entidades de servicio en lugar de usuarios del área de trabajo. Para crear tokens para entidades de servicio, consulte Administrar tokens para una entidad de servicio.
-
Guía de implementación del catálogo de Unity del proveedor de Terraform y documentación de referencia de recursos
Para obtener información sobre cómo implementar todos los requisitos previos y habilitar el catálogo de Unity para un área de trabajo, consulte Implementación de recursos de requisitos previos y habilitación del catálogo de Unity en la documentación del proveedor de Terraform de Databricks.
Si ya tiene algunos componentes de infraestructura del catálogo de Unity implementados, puede usar Terraform para implementar componentes adicionales de infraestructura del catálogo de Unity según sea necesario. Consulte cada sección de la guía a la que se hace referencia en el párrafo anterior y la sección del Catálogo de Unity de la documentación del proveedor de Terraform de Databricks.
Validar, planear, implementar o destruir los recursos
- Para validar la sintaxis de las configuraciones de Terraform sin implementarlas, ejecute el
terraform validatecomando . - Para mostrar las acciones que Terraform realizaría para implementar las configuraciones, ejecute el
terraform plancomando . Este comando no implementa realmente las configuraciones. - Para implementar las configuraciones, ejecute el
terraform deploycomando . - Para eliminar los recursos implementados, ejecute el
terraform destroycomando .