Guía rápida de creación de cálculo

Este artículo tiene como objetivo proporcionar instrucciones claras y fundamentadas para la creación de recursos de cómputo. Mediante el uso de los tipos de proceso adecuados para el flujo de trabajo, puede mejorar el rendimiento y ahorrar costos.

Práctica recomendada	Impacto	Documentación
Uso de cómputo sin servidor para la mayoría de las cargas de trabajo	Azure Databricks administra automáticamente el ajuste de tamaño, el escalado y la infraestructura. No se requiere ninguna configuración de clúster.	Computación sin servidor
Para el cálculo clásico: use el modo de acceso estándar a menos que la funcionalidad necesaria no esté soportada.	El proceso de computación con el modo de acceso estándar puede ser utilizado por varios usuarios con aislamiento de datos entre usuarios.	Modos de acceso
Para el proceso clásico: empiece por usar tipos de instancia de uso general si no está familiarizado con Azure Databricks	Al seleccionar el tipo de instancia adecuado para la carga de trabajo, se obtiene una mayor eficacia.	Crear un clúster
Para el proceso clásico: use los tipos de instancia de última generación si hay suficiente disponibilidad.	La última generación de tipos de instancia proporciona el mejor rendimiento y las características más recientes.	Tipos de instancia de Azure
Para el cómputo clásico: establezca el balance entre instancias puntuales y bajo demanda según la urgencia con que necesite ejecutar su carga de trabajo.	Las instancias spot ahorran en costos, pero pueden afectar al tiempo de ejecución general de una operación si las instancias spot son recuperadas.	Recomendaciones de configuración de proceso
Para computación clásica: elija el tamaño de sus nodos y el número de trabajadores en función de los tipos de operaciones que realiza la carga de trabajo.	Por ejemplo, si espera una gran cantidad de mezclas, puede ser más eficaz usar un único nodo grande, en lugar de varios nodos más pequeños.	Consideraciones sobre el dimensionamiento de computación
Para la computación clásica: ejecute el comando vacuum en un clúster con el autoescalado configurado para manejar de 1 a 4 trabajadores, donde cada trabajador tiene 8 núcleos. Seleccione un controlador con entre 8 y 32 núcleos. Aumente el tamaño del controlador si recibe errores de memoria insuficiente (OOM).	Las instrucciones de vacuum se dividen en dos fases, la segunda de las cuales es impulsada por drivers. Si no usa el clúster de tamaño correcto, la operación podría provocar una ralentización y podría no realizarse correctamente.	¿Qué tamaño necesita el clúster de vacío? VACUUM procedimientos recomendados
Para el proceso clásico: evalúe si el flujo de trabajo por lotes se beneficiaría de Photon.	Photon proporciona consultas más rápidas y reduce el costo total por carga de trabajo.	Ventajas de Photon

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-11

Guía rápida de creación de cálculo

Comentarios

Recursos adicionales