Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Este artículo tiene como objetivo proporcionar instrucciones claras y fundamentadas para la creación de recursos de cómputo. Mediante el uso de los tipos de proceso adecuados para el flujo de trabajo, puede mejorar el rendimiento y ahorrar costos.
| Práctica recomendada | Impacto | Documentación |
|---|---|---|
| Uso de cómputo sin servidor para la mayoría de las cargas de trabajo | Azure Databricks administra automáticamente el ajuste de tamaño, el escalado y la infraestructura. No se requiere ninguna configuración de clúster. | |
| Para el cálculo clásico: use el modo de acceso estándar a menos que la funcionalidad necesaria no esté soportada. | El proceso de computación con el modo de acceso estándar puede ser utilizado por varios usuarios con aislamiento de datos entre usuarios. | |
| Para el proceso clásico: empiece por usar tipos de instancia de uso general si no está familiarizado con Azure Databricks | Al seleccionar el tipo de instancia adecuado para la carga de trabajo, se obtiene una mayor eficacia. | |
| Para el proceso clásico: use los tipos de instancia de última generación si hay suficiente disponibilidad. | La última generación de tipos de instancia proporciona el mejor rendimiento y las características más recientes. | |
| Para el cómputo clásico: establezca el balance entre instancias puntuales y bajo demanda según la urgencia con que necesite ejecutar su carga de trabajo. | Las instancias spot ahorran en costos, pero pueden afectar al tiempo de ejecución general de una operación si las instancias spot son recuperadas. | |
| Para computación clásica: elija el tamaño de sus nodos y el número de trabajadores en función de los tipos de operaciones que realiza la carga de trabajo. | Por ejemplo, si espera una gran cantidad de mezclas, puede ser más eficaz usar un único nodo grande, en lugar de varios nodos más pequeños. | |
| Para la computación clásica: ejecute el comando vacuum en un clúster con el autoescalado configurado para manejar de 1 a 4 trabajadores, donde cada trabajador tiene 8 núcleos. Seleccione un controlador con entre 8 y 32 núcleos. Aumente el tamaño del controlador si recibe errores de memoria insuficiente (OOM). |
Las instrucciones de vacuum se dividen en dos fases, la segunda de las cuales es impulsada por drivers. Si no usa el clúster de tamaño correcto, la operación podría provocar una ralentización y podría no realizarse correctamente. |
|
| Para el proceso clásico: evalúe si el flujo de trabajo por lotes se beneficiaría de Photon. | Photon proporciona consultas más rápidas y reduce el costo total por carga de trabajo. |