Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En esta sección se incluyen ejemplos que muestran cómo entrenar modelos de aprendizaje automático en Azure Databricks con muchas bibliotecas populares de código abierto.
También puede usar AutoML, que prepara automáticamente un conjunto de datos para el entrenamiento del modelo, realiza un conjunto de pruebas mediante bibliotecas de código abierto, como scikit-learn y XGBoost, y crea un cuaderno Python con el código fuente de cada ejecución de prueba para poder revisar, reproducir y modificar el código.
Ejemplos de aprendizaje automático
| Paquete | Cuadernos | Características |
|---|---|---|
| scikit-learn | Tutorial sobre aprendizaje automático | Unity Catalog, modelo de clasificación, MLflow, ajuste automatizado de hiperparámetros con Hyperopt y MLflow |
| scikit-learn | Ejemplo de extremo a extremo | Unity Catalog, modelo de clasificación, MLflow, ajuste automatizado de hiperparámetros con Hyperopt y MLflow, XGBoost |
| MLlib | Ejemplos de MLlib | Clasificación binaria, árboles de decisión, regresión de GBT, Structured Streaming, transformador personalizado |
| xgboost | Ejemplos de XGBoost | Python, PySpark y Scala, cargas de trabajo de nodo único y entrenamiento distribuido |
Ejemplo de ajuste de hiperparámetros
Para obtener información general sobre el ajuste de hiperparámetros en Azure Databricks, consulte Ajuste de hiperparámetros.
Nota:
La versión de código abierto de Hyperopt ya no se mantiene.
Hyperopt no se incluye en Databricks Runtime para Machine Learning después de 16.4 LTS ML. Azure Databricks recomienda usar Optuna para la optimización de un solo nodo o RayTune para obtener una experiencia similar a la funcionalidad de optimización de hiperparámetros distribuidos de Hyperopt en desuso. Obtenga más información sobre el uso de RayTune en Azure Databricks.
| Paquete | Ordenador portátil | Características |
|---|---|---|
| Optuna | Introducción a Optuna | Optuna, Optuna distribuido, Scikit-learn, MLflow |
| Hyperopt | Hyperopt distribuido | Hyperopt distribuido, scikit-learn, MLflow |
| Hyperopt | Comparación de modelos | Utilizar Hyperopt distribuido para explorar el espacio de hiperparámetros para diferentes tipos de modelos de forma simultánea |
| Hyperopt | Algoritmos de entrenamiento distribuido e Hyperopt | Hyperopt, MLlib |
| Hyperopt | Procedimientos recomendados de Hyperopt | Procedimientos recomendados para conjuntos de datos de diferentes tamaños |