Ejemplos de entrenamiento de modelos

En esta sección se incluyen ejemplos que muestran cómo entrenar modelos de aprendizaje automático en Azure Databricks con muchas bibliotecas populares de código abierto.

También puede usar AutoML, que prepara automáticamente un conjunto de datos para el entrenamiento del modelo, realiza un conjunto de pruebas mediante bibliotecas de código abierto, como scikit-learn y XGBoost, y crea un cuaderno Python con el código fuente de cada ejecución de prueba para poder revisar, reproducir y modificar el código.

Ejemplos de aprendizaje automático

Paquete Cuadernos Características
scikit-learn Tutorial sobre aprendizaje automático Unity Catalog, modelo de clasificación, MLflow, ajuste automatizado de hiperparámetros con Hyperopt y MLflow
scikit-learn Ejemplo de extremo a extremo Unity Catalog, modelo de clasificación, MLflow, ajuste automatizado de hiperparámetros con Hyperopt y MLflow, XGBoost
MLlib Ejemplos de MLlib Clasificación binaria, árboles de decisión, regresión de GBT, Structured Streaming, transformador personalizado
xgboost Ejemplos de XGBoost Python, PySpark y Scala, cargas de trabajo de nodo único y entrenamiento distribuido

Ejemplo de ajuste de hiperparámetros

Para obtener información general sobre el ajuste de hiperparámetros en Azure Databricks, consulte Ajuste de hiperparámetros.

Nota:

La versión de código abierto de Hyperopt ya no se mantiene.

Hyperopt no se incluye en Databricks Runtime para Machine Learning después de 16.4 LTS ML. Azure Databricks recomienda usar Optuna para la optimización de un solo nodo o RayTune para obtener una experiencia similar a la funcionalidad de optimización de hiperparámetros distribuidos de Hyperopt en desuso. Obtenga más información sobre el uso de RayTune en Azure Databricks.

Paquete Ordenador portátil Características
Optuna Introducción a Optuna Optuna, Optuna distribuido, Scikit-learn, MLflow
Hyperopt Hyperopt distribuido Hyperopt distribuido, scikit-learn, MLflow
Hyperopt Comparación de modelos Utilizar Hyperopt distribuido para explorar el espacio de hiperparámetros para diferentes tipos de modelos de forma simultánea
Hyperopt Algoritmos de entrenamiento distribuido e Hyperopt Hyperopt, MLlib
Hyperopt Procedimientos recomendados de Hyperopt Procedimientos recomendados para conjuntos de datos de diferentes tamaños