Voorbeelden van modeltraining

Deze sectie bevat voorbeelden die laten zien hoe u machine learning-modellen traint op Azure Databricks met behulp van veel populaire opensource-bibliotheken.

U kunt ook AutoML gebruiken, waarmee automatisch een gegevensset wordt voorbereid voor modeltraining, een reeks proefversies worden uitgevoerd met behulp van opensource-bibliotheken, zoals scikit-learn en XGBoost, en een Python notebook wordt gemaakt met de broncode voor elke proefuitvoering, zodat u de code kunt bekijken, reproduceren en wijzigen.

Voorbeelden van machine learning

Pakket Notitieboek(en) Functies
scikit-learn Handleiding machine learning Unity Catalog, classificatiemodel, MLflow, geautomatiseerde afstemming van hyperparameters met Hyperopt en MLflow
scikit-learn End-to-end-voorbeeld Unity Catalog, classificatiemodel, MLflow, geautomatiseerde afstemming van hyperparameters met Hyperopt en MLflow, XGBoost
MLlib Voorbeelden van MLlib Binaire classificatie, beslissingsstructuren, GBT-regressie, Gestructureerd streamen, aangepaste transformator
xgboost XGBoost-voorbeelden Python, PySpark en Scala, workloads met één knooppunt en gedistribueerde training

Voorbeelden van hyperparameterafstemming

Zie Hyperparameter tuning voor algemene informatie over het afstemmen van hyperparameters in Azure Databricks.

Opmerking

De opensource-versie van Hyperopt wordt niet meer onderhouden.

Hyperopt is niet opgenomen in Databricks Runtime voor Machine Learning na 16.4 LTS ML. Azure Databricks raadt aan om Optuna te gebruiken voor optimalisatie van één knooppunt of RayTune voor een vergelijkbare ervaring als de afgeschafte functionaliteit voor hyperparameter-afstemming van Hyperopt. Meer informatie over het gebruik van RayTune op Azure Databricks.

Pakket Laptop Functies
Optuna Aan de slag met Optuna Optuna, gedistribueerde Optuna, scikit-learn, MLflow
Hyperopt Gedistribueerde hyperopt Gedistribueerde hyperopt, scikit-learn, MLflow
Hyperopt Modellen vergelijken Gedistribueerde hyperopt gebruiken om hyperparameterruimte voor verschillende modeltypen tegelijk te doorzoeken
Hyperopt Gedistribueerde trainingsalgoritmen en hyperopt Hyperopt, MLlib
Hyperopt Best practices voor Hyperopt Aanbevolen procedures voor gegevenssets met verschillende grootten