Ajuste de hiperparâmetros

Bibliotecas Python como Optuna, Ray Tune e Hyperopt simplificam e automatizam o ajuste de hiperparâmetros para encontrar com eficiência um conjunto ideal de hiperparâmetros para modelos de machine learning. Essas bibliotecas escalam em vários recursos de computação para encontrar rapidamente hiperparâmetros, com mínima necessidade de orquestração e configuração manual.

Optuna

O Optuna é uma estrutura leve que facilita a definição de um espaço de pesquisa dinâmico para ajuste de hiperparâmetros e seleção de modelos. O Optuna inclui alguns dos algoritmos de otimização e aprendizado de máquina mais recentes.

O Optuna pode ser facilmente paralelizado com Joblib para dimensionar cargas de trabalho e integrado ao MLflow para acompanhar hiperparâmetros e métricas entre avaliações.

Para começar a usar o Optuna, consulte Ajuste de hiperparâmetros com o Optuna.

Ray Tune

O Databricks Runtime ML inclui o Ray, uma estrutura de software livre usada para processamento de computação paralela. O Ray Tune é uma biblioteca de ajuste de hiperparâmetros que vem com o Ray e usa o Ray como um back-end para computação distribuída.

Para obter detalhes sobre como executar o Ray no Databricks, consulte O que é o Ray no Azure Databricks?. Para obter exemplos do Ray Tune, consulte a Documentação do Ray Tune.

Hiperopt

Observação

A versão de código aberto do Hyperopt não está mais sendo mantida.

O Hyperopt não está incluído no Databricks Runtime para Machine Learning após o 16.4 LTS ML. O Azure Databricks recomenda o uso de Optuna para otimização em nó único ou de RayTune para uma experiência semelhante à funcionalidade de ajuste distribuído de hiperparâmetros do Hyperopt descontinuado. Saiba mais sobre como usar o RayTune no Azure Databricks.

O Hyperopt é uma biblioteca Python usada para ajuste distribuído de hiperparâmetros e seleção de modelos. O Hyperopt funciona com algoritmos de ML distribuídos, como o Apache Spark MLlib e o Horovod, bem como com modelos de ML de computador individual, como o Scikit-learn e o TensorFlow.

Para começar a usar o Hyperopt, consulte Usar algoritmos de treinamento distribuídos com o Hyperopt.

Acompanhamento automatizado do MLflow pelo MLlib

Observação

O rastreamento automatizado de MLflow do MLlib está obsoleto e desabilitado por padrão em clusters que executam o Databricks Runtime 10.4 LTS ML e superior.

Em vez disso, use a funcionalidade de autologging do MLflow para PySpark ML chamando mlflow.pyspark.ml.autolog(), que é habilitada por padrão com o Databricks Autologging.

Com o acompanhamento automatizado do MLflow do MLlib, quando você executa o código de ajuste que usa CrossValidator ou TrainValidationSplit, hiperparâmetros e métricas de avaliação são automaticamente registrados no MLflow.

Comentários

Esta página foi útil?

Last updated on 2026-06-01