Magasin de fonctionnalités d’espace de travail (déconseillé)

Remarque

Cette documentation couvre le magasin de fonctionnalités de l’espace de travail. Le Magasin de fonctionnalités de l’espace de travail est disponible uniquement pour les espaces de travail créés avant le 19 août 2024, 14:00:00 (UTC).

Feature Store de l’espace de travail est obsolète. Databricks recommande d’utiliser l’ingénierie de caractéristiques dans Unity Catalog.

Le Magasin de fonctionnalités d’espace de travail est entièrement intégré à d’autres composants d’Azure Databricks et offre les avantages suivants :

  • Découvrabilité. L’interface utilisateur du magasin de caractéristiques, accessible depuis l’espace de travail Databricks, vous permet de parcourir et de rechercher les caractéristiques existantes.
  • Traçabilité. Quand vous créez une table de fonctionnalités dans Azure Databricks, les sources de données utilisées pour créer la table de fonctionnalités sont enregistrées et accessibles. Pour chaque caractéristique d’une table de caractéristiques, vous pouvez aussi accéder aux modèles, aux notebooks, aux travaux et aux points de terminaison qui utilisent la caractéristique.
  • Intégration avec l'évaluation et le déploiement des modèles. Quand vous utilisez des fonctionnalités du magasin de fonctionnalités pour entraîner un modèle, le modèle est accompagné des métadonnées des fonctionnalités. Quand vous utilisez le modèle pour de l’évaluation par lots ou de l’inférence en ligne, il récupère automatiquement les caractéristiques auprès du Feature Store. L’appelant n’a pas besoin de connaître les fonctionnalités, ni d’inclure une logique pour rechercher ou associer des fonctionnalités pour évaluer de nouvelles données. Ceci facilite le déploiement et les mises à jour des modèles.
  • Recherches ponctuelles dans le temps. Feature Store prend en charge les cas d’usage de séries chronologiques et basés sur des événements qui nécessitent une exactitude à un instant donné.

Le workflow typique de Machine Learning utilisant un Feature Store suit le chemin suivant :

  1. Écrivez du code pour convertir des données brutes en caractéristiques et créez un DataFrame Spark contenant les caractéristiques souhaitées.
  2. Écrivez le DataFrame en tant que table de fonctionnalités dans le magasin de fonctionnalités de l’espace de travail.
  3. Entraînez un modèle en utilisant les caractéristiques du feature store. Quand vous procédez ainsi, le modèle stocke les spécifications des caractéristiques utilisées pour l’entraînement. Lorsque le modèle est utilisé pour l’inférence, il joint automatiquement des caractéristiques à partir des tables de caractéristiques appropriées.
  4. Inscrivez le modèle dans le registre de modèles.

Vous pouvez maintenant utiliser ce modèle pour effectuer des prédictions sur de nouvelles données. Pour les cas d’usage de traitement par lots, le modèle récupère automatiquement les caractéristiques dont il a besoin dans le Feature Store.

Flux de travail du Feature Store pour les cas d’usage par lots de Machine Learning.

Pour les cas d’usage de service en temps réel, publiez les caractéristiques dans un magasin en ligne. Consultez les magasins de fonctionnalités Databricks Online.

Au moment de l’inférence, le modèle lit les fonctionnalités précalculées du magasin en ligne et les joint aux données fournies dans la requête du client au point de terminaison de mise en service du modèle.

Flux du Feature Store pour les modèles de machine learning qui sont déployés.

Commencer à utiliser le Store des fonctionnalités de l’espace de travail

Pour commencer, essayez ces exemples de notebooks. Le notebook de base vous guide tout au long de la création d’une table de caractéristiques, de son utilisation pour entraîner un modèle, puis d’effectuer un scoring par lot en utilisant la recherche automatique de caractéristiques. Il vous présente également l'interface utilisateur d'ingénierie des caractéristiques et vous montre comment l'utiliser pour rechercher des caractéristiques et comprendre comment les caractéristiques sont créées et utilisées.

Exemple de notebook de Feature Store basique d’espace de travail

Obtenir le notebook

L’exemple de notebook sur les taxis illustre le processus de création de caractéristiques, leur mise à jour et leur utilisation pour l’apprentissage de modèle et l’inférence par lots.

Exemple de notebook sur les taxis du Feature Store de l'espace de travail

Obtenir le notebook

Types de données pris en charge

Pour obtenir la liste des types de données pris en charge, consultez Types de données pris en charge.