Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Dans cet article, vous allez apprendre à développer une application IA générative en commençant par GitHub Modèles, puis à mettre à niveau votre expérience en déployant une ressource Foundry Tools avec Microsoft Modèles Foundry.
GitHub Models sont utiles lorsque vous souhaitez rechercher et expérimenter des modèles IA gratuitement lorsque vous développez une application IA générative. Lorsque vous êtes prêt à mettre votre application en production, mettez à niveau votre expérience en déployant une ressource Foundry Tools dans un abonnement Azure et en commençant à utiliser des modèles Foundry. Vous n’avez pas besoin de modifier quoi que ce soit d’autre dans votre code.
L’utilisation gratuite de l’API pour les modèles GitHub est soumise à des limites de taux par requêtes par minute, requêtes par jour, jetons par requête et demandes simultanées. Si vous êtes soumis à une limitation de fréquence, vous devez attendre que la limite atteinte se réinitialise avant de pouvoir effectuer plus de requêtes.
Conditions préalables
Tu as besoin de:
- Un compte GitHub ayant accès à GitHub Models.
- Un abonnement Azure avec un mode de paiement valide. Si vous n'avez pas d'abonnement Azure, créez un compte payé Azure à commencer. Vous pouvez également attendre que vous soyez prêt à déployer votre modèle en production, à quel moment vous serez invité à créer ou à mettre à jour votre compte Azure sur un compte standard.
- Les modèles Foundry des partenaires et de la communauté nécessitent l’accès à Place de marché Azure. Vérifiez que vous disposez des autorisations requises pour vous abonner aux offres de modèle. Foundry Models vendus directement par Azure n'ont pas cette exigence.
Mise à niveau vers des modèles Foundry
Les limites de débit pour le terrain de jeu et l’utilisation gratuite de l’API vous aident à expérimenter des modèles et à développer votre application IA. Lorsque vous êtes prêt à mettre votre application en production, utilisez une clé et un point de terminaison à partir d'un compte de Azure payant. Vous n’avez pas besoin de modifier quoi que ce soit d’autre dans votre code.
Note
GitHub Modèles sont gratuits avec des limites de taux. Après la mise à niveau vers les modèles Foundry, l’utilisation est facturée à votre abonnement Azure en fonction du type deployment vous choisissez.
Pour obtenir la clé et le point de terminaison :
Accédez à GitHub Models et sélectionnez un modèle pour atterrir sur son terrain de jeux. Cet article utilise Mistral Medium 3 (25.05).
Tapez certaines invites ou utilisez certaines invites suggérées pour interagir avec le modèle dans le terrain de jeu.
Sélectionnez Utiliser ce modèle dans le terrain de jeu. Cette action ouvre une fenêtre pour « Bien démarrer avec les modèles dans votre base de code ».
Dans l’étape « Configurer l’authentification », sélectionnez Get Microsoft Clé Foundry dans la section « IA Azure ».
Si vous êtes déjà connecté à votre compte Azure, ignorez cette étape. Toutefois, si vous n'avez pas de compte Azure ou si vous n'êtes pas connecté à votre compte, procédez comme suit :
Si vous n'avez pas de compte Azure, sélectionnez Creater mon compte et suivez les étapes pour en créer un.
Sinon, si vous disposez d’un compte Azure, sélectionnez Signez-vous dans. Si votre compte existant est un compte gratuit, vous devez d’abord effectuer une mise à niveau vers un plan standard.
Revenez au terrain de jeu du modèle et sélectionnez Obtenir la clé de Microsoft Foundry à nouveau.
Connectez-vous à votre compte Azure.
Vous êtes amené à Foundry > GitHub et atterrissez sur la page d'accueil dans un projet Foundry.
Conseil
Si vous atterrissez dans l’expérience Foundry (classique), basculez le commutateur New Foundry dans le volet de navigation supérieur droit pour passer à la nouvelle expérience Foundry.
Suivez les étapes décrites dans Déployer un modèle pour déployer le modèle de votre choix, le tester dans l’aire de jeu et inférencer le modèle déployé avec du code.
Vérifiez que le déploiement fonctionne en envoyant une invite de test dans le terrain de jeu. Si vous recevez une réponse, votre modèle est prêt à être utilisé à partir du code.
Important
Contrairement à GitHub Modèles où tous les modèles sont déjà configurés, la ressource Foundry Tools vous permet de contrôler les modèles disponibles dans votre point de terminaison et sous quelle configuration. Ajoutez autant de modèles que vous envisagez d’utiliser avant de les indiquer dans le model paramètre. Découvrez comment ajouter d’autres modèles à votre ressource.
Explorer d’autres fonctionnalités
Les modèles Foundry prennent en charge les fonctionnalités qui ne sont pas disponibles dans GitHub Modèles :
- Model catalog — Parcourir, comparer et évaluer des modèles à partir de Azure, de partenaires et de la communauté open source.
- Authentification sans clé : utilisez Microsoft Entra ID pour l’authentification basée sur des jetons sans gérer les clés API.
- Filtrage de contenu : configurez des filtres de sécurité de contenu pour vos déploiements.
- Limitation de débit : définissez des limites de débit personnalisées pour des modèles spécifiques dans votre ressource.
- Types de déploiement : choisissez parmi plusieurs références SKU de déploiement telles que le paiement par jeton, le provisionné et le traitement par lot.
Résoudre les problèmes courants
| Problème | Résolution |
|---|---|
| Modèle non disponible dans votre région | Vérifiez la disponibilité de la région du modèle dans sa page de catalogue de modèles et choisissez une région prise en charge. |
| Erreur d’authentification après échange de clé | Vérifiez que vous avez copié la clé correcte à partir du portail Foundry. Sélectionnez Paramètres du projet>Clés et points de terminaison pour afficher vos clés. |
| Erreurs de limite de débit après la mise à niveau | Les limites de débit dépendent de votre type de déploiement pour les modèles foundry. Effectuez un scale-up ou choisissez un déploiement à débit plus élevé. |
