Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Alleen van toepassing op:Foundry (klassiek) portal. Dit artikel is niet beschikbaar voor de nieuwe Foundry-portal.
Meer informatie over de nieuwe portal.
Opmerking
Koppelingen in dit artikel kunnen inhoud openen in de nieuwe Microsoft Foundry-documentatie in plaats van de Foundry-documentatie (klassiek) die u nu bekijkt.
De modelcatalogus in Microsoft Foundry is de hub voor het detecteren en gebruiken van een breed scala aan Foundry-modellen voor het bouwen van generatieve AI-toepassingen. U moet modellen implementeren om ze beschikbaar te maken voor het ontvangen van deductieaanvragen. Foundry biedt een uitgebreide reeks implementatieopties voor Foundry-modellen, afhankelijk van uw behoeften en modelvereisten.
Implementatieopties
Foundry biedt verschillende implementatieopties, afhankelijk van het type modellen en resources dat u moet inrichten. De volgende implementatieopties zijn beschikbaar:
- Standaardimplementatie in Foundry-resources
- Implementatie naar serverloze API-eindpunten
- Implementatie naar beheerde berekeningen
De Foundry-portal kan automatisch een implementatieoptie kiezen op basis van uw omgeving en configuratie. Gebruik Waar mogelijk Foundry-resources voor implementatie. Modellen die meerdere implementatieopties ondersteunen, gebruiken standaard Foundry-resources voor implementatie. Als u toegang wilt krijgen tot andere implementatieopties, gebruikt u de Azure CLI of Azure Machine Learning SDK voor implementatie.
Standaardimplementatie in Foundry-resources
Foundry-resources is de voorkeursimplementatieoptie in Foundry. Het biedt het breedste scala aan mogelijkheden, waaronder regionale, datazone of wereldwijde verwerking, en biedt standaard- en provisioned throughput (PTU)-opties. Vlaggenschipmodellen in Foundry Models ondersteunen deze implementatieoptie.
Deze implementatieoptie is beschikbaar in:
- Foundry-bronnen
- Azure OpenAI-resources1
- Azure AI-hub, wanneer deze is verbonden met een Foundry-resource
1Als u Azure OpenAI-resources gebruikt, toont de modelcatalogus alleen Azure OpenAI in Foundry-modellen voor implementatie. U kunt de volledige lijst met Foundry-modellen ophalen door een upgrade uit te voeren naar een Foundry-resource.
Zie Procedure: Modellen implementeren in Foundry-modellen om aan de slag te gaan met de standaardimplementatie in Foundry-resources.
Serverloze API-eindpunt
Deze implementatieoptie is alleen beschikbaar inAI Hub-resources. Hiermee kunt u toegewezen eindpunten maken om het model te hosten, toegankelijk via een API. Foundry Models ondersteunen serverloze API-eindpunten met betalen per gebruik-facturering en u kunt alleen regionale implementaties maken voor serverloze API-eindpunten.
Zie Modellen implementeren als serverloze API-implementaties om aan de slag te gaan met implementatie naar een serverloos API-eindpunt.
Beheerde rekenkracht
Deze implementatieoptie is alleen beschikbaar inAI Hub-resources. Hiermee kunt u een toegewezen eindpunt maken om het model te hosten in een toegewezen rekenproces. U heeft een rekenquotum nodig in uw abonnement om het model te hosten, en u wordt gefactureerd per reken-uptime.
Beheerde rekenkrachtimplementatie is vereist voor modelverzamelingen met:
- Knuffelend gezicht
- NVIDIA-inferentiemicroservices (NIM's)
- Industriemodellen (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
- Databricks
- Aangepaste modellen
Zie Hoe u een beheerde rekenimplementatie implementeert en inferentie uitvoert en Foundry-modellen implementeert op beheerde rekenfaciliteiten met betalen per gebruik.
Mogelijkheden voor de implementatieopties
Gebruik waar mogelijk standaardimplementaties in Foundry-resources . Deze implementatieoptie biedt de meeste mogelijkheden onder de beschikbare implementatieopties. De volgende tabel bevat details over specifieke mogelijkheden voor elke implementatieoptie:
| Vermogen | Standaardimplementatie in Foundry-resources | Serverloze API-eindpunt | Beheerde rekenkracht |
|---|---|---|---|
| Welke modellen kunnen worden geïmplementeerd? |
Foundry Models rechtstreeks verkocht door Azure Foundry Models van partners en de gemeenschap |
Foundry-modellen met facturering op basis van gebruik | Geopende en aangepaste modellen |
| Inzetresource | Gieterijhulpbron | AI-project (in AI-hubresource) | AI-project (in AI-hubresource) |
| Vereist AI-hubs | Nee | Ja | Ja |
| Opties voor gegevensverwerking | Regionale Gegevenszone Globaal |
Regionale | Regionale |
| Privénetwerken | Ja | Ja | Ja |
| Inhoudsfiltering | Ja | Ja | Nee |
| Aangepaste inhoudsfiltering | Ja | Nee | Nee |
| Sleutelloze verificatie | Ja | Nee | Nee |
| Factureringsbasissen | Tokengebruik en geconfigureerde doorvoereenheden | Tokengebruik2 | Rekenkern-uren3 |
2 Een minimale eindpuntinfrastructuur wordt per minuut gefactureerd. U wordt niet gefactureerd voor de infrastructuur die als host fungeert voor het model in serverloze implementatie. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.
3 Facturering is per minuut, afhankelijk van het productniveau en het aantal exemplaren dat in de implementatie wordt gebruikt vanaf het moment van creatie. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.