Implementatieoverzicht voor Microsoft Foundry Models (klassiek)

Alleen van toepassing op:Foundry (klassiek) portal. Dit artikel is niet beschikbaar voor de nieuwe Foundry-portal. Meer informatie over de nieuwe portal.

Opmerking

Koppelingen in dit artikel kunnen inhoud openen in de nieuwe Microsoft Foundry-documentatie in plaats van de Foundry-documentatie (klassiek) die u nu bekijkt.

De modelcatalogus in Microsoft Foundry is de hub voor het detecteren en gebruiken van een breed scala aan Foundry-modellen voor het bouwen van generatieve AI-toepassingen. U moet modellen implementeren om ze beschikbaar te maken voor het ontvangen van deductieaanvragen. Foundry biedt een uitgebreide reeks implementatieopties voor Foundry-modellen, afhankelijk van uw behoeften en modelvereisten.

Implementatieopties

Foundry biedt verschillende implementatieopties, afhankelijk van het type modellen en resources dat u moet inrichten. De volgende implementatieopties zijn beschikbaar:

Standaardimplementatie in Foundry-resources
Implementatie naar serverloze API-eindpunten
Implementatie naar beheerde berekeningen

De Foundry-portal kan automatisch een implementatieoptie kiezen op basis van uw omgeving en configuratie. Gebruik Waar mogelijk Foundry-resources voor implementatie. Modellen die meerdere implementatieopties ondersteunen, gebruiken standaard Foundry-resources voor implementatie. Als u toegang wilt krijgen tot andere implementatieopties, gebruikt u de Azure CLI of Azure Machine Learning SDK voor implementatie.

Standaardimplementatie in Foundry-resources

Foundry-resources is de voorkeursimplementatieoptie in Foundry. Het biedt het breedste scala aan mogelijkheden, waaronder regionale, datazone of wereldwijde verwerking, en biedt standaard- en provisioned throughput (PTU)-opties. Vlaggenschipmodellen in Foundry Models ondersteunen deze implementatieoptie.

Deze implementatieoptie is beschikbaar in:

Foundry-bronnen
Azure OpenAI-resources¹
Azure AI-hub, wanneer deze is verbonden met een Foundry-resource

¹Als u Azure OpenAI-resources gebruikt, toont de modelcatalogus alleen Azure OpenAI in Foundry-modellen voor implementatie. U kunt de volledige lijst met Foundry-modellen ophalen door een upgrade uit te voeren naar een Foundry-resource.

Zie Procedure: Modellen implementeren in Foundry-modellen om aan de slag te gaan met de standaardimplementatie in Foundry-resources.

Serverloze API-eindpunt

Deze implementatieoptie is alleen beschikbaar inAI Hub-resources. Hiermee kunt u toegewezen eindpunten maken om het model te hosten, toegankelijk via een API. Foundry Models ondersteunen serverloze API-eindpunten met betalen per gebruik-facturering en u kunt alleen regionale implementaties maken voor serverloze API-eindpunten.

Zie Modellen implementeren als serverloze API-implementaties om aan de slag te gaan met implementatie naar een serverloos API-eindpunt.

Beheerde rekenkracht

Deze implementatieoptie is alleen beschikbaar inAI Hub-resources. Hiermee kunt u een toegewezen eindpunt maken om het model te hosten in een toegewezen rekenproces. U heeft een rekenquotum nodig in uw abonnement om het model te hosten, en u wordt gefactureerd per reken-uptime.

Beheerde rekenkrachtimplementatie is vereist voor modelverzamelingen met:

Knuffelend gezicht
NVIDIA-inferentiemicroservices (NIM's)
Industriemodellen (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
Databricks
Aangepaste modellen

Zie Hoe u een beheerde rekenimplementatie implementeert en inferentie uitvoert en Foundry-modellen implementeert op beheerde rekenfaciliteiten met betalen per gebruik.

Mogelijkheden voor de implementatieopties

Gebruik waar mogelijk standaardimplementaties in Foundry-resources . Deze implementatieoptie biedt de meeste mogelijkheden onder de beschikbare implementatieopties. De volgende tabel bevat details over specifieke mogelijkheden voor elke implementatieoptie:

Vermogen	Standaardimplementatie in Foundry-resources	Serverloze API-eindpunt	Beheerde rekenkracht
Welke modellen kunnen worden geïmplementeerd?	Foundry Models rechtstreeks verkocht door Azure Foundry Models van partners en de gemeenschap	Foundry-modellen met facturering op basis van gebruik	Geopende en aangepaste modellen
Inzetresource	Gieterijhulpbron	AI-project (in AI-hubresource)	AI-project (in AI-hubresource)
Vereist AI-hubs	Nee	Ja	Ja
Opties voor gegevensverwerking	Regionale Gegevenszone Globaal	Regionale	Regionale
Privénetwerken	Ja	Ja	Ja
Inhoudsfiltering	Ja	Ja	Nee
Aangepaste inhoudsfiltering	Ja	Nee	Nee
Sleutelloze verificatie	Ja	Nee	Nee
Factureringsbasissen	Tokengebruik en geconfigureerde doorvoereenheden	Tokengebruik²	Rekenkern-uren³

² Een minimale eindpuntinfrastructuur wordt per minuut gefactureerd. U wordt niet gefactureerd voor de infrastructuur die als host fungeert voor het model in serverloze implementatie. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.

³ Facturering is per minuut, afhankelijk van het productniveau en het aantal exemplaren dat in de implementatie wordt gebruikt vanaf het moment van creatie. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.

Feedback

Is deze pagina nuttig?

Last updated on 2026-05-01