Implementatieoverzicht voor Microsoft Foundry Models (klassiek)

Alleen van toepassing op:Foundry (klassiek) portal. Dit artikel is niet beschikbaar voor de nieuwe Foundry-portal. Meer informatie over de nieuwe portal.

Opmerking

Koppelingen in dit artikel kunnen inhoud openen in de nieuwe Microsoft Foundry-documentatie in plaats van de Foundry-documentatie (klassiek) die u nu bekijkt.

De modelcatalogus in Microsoft Foundry is de hub voor het detecteren en gebruiken van een breed scala aan Foundry-modellen voor het bouwen van generatieve AI-toepassingen. U moet modellen implementeren om ze beschikbaar te maken voor het ontvangen van deductieaanvragen. Foundry biedt een uitgebreide reeks implementatieopties voor Foundry-modellen, afhankelijk van uw behoeften en modelvereisten.

Implementatieopties

Foundry biedt verschillende implementatieopties, afhankelijk van het type modellen en resources dat u moet inrichten. De volgende implementatieopties zijn beschikbaar:

  • Standaardimplementatie in Foundry-resources
  • Implementatie naar serverloze API-eindpunten
  • Implementatie naar beheerde berekeningen

De Foundry-portal kan automatisch een implementatieoptie kiezen op basis van uw omgeving en configuratie. Gebruik Waar mogelijk Foundry-resources voor implementatie. Modellen die meerdere implementatieopties ondersteunen, gebruiken standaard Foundry-resources voor implementatie. Als u toegang wilt krijgen tot andere implementatieopties, gebruikt u de Azure CLI of Azure Machine Learning SDK voor implementatie.

Standaardimplementatie in Foundry-resources

Foundry-resources is de voorkeursimplementatieoptie in Foundry. Het biedt het breedste scala aan mogelijkheden, waaronder regionale, datazone of wereldwijde verwerking, en biedt standaard- en provisioned throughput (PTU)-opties. Vlaggenschipmodellen in Foundry Models ondersteunen deze implementatieoptie.

Deze implementatieoptie is beschikbaar in:

  • Foundry-bronnen
  • Azure OpenAI-resources1
  • Azure AI-hub, wanneer deze is verbonden met een Foundry-resource

1Als u Azure OpenAI-resources gebruikt, toont de modelcatalogus alleen Azure OpenAI in Foundry-modellen voor implementatie. U kunt de volledige lijst met Foundry-modellen ophalen door een upgrade uit te voeren naar een Foundry-resource.

Zie Procedure: Modellen implementeren in Foundry-modellen om aan de slag te gaan met de standaardimplementatie in Foundry-resources.

Serverloze API-eindpunt

Deze implementatieoptie is alleen beschikbaar inAI Hub-resources. Hiermee kunt u toegewezen eindpunten maken om het model te hosten, toegankelijk via een API. Foundry Models ondersteunen serverloze API-eindpunten met betalen per gebruik-facturering en u kunt alleen regionale implementaties maken voor serverloze API-eindpunten.

Zie Modellen implementeren als serverloze API-implementaties om aan de slag te gaan met implementatie naar een serverloos API-eindpunt.

Beheerde rekenkracht

Deze implementatieoptie is alleen beschikbaar inAI Hub-resources. Hiermee kunt u een toegewezen eindpunt maken om het model te hosten in een toegewezen rekenproces. U heeft een rekenquotum nodig in uw abonnement om het model te hosten, en u wordt gefactureerd per reken-uptime.

Beheerde rekenkrachtimplementatie is vereist voor modelverzamelingen met:

  • Knuffelend gezicht
  • NVIDIA-inferentiemicroservices (NIM's)
  • Industriemodellen (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
  • Databricks
  • Aangepaste modellen

Zie Hoe u een beheerde rekenimplementatie implementeert en inferentie uitvoert en Foundry-modellen implementeert op beheerde rekenfaciliteiten met betalen per gebruik.

Mogelijkheden voor de implementatieopties

Gebruik waar mogelijk standaardimplementaties in Foundry-resources . Deze implementatieoptie biedt de meeste mogelijkheden onder de beschikbare implementatieopties. De volgende tabel bevat details over specifieke mogelijkheden voor elke implementatieoptie:

Vermogen Standaardimplementatie in Foundry-resources Serverloze API-eindpunt Beheerde rekenkracht
Welke modellen kunnen worden geïmplementeerd? Foundry Models rechtstreeks verkocht door Azure
Foundry Models van partners en de gemeenschap
Foundry-modellen met facturering op basis van gebruik Geopende en aangepaste modellen
Inzetresource Gieterijhulpbron AI-project (in AI-hubresource) AI-project (in AI-hubresource)
Vereist AI-hubs Nee Ja Ja
Opties voor gegevensverwerking Regionale
Gegevenszone
Globaal
Regionale Regionale
Privénetwerken Ja Ja Ja
Inhoudsfiltering Ja Ja Nee
Aangepaste inhoudsfiltering Ja Nee Nee
Sleutelloze verificatie Ja Nee Nee
Factureringsbasissen Tokengebruik en geconfigureerde doorvoereenheden Tokengebruik2 Rekenkern-uren3

2 Een minimale eindpuntinfrastructuur wordt per minuut gefactureerd. U wordt niet gefactureerd voor de infrastructuur die als host fungeert voor het model in serverloze implementatie. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.

3 Facturering is per minuut, afhankelijk van het productniveau en het aantal exemplaren dat in de implementatie wordt gebruikt vanaf het moment van creatie. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.