Eindpunten voor Microsoft Foundry-modellen

Microsoft Foundry Models kunt u toegang krijgen tot de krachtigste modellen van toonaangevende modelproviders via één eindpunt en een set referenties. Met deze mogelijkheid kunt u schakelen tussen modellen en deze gebruiken in uw toepassing zonder dat u code hoeft te wijzigen.

In dit artikel wordt uitgelegd hoe de Foundry-services modellen organiseren en hoe u het deductie-eindpunt kunt gebruiken om ze te openen.

Belangrijk

Azure AI Inference Beta SDK is afgeschaft en wordt buiten gebruik gesteld op 26 augustus 2026. Schakel over naar de algemeen beschikbare OpenAI/v1-API met een stabiele OpenAI SDK. Volg de migratiehandleiding om over te schakelen naar OpenAI/v1 met behulp van de SDK voor de programmeertaal van uw voorkeur.

Inzettingen

Foundry maakt gebruik van implementaties om modellen beschikbaar te maken. Implementaties geven een model een naam en stellen specifieke configuraties in. U kunt toegang krijgen tot een model met behulp van de implementatienaam in uw aanvragen.

Een implementatie omvat:

Een modelnaam
Een modelversie
Een voorziening of capaciteitstype¹
Een configuratie voor^{inhoudsfilters 1}
Een snelheidsbeperkingsconfiguratie¹

¹ Deze configuraties kunnen veranderen, afhankelijk van het geselecteerde model.

Een Foundry-resource kan veel modelimplementaties hebben. U betaalt alleen voor inference die wordt uitgevoerd op modelimplementaties. Implementaties zijn Azure resources, zodat ze onderhevig zijn aan Azure beleid.

Zie Modelimplementaties toevoegen en configureren voor meer informatie over het maken van implementaties.

Azure OpenAI-deductie-eindpunt

De Azure OpenAI-API biedt de volledige mogelijkheden van OpenAI-modellen en biedt ondersteuning voor meer functies zoals assistenten, threads, bestanden en batchdeductie. Mogelijk hebt u via deze route ook toegang tot niet-OpenAI-modellen.

Azure OpenAI-eindpunten, meestal van de vorm https://<resource-name>.openai.azure.com, werken op het implementatieniveau en elke implementatie heeft een eigen gekoppelde URL. U kunt echter hetzelfde verificatiemechanisme gebruiken om de implementaties te gebruiken. Zie de referentiepagina voor Azure OpenAI-API voor meer informatie.

Elke implementatie heeft een URL die wordt gevormd door het samenvoegen van de Azure OpenAI basis-URL en de route /deployments/<model-deployment-name>.

Installeer het pakket openai met behulp van uw pakketbeheer, zoals pip:

pip install openai --upgrade

Vervolgens kunt u het pakket gebruiken om het model te consumeren of toe te passen. In het volgende voorbeeld ziet u hoe u een client maakt om chatvoltooiingen te gebruiken:

import os
from openai import AzureOpenAI
    
client = AzureOpenAI(
    azure_endpoint = "https://<resource>.services.ai.azure.com"
    api_key=os.getenv("AZURE_INFERENCE_CREDENTIAL"),  
    api_version="2024-10-21",
)

Installeer het pakket openai met npm:

npm install openai

Vervolgens kunt u het pakket gebruiken om het model te consumeren of toe te passen. In het volgende voorbeeld ziet u hoe u een client maakt om chatvoltooiingen te gebruiken:

import { AzureKeyCredential } from "@azure/openai";

const endpoint = "https://<resource>.services.ai.azure.com";
const apiKey = new AzureKeyCredential(process.env.AZURE_INFERENCE_CREDENTIAL);
const apiVersion = "2024-10-21"

const client = new AzureOpenAI({ 
    endpoint, 
    apiKey, 
    apiVersion, 
    "deepseek-v3-0324"
});

Hier is deepseek-v3-0324 de naam van een modelimplementatie in de Microsoft Foundry-resource.

Installeer de OpenAI-bibliotheek met de volgende opdracht:

dotnet add package Azure.AI.OpenAI --prerelease

U kunt het pakket gebruiken om het model te implementeren. In het volgende voorbeeld ziet u hoe u een client maakt om chatvoltooiingen te gebruiken:

AzureOpenAIClient client = new(
    new Uri("https://<resource>.services.ai.azure.com"),
    new ApiKeyCredential(Environment.GetEnvironmentVariable("AZURE_INFERENCE_CREDENTIAL"))
);

Voeg het pakket toe aan uw project:

<dependency>
    <groupId>com.azure</groupId>
    <artifactId>azure-ai-openai</artifactId>
    <version>1.0.0-beta.16</version>
</dependency>

Vervolgens kunt u het pakket gebruiken om het model te consumeren of toe te passen. In het volgende voorbeeld ziet u hoe u een client maakt om chatvoltooiingen te gebruiken:

OpenAIClient client = new OpenAIClientBuilder()
    .credential(new AzureKeyCredential("{key}"))
    .endpoint("https://<resource>.services.ai.azure.com")
    .buildClient();

Gebruik de naslagsectie om het API-ontwerp te verkennen en welke parameters beschikbaar zijn. In de naslagsectie voor chatvoltooiingen wordt bijvoorbeeld beschreven hoe u de route /chat/completions gebruikt om voorspellingen te genereren op basis van instructies in chatindeling:

Verzoek

POST https://<resource>.services.ai.azure.com/openai/deployments/deepseek-v3-0324/chat/completions?api-version=2024-10-21
api-key: <api-key>
Content-Type: application/json

deepseek-v3-0324 Hier ziet u de naam van een modelimplementatie in de Foundry-resource.

response = client.chat.completions.create(
    model="deepseek-v3-0324", # Replace with your model deployment name.
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Explain Riemann's conjecture in 1 paragraph"}
    ]
)

print(response.model_dump_json(indent=2)

var messages = [
    { role: "system", content: "You are a helpful assistant" },
    { role: "user", content: "Explain Riemann's conjecture in 1 paragraph" },
];

const response = await client.chat.completions.create({ messages, model: "deepseek-v3-0324" });

console.log(response.choices[0].message.content)

ChatCompletion response = chatClient.CompleteChat(
    [
        new SystemChatMessage("You are a helpful assistant."),
        new UserChatMessage("Explain Riemann's conjecture in 1 paragraph"),
    ]);

Console.WriteLine($"{response.Role}: {response.Content[0].Text}");

List<ChatRequestMessage> chatMessages = new ArrayList<>();
chatMessages.add(new ChatRequestSystemMessage("You are a helpful assistant"));
chatMessages.add(new ChatRequestUserMessage("Explain Riemann's conjecture in 1 paragraph"));

ChatCompletions chatCompletions = client.getChatCompletions("deepseek-v3-0324",
    new ChatCompletionsOptions(chatMessages));

System.out.printf("Model ID=%s is created at %s.%n", chatCompletions.getId(), chatCompletions.getCreatedAt());
for (ChatChoice choice : chatCompletions.getChoices()) {
    ChatResponseMessage message = choice.getMessage();
    System.out.printf("Index: %d, Chat Role: %s.%n", choice.getIndex(), message.getRole());
    System.out.println("Message:");
    System.out.println(message.getContent());
}

Hier is deepseek-v3-0324 de naam van een modelimplementatie in de Microsoft Foundry-resource.

Verzoek

POST https://<resource>.services.ai.azure.com/openai/deployments/deepseek-v3-0324/chat/completions?api-version=2024-10-21
api-key: <api-key>
Content-Type: application/json

{
    "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant"
        },
        {
            "role": "user",
            "content": "Explain Riemann's conjecture in 1 paragraph"
        }
    ]
}

deepseek-v3-0324 Hier ziet u de naam van een modelimplementatie in de Foundry-resource.

Zie Azure OpenAI in de documentatie van Foundry Models voor meer informatie over het gebruik van het Azure OpenAI-eindpunt0>.

Sleutelloze verificatie

Modellen die zijn geïmplementeerd in Foundry Models in Foundry Tools ondersteunen sleutelloze autorisatie met behulp van Microsoft Entra ID. Sleutelloze autorisatie verbetert de beveiliging, vereenvoudigt de gebruikerservaring, vermindert de operationele complexiteit en biedt robuuste nalevingsondersteuning voor moderne ontwikkeling. Het maakt sleutelloze autorisatie een sterke keuze voor organisaties die veilige en schaalbare oplossingen voor identiteitsbeheer gebruiken.

Als u sleutelloze verificatie wilt gebruiken, configureert u uw resource en verleent u toegang tot gebruikers om inference uit te voeren. Nadat u de resource hebt geconfigureerd en toegang hebt verleend, moet u zich als volgt verifiëren:

Installeer de OpenAI SDK met behulp van een pakketbeheerder zoals pip:

pip install openai

Voor Microsoft Entra ID-verificatie moet u ook het volgende installeren:

pip install azure-identity

Gebruik het pakket om het model te gebruiken. In het volgende voorbeeld ziet u hoe u een client maakt om chatvoltooiingen met Microsoft Entra ID te gebruiken en een testgesprek te voeren naar het eindpunt voor voltooiing van de chat met uw modelimplementatie.

Vervang door <resource> de naam van de Foundry-resource. Zoek deze in de Azure-portal of door az cognitiveservices account list uit te voeren. Vervang DeepSeek-V3.1 door uw werkelijke implementatienaam.

from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), 
    "https://ai.azure.com/.default"
)

client = OpenAI(
    base_url="https://<resource>.openai.azure.com/openai/v1/",
    api_key=token_provider,
)

completion = client.chat.completions.create(
    model="DeepSeek-V3.1",  # Required: your deployment name
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "What is Azure AI?"}
    ]
)

print(completion.choices[0].message.content)

Verwachte uitvoer

Azure AI is a comprehensive suite of artificial intelligence services and tools from Microsoft that enables developers to build intelligent applications. It includes services for natural language processing, computer vision, speech recognition, and machine learning capabilities.

Naslaginformatie: OpenAI Python SDK en klasse DefaultAzureCredential.

Installeer de OpenAI SDK:

dotnet add package OpenAI

Installeer voor Microsoft Entra ID verificatie ook het pakket Azure.Identity:

dotnet add package Azure.Identity

Importeer de volgende naamruimten:

using Azure.Identity;
using OpenAI;
using OpenAI.Chat;
using System.ClientModel.Primitives;

Gebruik vervolgens het pakket om het model te gebruiken. In het volgende voorbeeld ziet u hoe u een client maakt voor het gebruiken van chatvoltooiingen door gebruik te maken van Microsoft Entra ID en vervolgens een testgesprek voert naar het chatvoltooiingen-eindpunt met uw modelimplementatie.

Vervang <resource> door de naam van de Foundry-resource (zoek deze in de Azure-portal). Vervang gpt-4o-mini door uw werkelijke implementatienaam.

#pragma warning disable OPENAI001

BearerTokenPolicy tokenPolicy = new(
    new DefaultAzureCredential(),
    "https://ai.azure.com/.default"
);

ChatClient client = new(
    model: "gpt-4o-mini", // Your deployment name
    authenticationPolicy: tokenPolicy,
    options: new OpenAIClientOptions() {
        Endpoint = new Uri("https://<resource>.openai.azure.com/openai/v1/")
    }
);

ChatCompletion completion = client.CompleteChat(
    new SystemChatMessage("You are a helpful assistant."),
    new UserChatMessage("What is Azure AI?")
);

Console.WriteLine(completion.Content[0].Text);

Verwachte uitvoer:

Azure AI is a comprehensive suite of artificial intelligence services and tools from Microsoft that enables developers to build intelligent applications. It includes services for natural language processing, computer vision, speech recognition, and machine learning capabilities.

Naslaginformatie: OpenAI .NET SDK en DefaultAzureCredential class.

Installeer de OpenAI SDK met npm:

npm install openai

Voor Microsoft Entra ID-verificatie moet u ook het volgende installeren:

npm install @azure/identity

Vervang <resource> door de naam van de Foundry-resource (zoek deze in de Azure-portal of door az cognitiveservices account list uit te voeren). Vervang DeepSeek-V3.1 door uw werkelijke implementatienaam.

import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity";
import { OpenAI } from "openai";

const tokenProvider = getBearerTokenProvider(
    new DefaultAzureCredential(),
    'https://ai.azure.com/.default'
);

const client = new OpenAI({
    baseURL: "https://<resource>.openai.azure.com/openai/v1/",
    apiKey: tokenProvider
});

const completion = await client.chat.completions.create({
    model: "DeepSeek-V3.1", // Required: your deployment name
    messages: [
        { role: "system", content: "You are a helpful assistant." },
        { role: "user", content: "What is Azure AI?" }
    ]
});

console.log(completion.choices[0].message.content);

Verwachte uitvoer:

Azure AI is a comprehensive suite of artificial intelligence services and tools from Microsoft that enables developers to build intelligent applications. It includes services for natural language processing, computer vision, speech recognition, and machine learning capabilities.

Naslaginformatie: OpenAI Node.js SDK en DefaultAzureCredential-klasse.

Voeg de OpenAI SDK toe aan uw project. Controleer de OpenAI Java GitHub opslagplaats voor de nieuwste versie en installatie-instructies.

Voor Microsoft Entra ID-verificatie voegt u ook het volgende toe:

<dependency>
    <groupId>com.azure</groupId>
    <artifactId>azure-identity</artifactId>
    <version>1.18.0</version>
</dependency>

Vervang <resource> door de naam van de Foundry-resource (zoek deze in de Azure-portal). Vervang DeepSeek-V3.1 door uw werkelijke implementatienaam.

import com.openai.client.OpenAIClient;
import com.openai.client.okhttp.OpenAIOkHttpClient;
import com.azure.identity.DefaultAzureCredential;
import com.azure.identity.DefaultAzureCredentialBuilder;
import com.openai.models.chat.completions.*;

DefaultAzureCredential tokenCredential = new DefaultAzureCredentialBuilder().build();

OpenAIClient client = OpenAIOkHttpClient.builder()
    .baseUrl("https://<resource>.openai.azure.com/openai/v1/")
    .credential(BearerTokenCredential.create(
        AuthenticationUtil.getBearerTokenSupplier(
            tokenCredential, 
            "https://ai.azure.com/.default"
        )
    ))
    .build();

ChatCompletionCreateParams params = ChatCompletionCreateParams.builder()
    .addSystemMessage("You are a helpful assistant.")
    .addUserMessage("What is Azure AI?")
    .model("DeepSeek-V3.1") // Required: your deployment name
    .build();

ChatCompletion completion = client.chat().completions().create(params);
System.out.println(completion.choices().get(0).message().content());

Verwachte uitvoer:

Azure AI is a comprehensive suite of artificial intelligence services and tools from Microsoft that enables developers to build intelligent applications. It includes services for natural language processing, computer vision, speech recognition, and machine learning capabilities.

Verwijzing: OpenAI Java SDK en DefaultAzureCredential-klasse.

Verken het API-ontwerp in de referentiesectie om te zien welke parameters beschikbaar zijn. Geef het verificatietoken aan in de header Authorization. In de sectie Chatvoltooiing wordt bijvoorbeeld beschreven hoe u de /chat/completions route gebruikt om voorspellingen te genereren op basis van instructies in chatindeling. Het pad /models is ingesloten in de root van de URL.

Verzoek

Vervang <resource> door de naam van de Foundry-resource (zoek deze in de Azure-portal of door az cognitiveservices account list uit te voeren). Vervang MAI-DS-R1 door uw werkelijke implementatienaam.

De base_url accepteert zowel https://<resource>.openai.azure.com/openai/v1/ als https://<resource>.services.ai.azure.com/openai/v1/ indelingen.

curl -X POST https://<resource>.openai.azure.com/openai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AZURE_OPENAI_AUTH_TOKEN" \
  -d '{
      "model": "MAI-DS-R1",
      "messages": [
      {
        "role": "system",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "Explain what the bitter lesson is?"
      }
    ]
  }'

Reactie

Bij succesvolle verificatie ontvangt u een 200 OK antwoord met voltooide chatresultaten in de antwoordtekst.

{
  "id": "chatcmpl-...",
  "object": "chat.completion",
  "created": 1738368234,
  "model": "MAI-DS-R1",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The bitter lesson refers to a key insight in AI research that emphasizes the importance of general-purpose learning methods that leverage computation, rather than human-designed domain-specific approaches. It suggests that methods which scale with increased computation tend to be more effective in the long run."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 28,
    "completion_tokens": 52,
    "total_tokens": 80
  }
}

Tokens moeten worden uitgegeven met een bereik https://ai.azure.com/.default.

Voor testdoeleinden is de eenvoudigste manier om een geldig token voor uw gebruikersaccount op te halen door de Azure CLI te gebruiken. Voer in een console de volgende Azure CLI opdracht uit:

az account get-access-token --resource https://cognitiveservices.azure.com --query "accessToken" --output tsv

Met deze opdracht wordt een toegangstoken uitgevoerd dat u kunt opslaan in de $AZURE_OPENAI_AUTH_TOKEN omgevingsvariabele.

Naslaginformatie: API voor chatvoltooiingen

Feedback

Is deze pagina nuttig?

Last updated on 2026-04-30

Eindpunten voor Microsoft Foundry-modellen

Inzettingen

Azure OpenAI-deductie-eindpunt

Sleutelloze verificatie

Verwante inhoud

Feedback

Aanvullende resources