Usando endpoints do Microsoft Foundry

Concluído

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

No Foundry, você pode definir os modelos e agentes que deseja usar em aplicativos de IA personalizados. Como os recursos do Foundry são baseados em nuvem, você pode consumi-los como APIs ( Interfaces de Programação de Aplicativo ) em conexões de Internet por meio de interfaces programáticas.

Observação

Uma API é um conjunto de regras que permite que um aplicativo fale com outro aplicativo ou serviço. Uma API define quais solicitações você pode fazer, quais dados você recebe de volta e como formatar sua solicitação.

Entender pontos de extremidade

Como a maioria dos serviços de nuvem, os recursos do Microsoft Foundry são acessados por meio de um ponto de extremidade de API, representando um ponto de entrada de serviço. O ponto de extremidade tem um endereço HTTP exclusivo, como um site, mas é para o código do aplicativo cliente em vez de usuários humanos com um navegador da Web. Quando você visualiza o ponto de extremidade do seu modelo, ele se parece com:

https://<foundry-project>-resource.cognitiveservices.azure.com/openai/deployments/gpt-4o/chat/completions?api-version=2024-05-01-preview

As interfaces fornecidas no ponto de extremidade são conhecidas como Interfaces de Transferência de Estado Representacional ou interfaces REST para abreviar.

Para manter seus recursos do Foundry seguros, o endpoint é protegido. Os aplicativos só poderão acessá-lo se apresentarem a chave de API correta ou um token confirmando que suas credenciais de ID do Microsoft Entra são válidas. O endpoint e a chave do modelo podem ser encontrados na página de detalhes do Foundry Playground.

Captura de tela do ponto de extremidade do modelo e da chave na página de detalhes do playground do Foundry.

Dois tipos comuns de endpoints na Foundry incluem:

  • Pontos de extremidade a nível de projeto: para trabalhar com seu projeto do Foundry e seus recursos
  • Pontos de extremidade de modelo: para enviar prompts para modelos implantados

Usando pontos de extremidade

Os aplicativos se comunicam com o ponto de extremidade enviando solicitações REST. As solicitações REST consistem em cabeçalhos que contêm metadados, como informações de autenticação e formato de dados, e um corpo que consiste em dados no formato JSON. Por exemplo, uma solicitação pode incluir um prompt inserido por um usuário em um aplicativo de chat, como "O que é um aplicativo de IA?".

curl -X POST https://YOUR-FOUNDRY-RESOURCE-NAME.services.ai.azure.com/api/projects/YOUR-PROJECT-NAME/openai/responses?api-version=2025-11-15-preview \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AUTH_TOKEN" \
-d '{
        "model": "gpt-4.1-mini",
        "input": "What is an AI application?"
}'

Os resultados da solicitação são retornados como uma resposta, também com cabeçalhos e um corpo. Por exemplo, a resposta pode incluir a resposta gerada por um modelo do prompt. A resposta volta em um formato JSON. Uma seção desse JSON pode ter a seguinte aparência:

{
    "metadata": {},
    "temperature": 1,
    "model": "gpt-4.1-mini",
    "object": "response",
    "status": "completed",
    "output": [
        {
            "type": "message",
            "status": "completed",
            "role": "assistant",
            "content": [
                {
                    "type": "output_text",
                    "text": "An AI application is a software program or system that utilizes artificial intelligence technologies to perform tasks that typically require human intelligence. These tasks can include recognizing speech, understanding natural language, making decisions, learning from data, recognizing images, and solving complex problems. AI applications are used in various fields such as healthcare, finance, customer service, autonomous vehicles, and more to enhance efficiency, accuracy, and user experience."
                }
            ]
        }
    ]
}

Embora os desenvolvedores possam escrever código que funcione diretamente com as interfaces REST, a maioria dos desenvolvedores prefere trabalhar com SDKs (kits de desenvolvimento de software) que abstraem as interfaces REST com bibliotecas de código para sua linguagem de programação preferida, como Python, JavaScript ou C#. Esses auxiliares específicos do idioma criam chamadas REST para você.

O ponto de extremidade para seus recursos do Foundry é o ponto central de serviço para aplicativos cliente, permitindo que você crie soluções personalizadas que são apoiadas pela segurança, escalabilidade e confiabilidade da Plataforma de Nuvem do Azure.

Em seguida, vamos tentar criar um recurso do Foundry e usar seu endpoint.