Usando um modelo de IA generativo

4 minutos

Dica

Consulte a guia Texto e imagens para obter mais detalhes!

A maneira mais fácil de interagir com um modelo implantado é usar o playground de modelos no portal do Foundry. Você pode usar os Playgrounds do Foundry para experimentar prompts, comparar modelos e capturar configurações de trabalho antes de escrever qualquer código.

Captura de tela dos playgrounds do Foundry.

Parâmetros principais de configuração

Vários argumentos ou parâmetros de modelo influenciam o comportamento, o desempenho e o custo do runtime. Nas configurações do playground, você pode configurar parâmetros como temperatura, tokens de saída máximos e instruções do sistema. Na interface de chat do playground, você pode enviar prompts e ver as respostas geradas pelo modelo.

Temperatura: controla a criatividade versus o determinismo.
Máximo de tokens de saída – limita o comprimento da resposta; afeta o consumo de token e o comportamento de limitação.
Instruções do sistema – define o comportamento e a função do modelo.

Ao contrário do prompt do usuário, que é a solicitação ou pergunta do usuário final (exemplo: para onde devo viajar?), um prompt do sistema define o comportamento, o tom, as ferramentas e os guardrails para o assistente. Um exemplo de um prompt do sistema é: "Você é um tutor passo a passo útil. Citar fontes. Recusar conselhos médicos."

O playground é uma ponte útil entre o Foundry e o código. Depois de testar prompts representativos, você pode usar os mesmos prompts de sistema e usuário e valores de parâmetro em seu código. O playground fornece código que pode chamar sua implantação do Foundry usando a API de Respostas compatível com OpenAI. O código é essencialmente o que está em execução quando você usa a interface de chat para definir configurações e enviar prompts do usuário.

Captura de tela do exemplo de código no portal do Foundry baseado no playground.

Você pode usar o código como ponto de partida para criar seu próprio cliente de chat.

Criar um cliente de chat leve usando o SDK do Foundry

Um aplicativo cliente leve é um aplicativo pequeno e mínimo cujo trabalho principal é coletar a entrada do usuário, chamar um serviço/API remoto e exibir resultados, sem estruturas de interface do usuário pesadas, lógica de back-end complexa ou grandes dependências locais. Na prática, normalmente:

Funciona como uma CLI (interface de linha de comando), pequeno utilitário de desktop ou página da web simples.
Mantém o estado e a computação principalmente no servidor (o modelo é executado remotamente).
Tem um pequeno volume de código e uma configuração mínima (geralmente apenas variáveis de ambiente + um script curto).
É fácil de protótipo, fácil de executar localmente e fácil de estender mais tarde.

Para o Foundry, um cliente de chat leve geralmente é um arquivo Python único que se conecta a um ponto de extremidade do projeto Foundry e envia mensagens de chat para um modelo implantado. O SDK do Foundry expõe um cliente project (operações nativas do Foundry) e um cliente compatível com OpenAI para chamar modelos por meio da API de Respostas. A maioria dos aplicativos usa ambos.

Criar um cliente de chat Python

Depois de criar um projeto do Foundry e implantar um modelo de chat (por exemplo, gpt-4.1), você pode usar o SDK do Foundry. No exemplo, o aplicativo cliente usa a autenticação para se conectar ao ponto de extremidade do modelo, enviar um prompt e exibir a resposta.

# pip install openai>=1.3.0
# pip install azure-ai-projects azure-identity openai

import os
from openai import OpenAI

client = OpenAI(
    base_url=f"{os.environ['AZURE_OPENAI_ENDPOINT']}/openai",
    api_key=os.environ["AZURE_OPENAI_API_KEY"]
)

response = client.responses.create(
    model=os.environ["DEPLOYMENT_NAME"],          # e.g., "gpt-4o-mini"
    input=[{"role": "system", "content": "You're a helpful assistant."},
           {"role": "user", "content": "Summarize the key points from our release notes in 3 bullets."}],
    max_output_tokens=300,
    temperature=0.7
)

print(response.output_text)

Entender a diferença entre modelos e agentes

No Microsoft Foundry, os modelos e agentes de IA generativos estão relacionados, mas servem a diferentes finalidades. Você pode pensar dessa forma:

Modelos = inteligência bruta
Agentes = trabalhadores empacotados e orientados a tarefas criados com base nessa inteligência

Quando você usa um modelo de IA generativo por conta própria:

Você deseja uma inferência pura: "Use este prompt e gere a saída".
Você está experimentando no Playground
Você chama o modelo por meio da API de Respostas do OpenAI

Em seguida, saiba como criar um agente no Foundry.

Comentários

Esta página foi útil?