Usando um modelo de IA generativo
Dica
Consulte a guia Texto e imagens para obter mais detalhes!
A maneira mais fácil de interagir com um modelo implantado é usar o playground de modelos no portal do Foundry. Você pode usar os Playgrounds do Foundry para experimentar prompts, comparar modelos e capturar configurações de trabalho antes de escrever qualquer código.
Parâmetros principais de configuração
Vários argumentos ou parâmetros de modelo influenciam o comportamento, o desempenho e o custo do runtime. Nas configurações do playground, você pode configurar parâmetros como temperatura, tokens de saída máximos e instruções do sistema. Na interface de chat do playground, você pode enviar prompts e ver as respostas geradas pelo modelo.
- Temperatura: controla a criatividade versus o determinismo.
- Máximo de tokens de saída – limita o comprimento da resposta; afeta o consumo de token e o comportamento de limitação.
- Instruções do sistema – define o comportamento e a função do modelo.
Ao contrário do prompt do usuário, que é a solicitação ou pergunta do usuário final (exemplo: para onde devo viajar?), um prompt do sistema define o comportamento, o tom, as ferramentas e os guardrails para o assistente. Um exemplo de um prompt do sistema é: "Você é um tutor passo a passo útil. Citar fontes. Recusar conselhos médicos."
O playground é uma ponte útil entre o Foundry e o código. Depois de testar prompts representativos, você pode usar os mesmos prompts de sistema e usuário e valores de parâmetro em seu código. O playground fornece código que pode chamar sua implantação do Foundry usando a API de Respostas compatível com OpenAI. O código é essencialmente o que está em execução quando você usa a interface de chat para definir configurações e enviar prompts do usuário.
Você pode usar o código como ponto de partida para criar seu próprio cliente de chat.
Criar um cliente de chat leve usando o SDK do Foundry
Um aplicativo cliente leve é um aplicativo pequeno e mínimo cujo trabalho principal é coletar a entrada do usuário, chamar um serviço/API remoto e exibir resultados, sem estruturas de interface do usuário pesadas, lógica de back-end complexa ou grandes dependências locais. Na prática, normalmente:
- Funciona como uma CLI (interface de linha de comando), pequeno utilitário de desktop ou página da web simples.
- Mantém o estado e a computação principalmente no servidor (o modelo é executado remotamente).
- Tem um pequeno volume de código e uma configuração mínima (geralmente apenas variáveis de ambiente + um script curto).
- É fácil de protótipo, fácil de executar localmente e fácil de estender mais tarde.
Para o Foundry, um cliente de chat leve geralmente é um arquivo Python único que se conecta a um ponto de extremidade do projeto Foundry e envia mensagens de chat para um modelo implantado. O SDK do Foundry expõe um cliente project (operações nativas do Foundry) e um cliente compatível com OpenAI para chamar modelos por meio da API de Respostas. A maioria dos aplicativos usa ambos.
Criar um cliente de chat Python
Depois de criar um projeto do Foundry e implantar um modelo de chat (por exemplo, gpt-4.1), você pode usar o SDK do Foundry. No exemplo, o aplicativo cliente usa a autenticação para se conectar ao ponto de extremidade do modelo, enviar um prompt e exibir a resposta.
# pip install openai>=1.3.0
# pip install azure-ai-projects azure-identity openai
import os
from openai import OpenAI
client = OpenAI(
base_url=f"{os.environ['AZURE_OPENAI_ENDPOINT']}/openai",
api_key=os.environ["AZURE_OPENAI_API_KEY"]
)
response = client.responses.create(
model=os.environ["DEPLOYMENT_NAME"], # e.g., "gpt-4o-mini"
input=[{"role": "system", "content": "You're a helpful assistant."},
{"role": "user", "content": "Summarize the key points from our release notes in 3 bullets."}],
max_output_tokens=300,
temperature=0.7
)
print(response.output_text)
Entender a diferença entre modelos e agentes
No Microsoft Foundry, os modelos e agentes de IA generativos estão relacionados, mas servem a diferentes finalidades. Você pode pensar dessa forma:
- Modelos = inteligência bruta
- Agentes = trabalhadores empacotados e orientados a tarefas criados com base nessa inteligência
Quando você usa um modelo de IA generativo por conta própria:
- Você deseja uma inferência pura: "Use este prompt e gere a saída".
- Você está experimentando no Playground
- Você chama o modelo por meio da API de Respostas do OpenAI
Em seguida, saiba como criar um agente no Foundry.