Microsoft Foundry para IA

Concluído

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

O Microsoft Foundry é uma PaaS (plataforma como serviço) unificada de nível empresarial para criar, implantar e gerenciar aplicativos e agentes de IA. Consolida modelos, orquestração de agente, monitoramento e ferramentas de governança em uma plataforma, oferecendo infraestrutura e segurança de nível de produção.

A Foundry oferece recursos avançados para desenvolvedores, incluindo a capacidade de escolher entre uma ampla gama de modelos, usar esses modelos para criar agentes, conectar esses agentes a ferramentas e integrar o conhecimento usando o IQ do Foundry, o ponto de conexão centralizado para fontes de dados.

Captura de tela de elementos no Foundry, incluindo ícones para modelos, ferramentas, agentes, ferramentas e conhecimento.

Models

A Foundry dá suporte a milhares de modelos, incluindo opções avançadas de primeira parte, de terceiros e de software livre, diretamente de seu catálogo de modelos unificado. Os desenvolvedores podem acessar modelos OpenAI hospedados no Azure, como a família GPT-5 mais recente (GPT-5, GPT-5-mini, GPT-5-nano, GPT-5-chat/5.2-chat) com amplas funcionalidades multimodais e de raciocínio, juntamente com modelos especializados da Anthropic (por exemplo, Claude Opus 4.6/4.5, Sonnet), Mistral, Cohere, Meta LLaMA, DeepSeek, Grok do xAI, Black Forest Labs e modelos fechados (governados por empresas) da Hugging Face.

Os usuários podem procurar milhares de modelos, que vão desde modelos básicos massivos até variantes leves e específicas de domínio, avaliá-los por meio de rankings integrados e ambientes de teste, e gerenciar implantações diretamente na Foundry. O suporte ao ciclo de vida completo permite a implantação por região, tipos de implantação personalizáveis (padrão, provisionado, lote), controle de versão e suporte de governança com IA responsável e segurança de conteúdo.

Agents

No centro do Microsoft Foundry está uma abordagem orientada ao agente, que permite que os desenvolvedores criem agentes inteligentes e focados em tarefas diretamente nos seus projetos no Foundry. Esses agentes podem raciocinar sobre entradas, ferramentas de chamada, interagir com dados e automatizar fluxos de trabalho usando a orquestração interna da plataforma. Foundry lida com a coordenação subjacente, incluindo encadeamento de mensagens, execução de ferramentas, controles de segurança e observabilidade, para que os desenvolvedores possam se concentrar na projeção das metas e funcionalidades do agente. Usando fluxos de trabalho de baixo código ou code-first, as equipes podem criar sistemas de vários agentes que funcionam com recursos de projeto, como documentos, conjuntos de dados, índices de pesquisa e conexões com sistemas externos, incluindo integrações como o Azure Functions ou o Microsoft Fabric.

Tools

A Foundry oferece um conjunto abrangente de serviços do Azure, como fala, visão, linguagem, inteligência de documentos e muito mais. Essas Ferramentas de Foundry fornecem recursos de IA que podem ser integrados a aplicativos web ou móveis de uma maneira fácil de implementar. Há mais de uma dúzia de serviços diferentes que podem ser usados separadamente ou juntos para adicionar energia de IA a aplicativos. Por exemplo, você pode usar a Visão do Azure para analisar imagens, a Linguagem do Azure para resumir texto, classificar informações ou extrair frases-chave e Fala do Azure para converter fala em texto e texto em fala.

Conhecimento

O IQ do Foundry fornece uma camada de conhecimento de várias fontes com reconhecimento de permissão que fornece aos agentes respostas precisas e fundamentadas usando os próprios dados de uma organização. Ele permite que você crie uma base de dados de conhecimento configurável composta por fontes de conhecimento internas e externas, como Armazenamento de Blobs do Azure, SharePoint, OneLake ou dados da Web públicos, e lida automaticamente com indexação, agrupamento de documentos, inserções de vetor e extração de metadados. Quando um agente consulta a base de conhecimento, o Foundry IQ usa a recuperação agêntica para dividir a questão em subconsultas, pesquisar várias fontes em paralelo e retornar informações relevantes, com citações de apoio, ao mesmo tempo em que impõe permissões de usuário e rótulos de confidencialidade do Microsoft Purview. Isso garante que os agentes possam extrair de conteúdo confiável e atualizado e retornar apenas as informações que o usuário está autorizado a ver, fornecendo uma base de dados de conhecimento confiável para fluxos de trabalho de IA corporativos.

Os ativos para sua solução de IA são organizados em um projeto. Cada projeto está contido em um recurso do Foundry, que fornece hospedagem de modelo e os serviços de que seus aplicativos e agentes precisam no Azure.

Recursos e projetos de fundições

Para começar a usar o Foundry, você precisa criar um recurso do Foundry, que fornece hospedagem de modelo e os serviços de que seus aplicativos e agentes precisam. Você pode criar um recurso do Foundry no portal do Azure, no portal do Foundry ou programaticamente com scripts.

Um recurso do Foundry é o recurso do Azure que fornece os recursos da plataforma. Um recurso do Foundry fornece acesso a:

  • Modelos (Microsoft, parceiros e compatíveis com OpenAI)
  • Serviço de agente do Foundry
  • Governança de implantação
  • Monitoramento > observabilidade
  • Limites de segurança
  • Cotas e controles operacionais

Um projeto do Foundry é um workspace dentro desse recurso em que você cria aplicativos, agentes e avaliações de IA. Um Projeto Foundry permite a você criar e gerenciar:

  • Agents
  • Avaliações
  • Arquivos e conjuntos de dados
  • Índices de vetor
  • Fluxos (lógica de IA)
  • Conexões
  • Configurações específicas do projeto

Você pode ter um recurso do Foundry para uma equipe ou departamento e muitos projetos do Foundry dentro dele, cada um focado em um caso de uso de IA separado.

Portal de fundição

O portal do Foundry fornece uma interface moderna baseada na Web para desenvolver, testar e operar soluções de IA. É aqui que você passará muito tempo trabalhando com modelos, agentes e outros ativos.

Captura de tela da página principal do Foundry.

Observação

O portal do Foundry tem uma interface do usuário (interface do usuário) clássica e uma nova interface do usuário. Os dois fornecem experiências ligeiramente diferentes para os usuários. Escolha o novo portal para uma experiência perfeita que combine simplicidade com ferramentas poderosas e seguras para criar, gerenciar e expandir aplicativos multiagentes. Somente projetos do Foundry são visíveis aqui – use classic para todos os outros tipos de recursos. Os usuários podem alternar entre as interfaces clássica e nova, conforme necessário.

No novo portal do Foundry, você pode descobrir modelos e ferramentas, criar agentes, gerenciar a operação desses agentes e muito mais. A qualquer momento, você pode obter ajuda com o assistente Ask AI. A experiência do Ask AI usa sub-agentes especializados para responder perguntas e ajuda com tarefas no Microsoft Foundry. Ele pode orientá-lo por meio da documentação, explicar os recursos do catálogo de modelos, solucionar problemas e gerenciar implantações de modelo, cotas e operações. Ele também compara e analisa modelos, interpreta painéis de monitoramento e dá suporte a fluxos de trabalho de avaliação de ponta a ponta para modelos de linguagem e agentes.

Captura de tela da página Docs do Foundry com o ajudante do agente aberto.

Usando o portal do Foundry para desenvolvimento de aplicativos

Quando você está criando aplicativos no Azure, o Foundry fornece uma plataforma poderosa e versátil para desenvolvimento. Um nome geral para aplicativos (que podem ou não ter recursos de IA) são aplicativos cliente. Um aplicativo cliente é um programa com o qual um usuário interage em seu dispositivo (como um telefone, laptop ou navegador) que envia solicitações para um servidor e exibe os resultados.

Considere o seguinte fluxo de trabalho para usar o portal do Foundry para desenvolver um aplicativo de IA:

  1. Entre no portal do Foundry usando sua assinatura do Azure e crie um projeto do Foundry.
  2. No Foundry, escolha um modelo no Catálogo de Modelos e implante-o. Captura de tela de um modelo selecionado.
  3. No Foundry, experimente o modelo no ambiente de teste. Você pode usar o Playground para gravar prompts, testar respostas de modelo, configurar parâmetros. Captura de tela do modelo no playground do Foundry.
  4. Use o modelo configurado em seu próprio aplicativo cliente.

Um aplicativo cliente de IA utiliza um modelo, dados e lógica de aplicativo para processar e retornar resultados. A lógica do aplicativo é o código ou fluxo de trabalho que envia solicitações para o modelo, recebe a resposta e processa e transforma resultados. Todo o processo é conhecido como uma interação cliente-servidor . Um sistema cliente-servidor fornece a base para como os usuários interagem com sistemas de IA, como as solicitações são processadas e como os resultados são entregues.

Responsabilidades do cliente:

  1. Apresentar uma interface do usuário ou CLI
  2. Coletar entrada do usuário (texto, voz, imagens)
  3. Formatar a entrada em um prompt ou solicitação de API
  4. Enviar uma solicitação para o servidor (ponto de extremidade do modelo)
  5. Exibir a saída retornada

O cliente solicita o modelo de resultados, que é hospedado pelo servidor ou pelo back-end. No Foundry, o servidor é sua implantação de modelo.

Responsabilidades do servidor:

  1. Receber o prompt
  2. Executar inferência no modelo
  3. Aplicar instruções do sistema, segurança, contexto e muito mais
  4. Retornar a saída gerada (por exemplo: texto, imagem, áudio ou JSON estruturado)

Em seguida, vamos dar uma olhada em como os clientes se conectam aos modelos da Foundry e como usar os endpoints da Foundry.