arquitetura do Microsoft Foundry

Microsoft Foundry organiza workloads de IA por meio de uma arquitetura em camadas: um recurso Foundry de nível superior para governança, projetos para isolamento de desenvolvimento e serviços do Azure conectados para armazenamento, busca e gerenciamento de segredos.

Este artigo fornece às equipes de segurança e operações de TI detalhes sobre o recurso Foundry e a arquitetura de serviço de Azure subjacente, seus componentes e sua relação com outros tipos de recursos Azure. Use essas informações para orientar como personalizar sua implantação do Foundry de acordo com os requisitos da sua organização. Para obter mais informações sobre como distribuir o Foundry em sua organização, consulte o Lançamento do Foundry.

Quando usar essa arquitetura

Considere o modelo de recurso do Foundry quando o cenário envolver:

  • Configuração inicial: você está iniciando um novo projeto de IA e deseja um único recurso que agrupe o acesso ao modelo, a hospedagem do agente e as ferramentas de avaliação.
  • Acesso de várias equipes: várias equipes precisam de projetos isolados com implantações de modelo compartilhado e governança centralizada.
  • Compliance-driven design: Sua organização requer rede privada, criptografia gerenciada pelo cliente ou escopo de Azure RBAC nos níveis de recurso e de projeto.
  • Azure OpenAI migração: você está migrando de um recurso autônomo do Azure OpenAI e deseja manter as políticas existentes e o RBAC ao adicionar capacidades de agente e avaliação.

Para exploração de desenvolvedor único, um recurso foundry com um projeto é o padrão recomendado. Se sua carga de trabalho exigir apenas as funcionalidades de completions do Azure OpenAI, sem a necessidade de hospedagem ou avaliação de agente, um recurso do Azure OpenAI independente poderá ser suficiente.

Tipos de recursos e provedores do Azure AI

Na família de produtos de IA do Azure, você pode usar esses provedores de recursos do Azure que dão suporte às necessidades do usuário em diferentes camadas da pilha.

Provedor de recursos Propósito Serviços com suporte
Microsoft. CognitiveServices Dá suporte ao desenvolvimento de aplicativos Agentic e GenAI compondo e personalizando modelos predefinidos. Fundição; Azure OpenAI; Azure Speech em Ferramentas de Fundição; Azure Language em Ferramentas de Fundição; Azure Vision em Ferramentas de Fundição
Microsoft. Busca Dá suporte à recuperação de conhecimento sobre seus dados Pesquisa de IA do Azure 

Para a maioria dos cenários de desenvolvimento de IA, incluindo criação de agente, implantação de modelo e fluxos de trabalho de avaliação, o recurso Foundry é o ponto de partida recomendado. Os recursos Foundry compartilham o namespace do provedor Microsoft.CognitiveServices com serviços como Azure OpenAI, Fala, Visão e Linguagem. Esse namespace de provedor compartilhado ajuda a alinhar APIs de gerenciamento, padrões de controle de acesso, rede e comportamento de política entre os recursos de IA relacionados.

Use a tabela a seguir para identificar qual tipo de recurso corresponde à carga de trabalho. Ele mostra os tipos e capacidades específicas de recursos no provedor Microsoft.CognitiveServices.

Tipo de recurso Tipo e provedor de recursos Variante Capacidades com suporte
Microsoft Foundry Microsoft.CognitiveServices/accounts AIServices Agentes, avaliações, Azure OpenAI, Fala, Visão, Linguagem e Compreensão de Conteúdo
Projeto de fundimento Microsoft.CognitiveServices/accounts/projects AIServices Subrecurso ao acima
Azure Speech nas ferramentas Foundry Microsoft.CognitiveServices/accounts Speech Fala
Linguagem Azure nas Ferramentas de Foundry Microsoft.CognitiveServices/accounts Language Linguagem
Azure Vision em Ferramentas de Fundição Microsoft.CognitiveServices/accounts Vision Visão

Os tipos de recursos nos mesmos namespaces de fornecedores compartilham as mesmas APIs de gerenciamento e usam ações semelhantes de controle de acesso baseado em função do Azure (Azure RBAC), configurações de rede e aliases para a configuração de Política do Azure. Se você estiver atualizando do Azure OpenAI para o Foundry, as políticas de Azure personalizadas existentes e as ações do RBAC Azure continuarão a ser aplicadas.

Hierarquia de recursos de fundição

O diagrama a seguir mostra um recurso foundry com implantações de modelo, configurações de segurança, conexões e dois projetos. Serviços Azure conectados, como Armazenamento, Key Vault e Pesquisa de IA do Azure , são recursos Azure separados sob seus próprios limites de governança:

Diagrama mostrando a hierarquia de recursos do Foundry com um limite de governança contendo implantações de modelo, configurações de segurança, conexões e dois projetos. Recursos conectados como Armazenamento, Key Vault e Pesquisa de IA do Azure  são mostrados como limites de governança separados.

Importante

Recursos conectados como Armazenamento, Key Vault e Pesquisa de IA do Azure  são recursos independentes Azure com seus próprios limites de governança. Você gerencia as configurações de rede, políticas de acesso e conformidade para esses recursos separadamente do recurso Foundry.

Use esse modelo ao planejar a arquitetura e os limites de acesso:

  • Foundry resource: recurso de Azure de nível superior em que você gerencia configurações de governança, como implantações de rede, segurança e modelo.
  • Project: limite de desenvolvimento dentro do recurso Foundry em que as equipes criam e avaliam casos de uso. Os projetos permitem que as equipes façam protótipos em um ambiente pré-configurado, reutilizando implantações e conexões de modelo existentes sem a configuração de TI repetida.
  • Ativos do projeto: arquivos, agentes, avaliações e artefatos relacionados ao escopo de um projeto.
  • Recursos Conectados: serviços do Azure como Armazenamento, Key Vault e Pesquisa de IA do Azure  aos quais o recurso Foundry faz referência através de conexões. Esses recursos têm limites de governança separados, portanto, você gerencia suas políticas de rede e acesso de forma independente.

Essa separação permite que as equipes de TI apliquem controles centralizados no nível do recurso enquanto as equipes de desenvolvimento trabalham dentro dos limites do nível do projeto.

Nota

A maioria das novas APIs está disponível no escopo do projeto. No entanto, algumas capacidades originalmente suportadas no nível da conta através dos serviços Azure OpenAI, Speech, Vision e Language estão disponíveis apenas no nível de recurso do Foundry, e não no escopo do projeto. Por exemplo, a API de Tradutor está disponível apenas no nível de recurso do Foundry. Planeje sua estrutura de implantação com base em quais escopos de API suas cargas de trabalho exigem.

Separação de responsabilidades impulsionada pela segurança

A Foundry impõe uma separação clara entre operações de gerenciamento e desenvolvimento para garantir cargas de trabalho de IA seguras e escalonáveis.

Governança de recursos de nível superior

O recurso Foundry de nível superior abrange operações de gerenciamento, como configurar a segurança, estabelecer conectividade com outros serviços do Azure e gerenciar implantações. Os contêineres de projeto dedicados isolam as atividades de desenvolvimento e fornecem limites para controle de acesso, arquivos, agentes e avaliações.

Controle de acesso baseado em função

Ações do Azure RBAC refletem essa separação de responsabilidades. As ações do plano de controle, como a criação de implantações e projetos, são distintas das ações do plano de dados, como criar agentes, executar avaliações e carregar arquivos. Você pode definir o escopo de atribuições RBAC tanto no nível de recurso de nível superior quanto no nível de projeto individual. Atribua identidades gerenciadas em qualquer escopo para dar suporte à automação segura e ao acesso ao serviço. Para obter mais informações, consulte o controle de acesso baseado em funções para o Microsoft Foundry.

As atribuições de início comuns para integração de privilégios mínimos incluem:

  • Azure Usuário de IA para cada entidade de usuário do desenvolvedor no escopo do recurso Foundry.
  • Usuário do Azure AI para cada identidade gerenciada de projeto no escopo do recurso Foundry.

Para obter as definições de função e as diretrizes de planejamento de escopo, consulte Controle de acesso baseado em função para Microsoft Foundry.

Monitoramento e observabilidade

Azure Monitor segmenta as métricas por escopo. Você pode exibir as métricas de gerenciamento e uso no recurso de nível superior, enquanto as métricas específicas do projeto, como desempenho de avaliação ou atividade de agente, têm como escopo os contêineres de projeto individuais.

Os principais recursos de monitoramento incluem:

  • Métricas em nível de recurso: consumo de token, latência do modelo, contagens de solicitações e taxas de erro em todos os projetos.
  • Métricas de nível de projeto: resultados da execução de análise, contagens de invocação de agente e atividade de operação de arquivo.
  • Log de diagnóstico: habilite as configurações de diagnóstico para rotear logs para Log Analytics, Armazenamento ou Hubs de Eventos para análise e retenção.

Para obter mais informações, consulte Azure Monitor visão geral.

Infraestrutura de computação

A Foundry gerencia a infraestrutura de computação para hospedagem de modelo, execução de agente e processamento em lote. Esta seção aborda tipos de implantação, infraestrutura de agente e avaliação, integração de rede virtual, isolamento de locatário, controles de segurança de conteúdo e disponibilidade regional.

Tipos de implantação de modelo

A Foundry dá suporte a vários tipos de implantação para hospedagem de modelo, agrupados por escopo de processamento de dados: global (entre regiões), zona de dados (dentro de um limite definido) e regional (região única). Cada tipo equilibra a latência, a taxa de transferência e o local de processamento de dados de forma diferente:

Tipo de implantação Processamento de dados Faturamento
Padrão Global Gerenciamento entre regiões pela Azure Pagamento por token
Globalmente Provisionado Gerenciado pela Azure em várias regiões Capacidade reservada por hora
Lote Global Entre regiões, gerenciado pela Azure Preços do token em lote
Padrão da Zona de Dados Dentro do limite da zona de dados Pagamento por token
Zona de dados provisionada Dentro do limite da zona de dados Capacidade reservada por hora
Lote da Área de Dados Dentro do limite da zona de dados Preços do token em lote
Standard Região única Pagamento por token
Provisionamento Regional Região única Capacidade reservada por hora
Desenvolvedor Qualquer região Azure (sem garantia de residência de dados) Pagamento por token (somente avaliação de modelo ajustada; tempo de vida de 24 horas; sem SLA)

Para obter detalhes sobre como escolher o tipo de implantação correto, consulte Tipos de implantação para modelos do Foundry.

Agentes, avaliações e processamento em lote

Agentes, avaliações e trabalhos em lotes são totalmente gerenciados por Microsoft. As cargas de trabalho do agente são executadas dentro da infraestrutura de contêiner da plataforma, que dá suporte à integração de rede virtual para cenários isolados de rede. As avaliações invocam pontos de extremidade de modelo, comparam saídas com critérios de classificação e armazenam resultados dentro do escopo do projeto. As filas de processamento em lote enfileiram solicitações de inferência para execução assíncrona com preços reduzidos por token. Os resultados dos três tipos de carga de trabalho são acessíveis por meio do portal ou do SDK.

Integração de rede virtual

Quando seus agentes se conectam com sistemas externos, você pode isolar o tráfego de rede usando container injection, em que a plataforma injeta uma sub-rede em sua rede virtual, habilitando a comunicação local com seus recursos Azure na mesma rede virtual.

A Foundry dá suporte a dois modelos de rede para isolamento de saída:

Modelo Como funciona Compromisso
VNet gerenciada pelo cliente (BYO) Você fornece a VNet e uma sub-rede dedicada atribuída a Microsoft.App/environments. A plataforma injeta em sua sub-rede, permitindo a comunicação local com seus recursos de Azure privados. Controle total sobre a configuração de rede; requer seu próprio gerenciamento de rede.
VNet gerenciada (versão prévia) A Foundry gerencia a VNet em seu nome. Configuração mais simples; limita as opções de personalização. Para obter detalhes, consulte Configurar rede virtual gerenciada.

Nota

Alguns cenários isolados de rede exigem o SDK ou a CLI em vez do portal. Por exemplo, implantações com pontos de extremidade privados que bloqueiam todo o acesso público não podem ser configuradas através da interface do usuário do portal. Para obter detalhes, consulte Como configurar um link privado para o Foundry.

Isolamento de locatário

As cargas de trabalho são executadas em ambientes logicamente isolados por recurso do Foundry. O código do cliente não compartilha contêineres de runtime com outros locatários.

Segurança de conteúdo e barreiras de proteção

A Foundry integra os controles de segurança de conteúdo ao pipeline de inferência do modelo e do agente. Guardrails definem riscos para detectar, pontos de intervenção para verificação (entrada do usuário, saída, chamadas de ferramenta (versão prévia) e respostas de ferramenta (versão prévia)) e ações de resposta quando um risco é detectado. Os filtros de conteúdo são executados em linha com as solicitações de modelo e podem ser configurados para cada implantação. Para obter mais informações, consulte a Visão Geral de Guardrails e Controles e Níveis de Severidade de Filtragem de Conteúdo.

Disponibilidade regional

Os recursos de computação variam de acordo com Azure região. A disponibilidade do modelo, as opções de tipo de implantação e o suporte a recursos, como Agentes ou avaliações, podem ser diferentes entre regiões. Confirme se sua região de destino dá suporte aos recursos necessários antes do provisionamento. Para obter a disponibilidade atual, consulte a disponibilidade de recursos entre regiões de nuvem.

Armazenamento de dados

A Foundry fornece opções flexíveis e seguras de armazenamento de dados para dar suporte a uma ampla gama de cargas de trabalho de IA.

Armazenamento gerenciado para upload de arquivo

Na configuração padrão, o Foundry usa contas de armazenamento gerenciadas por Microsoft que são logicamente separadas e dão suporte a uploads de arquivos diretos para casos de uso selecionados, como modelos OpenAI e Agentes, sem a necessidade de uma conta de armazenamento fornecida pelo cliente.

Traga seu próprio armazenamento

Opcionalmente, você pode conectar suas próprias contas de Armazenamento do Azure. Ferramentas de fundição, como avaliações e processamento em lote, podem ler entradas e gravar saídas nessas contas. Para obter detalhes sobre cenários com suporte, consulte Recursos próprios com o serviço Agent.

Armazenamento de estado do agente

  • Com a instalação do agente basic, o serviço Agente armazena threads, mensagens e arquivos no armazenamento multilocatário gerenciado por Microsoft, com separação lógica.
  • Com a configuração do agente padrão, você traz seus próprios recursos de Azure para todos os dados do cliente, incluindo arquivos, conversas e repositórios de vetores. Nessa configuração, os dados são isolados pelo projeto em suas contas de armazenamento.

Criptografia de chave gerenciada pelo cliente

Por padrão, os serviços do Azure criptografam dados em repouso e em trânsito usando chaves gerenciadas pela Microsoft com criptografia AES de 256 bits compatível com FIPS 140-2. Nenhuma alteração de código é necessária.

Para usar suas próprias chaves, confirme esses pré-requisitos antes de habilitar as chaves gerenciadas pelo cliente para o Foundry:

  • Key Vault é implantado na mesma região Azure que o recurso Foundry.
  • Exclusão lógica e proteção contra purga estão habilitadas no Key Vault.
  • As identidades gerenciadas têm permissões de chave necessárias, como a função Key Vault Crypto User ao usar Azure RBAC.

Traga seu próprio Cofre de Chaves

Por padrão, o Foundry armazena todos os segredos de conexão baseados em chave de API em um Azure Key Vault gerenciado. Se você preferir gerenciar segredos por conta própria, conecte o cofre de chaves ao recurso Foundry. Uma conexão Azure Key Vault gerencia todos os segredos de conexão no nível do projeto e do recurso. Para obter mais informações, consulte como configurar uma conexão do Azure Key Vault com o Foundry.

Para saber mais sobre criptografia de dados, consulte as chaves gerenciadas pelo cliente para criptografia com o Foundry.

Residência e conformidade de dados

A Foundry armazena todos os dados inativos na localidade designada do Azure. Os dados de inferência (prompts e completions) são processados de acordo com o tipo de implantação: implantações globais podem ser encaminhadas para qualquer região do Azure, implantações de zona de dados permanecem dentro da zona dos EUA ou da UE, e implantações padrão ou regionais são processadas na região de implantação. Para obter detalhes, consulte Os tipos de implantação. A Foundry não dá suporte ao failover automático entre regiões. Se sua organização exigir disponibilidade de várias regiões, implante recursos do Foundry separados em cada região de destino e gerencie a sincronização e o roteamento de dados na camada do aplicativo. Para obter detalhes de certificação de conformidade, consulte documentação de conformidade do Azure.

Validar decisões de arquitetura

Antes da distribuição, valide o seguinte para seu ambiente de destino: