arquitectura de Microsoft Foundry (clásico)

Visualización actual:Versión - Cambio a la versión del nuevo portal de Foundry

Nota

Los vínculos de este artículo pueden abrir contenido en la nueva documentación de Microsoft Foundry en lugar de la documentación de Foundry (clásico) que está viendo ahora.

Microsoft Foundry organiza las cargas de trabajo de inteligencia artificial a través de una arquitectura superpuesta: un recurso foundry de nivel superior para la gobernanza, proyectos para el aislamiento de desarrollo y servicios de Azure conectados para la administración de almacenamiento, búsqueda y secretos.

En este artículo se proporcionan operaciones de TI y equipos de seguridad con detalles sobre el recurso Foundry y la arquitectura del servicio Azure subyacente, sus componentes y su relación con otros tipos de recursos Azure. Use esta información para guiar cómo personalizar la implementación de Foundry en los requisitos de su organización. Para obtener más información sobre cómo implementar Foundry en su organización, consulte Foundry Rollout.

Cuándo usar esta arquitectura

Tenga en cuenta el modelo de recursos foundry cuando el escenario implique lo siguiente:

Configuración por primera vez: va a iniciar un nuevo proyecto de IA y quiere un único recurso que agrupa el acceso al modelo, el hospedaje del agente y las herramientas de evaluación.
Acceso a varios equipos: varios equipos necesitan proyectos aislados con implementaciones de modelos compartidos y gobernanza centralizada.
Diseño impulsado por el cumplimiento: La organización requiere redes privadas, cifrado administrado por el cliente o definición del ámbito de RBAC de Azure a nivel tanto de recursos como de proyectos.
Migración de Azure OpenAI: está transitando de un recurso Azure OpenAI independiente y desea mantener las directivas existentes y el RBAC al agregar capacidades de agente y evaluación.

Para la exploración de un solo desarrollador, un recurso Foundry con un proyecto es el valor predeterminado recomendado. Si la carga de trabajo solo requiere finalizaciones de Azure OpenAI sin hospedaje o evaluación del agente, un recurso de Azure OpenAI independiente podría ser suficiente.

Tipos de recursos de IA de Azure y proveedores

Dentro de la familia de productos Azure AI, puede usar estos proveedores de recursos de Azure que respaldan las necesidades del usuario en diferentes capas del stack.

Proveedor de recursos	Propósito	Servicios compatibles
Microsoft. CognitiveServices	Admite el desarrollo de aplicaciones Agentic y GenAI que componen y personalizan modelos precompilados.	Foundry; Azure OpenAI; Azure Speech en herramientas de Foundry; Azure Language en herramientas de Foundry; Azure Vision en herramientas de Foundry
Microsoft. Búsqueda	Permite la recuperación de información sobre datos.	Búsqueda de Azure AI

Para la mayoría de los escenarios de desarrollo de inteligencia artificial, incluidos los flujos de trabajo de creación de agentes, implementación de modelos y evaluación, el recurso Foundry es el punto de partida recomendado. Los recursos de Foundry comparten el espacio de nombres del proveedor Microsoft.CognitiveServices con servicios como Azure OpenAI, Speech, Vision y Language. Este espacio de nombres de proveedor compartido ayuda a alinear las API de administración, los patrones de control de acceso, las redes y el comportamiento de directivas en los recursos de IA relacionados.

Use la tabla siguiente para identificar qué tipo de recurso coincide con la carga de trabajo. Muestra los tipos de recursos y las capacidades específicas dentro del proveedor Microsoft.CognitiveServices.

Tipo de recurso	Proveedor de recursos y tipo	Tipo	Funcionalidades admitidas
Microsoft Foundry	`Microsoft.CognitiveServices/accounts`	`AIServices`	Agentes, evaluaciones, Azure OpenAI, habla, visión, lenguaje y comprensión de contenido
Proyecto de fundición	`Microsoft.CognitiveServices/accounts/projects`	`AIServices`	Subrecurso del anterior
Azure Speech en Foundry Tools	`Microsoft.CognitiveServices/accounts`	`Speech`	Voz
Idioma Azure en Herramientas Foundry	`Microsoft.CognitiveServices/accounts`	`Language`	Idioma
Azure Vision en Foundry Tools	`Microsoft.CognitiveServices/accounts`	`Vision`	Visión

Los tipos de recursos de los mismos espacios de nombres del proveedor comparten las mismas API de administración y usan acciones de Azure control de acceso basado en rol (Azure RBAC), configuraciones de red y alias para la configuración de Azure Policy. Si va a actualizar desde Azure OpenAI a Foundry, las directivas de Azure personalizadas existentes y las acciones de RBAC de Azure siguen aplicándose.

Jerarquía de recursos de fundición

En el diagrama siguiente se muestra un recurso Foundry con implementaciones de modelos, configuración de seguridad, conexiones y dos proyectos. Los servicios de Azure conectados, como Storage, Key Vault y Búsqueda de Azure AI, son recursos Azure independientes en sus propios límites de gobernanza:

Diagram que muestra la jerarquía de recursos Foundry con un límite de gobernanza que contiene implementaciones de modelos, configuración de seguridad, conexiones y dos proyectos. Los recursos conectados como Storage, Key Vault y Búsqueda de Azure AI se muestran como límites de gobernanza independientes.

Importante

Los recursos conectados, como Storage, Key Vault y Búsqueda de Azure AI, son recursos independientes Azure con sus propios límites de gobernanza. Puede administrar las redes, las directivas de acceso y la configuración de cumplimiento de estos recursos por separado del recurso Foundry.

Use este modelo al planear la arquitectura y los límites de acceso:

Recurso de Foundry: Recurso de Azure de nivel superior en el que administra la configuración de gobernanza, como redes, seguridad y despliegues de modelos.
Project: límite de desarrollo dentro del recurso Foundry donde los equipos crean y evalúan casos de uso. Los proyectos permiten a los equipos crear prototipos dentro de un entorno preconfigurado, reutilizar las implementaciones de modelos existentes y las conexiones sin una configuración repetida de TI.
Project assets: archivos, agentes, evaluaciones y artefactos relacionados dentro del ámbito de un proyecto.
Recursos conectados: servicios de Azure como Storage, Key Vault y Búsqueda de Azure AI a los que hace referencia el recurso Foundry a través de conexiones. Estos recursos tienen límites de gobernanza independientes, por lo que se administran sus directivas de redes y acceso de forma independiente.

Esta separación permite a los equipos de TI aplicar controles centralizados en el nivel de recurso mientras los equipos de desarrollo trabajan dentro de los límites del nivel de proyecto.

Nota

La mayoría de las nuevas API están disponibles en el ámbito del proyecto. Sin embargo, algunas funcionalidades admitidas originalmente en el nivel de cuenta a través de los servicios de Azure OpenAI, Speech, Vision y Language solo están disponibles en el nivel de recurso de Foundry, no en el ámbito del proyecto. Por ejemplo, Translator API solo está disponible en el nivel de recurso Foundry. Planee la estructura de implementación en función de los ámbitos de API que requieran las cargas de trabajo.

Separación de responsabilidades impulsada por la seguridad

Foundry aplica una separación clara entre las operaciones de administración y desarrollo para garantizar cargas de trabajo de inteligencia artificial seguras y escalables.

Gobernanza de recursos de nivel superior

Las operaciones de gestión en el ámbito de los recursos de Foundry de nivel superior incluyen aspectos como la configuración de la seguridad, el establecimiento de la conectividad con otros servicios de Azure y la gestión de implementaciones. Los contenedores de proyectos dedicados aíslan las actividades de desarrollo y proporcionan límites para el control de acceso, los archivos, los agentes y las evaluaciones.

Control de acceso basado en rol

Las acciones de RBAC de Azure reflejan esta separación de preocupaciones. Las acciones del plano de control, como la creación de implementaciones y proyectos, son distintas de las acciones del plano de datos, como la creación de agentes, la ejecución de evaluaciones y la carga de archivos. Puede definir el ámbito de las asignaciones de RBAC tanto en el nivel de recurso de nivel superior como en el nivel de proyecto individual. Asigne identidades administradas en cualquier ámbito para admitir la automatización segura y el acceso al servicio. Para obtener más información, consulte control de acceso basado en roles para Microsoft Foundry.

Entre las asignaciones de inicio comunes para la incorporación con privilegios mínimos se incluyen:

Usuario de Azure AI para cada entidad de seguridad del usuario desarrollador en el ámbito de recursos de Foundry.
Usuario de Azure AI para cada identidad administrada del proyecto en el ámbito de recursos de Foundry.

Para consultar las definiciones de roles y la guía de planificación del alcance, consulte Control de acceso basado en rol para Microsoft Foundry.

Supervisión y observabilidad

Azure Monitor segmenta las métricas por ámbito. Puede ver las métricas de administración y uso en el recurso de nivel superior, mientras que las métricas específicas del proyecto, como el rendimiento de evaluación o la actividad del agente, se limitan a los contenedores de proyectos individuales.

Entre las funcionalidades clave de supervisión se incluyen:

Métricas de nivel de recurso: consumo de tokens, latencia del modelo, recuentos de solicitudes y tasas de errores en todos los proyectos.
Métricas a nivel de proyecto: resultados de las ejecuciones de evaluación, conteos de invocación del agente y actividad de operaciones de archivo.
Registro de diagnóstico: habilite la configuración de diagnóstico para enrutar los registros a Log Analytics, Storage o Event Hubs para el análisis y la retención.

Para obtener más información, consulte Azure Monitor overview.

Infraestructura informática

Foundry administra la infraestructura de proceso para el hospedaje de modelos, la ejecución del agente y el procesamiento por lotes.

Tipos de implementación de modelos

La implementación estándar en recursos de Foundry proporciona arquitectura de hospedaje de modelos.

Cómputo administrado para agentes y evaluaciones

Los agentes, las evaluaciones y los trabajos por lotes se ejecutan como computación en contenedores gestionada, totalmente administrada por Microsoft. Las evaluaciones invocan los puntos de conexión del modelo y comparan las salidas con los criterios de calificación. Foundry almacena los resultados dentro del ámbito del proyecto, accesible a través del portal o el SDK.

Integración de red virtual

Cuando los agentes se conectan con sistemas externos, puede aislar el tráfico de red mediante la inyección de container, donde la plataforma inserta una subred en la red virtual, lo que permite la comunicación local con los recursos de Azure dentro de la misma red virtual.

Foundry admite dos modelos de red para el aislamiento de salida:

Modelo	Cómo funciona	Compromiso
Red virtual administrada por el cliente (BYO)	Proporcionas el VNet y una subred dedicada delegada a `Microsoft.App/environments`. La plataforma inyecta en su subred, permitiendo la comunicación local con sus recursos privados de Azure.	Control total sobre la configuración de red; requiere su propia administración de red.
Red virtual administrada (versión preliminar)	Foundry administra la red virtual en su nombre.	Configuración más sencilla; limita las opciones de personalización. Para más información, consulte Configuración de una red virtual administrada.

Nota

Algunos escenarios aislados de red requieren el SDK o la CLI en lugar del portal. Por ejemplo, las implementaciones con puntos de conexión privados que bloquean todo el acceso público no se pueden configurar a través de la interfaz de usuario del portal. Para obtener más información, consulte Configuración de un vínculo privado para Foundry.

Aislamiento de inquilinos

La computación gestionada por Microsoft ejecuta cargas de trabajo en entornos aislados lógicamente para cada proyecto. El código del cliente no comparte contenedores en tiempo de ejecución con otros inquilinos.

Seguridad y barreras de protección del contenido

Foundry integra controles de seguridad de contenido en la canalización de inferencia de modelos y agentes. Los límites de protección definen riesgos para detectar, puntos de intervención para examinar (entrada de usuario, salida, llamadas a herramientas (versión preliminar) y respuestas de herramientas (versión preliminar) y acciones de respuesta cuando se detecta un riesgo. Los filtros de contenido se ejecutan en línea con solicitudes de modelo y se pueden configurar por implementación. Para obtener más información, consulte Información general sobre los límites y controles de protección y Niveles de gravedad de filtrado de contenido.

Escalado

La computación gestionada para agentes y evaluaciones se escala automáticamente según la demanda de la carga de trabajo. El hospedaje de modelos se escala en función de la configuración de implementación.

Disponibilidad regional

Las funcionalidades de proceso varían según Azure región. La disponibilidad del modelo, las opciones de tipo de implementación y la compatibilidad con características, como agentes o evaluaciones, pueden diferir entre regiones. Confirme que la región de destino admite las funcionalidades necesarias antes del aprovisionamiento. Para obtener la disponibilidad actual, consulte Disponibilidad de características entre regiones en la nube.

Almacenamiento de datos

Foundry proporciona opciones de almacenamiento de datos flexibles y seguras para admitir una amplia gama de cargas de trabajo de inteligencia artificial.

Almacenamiento administrado para la carga de archivos

En la configuración predeterminada, Foundry usa cuentas de almacenamiento administradas Microsoft que están separadas lógicamente y admiten cargas directas de archivos para casos de uso seleccionados, como modelos y agentes de OpenAI, sin necesidad de una cuenta de almacenamiento proporcionada por el cliente.

Traiga su propio almacenamiento

Opcionalmente, puede conectar sus propias cuentas de Azure Storage. Las herramientas de fundición, como las evaluaciones y el procesamiento por lotes, pueden leer entradas desde y escribir salidas en estas cuentas. Para más información sobre los escenarios admitidos, consulte Bring-your-own resources with the Agent service (Traiga sus propios recursos con el servicio del agente).

Almacenamiento de estado del agente

Con la configuración básica del agente , el servicio de agente almacena subprocesos, mensajes y archivos en un almacenamiento multiinquilino administrado por Microsoft, con separación lógica.
Con la configuración del agente estándar , use sus propios recursos de Azure para todos los datos del cliente, incluidos archivos, conversaciones y almacenes de vectores. En esta configuración, el proyecto aísla los datos dentro de las cuentas de almacenamiento.

Cifrado de claves administradas por el cliente

De forma predeterminada, los servicios de Azure cifran los datos en reposo y en tránsito mediante claves administradas por Microsoft con cifrado AES de 256 bits compatible con FIPS 140-2. No se requieren cambios en el código.

Para usar sus propias claves en su lugar, confirme estos requisitos previos antes de habilitar las claves administradas por el cliente para Foundry:

Key Vault se implementa en la misma región de Azure que el recurso Foundry.
La eliminación temporal y la protección de purga están habilitadas en el Key Vault.
Las identidades administradas tienen permisos de clave necesarios, como el rol Key Vault Crypto User al usar Azure RBAC.

Traiga su propio Key Vault

De forma predeterminada, Foundry almacena todos los secretos de conexión basados en claves de API en un Azure Key Vault administrado. Si prefiere administrar los secretos usted mismo, conecte su bóveda de claves al recurso Foundry. Una conexión de Azure Key Vault administra todos los secretos de conexión a nivel de proyecto y recursos. Para obtener más información, consulte cómo configurar una conexión de Azure Key Vault a Foundry.

Para más información sobre el cifrado de datos, consulte Claves administradas por el cliente para el cifrado con Foundry.

Residencia y cumplimiento de datos

Foundry almacena todos los datos en reposo en la zona geográfica designada Azure. Los datos de inferencia (avisos y finalizaciones) se procesan según el tipo de implementación: las implementaciones globales pueden enrutar a cualquier región de Azure, las implementaciones de zona de datos permanecen dentro de la zona de EE. UU. o UE, y las implementaciones estándar o regionales se procesan en su región de implementación correspondiente. Para obtener más información, consulte Tipos de implementación. Foundry no admite la conmutación automática por error entre regiones. Si su organización requiere disponibilidad en varias regiones, implemente recursos de Foundry independientes en cada región de destino y administre la sincronización y el enrutamiento de datos en el nivel de aplicación. Para obtener más información sobre la certificación de cumplimiento, consulte Azure documentación de cumplimiento.

Validar decisiones de arquitectura

Antes de la implementación, valide lo siguiente para el entorno de destino:

Compruebe que los modelos y características necesarios están disponibles en las regiones de implementación. Para más información, consulte Disponibilidad de características entre regiones en la nube.
Compruebe que las asignaciones de roles tienen un ámbito correcto en los niveles de recursos y proyectos de Foundry. Para obtener más información, consulte el control de acceso basado en roles para Microsoft Foundry.
Valide los requisitos de aislamiento de red y las rutas de acceso privado. Para obtener más información, consulte Configuración de un vínculo privado para Foundry.
Confirme los requisitos de cifrado y administración de secretos, incluidas las claves administradas por el cliente y la integración de Azure Key Vault. Para obtener más información, consulte Claves administradas por el cliente para el cifrado con Foundry y cómo configurar una conexión de Azure Key Vault a Foundry.
Revise las cuotas y los límites de los recursos de destino, incluidos los límites de implementación del modelo y los límites de velocidad. Para obtener más información, consulte cuotas y límites de Azure OpenAI y límites, cuotas y regiones del servicio de agentes.

Despliegue de Foundry en mi organización
control de acceso basado en roles para Microsoft Foundry
Claves administradas por el cliente para el cifrado con Foundry
Configuración de un vínculo privado para Foundry
Traiga sus propios recursos con el servicio agente
Introducción a Azure Monitor
Cuotas y límites de Azure OpenAI
Tipos de implementación para Modelos Foundry
Información general sobre los límites de protección y los controles
Disponibilidad de características en regiones de la nube

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-29

arquitectura de Microsoft Foundry (clásico)

Cuándo usar esta arquitectura

Tipos de recursos de IA de Azure y proveedores

Jerarquía de recursos de fundición

Separación de responsabilidades impulsada por la seguridad

Gobernanza de recursos de nivel superior

Control de acceso basado en rol

Supervisión y observabilidad

Infraestructura informática

Tipos de implementación de modelos

Cómputo administrado para agentes y evaluaciones

Integración de red virtual

Aislamiento de inquilinos

Seguridad y barreras de protección del contenido

Escalado

Disponibilidad regional

Almacenamiento de datos

Almacenamiento administrado para la carga de archivos

Traiga su propio almacenamiento

Almacenamiento de estado del agente

Cifrado de claves administradas por el cliente

Traiga su propio Key Vault

Residencia y cumplimiento de datos

Validar decisiones de arquitectura

Contenido relacionado

Comentarios

Recursos adicionales