¿Qué es Azure Content Understanding in Foundry Tools?

Nota

Content Understanding ahora es un servicio disponible con carácter general (GA) con el lanzamiento de la versión 2025-11-01 de API. Para obtener más información, consulte Novedades.

Azure Content Understanding in Foundry Tools es un Foundry Tool que está disponible como parte de la Microsoft Foundry Resource en el portal de Azure. Usa ia generativa para procesar e ingerir muchos tipos de contenido, incluidos documentos, imágenes, vídeos y audio, en un formato de salida definido por el usuario. Content Understanding ofrece un proceso simplificado para razonar sobre grandes cantidades de datos no estructurados, lo que acelera el tiempo a valor mediante la generación de una salida que se puede integrar en flujos de trabajo de automatización y análisis.

Captura de pantalla de información general, proceso y flujo de trabajo de Content Understanding.

¿Por qué usar Content Understanding?

Content Understanding acelera la obtención de valor al habilitar el procesamiento directo de datos no estructurados con puntuaciones de confianza, que minimiza la revisión manual y reduce los costos operativos. Entre las principales ventajas se incluyen las siguientes:

  • Simplifique y optimice los flujos de trabajo. Content Understanding estandariza la extracción y clasificación del contenido, la estructura y la información de varios tipos de contenido en un proceso unificado.

  • Simplificación de la extracción de campos. La extracción de campos de Content Understanding facilita la generación de resultados estructurados a partir de contenido no estructurado. Defina un esquema para extraer, clasificar o generar valores de campo sin ingeniería de mensajes compleja.

  • Mejorar la precisión. Content Understanding emplea varios modelos de inteligencia artificial para analizar y validar la información simultáneamente, lo que da lugar a resultados más precisos y confiables.

  • Puntuaciones de confianza y fundamentación. Content Understanding garantiza la precisión de los valores extraídos a la vez que minimiza el costo de la revisión humana.

  • Clasificar tipos de contenido. Content Understanding permite clasificar los tipos de documento para simplificar la capacidad de procesar el contenido. Esta característica ya está disponible en un enfoque unificado en analyze API.

  • Analizadores precompilados específicos del sector. Content Understanding incluye analizadores predefinidos diseñados para escenarios específicos de la industria, como la preparación fiscal, el procesamiento de documentos de adquisiciones, el análisis de contratos, el análisis de centros de llamadas, el análisis de medios y mucho más.

Casos de uso de Content Understanding

  • Procesamiento inteligente de documentos (IDP). Content Understanding permite el procesamiento inteligente de documentos mediante la conversión de documentos no estructurados en datos estructurados con alta precisión. Las puntuaciones de confianza y las funcionalidades de puesta a tierra garantizan la calidad de los datos al tiempo que minimizan la revisión manual y reducen los costos operativos. Por ejemplo, automatice el procesamiento de facturas, el análisis de contratos y la administración de notificaciones mediante la extracción y validación de campos de documentos complejos.

  • Aplicaciones agénticas. Comprensión de Contenido convierte entradas de archivos multimodales desordenadas en entradas predecibles y estandarizadas. Ofrece representaciones de Markdown limpias para los flujos de trabajo de razonamiento y conocimiento, asegurando claridad y contexto para las tareas posteriores. Cuando se requieren datos estructurados, proporciona campos clave-valor alineados con esquemas con puntuaciones de confianza y base, lo que permite a los agentes automatizar las decisiones con precisión y auditabilidad.

  • Generación aumentada por búsqueda y recuperación (RAG). Content Understanding permite la ingesta de contenido de cualquier modalidad en un índice de búsqueda, con un amplio soporte para la descripción y el análisis de figuras para hacer tus datos más accesibles. El servicio de Comprensión de Contenidos ofrece varios analizadores predefinidos que están optimizados para proporcionarle las mejores salidas para los escenarios de búsqueda RAG.

  • Automatización de procesos robóticos (RPA). Content Understanding se integra perfectamente con los flujos de trabajo de RPA proporcionando datos estructurados extraídos de varios tipos de contenido. Esta funcionalidad permite la automatización de un extremo a otro de los procesos empresariales que requieren comprensión del contenido, como el procesamiento de pedidos, la incorporación de clientes y los flujos de trabajo de cumplimiento normativo.

  • Análisis e informes: las salidas de campo extraídas de Content Understanding mejoran el análisis y los informes, lo que permite a las empresas obtener información valiosa, realizar análisis más profundos y tomar decisiones fundamentadas basadas en informes precisos.

  • Optimización del flujo de trabajo a través de la clasificación: la característica de clasificación de Content Understanding permite clasificar primero los documentos antes de enrutarlos al analizador asociado para la extracción.

Aplicaciones específicas del sector

Algunas aplicaciones comunes específicas del sector para Content Understanding incluyen:

Aplicación Descripción
Automatización fiscal Las empresas de preparación fiscal pueden usar Content Understanding para generar una vista unificada de la información de varios documentos y crear declaraciones fiscales completas.
Procesamiento de solicitudes hipotecas Analice la documentación complementaria y las solicitudes de hipotecas para determinar si un posible comprador de viviendas proporcionó toda la documentación necesaria para proteger una hipoteca.
Comprobación del contrato de factura Revise cuidadosamente las facturas y los contratos contractuales con los clientes. Aplique un proceso de razonamiento de varios pasos para analizar los datos. Asegúrese de que las conclusiones, como validar la coherencia entre la factura y el contrato, sean precisas y exhaustivas.
Ingesta de generación aumentada de recuperación (RAG) Las organizaciones pueden mejorar sus flujos de trabajo RAG extrayendo información detallada de documentos que, de lo contrario, se perderían. Las descripciones de las figuras capturan información de gráficos, diagramas y visualizaciones, lo que facilita su búsqueda. El análisis de diseño conserva la estructura del documento, incluidas las tablas, las secciones y las jerarquías. La detección de anotaciones captura notas manuscritas, subrayados y tachaduras.
Análisis posterior a llamadas Las empresas y los centros de llamadas pueden generar información a partir de grabaciones de llamadas para realizar un seguimiento de los indicadores clave de rendimiento (KPI), mejorar la experiencia del producto, generar información empresarial, crear experiencias de cliente diferenciadas y responder a consultas más rápidas y precisas.
Administración de recursos multimedia Los proveedores de software y multimedia pueden usar Content Understanding para extraer información más completa y dirigida de vídeos para soluciones de administración de recursos multimedia.
Soporte técnico al cliente mejorado Las empresas con canales de soporte técnico pueden usar Content Understanding para la búsqueda RAG para mejorar la calidad de las respuestas basadas en datos de problemas anteriores y comentarios de los clientes.

Componentes clave de Content Understanding

El marco Content Understanding procesa contenido no estructurado a través de varias fases, transformando las entradas en salidas estructuradas y accionables. En la tabla siguiente se describe cada componente de izquierda a derecha, como se muestra en el diagrama:

Diagrama que muestra el marco de Comprensión de Contenido con entradas que fluyen a través de analizadores a resultados estructurados.

Componente Descripción
Entradas Contenido de origen que procesa Content Understanding. Admite varias modalidades, como Documentos, Imágenes, Vídeo y Audio. Obtenga más información sobre los tipos de archivo de entrada.
Analizador Componente principal que define cómo se procesa el contenido. Configura las opciones de extracción de contenido, el esquema de extracción de campos y las implementaciones de modelos. Una vez configurado, el analizador aplica de forma coherente estas opciones a todos los datos entrantes. Content Understanding ofrece analizadores creados previamente para escenarios comunes y admite analizadores personalizados adaptados a sus necesidades. Obtenga más información sobre los analizadores, los analizadores creados previamente y los analizadores personalizados.
Extracción de contenido Transforma la entrada no estructurada en metadatos y texto estructurado normalizado. Extrae texto mediante el reconocimiento óptico de caracteres (OCR), identifica marcas de selección y códigos de barras, detecta fórmulas y reconoce elementos de diseño como párrafos, secciones y tablas. Para audio y vídeo, transcribe la voz e identifica los elementos visuales clave. Obtenga más información sobre la extracción de contenido.
Segmentación Divide documentos o vídeos en secciones lógicas para el procesamiento dirigido. Configurado mediante la enableSegment propiedad en el esquema del analizador. Permite dividir el contenido en fragmentos significativos, como dividir un documento por tipo de documento o dividir un vídeo en escenas. Obtenga más información sobre la segmentación y la clasificación.
Extracción de campos Genera pares clave-valor estructurados en función del esquema definido. Consulte Límites de servicio para los tipos de campo admitidos. Los campos se pueden generar a través de tres métodos:

Extraer: extraer directamente los valores tal como aparecen en el contenido de entrada (solo compatible con documentos), como fechas de recibos o detalles de artículos de facturas.

Clasificar: clasificar el contenido de un conjunto predefinido de categorías, como el sentimiento de la llamada o el tipo de gráfico, y derivarlo al analizador correcto para su análisis.

Generar: generar valores libremente a partir de datos de entrada, como resumir una conversación de audio o crear descripciones de escena a partir de vídeos.

Obtenga más información sobre la extracción de campos.
Puntuaciones de confianza Proporciona estimaciones de confiabilidad de 0 a 1 para cada valor de campo extraído. Las puntuaciones altas indican la extracción de datos precisa, lo que permite el procesamiento directo en flujos de trabajo de automatización. Habilitado mediante la configuración estimateFieldSourceAndConfidence en los analizadores de documentos. Obtenga más información sobre las puntuaciones de confianza.
Puesta a tierra Identifica las regiones específicas del contenido donde se extrajo o generó cada valor. La referencia de origen permite a los usuarios en escenarios de automatización comprobar rápidamente la exactitud de los valores de campo, rastreándolos hasta su origen en el contenido. Habilitado mediante la configuración estimateFieldSourceAndConfidence en los analizadores de documentos. Obtenga más información sobre la puesta en tierra.
Contextualización La capa de contextualización prepara el contexto para los modelos generativos y postprocesa su salida. Incluye normalización y formato de salida, cálculo de base de origen, cálculo de puntuación de confianza e ingeniería de contexto para optimizar el uso del modelo. Más información sobre la contextualización.
Modelos de fundición Los modelos de lenguaje de gran tamaño (LLM) de Foundry y modelos de embeddings que impulsan capacidades generativas. Traiga sus propias implementaciones de modelos generativos admitidos y modelos de inserción de texto para ejemplos de entrenamiento. Content Understanding usa estos modelos para la extracción de campos, el análisis de figuras y otras características con tecnología de inteligencia artificial. Obtenga más información sobre los modelos e implementaciones.
Salida estructurada El resultado final se proporciona en el formato elegido. El contenido se puede generar como Markdown para escenarios de búsqueda y recuperación, o como JSON estructurado que coincida con el esquema definido para flujos de trabajo de automatización y análisis.

Experiencias de comprensión del contenido

Content Understanding es un servicio Foundry. Para usar Content Understanding, debe crear un recurso Azure Foundry. Content Understanding Studio complementa la experiencia de Foundry si necesita funcionalidades avanzadas. Para obtener un desglose más detallado de cada servicio, consulte Comparación de características: Comprensión del contenido en Foundry frente a Content Understanding Studio.

  • Comprensión de contenido en el portal de Foundry (nuevo) (próximamente): el portal Foundry NextGen le permite crear flujos de trabajo avanzados y completos con la herramienta de comprensión de contenido.
  • Content Understanding Studio: una experiencia de usuario complementaria, Content Understanding Studio permite una transición fluida si va a pasar de Document Intelligence. Ofrece una experiencia optimizada para mejorar el rendimiento del analizador, incluida la mejora de los analizadores personalizados mediante técnicas de etiquetado de datos. También admite la creación de analizadores personalizados basados en clasificación.

Inteligencia artificial responsable

Content Understanding está diseñado para protegerse contra el procesamiento de contenido dañino, como la violencia gráfica y el gore, el discurso odioso y el acoso, la explotación, el abuso y mucho más. El servicio usa la infraestructura de Foundry estándar, incluida la Seguridad del contenido de Azure AI, integrando los resultados de seguridad del contenido en la salida de Content Understanding. Para obtener más información y una lista completa de contenido prohibido, vea la nota de transparencia y el Código de conducta.

Filtrado de contenido y barreras de protección

Content Understanding expone los resultados del filtro de contenido directamente desde la implementación del modelo Foundry que usa. Cada implementación del modelo Foundry tiene una instancia de Guardrails asociada que evalúa tanto las indicaciones enviadas al modelo como las finalizaciones devueltas. Cuando la instancia de Guardrails marca el contenido, el resultado se incluye en la respuesta de análisis de Content Understanding como un content_filters array.

Para cambiar el comportamiento de filtrado de contenido de los analizadores, actualice la instancia de Guardrails asociada a la implementación del modelo en el proyecto de Fundición de IA de Azure. Puede ajustar los umbrales de cada categoría o cambiar del bloqueo al modo de anotación. Para obtener más información, consulte Filtrado de contenido.

Puede modificar los filtros de contenido para ajustar la gravedad bloqueada o anotar en lugar de bloquear el contenido, lo que le permite controlar el contenido potencialmente dañino en su propio flujo de trabajo.

Para obtener más información sobre los tipos de filtro de contenido, vea Tipos de filtro de contenido.

Importante

Funcionalidades de Face

Content Understanding proporciona funcionalidades de descripción facial que pueden generar descripciones detalladas de caras en contenido de vídeo e imagen. Cuando se habilita, el modelo generativo describe atributos faciales como el cabello facial y la expresión facial, y puede identificar personas destacadas o celebridades. Obtenga más información sobre la descripción de la cara en el procesamiento de vídeo.

Privacidad y seguridad de los datos

Consulte las directivas de Microsoft sobre los datos de los clientes al usar el servicio "Content Understanding". Para obtener más información, visite la página Datos, protección y privacidad .

Importante

Si usa Microsoft productos o servicios para procesar datos biométricos, usted es responsable de: (i) proporcionar aviso a los interesados, incluido con respecto a los períodos de retención y destrucción; (ii) obtener consentimiento de los interesados; y (iii) eliminar los datos biométricos, todos según corresponda, y requeridos en los requisitos de protección de datos aplicables. Para obtener información relacionada, consulte Datos y privacidad de Face.

Comenzar

Use estas guías de inicio rápido para empezar: