Azure Content Understanding en las cuotas y límites del servicio Foundry Tools

Nota

Las versiones 2024-12-01-preview de las API de Content Understanding y 2025-05-01-preview están actualmente en versión preliminar pública. Estas versiones preliminares se proporcionan sin un contrato de nivel de servicio y no se recomiendan para cargas de trabajo de producción. Para obtener más información, consulte los Términos Suplementarios de uso para las versiones preliminares de Microsoft Azure y el Anexo de Protección de Datos de Productos y Servicios de Microsoft ("DPA").

En este artículo se enumeran las cuotas y los límites del servicio Azure Content Understanding en Foundry Tools.

Límites generales

Propiedad Límite
Identificador del analizador 1-64 caracteres. Alfanumérico, punto y subrayado. Patrón: [a-zA-Z0-9._]{1,64}
Propiedades de dirección URL ≤ 8.192 caracteres
Propiedades de descripción ≤ 1024 caracteres
Nombres de campo ≤ 64 caracteres. Letras Unicode, números, marcas combinables, puntuación conectiva, punto, guion y subrayado. Patrón: [\p{L}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}._-]{1,64}
Etiquetas ≤ 10 etiquetas
Clave de etiqueta ≤ 64 caracteres. Caracteres alfanuméricos y + - . : = _ /. Patrón: [a-zA-Z0-9+-.:=_/]{1,64}
Valor de etiqueta ≤ 256 caracteres. Caracteres alfanuméricos y + - . : = _ /. Puede estar vacío. Patrón: [a-zA-Z0-9+-.:=_/]{0,256}
ID de referencia de imagen ≤ 256 caracteres

Límites de recursos

Cuota Estándar (S0)
Número máximo de analizadores 100,000
Análisis máximo/min 1000 páginas/imágenes
Cuatro horas de audio
Cuatro horas de vídeo
Máximo número de operaciones por minuto 3,000

Modelos generativos admitidos

Content Understanding se conecta a Foundry Models para funcionalidades generativas. El servicio agrega periódicamente compatibilidad con más modelos. Para más información, consulte Conexión del analizador de Content Understanding a las implementaciones de modelos de Foundry.

Los modelos admitidos actualmente son:

Tipo de modelo Modelo Versión
Finalización del chat gpt-4o 2024-08-06
Finalización del chat gpt-4o 2024-11-20
Finalización del chat gpt-4o-mini 2024-11-20
Finalización del chat gpt-4.1 2025-04-14
Finalización del chat gpt-4.1-mini 2025-04-14
Finalización del chat gpt-4.1-nano 2025-04-14
Embeddings inserción de texto-3-small
Embeddings inserción de texto-3-large
Embeddings text-embedding-ada-002

Límites de archivos de entrada

Documento y texto

Tipos de archivo admitidos Tamaño del archivo Longitud Medidor de extracción
.pdf
.tiff
.jpg, .jpeg, .jpe, .png, .bmp, .heif, .heic
≤ 200 MB ≤ 300 páginas Básico (OCR) o Estándar (diseño)
.docx, .xlsx, .pptx ≤ 200 MB ≤ 1M caracteres Mínimo
.txt
.html, .md, .rtf
.eml, .msg
.xml
≤ 1 MB ≤ 1M caracteres Mínimo

Recuento de páginas para archivos no paginados: Para fines de facturación, Content Understanding usa reglas equivalentes a páginas: archivos de texto y archivos de correo electrónico (TXT, HTML, MD, XML, MSG, EML) cuentan 3000 caracteres como una página (redondeado hacia arriba). Las hojas de cálculo (XLSX) cuentan una hoja como una página (incluidas las hojas ocultas). Las presentaciones (PPTX) cuentan una diapositiva como una página. Documentos Word (DOCX) usan paginación nativa.

Nota

El modo Pro (2025-05-01-preview) actualmente solo admite .pdf, .tiff y tipos de archivo de imagen como entrada. La entrada total no puede superar los 100 MB y 150 páginas.

Imagen

Tipos de archivo admitidos Tamaño del archivo Resolución
.jpg, .jpeg, .jpe, .png, .bmp, .heif, .heic ≤ 200 MB Min: 50 x 50 píxeles
Máximo: 10 000 x 10 000 píxeles

Audio

Tipos de archivo admitidos Tamaño del archivo Longitud
.wav (PCM: pcm_s8, pcm_u8, pcm_s16*, pcm_u16*, pcm_s24*, pcm_u24*, pcm_s32*, pcm_u32*, pcm_f32*, pcm_f64*)
.mp3
.mp4
.opus, .ogg (Opus)
.flac
.wma
.aac
.webm (Opus, Vorbis)
.m4a (AAC, AC-3)
Máximo: 300 MB Máximo: dos horas

Content Understanding admite archivos de audio de hasta 1 GB y 4 horas de duración, pero el tiempo de transcripción se reduce considerablemente para los archivos de 300 MB o menos o menos de dos horas o menos.

Vídeo

Tipos de archivo y resolución admitidos

Tipos de archivo admitidos Resolución
.mp4, .m4v
.flv (H.264 y AAC)
.wmv, .asf
.avi
.mkv
.mov
Min: 320 x 240 píxeles
Máximo: 1920 x 1080 píxeles

Límites de tamaño de archivo

Método de carga Tamaño del archivo Longitud Descripción
analyzeBinary API (carga directa) ≤ 200 MB ≤ 30 minutos Cargue archivos de vídeo directamente en el cuerpo de la solicitud de API mediante la API analyzeBinary. La experiencia de usuario de Microsoft Foundry y la experiencia de usuario de Content Understanding Studio usan este método.
analizar API (referencia de archivo) Máximo: 4 GB Máximo: dos horas Haga referencia a archivos de vídeo por dirección URL desde Azure Blob Storage o almacenamiento similar cuando use analyze API.

Nota

El análisis de vídeo tiene las siguientes limitaciones:

  • analyzeBinary API: tamaño máximo de archivo de 200 MB y duración máxima de 30 minutos al cargar vídeo directamente en el cuerpo de la solicitud
  • Muestreo de fotogramas: analiza aproximadamente un fotograma por segundo, lo que podría perder movimientos rápidos o breves eventos
  • Resolución: todos los fotogramas se escalan a 512 x 512 píxeles, lo que puede afectar a la visibilidad de pequeños detalles o objetos lejanos.

Límites de esquema de campo

Content Understanding admite tanto tipos de valor de campo básicos como estructuras anidadas, incluidas listas, grupos, tablas y tablas fijas.

  • Tipos de valor de campo básicos: string, date, time, number, integer y boolean.
  • Campo de lista: secuencia de valores del mismo tipo, representado como una matriz de campos básicos en la API.
  • Campo de grupo: un conjunto de campos semánticamente relacionados, representado como un objeto de campos básicos en la API.
  • Campo de tabla: un número variable de elementos con subcampos fijos, representados como una matriz de objetos de campos básicos en la API.
  • Campo de tabla fijo: un grupo de campos con subcampos compartidos, representado como un objeto de objetos de campos básicos en la API.

Límites básicos

Propiedad Documento Texto Imagen Audio Vídeo
Campos máximos 1,000 1,000 1,000 1,000 1,000
Clasificación máxima de categorías de campos 300 300 300 300 300
Métodos de generación admitidos extraer
generar
clasificar
generar
clasificar
generar
clasificar
generar
clasificar
generar
clasificar
  • El límite máximo de campos incluye todos los campos con nombre. Por ejemplo, una lista de cadenas cuenta como un campo, mientras que un grupo con subcampos de cadena y número cuenta como tres campos.
  • El límite máximo de categorías de campos de clasificación es el número total de categorías en todos los campos mediante el método de classify generación.

Límites del origen de conocimiento

Tipo Límites
Datos de entrenamiento Solo documentos
Total de 1 GB
50 000 páginas/imágenes totales

Límites de segmentación y clasificación

Nota

Estos límites se aplican a la segmentación y clasificación de Content Understanding . No se aplican a la clasificación de campos dentro de la funcionalidad de extracción.

Propiedad Límite
Nombre de categoría No se puede empezar con un signo de dólar ($).
Nombre y descripción de categoría Máximo de 120 caracteres para el nombre y la descripción combinados en cada categoría.
Número de categorías 200 por analizador para documentos, 1 para vídeos.
Clasificación jerárquica Cinco capas para documentos, dos capas para vídeos