Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Nota
Las versiones 2024-12-01-preview de las API de Content Understanding y 2025-05-01-preview están actualmente en versión preliminar pública. Estas versiones preliminares se proporcionan sin un contrato de nivel de servicio y no se recomiendan para cargas de trabajo de producción. Para obtener más información, consulte los Términos Suplementarios de uso para las versiones preliminares de Microsoft Azure y el Anexo de Protección de Datos de Productos y Servicios de Microsoft ("DPA").
En este artículo se enumeran las cuotas y los límites del servicio Azure Content Understanding en Foundry Tools.
Límites generales
| Propiedad | Límite |
|---|---|
| Identificador del analizador | 1-64 caracteres. Alfanumérico, punto y subrayado. Patrón: [a-zA-Z0-9._]{1,64} |
| Propiedades de dirección URL | ≤ 8.192 caracteres |
| Propiedades de descripción | ≤ 1024 caracteres |
| Nombres de campo | ≤ 64 caracteres. Letras Unicode, números, marcas combinables, puntuación conectiva, punto, guion y subrayado. Patrón: [\p{L}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}._-]{1,64} |
| Etiquetas | ≤ 10 etiquetas |
| Clave de etiqueta | ≤ 64 caracteres. Caracteres alfanuméricos y + - . : = _ /. Patrón: [a-zA-Z0-9+-.:=_/]{1,64} |
| Valor de etiqueta | ≤ 256 caracteres. Caracteres alfanuméricos y + - . : = _ /. Puede estar vacío. Patrón: [a-zA-Z0-9+-.:=_/]{0,256} |
| ID de referencia de imagen | ≤ 256 caracteres |
Límites de recursos
| Cuota | Estándar (S0) |
|---|---|
| Número máximo de analizadores | 100,000 |
| Análisis máximo/min | 1000 páginas/imágenes Cuatro horas de audio Cuatro horas de vídeo |
| Máximo número de operaciones por minuto | 3,000 |
Modelos generativos admitidos
Content Understanding se conecta a Foundry Models para funcionalidades generativas. El servicio agrega periódicamente compatibilidad con más modelos. Para más información, consulte Conexión del analizador de Content Understanding a las implementaciones de modelos de Foundry.
Los modelos admitidos actualmente son:
| Tipo de modelo | Modelo | Versión |
|---|---|---|
| Finalización del chat | gpt-4o | 2024-08-06 |
| Finalización del chat | gpt-4o | 2024-11-20 |
| Finalización del chat | gpt-4o-mini | 2024-11-20 |
| Finalización del chat | gpt-4.1 | 2025-04-14 |
| Finalización del chat | gpt-4.1-mini | 2025-04-14 |
| Finalización del chat | gpt-4.1-nano | 2025-04-14 |
| Embeddings | inserción de texto-3-small | |
| Embeddings | inserción de texto-3-large | |
| Embeddings | text-embedding-ada-002 |
Límites de archivos de entrada
Documento y texto
| Tipos de archivo admitidos | Tamaño del archivo | Longitud | Medidor de extracción |
|---|---|---|---|
✓ .pdf✓ .tiff✓ .jpg, .jpeg, .jpe, .png, .bmp, .heif, .heic |
≤ 200 MB | ≤ 300 páginas | Básico (OCR) o Estándar (diseño) |
✓ .docx, .xlsx, .pptx |
≤ 200 MB | ≤ 1M caracteres | Mínimo |
✓ .txt ✓ .html, .md, .rtf ✓ .eml, .msg ✓ .xml |
≤ 1 MB | ≤ 1M caracteres | Mínimo |
†Recuento de páginas para archivos no paginados: Para fines de facturación, Content Understanding usa reglas equivalentes a páginas: archivos de texto y archivos de correo electrónico (TXT, HTML, MD, XML, MSG, EML) cuentan 3000 caracteres como una página (redondeado hacia arriba). Las hojas de cálculo (XLSX) cuentan una hoja como una página (incluidas las hojas ocultas). Las presentaciones (PPTX) cuentan una diapositiva como una página. Documentos Word (DOCX) usan paginación nativa.
Nota
El modo Pro (2025-05-01-preview) actualmente solo admite .pdf, .tiff y tipos de archivo de imagen como entrada.
La entrada total no puede superar los 100 MB y 150 páginas.
Imagen
| Tipos de archivo admitidos | Tamaño del archivo | Resolución |
|---|---|---|
✓ .jpg, .jpeg, .jpe, .png, .bmp, .heif, .heic |
≤ 200 MB | Min: 50 x 50 píxeles Máximo: 10 000 x 10 000 píxeles |
Audio
| Tipos de archivo admitidos | Tamaño del archivo | Longitud |
|---|---|---|
✓ .wav (PCM: pcm_s8, pcm_u8, pcm_s16*, pcm_u16*, pcm_s24*, pcm_u24*, pcm_s32*, pcm_u32*, pcm_f32*, pcm_f64*)✓ .mp3 ✓ .mp4 ✓ .opus, .ogg (Opus)✓ .flac ✓ .wma ✓ .aac ✓ .webm (Opus, Vorbis) ✓ .m4a (AAC, AC-3) |
Máximo: 300 MB† | Máximo: dos horas† |
† Content Understanding admite archivos de audio de hasta 1 GB y 4 horas de duración, pero el tiempo de transcripción se reduce considerablemente para los archivos de 300 MB o menos o menos de dos horas o menos.
Vídeo
Tipos de archivo y resolución admitidos
| Tipos de archivo admitidos | Resolución |
|---|---|
✓ .mp4, .m4v ✓ .flv (H.264 y AAC) ✓ .wmv, .asf ✓ .avi ✓ .mkv ✓ .mov |
Min: 320 x 240 píxeles Máximo: 1920 x 1080 píxeles |
Límites de tamaño de archivo
| Método de carga | Tamaño del archivo | Longitud | Descripción |
|---|---|---|---|
| analyzeBinary API (carga directa) | ≤ 200 MB | ≤ 30 minutos | Cargue archivos de vídeo directamente en el cuerpo de la solicitud de API mediante la API analyzeBinary. La experiencia de usuario de Microsoft Foundry y la experiencia de usuario de Content Understanding Studio usan este método. |
| analizar API (referencia de archivo) | Máximo: 4 GB | Máximo: dos horas | Haga referencia a archivos de vídeo por dirección URL desde Azure Blob Storage o almacenamiento similar cuando use analyze API. |
Nota
El análisis de vídeo tiene las siguientes limitaciones:
- analyzeBinary API: tamaño máximo de archivo de 200 MB y duración máxima de 30 minutos al cargar vídeo directamente en el cuerpo de la solicitud
- Muestreo de fotogramas: analiza aproximadamente un fotograma por segundo, lo que podría perder movimientos rápidos o breves eventos
- Resolución: todos los fotogramas se escalan a 512 x 512 píxeles, lo que puede afectar a la visibilidad de pequeños detalles o objetos lejanos.
Límites de esquema de campo
Content Understanding admite tanto tipos de valor de campo básicos como estructuras anidadas, incluidas listas, grupos, tablas y tablas fijas.
- Tipos de valor de campo básicos: string, date, time, number, integer y boolean.
- Campo de lista: secuencia de valores del mismo tipo, representado como una matriz de campos básicos en la API.
- Campo de grupo: un conjunto de campos semánticamente relacionados, representado como un objeto de campos básicos en la API.
- Campo de tabla: un número variable de elementos con subcampos fijos, representados como una matriz de objetos de campos básicos en la API.
- Campo de tabla fijo: un grupo de campos con subcampos compartidos, representado como un objeto de objetos de campos básicos en la API.
Límites básicos
| Propiedad | Documento | Texto | Imagen | Audio | Vídeo |
|---|---|---|---|---|---|
| Campos máximos | 1,000 | 1,000 | 1,000 | 1,000 | 1,000 |
| Clasificación máxima de categorías de campos | 300 | 300 | 300 | 300 | 300 |
| Métodos de generación admitidos | extraer generar clasificar |
generar clasificar |
generar clasificar |
generar clasificar |
generar clasificar |
- El límite máximo de campos incluye todos los campos con nombre. Por ejemplo, una lista de cadenas cuenta como un campo, mientras que un grupo con subcampos de cadena y número cuenta como tres campos.
- El límite máximo de categorías de campos de clasificación es el número total de categorías en todos los campos mediante el método de
classifygeneración.
Límites del origen de conocimiento
| Tipo | Límites |
|---|---|
| Datos de entrenamiento | Solo documentos Total de 1 GB 50 000 páginas/imágenes totales |
Límites de segmentación y clasificación
Nota
Estos límites se aplican a la segmentación y clasificación de Content Understanding . No se aplican a la clasificación de campos dentro de la funcionalidad de extracción.
| Propiedad | Límite |
|---|---|
| Nombre de categoría | No se puede empezar con un signo de dólar ($). |
| Nombre y descripción de categoría | Máximo de 120 caracteres para el nombre y la descripción combinados en cada categoría. |
| Número de categorías | 200 por analizador para documentos, 1 para vídeos. |
| Clasificación jerárquica | Cinco capas para documentos, dos capas para vídeos |