Modelo de plantilla personalizada de Document Intelligence

Este contenido se aplica a:checkmarkv4.0 (GA) | Versiones anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (retirada)red-checkmarkv2.1 (retirada)

Este contenido se aplica a:checkmarkv3.1 (GA) | Versión más reciente:purple-checkmarkv4.0 (GA) | Versiones anteriores:blue-checkmarkv3.0blue-checkmarkv2.1

Este contenido se aplica a:red-checkmarkv3.0 (retirada) | Versiones más recientes:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Versión anterior:blue-checkmarkv2.1 (retirada)

Este contenido se aplica a:red-checkmarkv2.1 | Versión más reciente:blue-checkmarkv4.0 (GA)

La plantilla personalizada (anteriormente formulario personalizado) es un modelo de documento fácil de entrenar que extrae con precisión pares clave-valor etiquetados, marcas de selección, tablas, regiones y firmas de documentos. Los modelos de plantilla usan indicaciones de diseño para extraer valores de documentos y son adecuados para extraer campos de documentos altamente estructurados con plantillas visuales definidas.

Los modelos de plantilla personalizados comparten el mismo formato y estrategia de etiquetado que los modelos neuronales personalizados, con compatibilidad con más tipos y lenguajes de campo.

Funcionalidades del modelo

Los modelos de plantilla personalizados admiten pares clave-valor, marcas de selección, tablas, campos de firma y regiones seleccionadas.

Campos de formulario Marcas de selección Campos tabulares (tablas) Firma Regiones seleccionadas Campos superpuestos
Soportado Soportado Soportado Soportado Soportado No es compatible

Campos tabulares

Con el lanzamiento de las versiones de API v3.0 y versiones posteriores, los modelos de plantilla personalizados agregan compatibilidad con campos tabulares entre páginas (tablas):

  • Para etiquetar una tabla que abarque varias páginas, etiquete cada fila de la tabla en las distintas páginas de una sola tabla.
  • Como procedimiento recomendado, asegúrese de que el conjunto de datos contiene algunos ejemplos de las variaciones esperadas. Por ejemplo, incluya ejemplos en los que toda la tabla se encuentre en una sola página y donde las tablas abarquen dos o más páginas si espera ver esas variaciones en los documentos.

Los campos tabulares también son útiles al extraer información de repetición dentro de un documento que no se reconoce como una tabla. Por ejemplo, una sección de repetición de experiencias de trabajo en un currículum se puede etiquetar y extraer como un campo tabular.

Manejar variaciones

Los modelos de plantilla se basan en una plantilla visual definida, los cambios en la plantilla producen una menor precisión. En esos casos, divida el conjunto de datos de entrenamiento para incluir al menos cinco ejemplos de cada plantilla y entrenar un modelo para cada una de las variaciones. Después, puede componer los modelos en un solo endpoint. Para variaciones sutiles, como documentos e imágenes PDF digitales, es mejor incluir al menos cinco ejemplos de cada tipo en el mismo conjunto de datos de entrenamiento.

Requisitos de entrada

  • Para obtener los mejores resultados, proporcione una foto clara o un escaneo de alta calidad por cada documento.

  • Formatos de archivo admitidos:

    Modelo PDF Imagen:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) y HTML
    Lectura
    Diseño
    Documento general
    Prefabricado
    Personalizado

    ✱ archivos Microsoft Office no se admiten actualmente para otros modelos o versiones.

  • Para PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratis, solo se procesan las dos primeras páginas).

  • El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y 4 MB para el nivel gratis (F0).

  • Las dimensiones de imagen deben estar entre 50 x 50 píxeles y 10 000 px x 10 000 píxeles.

  • Si los archivos PDF están bloqueados con contraseña, debe quitar el bloqueo antes del envío.

  • El alto mínimo del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde a texto de tamaño de aproximadamente 8 puntos a 150 puntos por pulgada (DPI).

  • Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizado y 50 000 para el modelo neuronal personalizado.

  • Para el entrenamiento del modelo de extracción personalizado, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1G-MB para el modelo neuronal.

  • Para el entrenamiento del modelo de clasificación personalizada, el tamaño total de los datos de entrenamiento es 1GB con un máximo de 10 000 páginas.

Entrenamiento de un modelo

Los modelos de plantilla personalizados están disponibles con carácter general a partir de la API v2.0 y versiones posteriores. Si empieza con un nuevo proyecto o tiene un conjunto de datos etiquetado existente, use la API v3.1 o v3.0 con Document Intelligence Studio para entrenar un modelo de plantilla personalizado.

Modelo REST API SDK Etiquetar y probar modelos
Plantilla personalizada API v3.1 SDK de Inteligencia de documentos Document Intelligence Studio

La operación de compilación con las API v3.0 y posteriores para entrenar el modelo admite una nueva propiedad buildMode. Para entrenar un modelo de plantilla personalizado, establezca la propiedad buildMode en template.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-11-30


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Los modelos de plantilla personalizados están disponibles con carácter general con la API v3.1. Si empieza con un nuevo proyecto o tiene un conjunto de datos etiquetado existente, use la API v3.1 o v3.0 con Document Intelligence Studio para entrenar un modelo de plantilla personalizado.

Modelo REST API SDK Etiquetar y probar modelos
Plantilla personalizada API v3.1 SDK de Inteligencia de documentos Document Intelligence Studio

Con las APIs v3.0 y posteriores, la operación de construcción para entrenar el modelo admite una nueva propiedad buildMode, para entrenar un modelo de plantilla personalizado, establezca buildMode en template.

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Idiomas y configuraciones regionales admitidos

Consulte nuestra página Compatibilidad con idiomas: modelos personalizados para obtener una lista completa de los idiomas admitidos.

Los modelos personalizados (plantilla) están disponibles con carácter general con la API v2.1.

Modelo REST API SDK Etiquetar y probar modelos
Modelo personalizado (plantilla) Inteligencia de documentos 2.1 SDK de Inteligencia de documentos Herramienta de etiquetado de muestra de Inteligencia Documental

Pasos siguientes

Aprende a crear y componer modelos personalizados: