Modelo de factura de Document Intelligence

Este contenido se aplica a:v4.0 (GA) | Versiones anteriores:v3.1 (GA)v3.0 (retirada)v2.1 (retirada)

::: moniker-end

Este contenido se aplica a:v3.1 (GA) | Versión más reciente:v4.0 (GA) | Versiones anteriores:v3.0v2.1

Este contenido se aplica a:v3.0 (retirada) | Versiones más recientes:v4.0 (GA)v3.1 | Versión anterior:v2.1 (retirada)

Este contenido se aplica a:v2.1 | Versión más reciente:v4.0 (GA)

El modelo de factura de Document Intelligence usa eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) para analizar y extraer campos clave y elementos de línea de facturas de ventas, facturas de utilidad y pedidos de compra. Las facturas pueden ser de varios formatos y calidad, incluidas imágenes capturadas por teléfono, documentos escaneados y ARCHIVOS PDF digitales. La API analiza el texto de la factura; extrae información clave, como el nombre del cliente, la dirección de facturación, la fecha de vencimiento y el importe vencido; y devuelve una representación de datos JSON estructurada. El modelo admite actualmente facturas en 27 idiomas.

Tipos de documento admitidos:

Facturas
Facturas de servicios públicos
Pedidos de ventas
Pedidos de compra

Procesamiento automatizado de facturas

El procesamiento automatizado de facturas es el proceso de extracción de campos clave accounts payable de los documentos de la cuenta de facturación. Los datos extraídos incluyen los elementos de línea de facturas que se integran con los flujos de trabajo de cuentas por pagar (AP) para revisiones y pagos. Históricamente, el proceso de cuentas por pagar se realiza de forma manual y, por lo tanto, consume mucho tiempo. La extracción precisa de datos clave de las facturas suele ser la primera y uno de los pasos más críticos del proceso de automatización de facturas.

Factura de ejemplo procesada con Document Intelligence Studio:

Factura de ejemplo procesada con la herramienta de etiquetado de ejemplo de Document Intelligence:

Captura de pantalla de una factura de ejemplo.

Opciones de desarrollo

Document Intelligence v4.0: 2024-11-30 (GA) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de factura	• Document Intelligence Studio • REST API • SDK de C# • Python SDK • Java SDK • SDK de JavaScript	factura precompilada

Document Intelligence v3.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de factura	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • SDK de JavaScript	factura precompilada

Document Intelligence v3.0 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de factura	• Document Intelligence Studio• REST API• C# SDK• Python SDK• Java SDK• SDK de JavaScript	factura precompilada

Document Intelligence v2.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos
Modelo de factura	• Herramienta de etiquetado de inteligencia de documentos • REST API • SDK de biblioteca de cliente • Contenedor de Docker de Inteligencia de Documentos

Requisitos de entrada

Se admiten los siguientes formatos de archivo.

Modelo	PDF	Imagen: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lectura	✔	✔	✔
Diseño	✔	✔	✔
Documento general	✔	✔
Prefabricado	✔	✔
Extracción personalizada	✔	✔
Clasificación personalizada	✔	✔	✔

Fotos y escaneos: Para obtener mejores resultados, proporcione una foto clara o un escaneo de alta calidad por documento.
ARCHIVOS PDF y TIFF: para archivos PDF y TIFF, se pueden procesar hasta 2000 páginas. (Con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).
Tamaño del archivo: el tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y 4 MB para el nivel gratis (F0).
Dimensiones de imagen: las dimensiones deben estar entre 50 píxeles x 50 píxeles y 10 000 píxeles x 10 000 píxeles.
Bloqueos de contraseña: si los archivos PDF están bloqueados con contraseña, debe quitar el bloqueo antes del envío.
Alto del texto: el alto mínimo del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde a aproximadamente texto de 8 puntos a 150 puntos por pulgada.
Entrenamiento de modelos personalizados: el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizado y 50 000 para el modelo neuronal personalizado.
Entrenamiento del modelo de extracción personalizada: el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 GB para el modelo neuronal.
Entrenamiento del modelo de clasificación personalizada: el tamaño total de los datos de entrenamiento es de 1 GB con un máximo de 10 000 páginas. Para 2024-11-30 (GA), el tamaño total de los datos de entrenamiento es de 2 GB con un máximo de 10 000 páginas.
Tipos de archivo de Office (DOCX, XLSX, PPTX): el límite máximo de longitud de cadena es de 8 millones de caracteres.

Formatos de archivo admitidos: JPEG, PNG, PDF y TIFF.
Pdf y TIFF compatibles, se procesan hasta 2000 páginas. Para suscriptores de nivel gratis, solo se procesan las dos primeras páginas.
El tamaño de archivo admitido debe ser inferior a 50 MB y dimensiones de al menos 50 x 50 píxeles y, como máximo, 10 000 x 10 000 píxeles.

Extracción de datos del modelo de factura

Vea cómo se extraen los datos, incluida la información del cliente, los detalles del proveedor y los elementos de línea, de las facturas. Necesita los siguientes recursos:

Una suscripción de Azure, puede crear una de forma gratuita.
Una instancia de Document Intelligence en el portal de Azure. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Captura de pantalla de las claves y la ubicación del punto de conexión en el portal de Azure.

En la página principal de Document Intelligence Studio, seleccione Facturas.
Puede analizar la factura de ejemplo o cargar sus propios archivos.
Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones Analizar :

Probar Document Intelligence Studio

Herramienta de etiquetado de muestras de Inteligencia Documental

Vaya a la herramienta de muestra de Inteligencia de Documentos.
En la página principal de la herramienta de ejemplo, seleccione el icono Usar modelo precompilado para obtener datos .
Seleccione el tipo de formulario que se va a analizar en el menú desplegable.
Elija una dirección URL para el archivo que desea analizar de las siguientes opciones:
- Sample invoice document.
- Sample ID document.
- Imagen de muestra de recibo.
- Muestra de imagen de tarjeta de presentación.
En el campo Origen , seleccione URL en el menú desplegable, pegue la dirección URL seleccionada y seleccione el botón Capturar .
En el campo Punto de conexión del servicio de Document Intelligence, pegue el punto de conexión que obtuvo con la suscripción de Document Intelligence.
En el campo clave , pegue la clave que obtuvo del recurso de Document Intelligence.
Seleccione Ejecutar análisis. La herramienta de Etiquetado de Muestras de Inteligencia de Documentos llama a la API 'Analyze Prebuilt' y analiza el documento.
Vea los resultados: vea los pares clave-valor extraídos, los elementos de línea, el texto resaltado extraído y las tablas detectadas.

Nota

La herramienta de etiquetado de muestra no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del Servicio de Inteligencia Documental.

Idiomas y configuraciones regionales admitidos

Para obtener una lista completa de los idiomas admitidos, consulte nuestra página de compatibilidad con lenguajes de modelo precompilados .

Extracción de datos de campo

Para los campos de extracción de documentos admitidos, consulta la página del modelo de esquema de factura en nuestro repositorio de ejemplo de GitHub.
Los pares clave-valor de la factura y los elementos de línea extraídos se encuentran en la sección documentResults de la salida JSON.

Pares clave-valor

El modelo de factura precompilado admite la devolución opcional de pares clave-valor. De forma predeterminada, la devolución de pares clave-valor está deshabilitada. Los pares clave-valor son intervalos específicos dentro de la factura que identifican una etiqueta o clave y su respuesta o valor asociados. En una factura, estos pares podrían ser la etiqueta y el valor que especificó el usuario para ese campo o número de teléfono. El modelo de IA se entrena para extraer claves y valores identificables en función de una amplia variedad de tipos de documentos, formatos y estructuras.

Las claves también pueden existir de forma aislada cuando el modelo detecta que existe una clave, sin ningún valor asociado o al procesar campos opcionales. Por ejemplo, un campo de nombre intermedio puede dejarse en blanco en un formulario en algunos casos. Los pares clave-valor siempre son intervalos de texto contenidos en el documento. Para los documentos en los que el mismo valor se describe de maneras diferentes, por ejemplo, cliente o usuario, la clave asociada es cliente o usuario (en función del contexto).

Salida JSON

La salida JSON tiene tres partes:

"readResults" el nodo contiene todas las marcas de texto y selección reconocidas. El texto se organiza a través de la página y, a continuación, por línea, por palabras individuales.
El "pageResults" nodo contiene las tablas y celdas extraídas con sus cuadros delimitadores, nivel de confianza y una referencia a las líneas y palabras en readResults.
"documentResults" node contiene los valores específicos de la factura y los elementos de línea detectados por el modelo. Es donde encontrar todos los campos de la factura, como ID de factura, destino, dirección de facturación, cliente, total, líneas de artículos y mucho más.

Guía de migración

Siga nuestra guía de migración de Document Intelligence v3.1 para aprender a usar la versión v3.0 en sus aplicaciones y flujos de trabajo.