Modelo de recibo de Document Intelligence

Este contenido se aplica a:v4.0 (GA) | Versiones anteriores:v3.1 (GA)v3.0 (retirada)v2.1 (retirada)

Este contenido se aplica a:v3.1 (GA) | Versión más reciente:v4.0 (GA) | Versiones anteriores:v3.0v2.1

Este contenido se aplica a:v3.0 (retirada) | Versiones más recientes:v4.0 (GA)v3.1 | Versión anterior:v2.1 (retirada)

Este contenido se aplica a:v2.1 | Versión más reciente:v4.0 (GA)

El modelo de recibos de Document Intelligence combina eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer información clave de los recibos de ventas. Los recibos pueden ser de varios formatos y calidad, incluidos los recibos impresos y manuscritos. La API extrae información clave, como el nombre del comerciante, el número de teléfono del comerciante, la fecha de transacción, los impuestos y el total de transacciones y devuelve datos JSON estructurados. El modelo de recibo v4.0 (GA) admite otros campos, como ReceiptType, TaxDetails.NetAmountTaxDetails.Description, TaxDetails.Rate y CountryRegion junto con la extracción de tablas de IVA en recibos de hotel generales.

Extracción de datos de recibos

La digitalización de recibos abarca la transformación de varios tipos de recibos, incluidas las copias digitalizadas, fotográficas e impresas, en un formato digital para un procesamiento descendente simplificado. Entre los ejemplos se incluyen la administración de gastos, el análisis del comportamiento del consumidor, la automatización fiscal, etc. El uso de la inteligencia de documentos con tecnología OCR (reconocimiento óptico de caracteres) puede extraer e interpretar datos de estos diversos formatos de recibo. El procesamiento de la inteligencia de documentos simplifica el proceso de conversión, pero también reduce significativamente el tiempo y el esfuerzo necesarios, lo que facilita la administración de datos eficaz y la recuperación.

Recibo de ejemplo procesado con Document Intelligence Studio:

Recibo de ejemplo procesado con la herramienta de etiquetado para ejemplos de Inteligencia Documental:

Captura de pantalla de un recibo de ejemplo procesado con la herramienta de etiquetado de formularios de muestra.

Opciones de desarrollo

Document Intelligence v4.0: 2024-11-30 (GA) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de recibo	• Document Intelligence Studio• REST API• C# SDK• Python SDK• Java SDK• SDK de JavaScript	recibo precompilado

Document Intelligence v3.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de recibo	• Document Intelligence Studio• REST API• C# SDK• Python SDK• Java SDK• SDK de JavaScript	recibo precompilado

Document Intelligence v3.0 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de recibo	• Document Intelligence Studio• REST API• C# SDK• Python SDK• Java SDK• SDK de JavaScript	recibo precompilado

Document Intelligence v2.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos
Modelo de recibo	• Herramienta de etiquetado de inteligencia de documentos • REST API • SDK de biblioteca de cliente • Contenedor de Docker de Inteligencia de Documentos

Requisitos de entrada

Se admiten los siguientes formatos de archivo.

Modelo	PDF	Imagen: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lectura	✔	✔	✔
Diseño	✔	✔	✔
Documento general	✔	✔
Prefabricado	✔	✔
Extracción personalizada	✔	✔
Clasificación personalizada	✔	✔	✔

Fotos y escaneos: Para obtener mejores resultados, proporcione una foto clara o un escaneo de alta calidad por documento.
ARCHIVOS PDF y TIFF: para archivos PDF y TIFF, se pueden procesar hasta 2000 páginas. (Con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).
Tamaño del archivo: el tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y 4 MB para el nivel gratis (F0).
Dimensiones de imagen: las dimensiones deben estar entre 50 píxeles x 50 píxeles y 10 000 píxeles x 10 000 píxeles.
Bloqueos de contraseña: si los archivos PDF están bloqueados con contraseña, debe quitar el bloqueo antes del envío.
Alto del texto: el alto mínimo del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde a aproximadamente texto de 8 puntos a 150 puntos por pulgada.
Entrenamiento de modelos personalizados: el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizado y 50 000 para el modelo neuronal personalizado.
Entrenamiento del modelo de extracción personalizada: el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 GB para el modelo neuronal.
Entrenamiento del modelo de clasificación personalizada: el tamaño total de los datos de entrenamiento es de 1 GB con un máximo de 10 000 páginas. Para 2024-11-30 (GA), el tamaño total de los datos de entrenamiento es de 2 GB con un máximo de 10 000 páginas.
Tipos de archivo de Office (DOCX, XLSX, PPTX): el límite máximo de longitud de cadena es de 8 millones de caracteres.

Formatos de archivo admitidos: JPEG, PNG, PDF y TIFF.
Se admite la asignación de páginas para PDF y TIFF: La inteligencia de documentos puede procesar hasta 2000 páginas para suscriptores de nivel estándar o solo las dos primeras páginas para suscriptores de nivel gratuito.
Tamaño de archivo admitido: menos de 50 MB; píxeles mínimos de 50 x 50 px; píxeles máximos de 10 000 x 10 000 px.

Extracción de datos del modelo de recibo

Vea cómo Document Intelligence extrae los datos, incluida la hora y la fecha de las transacciones, la información del comerciante y los totales de importe de los recibos. Necesita los siguientes recursos:

Una suscripción de Azure, puede crear una de forma gratuita.
Una instancia de Document Intelligence en el portal de Azure. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Captura de pantalla de las claves y la ubicación del punto de conexión en el portal de Azure.

Nota

Document Intelligence Studio está disponible con las API v3.1 y v3.0 y versiones posteriores.

En la página principal de Document Intelligence Studio, seleccione Recibos.
Puede analizar el recibo de muestra o cargar sus propios archivos.
Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones Analizar:

Pruebe Document Intelligence Studio.

Herramienta de etiquetado de muestras de Inteligencia Documental

Vaya a la herramienta de muestra de Inteligencia de Documentos.
En la página principal de la herramienta de ejemplo, seleccione el icono Usar modelo precompilado para obtener datos .
Seleccione el tipo de formulario que se va a analizar en el menú desplegable.
Elija una dirección URL para el archivo que desea analizar de las siguientes opciones:
- Sample invoice document.
- Sample ID document.
- Imagen de muestra de recibo.
- Muestra de imagen de tarjeta de presentación.
En el campo Origen , seleccione URL en el menú desplegable, pegue la dirección URL seleccionada y seleccione el botón Capturar .
En el campo Punto de conexión del servicio de Document Intelligence, pegue el punto de conexión que obtuvo con la suscripción de Document Intelligence.
En el campo clave , pegue la clave que obtuvo del recurso de Document Intelligence.
Seleccione Ejecutar análisis. La herramienta de Etiquetado de Muestras de Inteligencia de Documentos llama a la API 'Analyze Prebuilt' y analiza el documento.
Vea los resultados: vea los pares clave-valor extraídos, los elementos de línea, el texto resaltado extraído y las tablas detectadas.

Nota

La herramienta de etiquetado de muestra no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del Servicio de Inteligencia Documental.

Idiomas y configuraciones regionales admitidos

Para obtener una lista completa de los idiomas admitidos, consulte nuestra página de compatibilidad con lenguaje de modelos precompilados .

Extracción de datos de campo

Para los campos de extracción de documentos admitidos, consulte la página del modelo de recibo en nuestro repositorio de ejemplo de GitHub

Nombre	Tipo	Descripción	Salida estandarizada
TipoDeRecibo	Cadena	Tipo de recibo de ventas	Desglosado
MerchantName	Cadena	Nombre del comerciante que emite el recibo
NúmeroDeTeléfonoDelComerciante	número de teléfono	Número de teléfono enumerado del comerciante	+1 xxx xxx xxxx
Dirección del Comerciante	Cadena	Dirección enumerada del comerciante
FechaDeTransacción	Fecha	Fecha en que se emitió el recibo	aaaa-mm-dd
TiempoDeTransacción	Hora	Hora en que se emitió el recibo	hh-mm-ss (24 horas)
Total	Número (USD)	Total de transacción completa del recibo	Float con dos decimales
Subtotal	Número (USD)	Subtotal del recibo, a menudo antes de que se apliquen los impuestos.	Número flotante con dos decimales
Impuestos	Número (USD)	Impuestos totales por recibo (a menudo impuestos de ventas o equivalentes). Se ha cambiado el nombre a "TotalTax" en la versión 2022-06-30.	Float con dos decimales
Propina	Número (USD)	Sugerencia incluida por el comprador	Float con dos decimales
Elementos	Matriz de objetos	Artículos de línea extraídos, con el nombre, la cantidad, el precio unitario y el precio total.
Nombre	Cadena	Descripción del elemento. Se ha cambiado el nombre a "Description" en la versión 2022-06-30.
Cantidad	Número	Cantidad de cada elemento	Float con dos decimales
Precio	Número	Precio individual de cada unidad de artículo	Número flotante con dos decimales
Precio Total	Número	Precio total del artículo de línea	Float con dos decimales

Guía de migración y API REST v3.1

Siga nuestra guía de migración de Document Intelligence v3.1 para aprender a usar la versión v3.1 en sus aplicaciones y flujos de trabajo.

Pasos siguientes

Pruebe a procesar sus propios formularios y documentos con Document Intelligence Studio.
Complete un inicio rápido de Document Intelligence y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.

Encuentra más ejemplos en GitHub.

Encuentra más ejemplos en GitHub.

Pruebe a procesar sus propios formularios y documentos con la herramienta de Etiquetado de Ejemplo de Inteligencia de Documentos.
Complete un inicio rápido de Document Intelligence y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-05-08