Modelo de recibo de Document Intelligence

Este contenido se aplica a:checkmarkv4.0 (GA) | Versiones anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (retirada)red-checkmarkv2.1 (retirada)

Este contenido se aplica a:checkmarkv3.1 (GA) | Versión más reciente:purple-checkmarkv4.0 (GA) | Versiones anteriores:blue-checkmarkv3.0blue-checkmarkv2.1

Este contenido se aplica a:red-checkmarkv3.0 (retirada) | Versiones más recientes:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Versión anterior:blue-checkmarkv2.1 (retirada)

Este contenido se aplica a:red-checkmarkv2.1 | Versión más reciente:blue-checkmarkv4.0 (GA)

El modelo de recibos de Document Intelligence combina eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer información clave de los recibos de ventas. Los recibos pueden ser de varios formatos y calidad, incluidos los recibos impresos y manuscritos. La API extrae información clave, como el nombre del comerciante, el número de teléfono del comerciante, la fecha de transacción, los impuestos y el total de transacciones y devuelve datos JSON estructurados. El modelo de recibo v4.0 (GA) admite otros campos, como ReceiptType, TaxDetails.NetAmountTaxDetails.Description, TaxDetails.Rate y CountryRegion junto con la extracción de tablas de IVA en recibos de hotel generales.

Extracción de datos de recibos

La digitalización de recibos abarca la transformación de varios tipos de recibos, incluidas las copias digitalizadas, fotográficas e impresas, en un formato digital para un procesamiento descendente simplificado. Entre los ejemplos se incluyen la administración de gastos, el análisis del comportamiento del consumidor, la automatización fiscal, etc. El uso de la inteligencia de documentos con tecnología OCR (reconocimiento óptico de caracteres) puede extraer e interpretar datos de estos diversos formatos de recibo. El procesamiento de la inteligencia de documentos simplifica el proceso de conversión, pero también reduce significativamente el tiempo y el esfuerzo necesarios, lo que facilita la administración de datos eficaz y la recuperación.

Recibo de ejemplo procesado con Document Intelligence Studio:

Captura de pantalla de un recibo de ejemplo procesado en Document Intelligence Studio.

Recibo de ejemplo procesado con la herramienta de etiquetado para ejemplos de Inteligencia Documental:

Captura de pantalla de un recibo de ejemplo procesado con la herramienta de etiquetado de formularios de muestra.

Opciones de desarrollo

Document Intelligence v4.0: 2024-11-30 (GA) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
Modelo de recibo Document Intelligence StudioREST APIC# SDKPython SDKJava SDKSDK de JavaScript recibo precompilado

Document Intelligence v3.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
Modelo de recibo Document Intelligence StudioREST APIC# SDKPython SDKJava SDKSDK de JavaScript recibo precompilado

Document Intelligence v3.0 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
Modelo de recibo Document Intelligence StudioREST APIC# SDKPython SDKJava SDKSDK de JavaScript recibo precompilado

Document Intelligence v2.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos
Modelo de recibo Herramienta de etiquetado de inteligencia de documentos
REST API
SDK de biblioteca de cliente
Contenedor de Docker de Inteligencia de Documentos

Requisitos de entrada

Se admiten los siguientes formatos de archivo.

Modelo PDF Imagen:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lectura
Diseño
Documento general
Prefabricado
Extracción personalizada
Clasificación personalizada
  • Fotos y escaneos: Para obtener mejores resultados, proporcione una foto clara o un escaneo de alta calidad por documento.
  • ARCHIVOS PDF y TIFF: para archivos PDF y TIFF, se pueden procesar hasta 2000 páginas. (Con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).
  • Tamaño del archivo: el tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y 4 MB para el nivel gratis (F0).
  • Dimensiones de imagen: las dimensiones deben estar entre 50 píxeles x 50 píxeles y 10 000 píxeles x 10 000 píxeles.
  • Bloqueos de contraseña: si los archivos PDF están bloqueados con contraseña, debe quitar el bloqueo antes del envío.
  • Alto del texto: el alto mínimo del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde a aproximadamente texto de 8 puntos a 150 puntos por pulgada.
  • Entrenamiento de modelos personalizados: el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizado y 50 000 para el modelo neuronal personalizado.
  • Entrenamiento del modelo de extracción personalizada: el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 GB para el modelo neuronal.
  • Entrenamiento del modelo de clasificación personalizada: el tamaño total de los datos de entrenamiento es de 1 GB con un máximo de 10 000 páginas. Para 2024-11-30 (GA), el tamaño total de los datos de entrenamiento es de 2 GB con un máximo de 10 000 páginas.
  • Tipos de archivo de Office (DOCX, XLSX, PPTX): el límite máximo de longitud de cadena es de 8 millones de caracteres.
  • Formatos de archivo admitidos: JPEG, PNG, PDF y TIFF.
  • Se admite la asignación de páginas para PDF y TIFF: La inteligencia de documentos puede procesar hasta 2000 páginas para suscriptores de nivel estándar o solo las dos primeras páginas para suscriptores de nivel gratuito.
  • Tamaño de archivo admitido: menos de 50 MB; píxeles mínimos de 50 x 50 px; píxeles máximos de 10 000 x 10 000 px.

Extracción de datos del modelo de recibo

Vea cómo Document Intelligence extrae los datos, incluida la hora y la fecha de las transacciones, la información del comerciante y los totales de importe de los recibos. Necesita los siguientes recursos:

  • Una suscripción de Azure, puede crear una de forma gratuita.

  • Una instancia de Document Intelligence en el portal de Azure. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Captura de pantalla de las claves y la ubicación del punto de conexión en el portal de Azure.

Nota

Document Intelligence Studio está disponible con las API v3.1 y v3.0 y versiones posteriores.

  1. En la página principal de Document Intelligence Studio, seleccione Recibos.

  2. Puede analizar el recibo de muestra o cargar sus propios archivos.

  3. Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones Analizar:

    Captura de pantalla de los botones Ejecutar análisis y Analizar opciones en Document Intelligence Studio.

Herramienta de etiquetado de muestras de Inteligencia Documental

  1. Vaya a la herramienta de muestra de Inteligencia de Documentos.

  2. En la página principal de la herramienta de ejemplo, seleccione el icono Usar modelo precompilado para obtener datos .

    Captura de pantalla del proceso de análisis de resultados del modelo de diseño.

  3. Seleccione el tipo de formulario que se va a analizar en el menú desplegable.

  4. Elija una dirección URL para el archivo que desea analizar de las siguientes opciones:

  5. En el campo Origen , seleccione URL en el menú desplegable, pegue la dirección URL seleccionada y seleccione el botón Capturar .

    Captura de pantalla del menú desplegable de ubicación de origen.

  6. En el campo Punto de conexión del servicio de Document Intelligence, pegue el punto de conexión que obtuvo con la suscripción de Document Intelligence.

  7. En el campo clave , pegue la clave que obtuvo del recurso de Document Intelligence.

    Captura de pantalla del menú desplegable select-form-type.

  8. Seleccione Ejecutar análisis. La herramienta de Etiquetado de Muestras de Inteligencia de Documentos llama a la API 'Analyze Prebuilt' y analiza el documento.

  9. Vea los resultados: vea los pares clave-valor extraídos, los elementos de línea, el texto resaltado extraído y las tablas detectadas.

    Captura de pantalla de la operación de análisis de resultados del modelo de diseño.

Nota

La herramienta de etiquetado de muestra no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del Servicio de Inteligencia Documental.

Idiomas y configuraciones regionales admitidos

Para obtener una lista completa de los idiomas admitidos, consulte nuestra página de compatibilidad con lenguaje de modelos precompilados .

Extracción de datos de campo

Para los campos de extracción de documentos admitidos, consulte la página del modelo de recibo en nuestro repositorio de ejemplo de GitHub

Nombre Tipo Descripción Salida estandarizada
TipoDeRecibo Cadena Tipo de recibo de ventas Desglosado
MerchantName Cadena Nombre del comerciante que emite el recibo
NúmeroDeTeléfonoDelComerciante número de teléfono Número de teléfono enumerado del comerciante +1 xxx xxx xxxx
Dirección del Comerciante Cadena Dirección enumerada del comerciante
FechaDeTransacción Fecha Fecha en que se emitió el recibo aaaa-mm-dd
TiempoDeTransacción Hora Hora en que se emitió el recibo hh-mm-ss (24 horas)
Total Número (USD) Total de transacción completa del recibo Float con dos decimales
Subtotal Número (USD) Subtotal del recibo, a menudo antes de que se apliquen los impuestos. Número flotante con dos decimales
Impuestos Número (USD) Impuestos totales por recibo (a menudo impuestos de ventas o equivalentes). Se ha cambiado el nombre a "TotalTax" en la versión 2022-06-30. Float con dos decimales
Propina Número (USD) Sugerencia incluida por el comprador Float con dos decimales
Elementos Matriz de objetos Artículos de línea extraídos, con el nombre, la cantidad, el precio unitario y el precio total.
Nombre Cadena Descripción del elemento. Se ha cambiado el nombre a "Description" en la versión 2022-06-30.
Cantidad Número Cantidad de cada elemento Float con dos decimales
Precio Número Precio individual de cada unidad de artículo Número flotante con dos decimales
Precio Total Número Precio total del artículo de línea Float con dos decimales

Guía de migración y API REST v3.1

Pasos siguientes