Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Este contenido se aplica a:
v4.0 (GA) | Versiones anteriores:
v3.1 (GA)
v3.0 (retirada)
v2.1 (retirada)
Este contenido se aplica a:
v3.1 (GA) | Versión más reciente:
v4.0 (GA) | Versiones anteriores:
v3.0
v2.1
Este contenido se aplica a:
v3.0 (retirada) | Versiones más recientes:
v4.0 (GA)
v3.1 | Versión anterior:
v2.1 (retirada)
Este contenido se aplica a:
v2.1 | Versión más reciente:
v4.0 (GA)
El modelo de recibos de Document Intelligence combina eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer información clave de los recibos de ventas. Los recibos pueden ser de varios formatos y calidad, incluidos los recibos impresos y manuscritos. La API extrae información clave, como el nombre del comerciante, el número de teléfono del comerciante, la fecha de transacción, los impuestos y el total de transacciones y devuelve datos JSON estructurados. El modelo de recibo v4.0 (GA) admite otros campos, como ReceiptType, TaxDetails.NetAmountTaxDetails.Description, TaxDetails.Rate y CountryRegion junto con la extracción de tablas de IVA en recibos de hotel generales.
Extracción de datos de recibos
La digitalización de recibos abarca la transformación de varios tipos de recibos, incluidas las copias digitalizadas, fotográficas e impresas, en un formato digital para un procesamiento descendente simplificado. Entre los ejemplos se incluyen la administración de gastos, el análisis del comportamiento del consumidor, la automatización fiscal, etc. El uso de la inteligencia de documentos con tecnología OCR (reconocimiento óptico de caracteres) puede extraer e interpretar datos de estos diversos formatos de recibo. El procesamiento de la inteligencia de documentos simplifica el proceso de conversión, pero también reduce significativamente el tiempo y el esfuerzo necesarios, lo que facilita la administración de datos eficaz y la recuperación.
Recibo de ejemplo procesado con Document Intelligence Studio:
Recibo de ejemplo procesado con la herramienta de etiquetado para ejemplos de Inteligencia Documental:
Opciones de desarrollo
Document Intelligence v4.0: 2024-11-30 (GA) admite las siguientes herramientas, aplicaciones y bibliotecas:
| Característica | Recursos | Id. de modelo |
|---|---|---|
| Modelo de recibo | • |
recibo precompilado |
Document Intelligence v3.1 admite las siguientes herramientas, aplicaciones y bibliotecas:
| Característica | Recursos | Id. de modelo |
|---|---|---|
| Modelo de recibo | • |
recibo precompilado |
Document Intelligence v3.0 admite las siguientes herramientas, aplicaciones y bibliotecas:
| Característica | Recursos | Id. de modelo |
|---|---|---|
| Modelo de recibo | • |
recibo precompilado |
Document Intelligence v2.1 admite las siguientes herramientas, aplicaciones y bibliotecas:
| Característica | Recursos |
|---|---|
| Modelo de recibo | • Herramienta de etiquetado de inteligencia de documentos • REST API • SDK de biblioteca de cliente • Contenedor de Docker de Inteligencia de Documentos |
Requisitos de entrada
Se admiten los siguientes formatos de archivo.
| Modelo | Imagen: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Lectura | ✔ | ✔ | ✔ |
| Diseño | ✔ | ✔ | ✔ |
| Documento general | ✔ | ✔ | |
| Prefabricado | ✔ | ✔ | |
| Extracción personalizada | ✔ | ✔ | |
| Clasificación personalizada | ✔ | ✔ | ✔ |
- Fotos y escaneos: Para obtener mejores resultados, proporcione una foto clara o un escaneo de alta calidad por documento.
- ARCHIVOS PDF y TIFF: para archivos PDF y TIFF, se pueden procesar hasta 2000 páginas. (Con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).
- Tamaño del archivo: el tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y 4 MB para el nivel gratis (F0).
- Dimensiones de imagen: las dimensiones deben estar entre 50 píxeles x 50 píxeles y 10 000 píxeles x 10 000 píxeles.
- Bloqueos de contraseña: si los archivos PDF están bloqueados con contraseña, debe quitar el bloqueo antes del envío.
- Alto del texto: el alto mínimo del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde a aproximadamente texto de 8 puntos a 150 puntos por pulgada.
- Entrenamiento de modelos personalizados: el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizado y 50 000 para el modelo neuronal personalizado.
- Entrenamiento del modelo de extracción personalizada: el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 GB para el modelo neuronal.
- Entrenamiento del modelo de clasificación personalizada: el tamaño total de los datos de entrenamiento es de 1 GB con un máximo de 10 000 páginas. Para 2024-11-30 (GA), el tamaño total de los datos de entrenamiento es de 2 GB con un máximo de 10 000 páginas.
- Tipos de archivo de Office (DOCX, XLSX, PPTX): el límite máximo de longitud de cadena es de 8 millones de caracteres.
- Formatos de archivo admitidos: JPEG, PNG, PDF y TIFF.
- Se admite la asignación de páginas para PDF y TIFF: La inteligencia de documentos puede procesar hasta 2000 páginas para suscriptores de nivel estándar o solo las dos primeras páginas para suscriptores de nivel gratuito.
- Tamaño de archivo admitido: menos de 50 MB; píxeles mínimos de 50 x 50 px; píxeles máximos de 10 000 x 10 000 px.
Extracción de datos del modelo de recibo
Vea cómo Document Intelligence extrae los datos, incluida la hora y la fecha de las transacciones, la información del comerciante y los totales de importe de los recibos. Necesita los siguientes recursos:
Una suscripción de Azure, puede crear una de forma gratuita.
Una instancia de Document Intelligence en el portal de Azure. Puede usar el plan de tarifa gratuito (
F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.
Nota
Document Intelligence Studio está disponible con las API v3.1 y v3.0 y versiones posteriores.
En la página principal de Document Intelligence Studio, seleccione Recibos.
Puede analizar el recibo de muestra o cargar sus propios archivos.
Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones Analizar:
Herramienta de etiquetado de muestras de Inteligencia Documental
Vaya a la herramienta de muestra de Inteligencia de Documentos.
En la página principal de la herramienta de ejemplo, seleccione el icono Usar modelo precompilado para obtener datos .
Seleccione el tipo de formulario que se va a analizar en el menú desplegable.
Elija una dirección URL para el archivo que desea analizar de las siguientes opciones:
Imagen de muestra de recibo.
En el campo Origen , seleccione URL en el menú desplegable, pegue la dirección URL seleccionada y seleccione el botón Capturar .
En el campo Punto de conexión del servicio de Document Intelligence, pegue el punto de conexión que obtuvo con la suscripción de Document Intelligence.
En el campo clave , pegue la clave que obtuvo del recurso de Document Intelligence.
Seleccione Ejecutar análisis. La herramienta de Etiquetado de Muestras de Inteligencia de Documentos llama a la API 'Analyze Prebuilt' y analiza el documento.
Vea los resultados: vea los pares clave-valor extraídos, los elementos de línea, el texto resaltado extraído y las tablas detectadas.
Nota
La herramienta de etiquetado de muestra no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del Servicio de Inteligencia Documental.
Idiomas y configuraciones regionales admitidos
Para obtener una lista completa de los idiomas admitidos, consulte nuestra página de compatibilidad con lenguaje de modelos precompilados .
Extracción de datos de campo
Para los campos de extracción de documentos admitidos, consulte la página del modelo de recibo en nuestro repositorio de ejemplo de GitHub
| Nombre | Tipo | Descripción | Salida estandarizada |
|---|---|---|---|
| TipoDeRecibo | Cadena | Tipo de recibo de ventas | Desglosado |
| MerchantName | Cadena | Nombre del comerciante que emite el recibo | |
| NúmeroDeTeléfonoDelComerciante | número de teléfono | Número de teléfono enumerado del comerciante | +1 xxx xxx xxxx |
| Dirección del Comerciante | Cadena | Dirección enumerada del comerciante | |
| FechaDeTransacción | Fecha | Fecha en que se emitió el recibo | aaaa-mm-dd |
| TiempoDeTransacción | Hora | Hora en que se emitió el recibo | hh-mm-ss (24 horas) |
| Total | Número (USD) | Total de transacción completa del recibo | Float con dos decimales |
| Subtotal | Número (USD) | Subtotal del recibo, a menudo antes de que se apliquen los impuestos. | Número flotante con dos decimales |
| Impuestos | Número (USD) | Impuestos totales por recibo (a menudo impuestos de ventas o equivalentes). Se ha cambiado el nombre a "TotalTax" en la versión 2022-06-30. | Float con dos decimales |
| Propina | Número (USD) | Sugerencia incluida por el comprador | Float con dos decimales |
| Elementos | Matriz de objetos | Artículos de línea extraídos, con el nombre, la cantidad, el precio unitario y el precio total. | |
| Nombre | Cadena | Descripción del elemento. Se ha cambiado el nombre a "Description" en la versión 2022-06-30. | |
| Cantidad | Número | Cantidad de cada elemento | Float con dos decimales |
| Precio | Número | Precio individual de cada unidad de artículo | Número flotante con dos decimales |
| Precio Total | Número | Precio total del artículo de línea | Float con dos decimales |
Guía de migración y API REST v3.1
- Siga nuestra guía de migración de Document Intelligence v3.1 para aprender a usar la versión v3.1 en sus aplicaciones y flujos de trabajo.
Pasos siguientes
Pruebe a procesar sus propios formularios y documentos con Document Intelligence Studio.
Complete un inicio rápido de Document Intelligence y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.
Pruebe a procesar sus propios formularios y documentos con la herramienta de Etiquetado de Ejemplo de Inteligencia de Documentos.
Complete un inicio rápido de Document Intelligence y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.