Modelo de documento de identificación de inteligencia de documentos

Este contenido se aplica a:v4.0 (GA) | Versiones anteriores:v3.1 (GA)v3.0 (retirada)v2.1 (retirada)

::: moniker-end

Este contenido se aplica a:v3.1 (GA) | Versión más reciente:v4.0 (GA) | Versiones anteriores:v3.0v2.1

Este contenido se aplica a:v3.0 (retirada) | Versiones más recientes:v4.0 (GA)v3.1 | Versión anterior:v2.1 (retirada)

Este contenido se aplica a:v2.1 | Versión más reciente:v4.0 (GA)

Nota

Document Intelligence v4.0 2024-11-30 (GA) API para el modelo de documento de identidad (ID) precompilado ahora admite documentos de identificación de todas las regiones de todo el mundo, incluida la cobertura ampliada en Norteamérica, América del Sur, Asia, Europa, África y Oceanía.

El modelo de Documento Inteligente de Identidad (ID) combina el reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer información clave de los documentos de identidad. La API analiza los documentos de identidad (incluidos los siguientes) y devuelve una representación de datos JSON estructurada.

Región	Tipos de documento
En todo el mundo	Libro de Pasaporte, Tarjeta de Pasaporte
Estados Unidos	Licencia de conducir, tarjeta de identificación, permiso de residencia (tarjeta verde), tarjeta de seguridad social, identificación militar
India	Licencia de Conducir, PAN Card, Aadhaar Card
Australia	Licencia de Conducir, Tarjeta con Foto, Identificación Key-pass (incluida la versión digital)
Otro	Permiso de conducir, Tarjeta de identificación, Permiso de residencia

La inteligencia de documentos puede analizar y extraer información de documentos de identificación emitidos por el gobierno (ID) mediante su modelo de identificadores creados previamente. Combina nuestras potentes funcionalidades de reconocimiento óptico de caracteres (OCR) con funcionalidades de reconocimiento de identificadores para extraer información clave de Passports mundiales y licencias de conducir de Ee. UU. (todos los 50 estados y D.C.). La API de identificadores extrae información clave de estos documentos de identidad, como el nombre, el apellido, la fecha de nacimiento, el número de documento, etc. Esta API está disponible en Document Intelligence v2.1 como servicio en la nube.

Procesamiento de documentos de identidad

El procesamiento de documentos de identidad implica extraer datos de documentos de identidad manualmente o mediante la tecnología basada en OCR. El procesamiento de documentos de identificador es un paso importante en cualquier operación empresarial que requiera una prueba de identidad. Entre los ejemplos se incluyen la verificación de clientes en bancos y otras instituciones financieras, aplicaciones hipotecas, visitas médicas, procesamiento de reclamaciones, industria de la hospitalidad, etc. Las personas proporcionan alguna prueba de su identidad a través de licencias de conducir, pasaportes y otros documentos similares para que la empresa pueda verificarlos de forma eficaz antes de proporcionar servicios y beneficios.

Ejemplo de licencia de conducir de EE. UU. procesada con Document Intelligence Studio

Imagen de una licencia de conducir de ejemplo.

Extracción de datos

El servicio de identificadores preconstruidos extrae los valores clave de los pasaportes internacionales y las licencias de conducir de EE. UU. y los devuelve en una respuesta JSON estructurada y organizada.

Ejemplo de licencia de conducir

Licencia de conducir de ejemplo

Ejemplo de Passport

Opciones de desarrollo

Document Intelligence v4.0: 2024-11-30 (GA) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de documento de identificador	• Document Intelligence Studio• REST API• C# SDK• Python SDK• Java SDK• SDK de JavaScript	preconstruido-idDocument

Document Intelligence v3.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de documento de identificador	• Document Intelligence Studio• REST API• C# SDK• Python SDK• Java SDK• SDK de JavaScript	preconstruido-idDocument

Document Intelligence v3.0 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos	Id. de modelo
Modelo de documento de identificador	• Document Intelligence Studio• REST API• C# SDK• Python SDK• Java SDK• SDK de JavaScript	preconstruido-idDocument

Document Intelligence v2.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos
Modelo de documento de identificador	• Herramienta de etiquetado de inteligencia de documentos • REST API • SDK de biblioteca de cliente • Contenedor de Docker de Inteligencia de Documentos

Requisitos de entrada

Se admiten los siguientes formatos de archivo.

Modelo	PDF	Imagen: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lectura	✔	✔	✔
Diseño	✔	✔	✔
Documento general	✔	✔
Prefabricado	✔	✔
Extracción personalizada	✔	✔
Clasificación personalizada	✔	✔	✔

Fotos y escaneos: Para obtener mejores resultados, proporcione una foto clara o un escaneo de alta calidad por documento.
ARCHIVOS PDF y TIFF: para archivos PDF y TIFF, se pueden procesar hasta 2000 páginas. (Con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).
Tamaño del archivo: el tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y 4 MB para el nivel gratis (F0).
Dimensiones de imagen: las dimensiones deben estar entre 50 píxeles x 50 píxeles y 10 000 píxeles x 10 000 píxeles.
Bloqueos de contraseña: si los archivos PDF están bloqueados con contraseña, debe quitar el bloqueo antes del envío.
Alto del texto: el alto mínimo del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde a aproximadamente texto de 8 puntos a 150 puntos por pulgada.
Entrenamiento de modelos personalizados: el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizado y 50 000 para el modelo neuronal personalizado.
Entrenamiento del modelo de extracción personalizada: el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 GB para el modelo neuronal.
Entrenamiento del modelo de clasificación personalizada: el tamaño total de los datos de entrenamiento es de 1 GB con un máximo de 10 000 páginas. Para 2024-11-30 (GA), el tamaño total de los datos de entrenamiento es de 2 GB con un máximo de 10 000 páginas.
Tipos de archivo de Office (DOCX, XLSX, PPTX): el límite máximo de longitud de cadena es de 8 millones de caracteres.

Formatos de archivo admitidos: JPEG, PNG, PDF y TIFF.
Número admitido de páginas para archivos PDF y TIFF: hasta 2000 páginas o solo las dos primeras páginas para suscriptores de nivel gratuito.
Tamaño de archivo admitido: menos de 50 MB TOTAL; píxeles mínimos: 50 x 50 px; píxeles máximos de 10 000 x 10 000 px.

Extracción de datos del modelo de documento de identificador

Extraiga datos, incluidos el nombre, la fecha de nacimiento y la fecha de expiración, de los documentos de identificación. Necesita los siguientes recursos:

Una suscripción de Azure, puede crear una de forma gratuita.
Una instancia de Document Intelligence en el portal de Azure. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Captura de pantalla de las claves y la ubicación del punto de conexión en el portal de Azure.

Nota

Document Intelligence Studio está disponible con las API v3.1 y v3.0 y versiones posteriores.

En la página principal de Document Intelligence Studio, seleccione Documentos de identidad.
Puede analizar la factura de ejemplo o cargar sus propios archivos.
Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones Analizar:

Pruebe Document Intelligence Studio.

Herramienta de etiquetado de muestras de Inteligencia Documental

Vaya a la herramienta de muestra de Inteligencia de Documentos.
En la página principal de la herramienta de ejemplo, seleccione el icono Usar modelo precompilado para obtener datos .
Seleccione el tipo de formulario que se va a analizar en el menú desplegable.
Elija una dirección URL para el archivo que desea analizar de las siguientes opciones:
- Sample invoice document.
- Sample ID document.
- Imagen de muestra de recibo.
- Muestra de imagen de tarjeta de presentación.
En el campo Origen , seleccione URL en el menú desplegable, pegue la dirección URL seleccionada y seleccione el botón Capturar .
En el campo Punto de conexión del servicio de Document Intelligence, pegue el punto de conexión que obtuvo con la suscripción de Document Intelligence.
En el campo clave , pegue la clave que obtuvo del recurso de Document Intelligence.
Seleccione Ejecutar análisis. La herramienta de etiquetado de muestras de Inteligencia de Documentos llama a la API Analyze Prebuilt y analiza el documento.
Vea los resultados: vea los pares clave-valor extraídos, los elementos de línea, el texto resaltado extraído y las tablas detectadas.
Descargue el archivo de salida JSON para ver los resultados detallados.
- El nodo "readResults" contiene todas las líneas de texto con su respectivo cuadro delimitador en la página.
- El nodo "selectionMarks" muestra cada marca de selección (casilla, marca de radio) y si su estado está seleccionado o no seleccionado.
- La sección "pageResults" incluye las tablas extraídas. Para cada tabla, Document Intelligence extrae el texto, el índice de fila y columna, el alcance de fila y columna, el cuadro delimitador, etc.
- El campo "documentResults" contiene información de pares clave-valor e información de elementos de línea para las partes más relevantes del documento.

Nota

La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Esta restricción es una limitación de la herramienta, no del servicio de inteligencia documental.

Extracciones de campos

Para consultar los campos de extracción de documentos admitidos, vea la página del modelo de documento ID en nuestro repositorio de ejemplos en GitHub.

Tipos de documentos admitidos

El modelo de documento de identificación admite actualmente licencias de conducir de EE. UU. y la página biográfica de pasaportes internacionales (excepto la extracción de visados y otros documentos de viaje).

Campos extraídos

Nombre	Tipo	Descripción	Valor
País	país	Código de país compatible con el estándar ISO 3166	"EE. UU."
FechaDeNacimiento	fecha	Fecha de nacimiento en formato AAAA-MM-DD	"1980-01-01"
FechaDeVencimiento	fecha	Fecha de expiración en formato aaaa-MM-DD	"2019-05-05"
Número de Documento	string	Número de pasaporte relevante, número de licencia de conducir, etc.	"340020013"
FirstName	string	Se extrajo el nombre y la inicial del segundo nombre, si corresponde.	"JENNIFER"
Apellido	string	Apellido extraído	"BROOKS"
Nacionalidad	país	Código de país compatible con el estándar ISO 3166	"EE. UU."
Sexo	género	Entre los posibles valores extraídos se incluyen "M" "F" "X"	"F"
MachineReadableZone	objeto	Passport `MRZ` extraído, incluidas dos líneas de 44 caracteres cada una	"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307 715816<"
TipoDeDocumento	string	Tipo de documento, por ejemplo, Passport, Licencia de conducir	pasaporte
Dirección	string	Dirección extraída (solo licencia de conducir)	123 CALLE SU CIUDAD WA 99999-1234
Región	string	Región extraída, estado, provincia, etc. (solo licencia de conducir)	"Washington"

Guía de migración

Siga nuestra guía de migración de Document Intelligence v3.1 para aprender a usar la versión v3.0 en sus aplicaciones y flujos de trabajo.

Pasos siguientes

Pruebe a procesar sus propios formularios y documentos con Document Intelligence Studio.
Complete un inicio rápido de Document Intelligence y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.

Encuentra más ejemplos en GitHub.

Encuentra más ejemplos en GitHub.

Pruebe a procesar sus propios formularios y documentos con la herramienta de Etiquetado de Ejemplo de Inteligencia de Documentos.
Complete un inicio rápido de Document Intelligence y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-05-08

Modelo de documento de identificación de inteligencia de documentos

Procesamiento de documentos de identidad

Extracción de datos

Ejemplo de licencia de conducir

Ejemplo de Passport

Opciones de desarrollo

Requisitos de entrada

Extracción de datos del modelo de documento de identificador

Herramienta de etiquetado de muestras de Inteligencia Documental

Extracciones de campos

Tipos de documentos admitidos

Campos extraídos

Guía de migración

Pasos siguientes

Comentarios

Recursos adicionales