Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
La habilidad Reconocimiento de entidades con nombre (v2) extrae entidades con nombre del texto. Las entidades disponibles incluyen los tipos person, location y organization.
Important
La aptitud de reconocimiento de entidades nombradas (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) se ha dejado de usar y se ha sustituido por Microsoft.Skills.Text.V3.EntityRecognitionSkill. Siga las recomendaciones de Aptitudes de Búsqueda de Azure AI en desuso para migrar a una aptitud admitida.
Note
A medida que expanda el ámbito aumentando la frecuencia de procesamiento, agregando más documentos o agregando más algoritmos de IA, tendrá que asociar un recurso facturable de Microsoft Foundry. Los cargos se acumulan cuando se llama a las API de Herramientas de Foundry y por la extracción de imágenes como parte de la fase de descifrado de documentos de Búsqueda de Azure AI. No hay ningún cargo por la extracción de texto de documentos. La ejecución de aptitudes integradas se cobra por el precio estándar de las Herramientas de Foundry existentes.
La extracción de imágenes es un cargo adicional que mide Búsqueda de Azure AI, como se describe en la página de precios. La extracción de texto es gratuita.
@odata.type
Microsoft.Skills.Text.NamedEntityRecognitionSkill
Data limits
El tamaño máximo de un registro debe tener menos de 50 000 caracteres según la medición de String.Length. Si tiene que dividir los datos antes de enviarlos al extractor de frases clave, puede usar la aptitud de división de texto. Si usa una aptitud de división de texto, establezca la longitud de la página en 5000 para obtener el mejor rendimiento.
Skill parameters
Los parámetros distinguen entre mayúsculas y minúsculas.
| Parameter name | Description |
|---|---|
| categories | Matriz de categorías que se deben extraer. Tipos de categorías posibles: "Person", "Location" y "Organization". Si no se proporciona ninguna categoría, se devuelven todos los tipos. |
| defaultLanguageCode | Código de idioma del texto de entrada. Se admiten los siguientes idiomas: de, en, es, fr, it |
| minimumPrecision | Número comprendido entre 0 y 1. Si la precisión es inferior a este valor, no se devuelve la entidad. El valor predeterminado es 0. |
Skill inputs
| Input name | Description |
|---|---|
| languageCode | Optional. El valor predeterminado es "en". |
| text | Texto que se analizará. |
Skill outputs
| Output name | Description |
|---|---|
| persons | Una matriz de cadenas donde cada cadena representa el nombre de una persona. |
| locations | Una matriz de cadenas donde cada cadena representa una ubicación. |
| organizations | Una matriz de cadenas donde cada cadena representa una organización. |
| entities | Una matriz de tipos complejos. Cada tipo complejo incluye los siguientes campos:
|
Sample definition
{
"@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
"categories": [ "Person", "Location", "Organization"],
"defaultLanguageCode": "en",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "persons",
"targetName": "people"
}
]
}
Sample input
{
"values": [
{
"recordId": "1",
"data":
{
"text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
"languageCode": "en"
}
}
]
}
Sample output
{
"values": [
{
"recordId": "1",
"data" :
{
"persons": [ "Joe Romero", "Ana Smith"],
"locations": ["Chile", "Australia"],
"organizations":["Microsoft"],
"entities":
[
{
"category":"person",
"value": "Joe Romero",
"offset": 33,
"confidence": 0.87
},
{
"category":"person",
"value": "Ana Smith",
"offset": 124,
"confidence": 0.87
},
{
"category":"location",
"value": "Chile",
"offset": 88,
"confidence": 0.99
},
{
"category":"location",
"value": "Australia",
"offset": 112,
"confidence": 0.99
},
{
"category":"organization",
"value": "Microsoft",
"offset": 54,
"confidence": 0.99
}
]
}
}
]
}
Warning cases
Si el código de idioma del documento no se admite, se devuelve una advertencia y no se extrae ninguna entidad.