Datos y privacidad para la clasificación de texto personalizada

Importante

Las traducciones no en inglés solo se proporcionan para mayor comodidad. Consulte la EN-US versión de este documento para obtener la versión definitiva.

En este artículo se proporcionan detalles generales sobre cómo se procesan los datos mediante la clasificación de texto personalizada. Recuerde que usted es responsable de su uso y la implementación de esta tecnología, que incluye cumplir con todas las leyes y regulaciones que se aplican a usted. Por ejemplo, es su responsabilidad:

Comprenda dónde procesan y almacenan los datos el servicio de clasificación de texto personalizado para cumplir con las obligaciones normativas de su aplicación.
Asegúrese de que tiene todas las licencias necesarias, derechos de propiedad u otros permisos necesarios para el contenido del conjunto de datos que se usa como base para crear los modelos de clasificación de texto personalizados.

Es su responsabilidad cumplir con todas las leyes y regulaciones aplicables en su jurisdicción.

¿Qué datos procesa la clasificación de texto personalizado?

La clasificación de texto personalizada procesa los datos siguientes:

Archivo de etiquetas y conjuntos de datos de usuario: como requisito previo para crear un proyecto de clasificación de texto personalizado, los usuarios deben cargar su conjunto de datos en su contenedor de Azure Blob Storage. Un archivo de etiquetas es un archivo con formato JSON que contiene referencias a las clases y datos etiquetados de un usuario. El usuario puede traer sus propias etiquetas o puede etiquetar sus datos a través de la experiencia de la interfaz de usuario en Language Studio. En cualquier caso, un archivo de etiquetas que contiene datos etiquetados y clases es esencial para el entrenamiento.

El conjunto de datos de un usuario se divide en conjuntos de entrenamiento y pruebas, donde los desarrolladores pueden predefinir la división en un archivo de etiquetas o elegir de forma aleatoria durante el entrenamiento. El conjunto de datos de entrenamiento y el archivo de etiquetas se procesan durante el proceso de aprendizaje para crear el modelo de clasificación de texto personalizado. El modelo entrenado procesa posteriormente el conjunto de pruebas para evaluar su rendimiento.
Modelos de clasificación de texto personalizados: en función de la solicitud del usuario para entrenar el modelo, la clasificación de texto personalizada procesa los datos etiquetados proporcionados para generar un modelo entrenado. El usuario puede optar por entrenar un nuevo modelo o sobrescribir uno existente. A continuación, el modelo entrenado se almacena en el lado del servicio y se usa para procesar la evaluación del modelo. Después de que el desarrollador esté contenido con el rendimiento del modelo, solicita implementar el modelo para su uso de consumo. El modelo implementado también se almacena en el lado del servicio, que se usa para procesar las solicitudes del usuario para la predicción a través de la API Analyze.
Datos enviados para la clasificación: estos datos son el texto del usuario enviado desde la aplicación cliente de un cliente a través de analyze API para que el modelo de aprendizaje automático personalizado procese la clasificación de texto. La salida de los datos procesados contiene las clases predichas junto con sus puntuaciones de confianza. Esta salida se devuelve a la aplicación del cliente para realizar una acción para satisfacer la solicitud del usuario.

La clasificación de texto personalizada no recopila ni almacena ningún dato de cliente para mejorar sus modelos de aprendizaje automático o con fines de mejora del producto. Usamos telemetría agregada, como las API que se usan y el número de llamadas de cada suscripción y recurso, con fines de supervisión de servicios.

¿Cómo procesa la clasificación de texto personalizado los datos?

En el diagrama siguiente se muestra cómo se procesan los datos.

Diagrama que muestra cómo se procesan los datos.

¿Cómo se conservan los datos y qué controles de cliente están disponibles?

La clasificación de texto personalizada es un procesador de datos con fines generales del Reglamento de protección de datos (RGPD). En cumplimiento de las directivas del RGPD, los usuarios de clasificación de texto personalizado tienen control total para ver, exportar o eliminar cualquier contenido de usuario a través de Language Studio o mediante programación mediante api de lenguaje.

Los datos solo se almacenan en la cuenta de Azure Storage. La clasificación de texto personalizada solo tiene acceso para leerlo durante el entrenamiento.

Los controles de cliente incluyen:

Los datos etiquetados proporcionados por el usuario como requisito previo para entrenar el modelo se guardan en la cuenta Azure Storage del cliente que está conectada al proyecto durante la creación. Los clientes pueden editar o quitar etiquetas siempre que quieran a través de Language Studio.
Los metadatos de los proyectos de clasificación de texto personalizados se almacenan en el lado del servicio hasta que el cliente elimina el proyecto. Los metadatos del proyecto son los campos que se rellenan al crear el proyecto, como el nombre del proyecto, la descripción, el idioma, el nombre del contenedor de blobs conectados y la ubicación del archivo de etiquetas.
Los modelos de clasificación de texto personalizado entrenados se almacenan en las cuentas de Azure Storage del servicio hasta que el cliente las elimina. El modelo se sobrescribe cada vez que el usuario lo vuelve a entrenar.
Los modelos de clasificación de texto personalizado implementados persisten en las cuentas de Azure Storage del servicio hasta que el cliente elimina la implementación o elimina el propio modelo. El modelo se sobrescribe cada vez que el usuario despliega bajo el mismo nombre de implementación.

Opcional: Seguridad para los datos de los clientes

Azure servicios se implementan al tiempo que se mantienen las medidas técnicas y organizativas adecuadas para proteger los datos de los clientes en la nube.

Para obtener más información sobre los compromisos de privacidad y seguridad de Microsoft, consulte el Microsoft Centro de confianza.

Pasos siguientes

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-29