Dados e privacidade para classificação de texto personalizada

Importante

Traduções não ingleses são fornecidas apenas por conveniência. Por favor, consulte a EN-US versão deste documento para a versão definitiva.

Este artigo fornece detalhes de alto nível sobre como os dados são processados por classificação de texto personalizada. Lembre-se de que é responsável pela sua utilização e implementação desta tecnologia, o que inclui o cumprimento de todas as leis e regulamentos que se aplicam a si. Por exemplo, é da sua responsabilidade:

Compreenda onde os seus dados são processados e armazenados pelo serviço personalizado de classificação de texto para cumprir as obrigações regulamentares da sua candidatura.
Certifique-se de que possui todas as licenças, direitos proprietários ou outras permissões necessárias para o conteúdo do seu conjunto de dados que serve de base para construir os seus modelos personalizados de classificação de texto.

É sua responsabilidade cumprir todas as leis e regulamentos aplicáveis na sua jurisdição.

Que dados processa a classificação de texto personalizada?

A classificação de texto personalizada processa os seguintes dados:

User's dataset and tags file: Como pré-requisito para criar um projeto personalizado de classificação de texto, os utilizadores precisam de carregar o seu conjunto de dados para o seu contentor de Armazenamento de Blobs do Azure. Um ficheiro de etiquetas é um ficheiro formatado em JSON que contém referências aos dados e classes marcados por um utilizador. O utilizador pode trazer as suas próprias etiquetas ou pode etiquetar os seus dados através da experiência de interface no Language Studio. De qualquer forma, um ficheiro de tags que contenha dados e classes etiquetadas é essencial para o treino.

O conjunto de dados de um utilizador é dividido em conjuntos de treino e de teste, onde a divisão pode ser pré-definida pelos programadores num ficheiro de etiquetas ou escolhida aleatoriamente durante o treino. O conjunto de treino e o ficheiro de rótulos são processados durante o treinamento para criar o modelo personalizado de classificação de texto. O conjunto de testes é posteriormente processado pelo modelo treinado para avaliar o seu desempenho.
Modelos personalizados de classificação de texto: Com base no pedido do utilizador para treinar o modelo, a classificação de texto personalizada processa os dados marcados fornecidos para produzir um modelo treinado. O utilizador pode escolher treinar um novo modelo ou sobrescrever um existente. O modelo treinado é então armazenado do lado do serviço e utilizado para processar a avaliação do modelo. Depois de o desenvolvedor estar satisfeito com o desempenho do modelo, solicita a implementação do modelo para uso de consumo. O modelo implementado também é armazenado do lado do serviço, sendo utilizado para processar os pedidos de previsão do utilizador através da API Analyze.
Dados enviados para classificação: Estes dados são o texto do utilizador enviado pela aplicação cliente do cliente através da API Analyze , para ser processado para classificação de texto pelo modelo personalizado de aprendizagem automática. A saída dos dados processados contém as classes previstas juntamente com as suas pontuações de confiança. Esta saída é devolvida à aplicação do cliente para realizar uma ação que satisfaz o pedido do utilizador.

A classificação de texto personalizada não recolhe nem armazena quaisquer dados de clientes para melhorar os seus modelos de aprendizagem automática ou para fins de melhoria do produto. Utilizamos telemetria agregada, como quais APIs são usadas e o número de chamadas de cada subscrição e recurso, para fins de monitorização de serviço.

Como é que a classificação de texto personalizada processa os dados?

O diagrama seguinte ilustra como os seus dados são processados.

Diagrama que mostra como os dados são processados.

Como é que os dados são retidos e que controlos para os clientes estão disponíveis?

A classificação de texto personalizada é um processador de dados para efeitos do Regulamento Geral de Proteção de Dados (RGPD). Em conformidade com as políticas do RGPD, os utilizadores de classificação de texto personalizada têm controlo total para visualizar, exportar ou eliminar qualquer conteúdo do utilizador, seja através do Language Studio ou programaticamente através de APIs de Linguagem.

Os seus dados só são armazenados na sua conta Armazenamento do Azure. A classificação de texto personalizada só tem acesso para ler a partir dele durante o treino.

Os controlos do cliente incluem:

Os dados etiquetados fornecidos pelo utilizador como pré-requisito para treinar o modelo são guardados na conta Armazenamento do Azure do cliente, que está ligada ao projeto durante a criação. Os clientes podem editar ou remover etiquetas sempre que quiserem através do Language Studio.
Os metadados personalizados dos projetos de classificação de texto são armazenados no lado do serviço até que o cliente elimine o projeto. Os metadados do projeto são os campos que preenche ao criar o seu projeto, como nome do projeto, descrição, língua, nome do contentor de blob ligado e a localização do ficheiro das etiquetas.
Modelos treinados de classificação de texto personalizados são armazenados nas contas Armazenamento do Azure do serviço até que o cliente os elimine. O modelo é sobrescrito cada vez que o utilizador o retreina.
Os modelos personalizados de classificação de texto implementados persistem nas contas Armazenamento do Azure do serviço até que o cliente elimine a implementação ou o próprio modelo. O modelo é sobrescrito cada vez que o utilizador implementa o mesmo nome de implementação.

Opcional: Segurança dos dados dos clientes

Os serviços Azure são implementados mantendo medidas técnicas e organizacionais adequadas para proteger os dados dos clientes na cloud.

Para saber mais sobre os compromissos da Microsoft em matéria de privacidade e segurança, consulte o Microsoft Trust Center.

Próximos passos

Comentários

Esta página foi útil?

Last updated on 2026-04-29