Dados e privacidade para classificação de texto personalizado

Importante

Traduções não em inglês são fornecidas apenas para conveniência. Consulte a EN-US versão deste documento para obter a versão definitiva.

Este artigo fornece detalhes de alto nível sobre como os dados são processados pela classificação de texto personalizada. Lembre-se de que você é responsável pelo uso e pela implementação dessa tecnologia, que inclui o cumprimento de todas as leis e regulamentos que se aplicam a você. Por exemplo, é sua responsabilidade:

Entenda onde seus dados são processados e armazenados pelo serviço de classificação de texto personalizado para atender às obrigações regulatórias do aplicativo.
Verifique se você tem todas as licenças necessárias, direitos proprietários ou outras permissões necessárias para o conteúdo em seu conjunto de dados que é usado como base para criar seus modelos de classificação de texto personalizados.

É sua responsabilidade cumprir todas as leis e regulamentos aplicáveis em sua jurisdição.

Quais dados são processados pela classificação de texto personalizada?

A classificação de texto personalizado processa os seguintes dados:

Arquivo de marcas e conjunto de dados do usuário: como pré-requisito para criar um projeto de classificação de texto personalizado, os usuários precisam carregar seu conjunto de dados em contêiner Armazenamento de Blobs do Azure. Um arquivo de marcas é um arquivo formatado em JSON que contém referências aos dados e classes marcados de um usuário. O usuário pode usar suas próprias marcas ou etiquetar seus dados por meio da interface do usuário no Language Studio. De qualquer forma, um arquivo de tags que contém dados etiquetados e classes é essencial para o treinamento.

O conjunto de dados de um usuário é dividido em conjuntos de treinamento e teste, em que a divisão pode ser predefinida por desenvolvedores em um arquivo de marcas ou escolhida aleatoriamente durante o treinamento. O conjunto de treinos e o arquivo de etiquetas são processados durante o treinamento para criar o modelo de classificação de texto personalizado. O conjunto de testes é processado posteriormente pelo modelo treinado para avaliar seu desempenho.
Modelos de classificação de texto personalizados: com base na solicitação do usuário para treinar o modelo, a classificação de texto personalizado processa os dados marcados fornecidos para gerar um modelo treinado. O usuário pode optar por treinar um novo modelo ou substituir um existente. Em seguida, o modelo treinado é armazenado no lado do servidor e usado na avaliação do modelo. Depois que o desenvolvedor estiver satisfeito com o desempenho do modelo, ele solicitará a implantação do modelo para uso de consumo. O modelo implantado também é armazenado no lado do serviço, que é usado para processar as solicitações de previsão do usuário por meio da API de Análise.
Dados enviados para classificação: esses dados são o texto do usuário enviado do aplicativo cliente de um cliente por meio da API de Análise a ser processada para classificação de texto pelo modelo de machine learning personalizado. A saída dos dados processados contém as classes previstas, juntamente com suas pontuações de confiança. Essa saída é retornada ao aplicativo do cliente para executar uma ação para atender à solicitação do usuário.

A classificação de texto personalizado não coleta nem armazena dados do cliente para melhorar seus modelos de aprendizado de máquina ou para fins de melhoria do produto. Usamos a telemetria agregada, como quais APIs são usadas e o número de chamadas de cada assinatura e recurso, para fins de monitoramento de serviço.

Como a classificação de texto personalizado processa os dados?

O diagrama a seguir ilustra como os dados são processados.

Diagrama que mostra como os dados são processados.

Como os dados são retidos e quais controles do cliente estão disponíveis?

A classificação de texto personalizada é um processador de dados para fins do Regulamento Geral sobre a Proteção de Dados (GDPR). Em conformidade com as políticas de RGPD, os usuários de classificação de texto personalizado têm controle total para exibir, exportar ou excluir qualquer conteúdo do usuário por meio do Language Studio ou programaticamente usando APIs de linguagem.

Seus dados só são armazenados em sua conta Armazenamento do Azure. A classificação de texto personalizado só tem acesso à leitura dele durante o treinamento.

Os controles do cliente incluem:

Os dados marcados fornecidos pelo usuário como um pré-requisito para treinar o modelo são salvos na conta de Armazenamento do Azure do cliente conectada ao projeto durante a criação. Os clientes podem editar ou remover tags sempre que quiserem através do Language Studio.
Os metadados de projetos de classificação de texto personalizados são armazenados no lado do serviço até que o cliente exclua o projeto. Os metadados do projeto são os campos que você preenche ao criar seu projeto, como nome do projeto, descrição, idioma, nome do contêiner de blob conectado e local do arquivo de marcas.
Os modelos de classificação de texto personalizado treinados são armazenados nas contas de Armazenamento do Azure do serviço até que o cliente os exclua. O modelo é substituído sempre que o usuário o treina novamente.
Os modelos de classificação de texto personalizados implantados persistem nas contas de Armazenamento do Azure do serviço até que o cliente exclua a implantação ou exclua o próprio modelo. O modelo é substituído sempre que o usuário realiza uma implantação para o mesmo nome de implantação.

Opcional: segurança para os dados dos clientes

Serviços do Azure são implementados, adotando medidas técnicas e organizacionais adequadas para proteger os dados dos clientes na nuvem.

Para saber mais sobre os compromissos de privacidade e segurança do Microsoft, consulte o Microsoft Trust Center.

Próximas etapas

Comentários

Esta página foi útil?

Last updated on 2026-04-30