Casos de uso para classificação de texto personalizado

Importante

Traduções não em inglês são fornecidas apenas para conveniência. Consulte a EN-US versão deste documento para obter a versão definitiva.

O que é uma Nota de Transparência?

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usarão, as pessoas que serão afetadas por ela e o ambiente no qual ela é implantada. A criação de um sistema adequado para sua finalidade pretendida requer uma compreensão de como a tecnologia funciona, suas funcionalidades e limitações e como obter o melhor desempenho. as Notas de Transparência da Microsoft destinam-se a ajudá-lo a entender como nossa tecnologia de IA funciona, as escolhas que os proprietários do sistema podem fazer que influenciam o desempenho e o comportamento do sistema e a importância de pensar em todo o sistema, incluindo a tecnologia, as pessoas e o meio ambiente. Você pode usar Notas de Transparência ao desenvolver ou implantar seu próprio sistema ou compartilhá-las com as pessoas que usarão ou serão afetadas pelo seu sistema.

as Notas de Transparência da Microsoft fazem parte de um esforço mais amplo em Microsoft para colocar nossos princípios de IA em prática. Para saber mais, consulte Microsoft Princípios de IA.

Introdução à classificação de texto personalizada

A classificação de texto personalizado é um serviço de API baseado em nuvem que aplica inteligência de aprendizado de máquina para permitir que você crie modelos personalizados para tarefas de classificação de texto.

A classificação de texto personalizado dá suporte a dois tipos de projetos:

Classificação de rótulo único: você atribui apenas um rótulo para cada arquivo em seu conjunto de dados. Por exemplo, se um arquivo for um script de filme, ele só poderá ser classificado como "Ação", "Thriller" ou "Romance".
Classificação de vários rótulos: você atribui vários rótulos para cada arquivo em seu conjunto de dados. Por exemplo, se um arquivo for um script de filme, ele poderá ser classificado como "Ação" ou "Ação" e "Thriller".

Os conceitos básicos da classificação de texto personalizado

A classificação de texto personalizado é oferecida como parte dos recursos personalizados no Azure Language in Foundry Tools. Esse recurso permite que seus usuários criem modelos de IA personalizados para classificar o texto em categorias personalizadas predefinidas pelo usuário. Ao criar um projeto de classificação de texto personalizado, os desenvolvedores podem marcar dados iterativamente e treinar, avaliar e melhorar o desempenho do modelo antes de disponibilizá-los para consumo. A qualidade dos dados marcados afeta muito o desempenho do modelo.

Para simplificar a criação e personalização do modelo, o serviço oferece um portal da Web personalizado que pode ser acessado por meio do Language Studio. Você pode começar facilmente com o serviço seguindo as etapas neste início rápido.

Terminologia de classificação de texto personalizado

Os seguintes termos são comumente usados na classificação de texto personalizado:

Termo	Definição
Projeto	Um projeto é uma área de trabalho para criar seus modelos de IA personalizados com base em seus dados. Seu projeto só pode ser acessado por você e por outras pessoas que têm acesso de colaborador ao recurso Azure que está sendo usado. Em um projeto, você pode marcar dados, criar modelos, avaliá-los e melhorá-los quando necessário e, eventualmente, implantar um modelo para estar pronto para consumo. Você pode criar vários modelos em seu projeto no mesmo conjunto de dados.
Modelo	Um modelo é um objeto treinado para realizar uma determinada tarefa. Para esse sistema, os modelos classificam o texto. Os modelos são treinados aprendendo com dados marcados.
Classe	Uma classe é uma categoria definida pelo usuário que indica a classificação geral do texto. Os desenvolvedores marcam seus dados com suas classes atribuídas antes de passá-los para o modelo de treinamento.

Casos de uso de exemplo para classificação de texto personalizada

A classificação de texto personalizado pode ser usada em vários cenários em vários setores. Alguns exemplos são:

E-mails automáticos ou triagem de tickets: Os centros de suporte de todos os tipos recebem um alto volume de e-mails ou tickets contendo textos e anexos não estruturados. A revisão oportuna, a confirmação e o roteamento para especialistas no assunto dentro das equipes internas são críticos. A triagem de email nessa escala exige que as pessoas revisem e roteiem para os departamentos certos, o que leva tempo e recursos. A classificação de texto personalizado pode ser usada para analisar o texto de entrada e fazer a triagem e categorizar o conteúdo a ser roteado automaticamente para os departamentos relevantes para outras ações.
Mineração de conhecimento para aprimorar e enriquecer a pesquisa semântica: A pesquisa é fundamental para qualquer aplicativo que exibe conteúdo de texto para os usuários. Cenários comuns incluem pesquisas de catálogo ou documentos, pesquisas de produtos de varejo ou mineração de conhecimento para ciência de dados. Muitas empresas de vários setores estão buscando criar uma experiência de pesquisa avançada sobre conteúdo privado e heterogêneo, que inclui documentos estruturados e não estruturados. Como parte de seu pipeline, os desenvolvedores podem usar a classificação de texto personalizado para categorizar seu texto em classes relevantes para o setor. As classes previstas podem ser usadas para enriquecer a indexação do arquivo para uma experiência de pesquisa mais personalizada.

Considerações ao escolher um caso de uso

Evite usar a classificação de texto personalizada para decisões que possam ter sérios impactos adversos. Inclua a revisão humana das decisões que têm o potencial de impactos sérios nos indivíduos. Por exemplo, identificar se uma declaração de seguro deve ser aceita ou rejeitada com base na descrição de um incidente por um usuário.
Evite criar classes ambíguas e não representativas. Ao projetar seu esquema, evite classes tão semelhantes umas às outras que podem haver dificuldade em diferenciá-las umas das outras. Por exemplo, se você estiver classificando scripts de filmes, evite criar uma classe para romance, comédia e rom-com. Em vez disso, considere usar um modelo de classificação de vários rótulos com classes de romance e comédia. Em seguida, para filmes de comédias românticas, atribua ambas as classes.
Considerações legais e regulatórias: as organizações precisam avaliar possíveis obrigações legais e regulatórias específicas ao usar quaisquer Ferramentas e soluções do Foundry, que podem não ser apropriadas para uso em todos os setores ou cenários. Além disso, as ferramentas ou soluções do Foundry não são projetadas e podem não ser usadas de maneiras proibidas em termos de serviço aplicáveis e códigos de conduta relevantes.

Próximas etapas

Comentários

Esta página foi útil?

Last updated on 2026-04-30