Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Importante
Traduções não ingleses são fornecidas apenas por conveniência. Por favor, consulte a EN-US versão deste documento para a versão definitiva.
O que é uma Nota de Transparência?
Um sistema de IA inclui não só a tecnologia, mas também as pessoas que a irão utilizar, as pessoas que serão afetadas por ela e o ambiente onde é implementada. Criar um sistema adequado ao seu propósito requer compreender como a tecnologia funciona, as suas capacidades e limitações, e como alcançar o melhor desempenho. As Notas de Transparência da Microsoft destinam-se a ajudá-lo a compreender como funciona a nossa tecnologia de IA, as escolhas que os proprietários do sistema podem fazer que influenciam o desempenho e o comportamento do sistema, e a importância de pensar no sistema como um todo, incluindo a tecnologia, as pessoas e o ambiente. Pode usar as Notas de Transparência ao desenvolver ou implementar o seu próprio sistema, ou partilhá-las com as pessoas que irão usar ou ser afetadas pelo seu sistema.
As Notas de Transparência da Microsoft fazem parte de um esforço mais amplo da Microsoft para pôr em prática os nossos princípios de IA. Para saber mais, consulte Microsoft Princípios da IA.
Introdução à classificação de texto personalizada
A classificação de texto personalizada é um serviço API baseado na cloud que aplica inteligência de aprendizagem automática para lhe permitir construir modelos personalizados para tarefas de classificação de texto.
A classificação de texto personalizada suporta dois tipos de projetos:
- Classificação de etiqueta única: Atribui apenas uma etiqueta a cada ficheiro do seu conjunto de dados. Por exemplo, se um ficheiro for um guião de filme, só pode ser classificado como "Ação", "Thriller" ou "Romance".
- Classificação múltipla de etiquetas: Atribui múltiplas etiquetas a cada ficheiro do seu conjunto de dados. Por exemplo, se um ficheiro for um guião de filme, pode ser classificado como "Ação" ou "Ação" e "Thriller".
Os fundamentos da classificação de textos personalizados
A classificação de texto personalizada é oferecida como parte das funcionalidades personalizadas dentro do Azure Language no Foundry Tools. Esta funcionalidade permite aos utilizadores construir modelos de IA personalizados para classificar o texto em categorias personalizadas pré-definidas pelo utilizador. Ao criar um projeto personalizado de classificação de texto, os programadores podem etiquetar iterativamente os dados e treinar, avaliar e melhorar o desempenho dos modelos antes de os disponibilizarem para consumo. A qualidade dos dados marcados afeta significativamente o desempenho do modelo.
Para simplificar a construção e personalização do seu modelo, o serviço oferece um portal web personalizado que pode ser acedido através do Language Studio. Pode começar facilmente com o serviço seguindo os passos deste quickstart.
Terminologia de classificação de texto personalizada
Os seguintes termos são frequentemente usados na classificação de textos personalizados:
| Termo | Definição |
|---|---|
| Projeto | Um projeto é uma área de trabalho para construir os seus modelos de IA personalizados baseados nos seus dados. O seu projeto só pode ser acedido por si e por outros que tenham acesso de contribuidor ao recurso Azure que está a ser utilizado. Dentro de um projeto, pode etiquetar dados, construir modelos, avaliá-los e melhorá-los quando necessário, e eventualmente implementar um modelo para estar pronto para consumo. Pode construir múltiplos modelos dentro do seu projeto no mesmo conjunto de dados. |
| Modelo | Um modelo é um objeto treinado para realizar uma determinada tarefa. Para este sistema, os modelos classificam o texto. Os modelos são treinados aprendendo a partir de dados marcados. |
| Classe | Uma classe é uma categoria definida pelo utilizador que indica a classificação global do texto. Os programadores etiquetam os seus dados com as classes atribuídas antes de os passar para o modelo para treino. |
Exemplos de casos de uso para classificação de texto personalizada
A classificação personalizada de textos pode ser usada em múltiplos cenários em vários setores. Alguns exemplos são:
Emails automáticos ou triagem de tickets: Centros de suporte de todos os tipos recebem um elevado volume de emails ou tickets contendo texto livre e não estruturado e anexos. A revisão, reconhecimento e encaminhamento atempados para especialistas dentro das equipas internas é fundamental. A triagem de emails nesta escala exige que as pessoas revisem e encaminhem para os departamentos certos, o que exige tempo e recursos. A classificação personalizada de texto pode ser usada para analisar o texto recebido, triar e categorizar o conteúdo a ser automaticamente encaminhado para os departamentos relevantes para ações adicionais.
Mineração de conhecimento para melhorar e enriquecer a pesquisa semântica: A pesquisa é fundamental para qualquer aplicação que mostre conteúdo de texto aos utilizadores. Cenários comuns incluem pesquisas em catálogos ou documentos, pesquisas de produtos de retalho ou mineração de conhecimento para ciência de dados. Muitas empresas de vários setores procuram construir uma experiência de pesquisa rica sobre conteúdos privados e heterogéneos, que incluem documentos estruturados e não estruturados. Como parte do seu pipeline, os programadores podem usar classificação de texto personalizada para categorizar o seu texto em classes relevantes para o seu setor. As classes previstas podem ser usadas para enriquecer a indexação do ficheiro para uma experiência de pesquisa mais personalizada.
Considerações ao escolher um caso de uso
Evite usar classificação de texto personalizada para decisões que possam ter impactos adversos graves. Incluir a revisão humana das decisões que possam ter impactos graves nos indivíduos. Por exemplo, identificar se deve aceitar ou rejeitar uma reclamação de seguro com base na descrição de um incidente feita por um utilizador.
Evite criar aulas ambíguas e não representativas. Ao desenhar o seu esquema, evite classes que sejam tão semelhantes entre si que possa haver dificuldade em diferenciá-las. Por exemplo, se estiver a classificar guiões de filmes, evite criar uma aula para romance, comédia e comédia romântica. Em vez disso, considere usar um modelo de classificação de múltiplas etiquetas com aulas de romance e comédia. Depois, para filmes de comédia romântica, atribua as duas classes.
-
Considerações legais e regulatórias: As organizações precisam de avaliar potenciais obrigações legais e regulatórias específicas ao utilizar quaisquer Ferramentas e Soluções da Foundry, que podem não ser adequadas para uso em todos os setores ou cenários. Além disso, as ferramentas ou soluções da Foundry não foram concebidas para e não podem ser usadas de formas proibidas nos termos de serviço aplicáveis e nos códigos de conduta relevantes.