Casi d'uso per la classificazione del testo personalizzata

Importante

Le traduzioni non in inglese sono disponibili solo per praticità. Consultare la EN-US versione di questo documento per la versione definitiva.

Che cos'è una nota sulla trasparenza?

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo useranno, le persone che ne saranno interessate e l'ambiente in cui viene distribuito. La creazione di un sistema adatto allo scopo previsto richiede una comprensione del funzionamento della tecnologia, delle sue capacità e limitazioni e di come ottenere le migliori prestazioni. le note sulla trasparenza di Microsoft consentono di comprendere il funzionamento della tecnologia di intelligenza artificiale, le scelte che i proprietari del sistema possono fare che influenzano le prestazioni e il comportamento del sistema e l'importanza di pensare all'intero sistema, tra cui la tecnologia, le persone e l'ambiente. È possibile usare le note sulla trasparenza durante lo sviluppo o la distribuzione del proprio sistema oppure condividerle con le persone che useranno o saranno interessate dal sistema.

le note sulla trasparenza di Microsoft fanno parte di uno sforzo più ampio per Microsoft mettere in pratica i principi di IA. Per altre informazioni, vedere Microsoft Ai Principles.

Introduzione alla classificazione del testo personalizzata

La classificazione del testo personalizzata è un servizio API basato sul cloud che applica l'intelligenza di Machine Learning per consentire di creare modelli personalizzati per le attività di classificazione del testo.

La classificazione del testo personalizzata supporta due tipi di progetti:

  • Classificazione con etichetta singola: si assegna una sola etichetta per ogni file nel set di dati. Ad esempio, se un file è uno script cinematografico, potrebbe essere classificato solo come "Azione", "Thriller" o "Romanticismo".
  • Classificazione di più etichette: si assegnano più etichette per ogni file nel set di dati. Ad esempio, se un file è uno script cinematografico, potrebbe essere classificato come "Azione" o "Azione" e "Thriller".

Nozioni di base sulla classificazione del testo personalizzata

La classificazione del testo personalizzata viene offerta come parte delle funzionalità personalizzate all'interno di Azure Language in Foundry Tools. Questa funzionalità consente agli utenti di creare modelli di intelligenza artificiale personalizzati per classificare il testo in categorie personalizzate predefinite dall'utente. Creando un progetto di classificazione del testo personalizzato, gli sviluppatori possono contrassegnarli in modo iterativo ed eseguire il training, valutare e migliorare le prestazioni del modello prima di renderli disponibili per l'utilizzo. La qualità dei dati contrassegnati influisce notevolmente sulle prestazioni del modello.

Per semplificare la compilazione e la personalizzazione del modello, il servizio offre un portale Web personalizzato accessibile tramite Language Studio. È possibile iniziare facilmente a usare il servizio seguendo la procedura descritta in questa guida introduttiva.

Terminologia personalizzata per la classificazione del testo

I termini seguenti vengono comunemente usati all'interno della classificazione del testo personalizzata:

Termine Definizione
Progetto Un progetto è un'area di lavoro per la creazione di modelli di intelligenza artificiale personalizzati basati sui dati. È possibile accedere al progetto solo dall'utente e da altri utenti che dispongono dell'accesso collaboratore alla risorsa Azure usata. All'interno di un progetto è possibile contrassegnare i dati, compilare modelli, valutarli e migliorarli dove necessario e infine distribuire un modello per essere pronti per l'utilizzo. È possibile compilare più modelli all'interno del progetto nello stesso set di dati.
Modello Un modello è un oggetto sottoposto a training per eseguire una determinata attività. Per questo sistema, i modelli classificano il testo. I modelli vengono addestrati imparando dai dati etichettati.
Classe Una classe è una categoria definita dall'utente che indica la classificazione complessiva del testo. Gli sviluppatori contrassegnano i dati con le classi assegnate prima di passarli al modello per il training.

Casi d'uso di esempio per la classificazione del testo personalizzata

La classificazione del testo personalizzata può essere usata in più scenari in un'ampia gamma di settori. Ecco alcuni esempi:

  • Valutazione automatica di messaggi di posta elettronica o ticket: I centri di supporto di tutti i tipi ricevono un volume elevato di messaggi di posta elettronica o ticket contenenti testo non strutturato, testo a mano libera e allegati. La revisione, il riconoscimento e l'instradamento tempestivi agli esperti in materia all'interno dei team interni è fondamentale. La valutazione della posta elettronica su questa scala richiede che le persone esaminino e instradano i reparti giusti, che richiedono tempo e risorse. La classificazione del testo personalizzata può essere usata per analizzare il testo in ingresso e valutare e classificare il contenuto da instradare automaticamente ai reparti pertinenti per ulteriori azioni.

  • Knowledge mining per migliorare e arricchire la ricerca semantica: La ricerca è fondamentale per qualsiasi app che espone contenuto di testo agli utenti. Gli scenari comuni includono ricerche di catalogo o documenti, ricerche di prodotti al dettaglio o knowledge mining per l'analisi scientifica dei dati. Molte aziende in diversi settori stanno cercando di creare un'esperienza di ricerca avanzata su contenuti privati ed eterogenei, che includono documenti strutturati e non strutturati. Come parte della pipeline, gli sviluppatori possono usare la classificazione del testo personalizzata per classificare il testo in classi rilevanti per il proprio settore. Le classi stimate possono essere usate per arricchire l'indicizzazione del file per un'esperienza di ricerca più personalizzata.

Considerazioni quando si sceglie un caso d'uso

  • Evitare di usare la classificazione del testo personalizzata per decisioni che potrebbero avere gravi effetti negativi. Includere la revisione umana delle decisioni che hanno il potenziale di gravi impatti sulle persone. Ad esempio, identificare se accettare o rifiutare un'attestazione assicurativa in base alla descrizione di un evento imprevisto da parte di un utente.

  • Evitare di creare classi ambigue e non rappresentative. Quando si progetta lo schema, evitare classi così simili tra loro che potrebbero verificarsi difficoltà a differenziarle l'una dall'altra. Ad esempio, se si classificano script di film, evitare di creare una classe per romanticismo, commedia e rom-com. Prendere invece in considerazione l'uso di un modello di classificazione con più etichette con classi romantiche e commedie. Quindi, per i film rom-com, assegnare entrambe le classi.

  • Considerazioni legali e normative: le organizzazioni devono valutare potenziali obblighi legali e normativi specifici quando si usano strumenti e soluzioni Foundry, che potrebbero non essere appropriati per l'uso in ogni settore o scenario. Inoltre, gli strumenti o le soluzioni Foundry non sono progettati per e non possono essere usati in modi vietati in termini di servizio applicabili e codici di comportamento pertinenti.

Passaggi successivi