Dati e privacy per la classificazione testo personalizzata

Importante

Le traduzioni non in inglese sono disponibili solo per praticità. Consultare la EN-US versione di questo documento per la versione definitiva.

Questo articolo fornisce informazioni generali sul modo in cui i dati vengono elaborati dalla classificazione del testo personalizzata. Tenere presente che l'utente è responsabile dell'uso e dell'implementazione di questa tecnologia, che include la conformità a tutte le leggi e le normative applicabili all'utente. Ad esempio, è responsabilità dell'utente:

  • Comprendi dove vengono elaborati e archiviati i tuoi dati dal servizio di classificazione del testo personalizzato per soddisfare gli obblighi normativi per la tua applicazione.
  • Assicurarsi di avere tutte le licenze necessarie, i diritti proprietari o altre autorizzazioni necessarie per il contenuto nel set di dati usato come base per la compilazione di modelli di classificazione del testo personalizzati.

È responsabilità dell'utente rispettare tutte le leggi e le normative applicabili nella giurisdizione.

Quali dati elabora la classificazione del testo personalizzata?

La classificazione del testo personalizzata elabora i dati seguenti:

  • File di set di dati e tag dell'utente: come prerequisito per la creazione di un progetto di classificazione del testo personalizzato, gli utenti devono caricare il set di dati nel contenitore Archiviazione BLOB di Azure. Un file di tag è un file in formato JSON che contiene riferimenti ai dati e alle classi con tag di un utente. L'utente può usare tag personalizzati o contrassegnarne i dati tramite l'esperienza dell'interfaccia utente in Language Studio. In entrambi i casi, un file di tag che contiene dati e classi con tag è essenziale per il training.

    Il set di dati di un utente viene suddiviso in set di training e test, in cui la suddivisione può essere predefinita dagli sviluppatori in un file di tag o scelta in modo casuale durante il training. Il set di training e il file di tag vengono elaborati durante il training per creare il modello di classificazione del testo personalizzato. Il set di test viene elaborato successivamente dal modello sottoposto a training per valutarne le prestazioni.

  • Modelli di classificazione del testo personalizzati: in base alla richiesta dell'utente di eseguire il training del modello, la classificazione del testo personalizzata elabora i dati contrassegnati forniti per restituire un modello sottoposto a training. L'utente può scegliere di eseguire il training di un nuovo modello o di sovrascrivere uno esistente. Il modello addestrato viene quindi archiviato dal servizio e utilizzato per la valutazione del modello. Dopo che lo sviluppatore è soddisfatto delle prestazioni del modello, richiede di distribuire il modello per l'uso da parte degli utenti. Il modello distribuito viene archiviato anche sul lato del servizio, che viene usato per elaborare le richieste dell'utente per la stima tramite l'API Analyze.

  • Dati inviati per la classificazione: questi dati sono il testo dell'utente inviato dall'applicazione client di un cliente tramite l'API Analizza da elaborare per la classificazione del testo dal modello di Machine Learning personalizzato. L'output dei dati elaborati contiene le classi stimate insieme ai relativi punteggi di attendibilità. Questo output viene restituito all'applicazione del client per eseguire un'azione per soddisfare la richiesta dell'utente.

La classificazione del testo personalizzata non raccoglie o archivia i dati dei clienti per migliorare i modelli basati su machine learning o per scopi di miglioramento del prodotto. Vengono usati dati di telemetria aggregati, ad esempio le API usate e il numero di chiamate da ogni sottoscrizione e risorsa, a scopo di monitoraggio del servizio.

In che modo la classificazione del testo personalizzata elabora i dati?

Il diagramma seguente illustra come vengono elaborati i dati.

Diagramma che mostra come vengono elaborati i dati.

Come vengono conservati i dati e quali sono i controlli dei clienti disponibili?

La classificazione del testo personalizzata è un elaboratore di dati per scopi del Regolamento generale sulla protezione dei dati (GDPR). In conformità ai criteri GDPR, gli utenti di classificazione del testo personalizzato hanno il controllo completo per visualizzare, esportare o eliminare qualsiasi contenuto utente tramite Language Studio o a livello di codice usando le API del linguaggio.

I dati vengono archiviati solo nell'account Archiviazione di Azure. la classificazione del testo personalizzata ha accesso solo alla lettura durante il training.

I controlli dei clienti includono:

  • I dati contrassegnati forniti dall'utente come prerequisito per il training del modello vengono salvati nell'account Archiviazione di Azure del cliente connesso al progetto durante la creazione. I clienti possono modificare o rimuovere tag ogni volta che vogliono tramite Language Studio.
  • I metadati dei progetti di classificazione del testo personalizzati vengono archiviati sul lato del servizio finché il cliente non elimina il progetto. I metadati del progetto sono i campi compilati quando si crea il progetto, ad esempio il nome del progetto, la descrizione, la lingua, il nome del contenitore BLOB connesso e il percorso del file tag.
  • I modelli di classificazione del testo personalizzati sottoposti a training vengono archiviati negli account Archiviazione di Azure del servizio fino a quando il cliente non li elimina. Il modello viene sovrascritto ogni volta che l'utente lo ripete.
  • I modelli di classificazione del testo personalizzati distribuiti vengono mantenuti negli account di Archiviazione di Azure del servizio fino a quando il cliente non elimina la distribuzione o elimina il modello stesso. Il modello viene sovrascritto ogni volta che l'utente distribuisce sullo stesso nome di distribuzione.

Facoltativo: sicurezza per i dati dei clienti

Azure servizi vengono implementati mantenendo misure tecniche e organizzative appropriate per proteggere i dati dei clienti nel cloud.

Per altre informazioni sugli impegni di privacy e sicurezza di Microsoft, vedere Microsoft Centro protezione.

Passaggi successivi