Dati e privacy per il riconoscimento di entità denominate personalizzate

Importante

Le traduzioni non in inglese sono disponibili solo per praticità. Consultare la EN-US versione di questo documento per la versione definitiva.

Questo articolo fornisce alcuni dettagli generali sul modo in cui i dati vengono elaborati dal riconoscimento personalizzato delle entità denominate (NER). L'utente è responsabile dell'uso e dell'implementazione di questa tecnologia, inclusa la conformità a tutte le leggi e le normative applicabili all'utente. Ad esempio, è responsabilità dell'utente:

  • Comprendere dove i dati vengono elaborati e archiviati dal servizio NER personalizzato, per soddisfare gli obblighi normativi della vostra applicazione.

  • Assicurarsi di avere tutte le licenze necessarie, i diritti proprietari o altre autorizzazioni necessarie per il contenuto nel set di dati usato come base per la compilazione dei modelli NER personalizzati e per il contenuto valutato al momento della distribuzione o dell'uso di NER personalizzato nell'ambiente di produzione.

Quali dati elabora il processo NER personalizzato?

NER personalizzato elabora i dati seguenti:

  • Il set di dati e i tag dell'utente: Come prerequisito per la creazione di un progetto NER personalizzato, gli utenti devono caricare il set di dati nel contenitore Archiviazione BLOB di Azure. Un file di tag è un file in formato JSON che contiene un riferimento alle entità con tag dell'utente. Il set di dati di un utente include set di training e test, che gli sviluppatori possono predefinito nel file di tag o che possono essere scelti in modo casuale durante il training. Il set di training e il file di tag vengono elaborati durante il training per creare il modello NER personalizzato. Il set di test viene elaborato successivamente dal modello sottoposto a training per valutarne le prestazioni.

  • Modelli NER personalizzati: In base alla richiesta dell'utente di eseguire il training del modello, NER personalizzato elabora i dati contrassegnati forniti per restituire un modello sottoposto a training. L'utente può scegliere di eseguire il training di un nuovo modello o di sovrascrivere uno esistente. Il modello allenato viene quindi memorizzato dal servizio e utilizzato per la valutazione del modello. Dopo che lo sviluppatore è soddisfatto delle prestazioni del modello, richiede il deployment del modello per l'uso. Il modello distribuito verrà archiviato anche sul lato del servizio, che viene usato per elaborare le richieste dell'utente per la stima tramite l'API Analizza.

  • Dati inviati per l'estrazione: Si tratta del testo dell'utente, inviato da un'applicazione client tramite l'API Analyze, da elaborare per l'estrazione di entità dal modello NER personalizzato. L'output dei dati elaborati contiene le entità estratte e i relativi punteggi di attendibilità. Viene restituito all'applicazione del client per eseguire un'azione per soddisfare la richiesta dell'utente.

I dati dell'utente caricati per il training, il test o l'estrazione sono i dati dei clienti. Il NER personalizzato non usa i dati dei clienti per migliorare i modelli generali basati su machine learning a scopo di miglioramento del prodotto. Vengono usati dati di telemetria aggregati, ad esempio le API usate e il numero di chiamate da ogni sottoscrizione e risorsa, a scopo di monitoraggio del servizio.

In che modo NER personalizzato elabora i dati?

Il diagramma seguente illustra come vengono elaborati i dati.

Diagramma che mostra come vengono elaborati i dati.

Come vengono conservati i dati e quali sono i controlli dei clienti disponibili?

NER personalizzato è un responsabile del trattamento dei dati ai fini del GDPR. In conformità ai criteri GDPR, gli utenti NER personalizzati hanno il controllo completo per visualizzare, esportare o eliminare i dati dei clienti. Gli utenti possono eseguire queste azioni tramite Language Studio o a livello di codice usando le API del linguaggio.

I dati vengono archiviati solo nell'account di archiviazione Azure. Il NER personalizzato ha accesso solo alla lettura da esso durante l'addestramento e la valutazione. NER personalizzato non registra o archivia i dati inviati dal cliente per le attività di estrazione tramite l'API di stima.

I controlli dei clienti includono:

  • I dati contrassegnati, forniti dall'utente come prerequisito per il training del modello, vengono salvati nell'account di archiviazione del cliente Azure connesso al progetto durante la creazione. I clienti possono modificare o rimuovere tag ogni volta che vogliono tramite Language Studio.

  • I metadati del progetto NER personalizzati vengono archiviati sul lato del servizio, fino a quando il cliente non elimina il progetto. Quando si crea il progetto, si compilano i campi dei metadati, ad esempio il nome del progetto, la descrizione, la lingua, il nome del contenitore BLOB connesso e il percorso del file tag.

  • I modelli NER personalizzati sottoposti a training vengono archiviati negli account di archiviazione Azure del servizio fino a quando il cliente non li elimina. I modelli vengono sovrascritti ogni volta che l'utente li riaddestra.

  • I modelli NER personalizzati distribuiti vengono mantenuti negli account di archiviazione Azure del servizio fino a quando il cliente non elimina la distribuzione o elimina il modello stesso. Il modello viene sovrascritto ogni volta che l'utente esegue la distribuzione con lo stesso nome di distribuzione.

Sicurezza per i dati dei clienti

Azure servizi vengono implementati mantenendo misure tecniche e organizzative appropriate per proteggere i dati dei clienti nel cloud.

Per informazioni sugli impegni di sicurezza di Microsoft, vedere Microsoft Centro protezione.

Passaggi successivi