Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Azure Confidential Clean Rooms offre un ambiente protetto, denominato clean room, che consente alle organizzazioni di superare le problematiche di sicurezza e privacy dell'uso dei dati sensibili. Le organizzazioni possono collaborare e analizzare i dati nella stanza pulita usando funzionalità avanzate di miglioramento della privacy, ad esempio governance e controllo protetti, attendibilità verificabile e accesso controllato abilitato dal confidential computing.
Gli scenari tipici includono l'analisi di big data tra più parti su set di dati combinati, l'addestramento e la messa a punto del machine learning (ML), in cui i dati di addestramento e il modello provengono da soggetti diversi, e l'inferenza ML tra più parti su input sensibili.
Azure Confidential Clean Rooms per l'analisi (Anteprima)
Azure Confidential Clean Rooms for Analytics è un servizio completamente gestito che consente ai clienti e ai rispettivi partner di analizzare in modo sicuro set di dati sensibili dal punto di vista della privacy. Utilizza analisi dei Big Data basata su Apache Spark con confidential compute abilitato (Spark SQL), che consente di proteggere i dati grezzi da altri collaboratori e dall'operatore di Azure eseguendo i calcoli in un ambiente di esecuzione attendibile (TEE).
Il diagramma seguente illustra come le organizzazioni collaborano usando Azure Confidential Clean Rooms for Analytics.
Nota
Azure confidential clean rooms for Analytics è attualmente disponibile in anteprima limitata. L'anteprima è soggetta alle Condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure. I clienti non devono usare l'anteprima per elaborare i dati personali o altri dati soggetti a requisiti legali o normativi di conformità. L'anteprima è destinata a test, valutazione e feedback e non deve essere usata nell'ambiente di produzione.
Funzionalità principali
- Completamente gestito: Azure si occupa della predisposizione e del ridimensionamento dell'infrastruttura senza alcun intervento da parte dell'utente, consentendo ai clienti di concentrarsi sulle query e sulle analisi anziché sulla gestione dell'infrastruttura.
- Confidential Spark SQL:Confidential Spark SQL: Spark SQL consente di eseguire query su set di dati di grandi dimensioni ed eseguire query complesse in un ambiente di elaborazione distribuito. Nella versione con confidential computing abilitato, il driver Spark e gli executor sono enclave completamente attestate e governate da criteri, in esecuzione come nodi virtuali in Istanze di Azure Container riservate (C-ACI) in un cluster di Servizio Azure Kubernetes (AKS), il che contribuisce a impedire l'esfiltrazione dei dati dei collaboratori durante l'esecuzione della query.
- Governance: Consente di gestire l'appartenenza alle clean room, di ottenere e verificare l'approvazione per le query dei collaboratori interessati prima della loro esecuzione e di verificare il consenso all'accesso ai dati sensibili dei collaboratori. Consente inoltre di generare audit trail resistenti alle manomissioni contenenti eventi di pulizia salienti. Questa governance è resa possibile con l'aiuto di un'implementazione di Confidential Consortium Framework (CCF).
-
Controlli sulla privacy: Ogni set di dati fornito dichiara un
allowedFieldselenco in modo che solo le colonne vengano esposte alle query. Inoltre, ogni query pubblicata può dichiarare un numero minimo di righe per ciascuna vista di input, al di sotto del quale la query viene rifiutata (pre-condizioni), e un numero minimo al di sotto del quale i gruppi aggregati nell'output vengono eliminati (post-filtri). Tali guardie aiutano a prevenire la ri-identificazione degli individui attraverso l'output. - Attendibilità verificabile: L'attestazione remota crittografica in ogni passaggio costituisce la pietra angolare del servizio, consentendo a ogni partecipante di verificare in modo indipendente che la stanza pulita sia in esecuzione codice noto e attestato su hardware riservato originale.
-
Contenitori open source: Tutte le immagini di contenitori clean-room e i sidecar forniti da Microsoft sono pubblicati in
mcr.microsoft.com/cleanroom, e il relativo codice sorgente è disponibile nel repository Azure/azure-cleanroom. È possibile verificarne la provenienza e l'integrità tramite l'attestazione dell'artefatto di GitHub.
Casi d'uso
L'analisi dei Big Data riservati multiparty sblocca il valore negli scenari in cui la riservatezza dei dati, la pressione normativa o le problematiche competitive in precedenza bloccavano la collaborazione. Gli scenari seguenti sono esempi di dove l'analisi riservata può fornire valore. Si noti che l'anteprima non deve essere usata per elaborare dati personali o altri dati soggetti a requisiti di conformità legali o normativi.
Media e pubblicità
- Collaborazione dei dati CRM dell'inserzionista con i dati dell'editore per l'assegnazione di destinatari e l'attivazione di segmenti.
- Collaborazione dei dati dei destinatari con i partner di misurazione per la misurazione e l'attribuzione.
Servizi bancari e finanziari
- Collaborazione tra banche e compagnie assicurative per l'upselling dei prodotti rilevanti ai clienti esistenti senza condividere dati non elaborati da entrambe le parti.
- Collaborazione con i rivenditori per generare offerte personalizzate per i clienti bancari, senza esporre i dati sottostanti di una delle parti.
Governo e settore pubblico
- Proteggere la collaborazione tra i reparti governativi per ottenere risultati migliori per il benessere dei cittadini.
- Collaborazione sicura tra enti pubblici e aziende private su carichi di lavoro di interesse condiviso, ad esempio il monitoraggio del traffico e i sistemi meteorologici.
Assistenza sanitaria
- Consentire alle aziende sanitarie di combinare i propri dati con istituzioni di terze parti per accelerare lo sviluppo clinico senza esporre i dati dei pazienti sottostanti. Un esempio può essere l'identificazione dei partecipanti idonei per uno studio clinico.
- Combinare i set di dati dei pazienti in tutti gli ospedali per studiare i modelli o i risultati delle malattie senza esporre informazioni sensibili sui pazienti da entrambi i lati.
Retail
- Analizzare il comportamento dei clienti tra rivenditori e partner per consentire una personalizzazione e una pianificazione dell'inventario più avanzati, senza esporre i dati dei clienti sottostanti di ogni rivenditore.
Domande frequenti
È disponibile un esempio da provare?
Sì. Dopo aver accettato la richiesta di partecipare all'anteprima, usare uno degli esempi pubblicati:
- esempio basato su interfaccia della riga di comando di Azure:analytics-using-managedcleanroom - README-CLI
- esempio basato su API REST:analytics-using-managedcleanroom — README-API
Più di due organizzazioni possono partecipare a una collaborazione?
Sì. Azure Confidential Clean Rooms consente a più provider di dati di condividere i dati in una singola stanza pulita.
Quali formati di dati sono supportati come input e output?
CSV, Parquet e JSON.
In che modo il servizio limita le colonne esposte alle query?
Ogni set di dati fornito dichiara un
allowedFieldselenco, quindi solo tali colonne vengono esposte alle query in esecuzione nella stanza pulita. Ogni altra colonna nell'archiviazione di origine viene esclusa dall'accesso.In che modo il servizio impedisce la reidentificazione dei singoli individui nell'output?
Ogni query pubblicata può dichiarare un numero minimo di righe per ogni vista di input, al di sotto del quale la query viene rifiutata (pre-condizioni), e un numero minimo al di sotto del quale i gruppi aggregati nell'output vengono eliminati (post-filtri). Il compositore di query può impostare questi elementi e altri collaboratori possono esaminarli e approvarli.
Chi deve approvare una query?
Tutti i collaboratori ai quali viene fatto riferimento ai set di dati da una query devono approvarlo.
Partecipazione all'anteprima
Azure confidential clean rooms for Analytics è attualmente disponibile in anteprima limitata. Se si è interessati a partecipare all'anteprima, compilare e inviare il modulo.
Dopo aver inviato il modulo, la richiesta verrà esaminata. Se accettiamo la richiesta, ti contatteremo con i passaggi dettagliati per partecipare. Tenere presente che, poiché l'anteprima è limitata, potrebbe non essere possibile accettare tutte le richieste.
Se hai requisiti di carico di lavoro al di fuori delle analisi Spark SQL, ad esempio pipeline di analisi personalizzate, addestramento e ottimizzazione di modelli di machine learning o inferenza, compila e invia lo stesso modulo e ti ricontatteremo.