Traduttore di Azure nella nota sulla trasparenza degli strumenti di Foundry

Importante

Le traduzioni non in inglese sono disponibili solo per praticità. Consultare la EN-US versione di questo documento per la versione definitiva.

Un sistema di intelligenza artificiale (IA) include non solo la tecnologia, ma anche le persone che lo useranno, le persone che ne saranno interessate e l'ambiente in cui viene distribuito. La creazione di un sistema adatto allo scopo previsto richiede una comprensione del funzionamento della tecnologia, delle funzionalità e delle limitazioni e di come ottenere le migliori prestazioni. Microsoft note sulla trasparenza sono destinate a comprendere il funzionamento della nostra tecnologia di IA, le scelte che i proprietari del sistema possono fare che influenzano le prestazioni e il comportamento del sistema e l'importanza di pensare all'intero sistema, tra cui la tecnologia, le persone e l'ambiente. È possibile usare le note sulla trasparenza durante lo sviluppo o la distribuzione del proprio sistema o condividerle con le persone che useranno o saranno interessate dal sistema.

Microsoft le note sulla trasparenza fanno parte di un impegno più ampio in Microsoft per mettere in pratica i nostri principi di IA. Per altre informazioni, vedere i principi di IA Microsoft.

Nozioni di base su Traduttore di Azure in Foundry Tools

Introduzione

Translator è un servizio di intelligenza artificiale che traduce il testo da un linguaggio naturale a un altro. Nella letteratura di Machine Learning questo processo è detto traduzione automatica. L'applicazione di tecniche di IA ha reso la traduzione automatica tra le lingue significativamente migliore negli ultimi 70 anni di ricerca di traduzione automatica, fino al punto che possiamo presentare il risultato della traduzione automatica ai destinatari umani per l'utilizzo diretto, senza modifiche, in alcuni casi d'uso.

Translator offre un'API che consente di tradurre da una lingua a un'altra o a più lingue contemporaneamente.

Internamente, ogni traduzione della lingua viene eseguita come atto separato. È possibile tradurre tra più di 135 lingue e dialetti offerti da Translator.

L'addestramento dei sistemi di traduzione dipende dalla disponibilità dei dati tra le coppie linguistiche. Creiamo sistemi bilingue (sistemi di traduzione tra due lingue) o sistemi multilingue (sistemi di traduzione in più lingue). In base alla qualità del modello, il servizio sceglierà il percorso ottimale per una particolare traduzione richiesta dall'utente.

La traduzione tra alcune coppie può passare attraverso una terza lingua. Ad esempio, la traduzione tra Swahili e Hindi potrebbe comportare la traduzione da Swahili all'inglese seguita dalla traduzione dall'inglese all'hindi. Questo processo viene eseguito automaticamente all'interno del servizio.

Termini chiave

Termine Definizione
Carattere L'API Translator conta ogni punto di codice definito in Unicode come carattere.
Frase testuale Frase completa o parziale.
Documento Una raccolta di testo in un formato di file digitale, tra cui Word documento, Excel foglio di calcolo, PowerPoint presentazione, Adobe PDF, HTML, Testo e Markdown.
Stile e registro Il modo di ortografia/punteggiatura del testo, che può influire sulla qualità della traduzione.

Funzionalità

Comportamento del sistema

Translator offre funzionalità per:

  • Tradurre il testo in più lingue.
  • Traslitterare il testo da uno script a un altro.
  • Convertire in modo asincrono batch di documenti di grandi dimensioni in più lingue che mantengono la struttura e il layout come nel documento di origine.
  • Convertire in modo sincrono un singolo documento in un'unica lingua di destinazione che mantiene la struttura e il layout come nel documento di origine.

Casi d'uso

Usi previsti

Vengono fornite le classi di casi d'uso della traduzione seguenti per facilitare l'analisi degli scenari personalizzati:

Traduzione in uscita: un editore di informazioni fornisce documenti o testo in più lingue, indirizzando il pubblico di destinazione nella lingua del destinatario. Esistono classi e formati diversi di materiale in uscita, ad esempio volantini di marketing, video informativi o manuali di fabbrica. La traduzione automatica è più adatta per alcune classi rispetto ad altre. Come regola generale, l'idoneità della traduzione automatica è inversamente proporzionale alla creatività del contenuto. La traduzione può essere pubblicata come contenuto Web, un documento elettronico o come sottotitoli video o doppiatori o essere stampati su carta.

  • Traduzione non elaborata: pubblicare la traduzione come fornita dal sistema di traduzione automatica. Questo caso d'uso comporta il costo più basso e viene fornito con una frequenza di errore non trascurabile. Dovrebbero essere presenti meccanismi per reagire a errori di traslazione, ad esempio il feedback degli utenti.
  • Traduzione post-modificata: pubblicare la traduzione post-modificata, ovvero il risultato della traduzione automatica corretto da un revisore umano. L'intervento umano aumenta il costo della traslazione non elaborata di un fattore superiore a 1.000, ma riduce significativamente il tasso di errore e migliora la fluenza e la comprensibilità della traduzione.

Traduzione in ingresso: qualcuno riceve informazioni in una lingua straniera e usa Translator per tradurre le informazioni nella lingua nativa. Ad esempio, siti Web, recensioni di prodotti, report finanziari e aziendali o segnalazioni di bug che arrivano in una lingua straniera. La tolleranza per gli errori di traduzione potrebbe essere più elevata in questo caso d'uso, ma la traduzione potrebbe causare errori significativi in un numero non trascurabile di casi. Spesso in questo scenario, una traduzione automatica è migliore di nessuna traduzione. Un individuo o un'azienda può filtrare o classificare automaticamente per estrarre informazioni o per applicare altre tecniche di intelligenza artificiale su documenti provenienti da un'ampia gamma di origini, inclusi i documenti in lingua straniera. Alcuni esempi possono essere il monitoraggio multimediale, gli assistenti virtuali multilingue o l'individuazione elettronica. Il destinatario applica la traduzione automatica prima di passare il documento all'analisi automatica. Nella maggior parte dei casi, questo processo è completamente automatizzato senza intervento umano.

Traduzione bidirezionale: due o più persone che non parlano la stessa lingua usano la traduzione automatica in una chat live tramite messaggistica istantanea o in una conversazione parlata. Ad esempio, un agente di supporto non parla la stessa lingua del cliente che cerca assistenza.

Sequenziare più strumenti Foundry

  • Traduzione vocale: Azure Speech, un altro degli strumenti Foundry, può tradurre la voce tra diverse lingue. Voce genera la trascrizione nella stessa lingua del parlato originale e quindi usa internamente Traduttore per tradurre la trascrizione. I casi d'uso includono la conversazione tra esseri umani, il doppiaggio o la sottotitolazione del contenuto tradotto.
  • Traduzione del testo nelle immagini : Visione artificiale di Azure, un altro strumento Foundry, può estrarre testo visibile dalle immagini. Questo testo estratto può quindi essere tradotto. I casi d'uso includono la traduzione di documenti, menu e segni digitalizzati.

Considerazioni per la scelta di altri casi d'uso

La qualità della traduzione sarà influenzata dall'idoneità del contenuto tradotto. Lo stile e il registro del testo tradotto e lo scopo e il caso d'uso determinano l'idoneità:

È consigliabile utilizzare: contenuto scritto in modo corretto, con punteggiatura accurata e fluente. Di seguito sono riportati alcuni esempi di contenuto:

  • Documentazione tecnica
  • Manuali del prodotto
  • Basi di conoscenza
  • Contenuto del sito Web

Valutare attentamente l'uso di: traduzione di materiale non creato in modo non professionale. Gli esempi includono:

  • Scrittura colloquiale
  • Discorso trascritto
  • Chat sui social media

Valutare attentamente l'applicazione di una revisione umana quando sono coinvolti dati o scenari sensibili: è importante includere un essere umano nel ciclo per una revisione manuale quando si gestiscono scenari ad alto rischio (ad esempio, che influiscono sui diritti consequenziali di un utente) o dati sensibili. La traduzione automatica può commettere errori. Valutare attentamente quando includere un passaggio di revisione manuale per determinati flussi di lavoro. Ad esempio, la traduzione delle cartelle cliniche deve includere la supervisione umana.

Valutare attentamente quando si usa per l'assegnazione o la negazione dei vantaggi: Translator non è stato progettato o valutato per il premio o la negazione dei vantaggi e l'uso in questi scenari può avere conseguenze impreviste. Questi scenari includono:

  • Assicurazione medica: ciò includerebbe l'uso di cartelle sanitarie tradotte e prescrizioni mediche come base per decisioni sulla ricompensa assicurativa o negazione.
  • Approvazioni dei prestiti: tra cui la traduzione di domande per nuovi prestiti o il rifinanziamento di quelli esistenti.

Usi non supportati:

  • Documenti legali: i contratti tradotti male causano il mancato rispetto degli stessi.
  • Contenuti creativi, come materiali di marketing, poesia e finzione: la traduzione non trasmetterà la creatività.

Considerazioni legali e normative: le organizzazioni devono valutare potenziali obblighi legali e normativi specifici quando si usano strumenti e soluzioni Foundry, che potrebbero non essere appropriati per l'uso in ogni settore o scenario. Inoltre, gli strumenti o le soluzioni Foundry non sono progettati per e non possono essere usati in modi vietati in termini di servizio applicabili e codici di comportamento pertinenti.

Limitazioni

La traduzione automatica può essere un metodo conveniente per fornire traduzioni di grandi volumi di contenuto in tempi molto più brevi. La traduzione automatica costa meno di 1/1.000 di traduzione umana ed è più veloce, ma può commettere errori.

I modelli di traduzione automatica personalizzati producono in genere un output di qualità significativamente migliore con un numero ridotto di errori di terminologia. Questi modelli di traduzione automatica vengono sottoposti a training con traduzioni precedenti sufficientemente ampie e di qualità, specifiche per il cliente.

Limitazioni tecniche, fattori operativi e intervalli

Contesto completo del documento

I sistemi di traduzione completa dei documenti sono in fase di sviluppo, ma la maggior parte dei sistemi di traduzione automatica disponibili a livello generale, incluso il nostro, elabora una frase di documento per frase. Quando i sistemi di oggi traducono una frase, la maggior parte di essi non ha alcuna conoscenza delle frasi precedenti o successive nello stesso documento. Le informazioni necessarie per tradurre correttamente una frase (ad esempio, sesso e numero di pronomi) potrebbero essere disponibili solo a livello di documento, causando una traslazione errata.

Esempio:

  1. Inglese: Il sole stava per tramontare. Era ancora splendente.
  2. Traduzione automatica in tedesco: Die Sonne stand kurz vor dem Untergehen. Era ancora luminoso.

Il "sole" in tedesco ha sesso femminile. La traduzione automatica in questo esempio usa il sesso neutro.

Nelle traduzioni da un originale senza sesso a una traduzione di genere, il sistema di traduzione presuppone un sesso. Tenta di produrre una frase fluente e grammaticalmente corretta nella lingua di destinazione. Quando il sistema utilizza un genere, applica un pregiudizio verso il genere che era prevalente nel contesto specifico del materiale utilizzato per eseguire il training del sistema. Questa pratica può causare errori.

I costrutti senza genere sono presenti in un'ampia gamma di lingue, tra cui cinese, finlandese, tamil, turco e vietnamita.

Sequenziazione di più strumenti di fonderia

Durante il sequenziamento di più servizi, ciascuno con un tasso di errore non nullo, gli errori si sommano. La traduzione dei risultati del riconoscimento vocale o del riconoscimento ottico dei caratteri (OCR) non sarà in grado di recuperare da un errore nel passaggio di riconoscimento e aggiungerà i propri errori dopo il riconoscimento.

Input in linguaggio misto

Ogni richiesta di traduzione si traduce da una lingua a un'altra. Se più lingue si trovano nel testo di origine di una singola richiesta di traduzione, la traduzione del testo nella lingua di destinazione potrebbe essere non ottimale. Potrebbe essere lasciato così com'è, essere tradotto in modo errato, essere tradotto correttamente o potrebbe essere traslitterato correttamente o in modo errato.

Traduttore può rilevare automaticamente la lingua del testo di origine, ma applica la lingua rilevata all'intero testo.

Conoscenza del mondo reale

Viene eseguito il training di un sistema di traduzione automatica sui documenti tradotti in precedenza. Il sistema usa solo ciò che è possibile apprendere dalle singole frasi dei documenti di training; non ha un contesto più ampio.

Questa mancanza di conoscenza reale può causare diversi errori, ad esempio:

  • Le traduzioni sono troppo letterali, non riflettono l'implicazione, la sfumatura o l'inuendo dell'originale.
  • Idiomi ed espressioni che non sono concepiti letteralmente non esprimono il significato implicito dell'originale. Un esempio inglese è "Knocking it out of the ballpark".
  • Quando una traduzione richiede una modifica con sensibilità culturale dell'originale, potrebbe non essere riflessa in modo appropriato. Questo errore può verificarsi per una conversione di valuta, una conversione di formato di data o ora, la modifica del nome della lingua quando si intende la lingua ufficiale di una regione, o la modifica di una regione, per una corretta localizzazione del documento target.
  • I titoli e le classificazioni degli individui non vengono potenzialmente rispecchiati in modo appropriato, ad esempio, quando vengono tradotti da una lingua straniera alla cultura dell'individuo.
  • Il tono e l'umor (arrabbiato, calmo, entusiasta, triste) del testo originale potrebbe non essere riflesso in modo appropriato. In genere, la traduzione automatica è più neutra e meno colorata rispetto all'originale.
  • L'età, il titolo, la relazione o l'esperienza di qualcuno a cui si fa riferimento in una conversazione potrebbe non essere adeguatamente rappresentata. Questo errore è particolarmente significativo quando si traduce da una lingua in cui il modo di affrontare qualcuno è relativamente indipendente dall'età e dalla relazione, come "voi" in inglese, in una lingua in cui ci sono più opzioni, come "tu" e "vous" in francese. Quale forma di indirizzo utilizzare è quasi sempre rilevante. Il sistema di traduzione sceglierà il termine che corrisponde ai dati di training migliori, in base al contesto breve visualizzato all'interno della frase, ma non saprà, ad esempio, se i partecipanti alla conversazione sono correlati, anche se tali informazioni sono menzionate altrove nel documento.

Errori di gravità elevata

Gli errori con gravità elevata sono definiti come errori che possono offuscare la reputazione della persona o dell'istituto che parla in una voce tradotta, o in un testo tradotto o in un documento, sia che si tratti di essere umani o tradotti in macchina. Un errore di gravità elevata è imbarazzante per l'altoparlante o l'autore o può portare a una conclusione errata con conseguenze significative. Una traduzione errata o un errore grammaticale da solo non qualifica come errore di gravità elevata. La maggior parte degli errori nella traduzione automatica può essere corretta dal revisore in base al contesto. Un errore di gravità elevata comporta un effetto negativo tangibile.

Esempi di potenziali errori di gravità elevata:

  • Negazione invertita: il testo originale dice di non fare qualcosa; tuttavia, la traduzione dice di farlo. Oppure l'originale afferma un fatto, ma la traduzione indica l'opposto. Le frasi complesse e i doppi negativi possono causare questo errore.
  • Numero modificato o unità di misura: un indicatore di dimensione, un'unità di misura o una valuta (pollice, sterlina, centimetro, centesimi) viene convertito in modo errato, che può causare una misurazione errata o una perdita o un guadagno di fondi non corretto.
  • Nomi e titoli di persona falsificati: il titolo errato viene applicato a una persona, ad esempio "Re", dove deve essere "Principe ereditario". In un ambiente politicamente sensibile, questo errore potrebbe portare a un imbarazzo significativo.
  • Figure religiose o simboli posizionati in un contesto sfavorevole: l'ambiguità nel materiale originale può portare a una traduzione che mostra una figura religiosa significativa o un simbolo rilevante in una luce sfavorevole. Può essere semplice come una frase con una connotazione religiosa che appare come la traduzione, o una non parola come un'abbreviazione, un errore di digitazione o un input senza significato.
  • Omissioni e contenuto non in primo piano: la traduzione automatica potrebbe omettere una parte del contenuto di origine o aggiungere un concetto non presente nell'originale. Le reti neurali hanno la possibilità di produrre frasi molto fluenti. Una frase di origine insolita o disfluente potrebbe essere tradotta in una frase di destinazione fluente che non riflette l'originale accuratamente o potrebbe non essere completamente correlata all'origine.
  • Offesa: una traduzione letterale di un idioma o di un'espressione neutra potrebbe diventare più aggressiva o offensiva. Alcune espressioni non hanno un equivalente culturale nella lingua di destinazione. Ad esempio, "Break a leg" è un augurio di buona fortuna per un'esibizione teatrale. Il sistema potrebbe non essere a conoscenza del contesto completo per ottenere una traduzione adatta.

Con i sistemi di traduzione automatica di oggi, gli errori di gravità elevata sono rari. La paura di un errore che danneggia la reputazione è un ostacolo principale alla pubblicazione di traduzione automatica non elaborata e non modificata. Anche se il rischio di errori di gravità elevata potrebbe essere basso per coppie di linguaggi più compatibili, uno sviluppatore vuole usare tecniche per ridurre l'effetto se necessario. Attualmente, i traduttori umani sono meglio attrezzati per trovare e correggere gli errori con gravità elevata rispetto ai computer. L'aggiunta di un passaggio di revisione umana per trovare e correggere gli errori di gravità elevata nella traduzione automatica è un modo per risolvere questa limitazione. È anche possibile prendere in considerazione l'aggiunta di una revisione umana su richiesta o in base a metriche di business intelligence, ad esempio valutazioni utente, destinatari o importanza del contenuto, dopo aver pubblicato il documento non visualizzato.

Pregiudizi

I sistemi di traduzione automatica di oggi sono basati su algoritmi di Machine Learning. I sistemi di traduzione imparano a tradurre da documenti tradotti in precedenza. Ciò che il sistema ha appreso viene archiviato in un modello probabilistico, che in genere è una rete neurale. Il runtime che gestisce una richiesta di traduzione fa riferimento a tale rete neurale per produrre ciò che determina è il candidato migliore tra le possibili traduzioni per l'input specificato. Questa traduzione rifletterà il dominio, la terminologia, lo stile e la distorsione presenti nel materiale di training originale. Questo pregiudizio può essere molto sottile. In alcune coppie di lingue, ad esempio, quando si traduce una frase senza un pronome soggetto, il sistema costituisce un pronome perché la grammatica della lingua di destinazione richiede un soggetto. Il genere di tale pronome costituito sarà influenzato dal contesto trovato nel materiale di formazione, indipendentemente dal sesso effettivo del soggetto nel documento da tradurre. Questo problema è un'area di ricerca attiva e stiamo lavorando per risolvere i problemi correlati alla distorsione.

Esempi di potenziali distorsioni nella traduzione automatica:

  • Pregiudizio di genere: quando si traduce da una lingua indipendente dal genere a una lingua fortemente di genere, i pronomi scelti saranno influenzati dal contesto trovato nel materiale di formazione, che potrebbe non riflettere il sesso effettivo dell'attore.
  • Pregiudizio politico: frasi o scelte di parole con un pregiudizio politico in una lingua non si traducono necessariamente con la stessa distorsione o connotazione nell'altra lingua.
  • Pregiudizi religiosi: come il pregiudizio politico, la scelta delle parole può indicare un punto di vista specifico, una certa convinzione o un dogma. Quando si cambiano lingue, tale punto di vista può essere aggiunto o rimosso o modificato in un'interpretazione diversa.
  • Orientamento sessuale, origine nazionale, etnia, razza: i termini che la società si applica ai gruppi all'interno della società cambiano nel tempo. Un termine discriminatorio scritto in un documento originale potrebbe essere persistente nel materiale di formazione e potrebbe emergere nella traduzione in un contesto dannoso.
  • Volgarità: ciò che viene considerato volgare all'interno di una cultura cambia nel tempo. Lo scopo del sistema di traduzione è mantenere la natura volgare o non professionale dell'espressione nell'input. Questo livello di accuratezza non funziona con 100% affidabilità perché molti termini volgari sono in realtà ambigui e il grado di volgarità del termine tradotto varia tra le lingue coinvolte.

Prestazioni del sistema

  • L'API Translator non prevede limiti per le richieste simultanee.
  • L'API Translator imposta varie quote sul numero di caratteri che possono essere tradotti in un'ora da una risorsa traduttore in base allo SKU concesso in licenza dal cliente. I limiti di quota variano da 40 milioni di caratteri all'ora a 200 milioni di caratteri all'ora.
  • Translator ha una latenza massima di 15 secondi usando i modelli standard. In genere, le risposte per il testo entro 100 caratteri vengono restituite in 150 millisecondi a 300 millisecondi.
  • I tempi di risposta dell'API Translator variano in base alle dimensioni della coppia di richieste e lingue.
    • La traduzione tra una lingua e l'inglese è più veloce della traduzione tra due lingue non inglesi.

Procedure consigliate per migliorare le prestazioni del sistema

  • Gli utenti possono ottenere prestazioni ottimali per la traduzione di una frase di testo in più lingue di destinazione effettuando singole richieste per ogni lingua anziché effettuare una singola richiesta per più lingue. Questo approccio consente agli utenti di utilizzare traduzioni disponibili invece di attendere che tutte le traduzioni vengano restituite dal sistema.
  • Se il volume di traduzione è elevato, passare a livelli di impegno o di volume più elevati.

Valutazione del traduttore

Metodi di valutazione

La qualità della traduzione è sempre relativa a un set di test. Non esistono set di test di traduzione standard stabiliti per il benchmarking. Per questo motivo, non vengono pubblicati i punteggi assoluti delle misurazioni dei sistemi di traduzione automatica.

I sistemi di traduzione automatica basati sulla rete neurale di oggi possono produrre frasi fluenti e grammaticalmente corrette, data una fonte appropriata. Tuttavia, la qualità dei sistemi di traduzione automatica differisce in base alla coppia di lingue. È possibile determinare se una determinata classe di documenti è adatta per la traduzione automatica per una coppia di lingue specifica.

È consigliabile misurare la qualità per un set di test rappresentativo per uno scenario specifico. Il livello di tolleranza di traslazione errata in base al linguaggio varia in base allo scenario. Anche l'aspettativa di traduzione linguistica, formale e colloquiale varia in base allo scenario.

Risultati della valutazione

Esistono molti modi per misurare la qualità. Le tecniche automatiche calcolano la distanza da una traduzione di riferimento creata dall'utente. Il punteggio del Bi-lingual Evaluation Understudy (BLEU) è la tecnica più antica ed è tuttora molto diffusa. Altre tecniche utilizzano un modello linguistico addestrato per misurare la distanza rispetto alle sequenze e al contesto memorizzati nel modello, come la metrica ottimizzata crosslinguistica per la valutazione della traduzione (COMET). In una valutazione umana, gli valutatori giudicano la traduzione su uno o più criteri, ad esempio, accuratezza e fluenza. La qualità di Translator viene misurata continuamente usando una vasta gamma di tecniche. La valutazione umana fornisce i punteggi più significativi e affidabili.

Valutazione e integrazione di Translator per il tuo utilizzo

Come Microsoft lavora per aiutare i clienti a sviluppare e distribuire soluzioni in modo sicuro usando Translator, stiamo adottando un approccio di principio per sostenere l'agenzia personale e la dignità considerando l'equità dei sistemi di intelligenza artificiale, affidabilità e sicurezza, privacy e sicurezza, inclusività, trasparenza e responsabilità umana. Queste considerazioni sono in linea con il nostro impegno nello sviluppo dell'IA responsabile.

Quando si è pronti per l'integrazione e l'uso di prodotti o funzionalità basati sull'intelligenza artificiale, tenere presenti i principi seguenti:

  • Raccomandazioni per la presviluppo delle applicazioni: è consigliabile che gli sviluppatori inizino eseguendo una valutazione dell'impatto per comprendere l'uso, il contesto e gli usi imprevisti o ad alto rischio per evitare.
  • Comprendere le operazioni che può eseguire: valutare completamente Translator per comprendere le funzionalità e/o le limitazioni. i test di Microsoft potrebbero non riflettere lo scenario in uso. Comprendere come verrà eseguita nello scenario specifico testandolo accuratamente con condizioni reali e dati utente diversi che riflettono il contesto, incluse le considerazioni sull'equità.

Umano nel processo: includere la supervisione umana come area di modello coerente da esplorare. Questo approccio significa garantire una costante supervisione umana di Translator e mantenere il ruolo degli esseri umani nel processo decisionale. Assicurarsi di avere un intervento umano in tempo reale nella soluzione per evitare danni. Questa funzionalità consente di gestire la posizione in cui Translator non esegue le operazioni necessarie.

  • Misurazioni di qualità: è consigliabile misurare la qualità della traduzione per un set di test rappresentativo per uno scenario specifico. Il livello di tolleranza di traslazione errata in base al linguaggio varia in base allo scenario. Anche l'aspettativa di traduzione linguistica, formale e colloquiale varia in base allo scenario. Per altre informazioni, vedere la sezione successiva.
  • Rispettare il diritto di un individuo alla privacy: Translator non mantiene il contenuto inviato dai clienti per la traduzione. È consigliabile non conservare i contenuti e le informazioni ricevuti dagli utenti dell'app per rispettare il diritto delle persone alla privacy.
  • Revisione legale: ottenere consigli legali appropriati per esaminare la soluzione, in particolare se si prevede di usarlo in applicazioni sensibili o ad alto rischio. Comprendi quali limitazioni potresti dover affrontare e la tua responsabilità di risolvere eventuali problemi futuri.
  • Sicurezza: assicurarsi che la soluzione sia sicura e disponga di controlli adeguati per mantenere l'integrità del contenuto e impedire l'accesso non autorizzato.
  • Ciclo di feedback dei clienti: fornire un canale di feedback che consente a utenti e utenti di segnalare problemi con il servizio dopo la distribuzione. Dopo aver distribuito Translator, è necessario un monitoraggio e un miglioramento continui. Essere pronti per implementare eventuali commenti e suggerimenti per il miglioramento.

Human-in-the-loop

Un'introduzione responsabile della traduzione automatica include l'opzione per condurre una revisione umana e correggere la traduzione automatica.

I revisori umani hanno conoscenze reali, competenze in materia e una sensibilità naturale per parole e frasi potenzialmente controverse. Gli esseri umani possono identificare il contesto pertinente e produrre una traduzione che riflette il tono appropriato per una determinata situazione. I computer sono più limitati nella loro capacità di applicare tono e contesto correttamente.

È utile prepararsi per l'infrastruttura in grado di eseguire una revisione umana in modo rapido ed efficiente. Questo tipo di sistema è detto sistema di gestione delle traduzioni (TMS). I TMS sono disponibili da molti fornitori. Microsoft non vende un sistema di gestione dei trasporti. Translator è integrato in diversi TMS.

La revisione umana è un'impresa costosa. Per un uso ottimale dei fondi e la disponibilità immediata dei documenti a un pubblico di destinazione, è necessario identificare gli indicatori in base all'uso previsto o alla business intelligence. Questi indicatori possono suggerire che l'articolo o l'elemento di un documento richieda una revisione umana.

Esempi di segnali di business intelligence:

  • Visualizzazioni pagina: l'editore di informazioni tradotte decide una soglia misurata nelle visualizzazioni pagina delle informazioni tradotte. Se le informazioni tradotte automaticamente superano la soglia di visualizzazione pagina definita, il sistema attiva una revisione umana di questo contenuto. La revisione umana può ridurre l'esposizione di una traduzione errata ad altri visualizzatori o clienti.
  • Escalation dell'utente: il destinatario della traduzione può fornire feedback o inviare un avviso su una traduzione errata, fuorviante od offensiva. Questa escalation attiva la revisione umana del contenuto in questione.
  • Escalation dei dipendenti: un dipendente presso l'editore di informazioni tradotte potrebbe effettuare una richiesta per una revisione umana di un articolo.
  • Importanza o valore dell'articolo: un articolo su o una descrizione di un articolo a basso prezzo e di un articolo a basso volume per la vendita potrebbe non essere economicamente fattibile per essere tradotto da un essere umano. Tuttavia, un articolo di valore superiore può giustificare bene la spesa di una traduzione umana. Il valore elevato potrebbe attivare automaticamente una revisione umana della traduzione.
  • Idoneità: alcune classi di documenti si traducono con una qualità migliore rispetto ad altre. Un editore può usare meccanismi di assegnazione dei punteggi automatici o classificazione del contenuto del documento per determinare se questo documento necessita di una revisione umana. Microsoft Azure offre alcune tecniche per la classificazione basata su contenuto, ad esempio Language Understanding e Analisi del testo. Translator non restituisce un punteggio di attendibilità per le traduzioni.

Passaggi successivi