Panoramica dell'ottimizzazione della progettazione dell'agente vocale in tempo reale (anteprima)

[Questo articolo fa parte della documentazione non definitiva, pertanto è soggetto a modifiche.]

Gli articoli di questa guida illustrano le procedure consigliate per la creazione di agenti vocali in tempo reale che usano tecnologie Microsoft. Questi articoli forniscono una guida pratica per gli utenti che devono progettare e creare agenti in tempo reale (RTA) e vogliono un modo per scegliere l'approccio appropriato in base al percorso del cliente.

Oltre a questa guida, Microsoft ha sviluppato modelli basati su implementazioni del mondo reale che puoi trovare su Dynamics 365 Commerce Forward Deployed Engineering GitHub.

Importante

  • Questa è una funzionalità di anteprima.
  • Le funzionalità di anteprima non sono destinate ad essere utilizzate per la produzione e sono soggette a restrizioni. Queste funzionalità sono soggette a condizioni per l'utilizzo supplementari e sono disponibili prima di una versione ufficiale in modo che i clienti possano ottenere l'accesso in anteprima e fornire feedback.

Selezionare l'orchestrazione e la modalità vocale

Quando costruisci un agente di intelligenza artificiale, inizia con un unico principio:

  • La progettazione di ogni agente inizia decidendo come viene controllata la conversazione.

Per gli agenti vocali, c'è una seconda decisione altrettanto importante:

  • Modalità di gestione della voce end-to-end.

L'orchestrazione delle conversazioni e la forma della modalità vocale influenzano il costo, la latenza, la flessibilità, la conformità e la complessità operativa.

Il diagramma seguente riepiloga le scelte di selezione.

Screenshot della selezione del modello di orchestrazione con le opzioni classiche, ibride e generative, oltre ai pannelli Modalità di riconoscimento vocale di base e streaming.