Tal

Slutförd

Anmärkning

Mer information finns på fliken Text och bilder !

Talfunktioner i AI-program och agenter gör det möjligt för användare att interagera med dem via talat språk.

Vår webbplats för databehandlingshistorik kan till exempel innehålla en mikrofonknapp som gör att användarna kan ställa frågor verbalt och svara genom att syntetisera talade svar.

Skärmbild av en webbplats för databehandlingshistorik som utför taligenkänning.

Taligenkänning

Diagram över en användares talade indata som konverteras till text.

Taligenkänning är AI:s förmåga att "höra" och tolka tal. Vanligtvis är den här funktionen i form av tal till text (där ljudsignalen för talet transkriberas till text).

Talsyntes

Diagram över text som konverteras till hörbart tal.

Talsyntes är AI:s förmåga att uttrycka ord som talat språk. Vanligtvis är den här funktionen i form av text till tal där information i textformat konverteras till en hörbar signal.

AI-taltekniken utvecklas snabbt för att hantera utmaningar som att ignorera bakgrundsbrus, upptäcka avbrott och generera allt mer uttrycksfulla och människoliknande röster.

AI-talscenarier

Vanliga användningsområden för AI-taltekniker är:

  • AI-agenter som förstår talade indata, utför uppgifter och svarar med talade resultat.
  • Automatiserad transkription av samtal eller möten.
  • Automatisera ljudbeskrivningar av video eller text.
  • Automatiserad talöversättning mellan språk.