Tal
Anmärkning
Mer information finns på fliken Text och bilder !
Talfunktioner i AI-program och agenter gör det möjligt för användare att interagera med dem via talat språk.
Vår webbplats för databehandlingshistorik kan till exempel innehålla en mikrofonknapp som gör att användarna kan ställa frågor verbalt och svara genom att syntetisera talade svar.
Taligenkänning
Taligenkänning är AI:s förmåga att "höra" och tolka tal. Vanligtvis är den här funktionen i form av tal till text (där ljudsignalen för talet transkriberas till text).
Talsyntes
Talsyntes är AI:s förmåga att uttrycka ord som talat språk. Vanligtvis är den här funktionen i form av text till tal där information i textformat konverteras till en hörbar signal.
AI-taltekniken utvecklas snabbt för att hantera utmaningar som att ignorera bakgrundsbrus, upptäcka avbrott och generera allt mer uttrycksfulla och människoliknande röster.
AI-talscenarier
Vanliga användningsområden för AI-taltekniker är:
- AI-agenter som förstår talade indata, utför uppgifter och svarar med talade resultat.
- Automatiserad transkription av samtal eller möten.
- Automatisera ljudbeskrivningar av video eller text.
- Automatiserad talöversättning mellan språk.