Talegenkendelse
Talegenkendelse (ASR – automatic speech recognition) er sprogteknologi, hvor software analyserer og fortolker menneskelig tale for at omsætte den til skreven tekst. Teknologien benævnes også tale-til-tekst-teknologi. Teknologien gør brug af avancerede algoritmer og maskinlæringsteknikker til at identificere og forstå lydmønstre, fonetiske elementer og sprogstrukturer.
Talegenkendelse har et bredt anvendelsesområde, herunder i forbindelse med virtuelle assistenter, transskriberingstjenester, stemmestyrede enheder og lignende. Med udviklingen inden for kunstig intelligens og neurale netværk er talegenkendelse blevet stadig mere præcist og bedre i stand til at håndtere forskellige sprog, dialekter og talesituationer.
Talegenkendelse har potentiale til at forandre interaktionen mellem mennesker og maskiner, fx ved at muliggøre stemmestyrede kommandoer (stemmeinteraktion) og automatisk transskribering og informationsbehandling.
Ved at forenkle komplekse sprogopgaver og øge tilgængeligheden af information gennem stemmeinteraktion får talegenkendelsesteknologi stigende betydning for mennesket, både i arbejds- og privatlivet.