Mis on kõnetöötlus?

Kõnetöötlus on protsess, mille käigus kõnesignaale tõlgendatakse, mõistetakse ja neile reageeritakse. See viitab konkreetselt inimkõne töötlemisele arvutisüsteemidega, näiteks hääletuvastustarkvara või hääle tekstiks muutmise programmide puhul. Kõnetöötlus on paljudes valdkondades oluline nii teoreetiliseks kui ka praktiliseks kasutuseks, alates häälaktiveerimisest ja -juhtimisest telefonides kuni funktsionaalse tehisintellekti arendamiseni arvutiteaduses. Kõne töötlemisel on olulised nii sidusa kõne tõlgendamine kui ka tootmine; mõned probleemid eelistavad siiski üksteist, kuna kõnetöötluse rakendusvajadused on väga erinevad.

Kõnetuvastus on kõnetöötluse üks olulisemaid aspekte, kuna kõne töötlemise üldine eesmärk on kõnekeele mõistmine ja selle järgi tegutsemine. Üks levinumaid kõnetuvastuse rakendusi on lihtne kõnest tekstiks teisendamine, mida kasutatakse paljudes tekstitöötlusprogrammides. Paljud rakendused nõuavad aga palju suuremat täpsust, kui kõnest tekstiks teisendamise tarkvara jaoks. Suur huvi on näiteks kõnetuvastuse kasutamise vastu sõjalennukites, et vähendada mõningast piloodi vastutust ja pinget. Täpsuse ja täpsuse saavutamiseks on vaja, et kõneleja kalibreeriks tuvastustarkvara oma hääle ja kõnestiili järgi.

Kõnelejatuvastus, teine ​​kõnetuvastuse element, on kõnetöötluse teine ​​väga oluline aspekt, kuigi seda ei rakendata veel nii laialdaselt kui üldist kõnetuvastust. Kui kõnetuvastus viitab konkreetselt öeldu mõistmisele, siis kõneleja tuvastamine puudutab ainult seda, kes räägib. Kõneleja identiteedi kinnitamine võib olla oluline turvafunktsioon, mis takistab arvutisüsteemile volitamata juurdepääsu või selle kasutamist.

Kõnetöötluse teine ​​komponent on hääletuvastus, mis on sisuliselt kõne ja kõneleja tuvastamise kombinatsioon. Hääletuvastus toimub siis, kui kõnetuvastusprogrammid töötlevad tuntud kõneleja kõnet; sellised programmid suudavad üldiselt tõlgendada tuntud kõneleja kõnet palju suurema täpsusega kui juhusliku kõneleja kõnet.

Teine kõnetöötluse valdkonna õppeteema on hääleanalüüs. Hääleanalüüs erineb teistest kõnetöötluse teemadest, kuna see ei puuduta tegelikult kõne keelelist sisu. See puudutab peamiselt kõnemustreid ja helisid. Hääleanalüüsi saab kasutada häälepaelte või muude kõnega seotud organite probleemide diagnoosimiseks, märkides helisid, mis viitavad haigusele või kahjustusele. Heli- ja stressimustreid saab kasutada ka selleks, et teha kindlaks, kas inimene räägib tõtt, kuigi selline hääleanalüüsi kasutamine on väga vastuoluline.