Mis on automaatne huulte lugemine?

Huultelt lugemine pole vaevalt uus suhtlusvorm: see on kurtide kogukonna peamine tööriist, rääkimata kasulikust oskusest sõnumite edastamiseks üle valju peo või üle laste peade. Uus tehnoloogiavorm üritab aga seda igivana suhtlusmeetodit mehhaniseerida. Automaatne huulte lugemine, tuntud ka kui automaatne kõne lugemine, on kõnetuvastustehnoloogia kasvav haru. Teoreetiliselt suudavad spetsiaalselt loodud arvutiprogrammid kõneleja huulte liigutusi ja muid seotud elemente jälgides suulisi sõnumeid tõlgendada isegi siis, kui müra või muud takistused takistavad inimhäält õigesti kuulda.

Tavaliselt nõuab automaatne huulte lugemine kõnelejast videot. Huulte kujundatud kujundid ja rütmid on sageli tõlgendamisel kõige olulisemad tegurid, kuid ka mitmesugused muud liigutused võivad aidata kõneleja sõnumit lahti mõtestada. Näoilmed ja pea liigutused võivad olla määravad tegurid. Kui mõni kasulik heli on saadaval, on automaatne huulte lugemise protsess oluliselt hõlbustatud, kuna kuuldava osa konteksti vihjed võivad vihjata kuuldamatutele sõnadele või kõne fragmentidele.

Automaatse huulte lugemise tehnoloogia arendamine põhineb võimel tuvastada isoleeritud sõnu, mis kasutavad iga kord rääkides samu huulte liigutusi. Lip Geometry Estimation (LGE) on üks arenenumaid arvutisüsteeme, mis jälgib ja tõlgendab selliseid mustreid. Teadlased on hollandi keele jaoks välja töötanud märkimisväärse automaatse huulte lugemise ja kõnetuvastussüsteemi, kuid üldiselt on sellel alal veel palju arenguruumi.

Automaatne huulte lugemine on hiljuti pälvinud huvi ja tähelepanu, kuna see on rakendatud Adolf Hitleri arhiivitud koduvideotes. Sõja ajal Eva Brauni filmitud kunagised tummfilmid ärkasid ellu, kui kaadritele rakendati kõnetuvastustehnoloogiat. Sõltumata sellest, kas tõlgendused on täiesti täpsed või mitte, on automaatne huulte lugemise programm andnud pilgu ajaloolisele isikule, mis kahtlemata tekitab jätkuvat huvi automaatse huulte lugemise vastu.