Mis on akustiline mudel?

Akustiline mudel on sisuliselt hääle kaart seoses trükitud sõnade seeriaga. Seda tehnoloogiat kasutatakse kõnetuvastusprogrammides, et aidata arvutil õppida ära tundma inimese kõnemustreid. Akustiline mudel on üks kahest põhifailist, mis on vajalikud kõnetuvastusprogrammi käitamiseks; teine ​​on keelemudel, mis näitab tõenäolisi sõnu ja kõnemustreid, mida kõneleja võib kasutada. Need mudelid luuakse kõnehelifaili helidetailide võrdlemisel öeldud sõnade tekstiga.

Kõnetuvastustarkvara on tarkvara, mis on loodud inimese öeldud sõnade äratundmiseks ja transkribeerimiseks või neile reageerimiseks. Paljud operatsioonisüsteemid on loodud sisseehitatud põhiliste kõnetuvastusvõimalustega, mida kasutaja saab sisse ja välja lülitada. Operatsioonisüsteemide kõnetuvastusvõimalused annavad kasutajale tavaliselt võimaluse arvutit juhtida ja häält kasutades ekraanile sõnu sisestada.

Kõnetuvastustarkvarale juurdepääsuks vajab kasutaja mikrofoni, et hääl arvutisse jõuaks, ja programmi, mis heli töötleb. Kuigi paljudel arvutitel on sisseehitatud mikrofonid, võimaldab väline peakomplekti mikrofon kasutajal saada kasu selgemast häälest ja vabadusest rääkimise ajal ruumis ringi liikuda. Eraldiseisvate kõnetuvastustarkvara kaubamärkide hulka kuuluvad LumenVox®, Loquendo® ja Dragon®.

Enamikul kõnetuvastusprogrammidel on akustilise mudeli programmeerimine, mis võimaldab programmil tuvastada häälduse variatsioone. Nad kasutavad kõnes esinevate sõnade tuvastamiseks kõneleja hääle helimustreid. Paljud neist on loodud koos seadistustarkvaraga, mis aitab kasutajal luua akustilise mudeli, mis on loodud tema enda hääle tõlgendamiseks. Mõned täiustatud kõnetuvastusprogrammid suudavad tuvastada ja tõlgendada mitut keelt, sageli väikese heliteabega. Mida arenenum on kõnetuvastusprogramm, seda tõenäolisem on, et see tõlgendab sõnu täpselt selle konteksti põhjal, sealhulgas selle kohta, kus lauses sõna räägitakse.

Kõnetuvastustehnoloogiat arendavat õppevaldkonda nimetatakse arvutuslingvistikaks. Arvutuslingvistika hõlmab uurimist ja disaini, mis loob tarkvara, mis on programmeeritud inimkõne mõistmiseks. See väli sisaldab sageli psühholoogiauuringutest saadud teavet, et luua akustilisi mudeleid, mis suudavad kõnet täpsemalt tõlgendada.

Sõna “akustiline” viitab üldiselt kõigele, mis on seotud heliga. Kuigi kõnetuvastuses kasutatakse kõige sagedamini akustilisi mudeleid, saab neid kasutada ka muusikas. Muusikapala akustiline mudel suudab tuvastada selliseid omadusi nagu lööki minutis, muusika võtmeid või muusikas domineerivaid helikõrgusi. Seda teavet saab kasutada arvutiprogramm muusikapala tuvastamiseks või seda saab kasutada žanri, millesse muusika tõenäoliselt liigitatakse, lõdvaks määramiseks. Akustilisi mudeleid kasutatakse ka psühhoakustika nimelises uurimisvaldkonnas, kus teadlased loodavad õppida struktureerima muusikat, mis mõjutab aju ennustatavalt.