Mis on heli kaevandamine?

Heli kaevandamist kasutatakse tavaliselt kõnetuvastustarkvaras ja muusikaanalüüsis. See tehnoloogia annab kasutajale võimaluse otsida kõne- või muusikaheli, mille spetsiifilisi omadusi on analüüsitud. Kõnetuvastustehnoloogias kasutamisel tuvastab heli kaevandamine helis öeldud sõnad ja lisab need otsitavasse faili. See funktsioon võib olla kasulik üliõpilastele või ärimaailmas tegutsevatele inimestele, kes osalevad paljudel koosolekutel, kuna see võimaldab kasutajal kõneesitlustest hõlpsamini päevakohast teavet sirvida. Seda tüüpi analüüsi saab kasutada ka muusikas, et määrata kindlaks sellised omadused nagu lööki minutis (BPM), muusikaline võti ja muusikaline struktuur – teave, mida kasutatakse muusika klassifitseerimiseks.

Kõnetuvastuses, kus seda tehnoloogiat kõige sagedamini kasutatakse, kasutatakse akustilise mudeli loomiseks heli kaevandamist. Akustiline mudel programmeerib kõnetuvastustarkvara kõnemustrite sõnadena tuvastamiseks. See tehnoloogia on välja töötatud öeldud fraasi salvestise heli kaevandamise teel, mida võrreldakse öeldud fraasile vastava tekstiga. Arvuti kasutab seda teavet sõnade äratundmiseks, kui kasutaja teeb sarnaseid helisid akustilise mudeli helidega. Akustilist mudelit kasutatakse koos failiga, mis ütleb kõnetuvastusprogrammile, millist keelt tõlgendada ja milliseid sõnade mustreid teatud lausetes ja olukordades tõenäoliselt räägitakse.

Nii muusikud kui ka muusikakuulajad saavad muusikas heli kaevandamisest kasu. Mõnikord kasutab muusikat žanri järgi kategoriseeriv muusikatarkvara muusika korraldamiseks heli kaevandamist. Protsess tuvastab ja rühmitab muusikažanrites sageli esinevaid helisarnasusi sisaldavaid muusikafaile. Kuigi see tehnoloogia võib muuta muusika korraldamise ja uue muusika leidmise lihtsamaks, võib see teha vigu lugude klassifitseerimisel, millel on sarnased mõõdetud omadused, kuid erinev üldine heli. Helianalüüsi tarkvara võib olla kasulik muusikutele, eriti heliloojatele, kuna see võimaldab heliloojal liikuda laulu struktuuri teatud osade juurde, sealhulgas muusikaliste võtmemuutuste ja sõnade sõnade juurde.

Kõnetuvastustarkvara tootja Dragon® müüb programmi nimega AudioMining®, mis transkribeerib helifaile ja märgib failid, et saaks nendes teksti otsida. Dragon on arvutilingvistikaprogrammide tootja, mis on kõne tõlgendamiseks mõeldud tarkvara valdkonna tehniline termin. Heli kaevandamine, kui seda kasutatakse kahe sõnana, on üldine termin, mis viitab helifaili analüüsimisele kindlaksmääratud heliomaduste kogumi jaoks. Teiste helikaevandamise tarkvara tootjate hulka kuuluvad Nuance® ja Nexidia®.