Mis on dünaamiline ajakõverdus?

Dünaamiline ajakõverdus (DTW) hõlmab arvutusmeetodit, mida nimetatakse algoritmiks, et võrrelda helisid, videot ja graafikat, mis võivad olla sarnased, kuid mille näidistel võivad olla väikesed erinevused. Arvutused formuleerivad tavaliselt valimi lineaarse esituse ja mõõdavad erinevusi aja funktsioonina. Valimi erinevaid elemente saab sarnasuste tuvastamiseks kaardistada ruudustikul, samas kui funktsioonide käsud kasutavad iga muutuja tuvastamiseks sageli sümboleid. Näiteks kõnetuvastus kasutab mõnikord sõnade sobitamiseks dünaamilist ajakõverdust, isegi kui neid räägitakse erineva kiirusega või teatud osi hääldatakse erinevalt.

Paljud kõnetuvastusprogrammid kasutavad dünaamilist ajakõverdust, kuna inimesed räägivad sageli erineva kiirusega. Teatud täishäälikuid võib sõltuvalt emotsioonidest või muudest teguritest hääldada erinevalt. Mõned programmid tunnevad ära öeldud sõnad olenemata sellest, kes räägib. Sel põhjusel ei ole tavaliselt efektiivne helide võrdlemiseks ajavahemike kaupa kaugusi liita. DTW abil analüüsitakse iga signaali jaoks erinevaid ajaspetsiifilisi punkte; need vahemaad arvutatakse ruudustikul, mis kulgeb alt vasakult üleval paremale.

Kahe proovi vastavate osade sarnasusi saab mõõta Levenshteini kauguse abil. Tähti kasutatakse muutuste tähistamiseks ühe allika ja teise vahel. Algoritmi lahendus on tavaliselt seda suurem arv, mida erinevad on kaks näidist. Seda kontseptsiooni kasutatakse sageli nii kõnetuvastuseks kui ka õigekirjakontrolliks ja geneetilise materjali analüüsimiseks.

Mõnel mõõtmisel võivad sageduse muutused kompenseerida dünaamilise aja moonutamise võimet. Signaale saab arvutada nii, et nende vormi kasutatakse sõltumata sagedusest. Moduleeritud signaalid võivad samuti tekitada probleeme, kuid ruudustik, mis arvutab punktide asemel joonelõikude vahelisi kaugusi, võib seda kompenseerida.

Järjestuste joondamine on üldiselt matemaatiline ja selle täielikuks mõistmiseks on vaja mõningaid arvutiprogrammeerimisoskusi. Dünaamilised ajakõverdusalgoritmid sõltuvad mõningatest põhitingimustest heli- või visuaalsete näidiste erinevuste realistlikuks arvutamiseks. Arvestades valimit teekonnana piki ruudustikku, järgib algoritm sageli reegleid, näiteks tee ei saa tagasi pöörata ja seda mõõdetakse üks samm korraga. Lisaks alt vasakult üleval paremale vormingule on mõõtmised piiratud diagonaaljoone lähedal asuvate asukohtadega. Liiga järsud või madalad väärtused jäetakse sageli tähelepanuta, kuna need võivad lõppmõõtmisel põhjustada vigu.