Mis on masintõlge?

Masintõlge on arvutiteaduse valdkond, mis keskendub kirjaliku teksti või verbaalse kõne teisendamisele ühest loomulikust inimkeelest teise. Selle valdkonna uurimine algas 1950. aastatel ja on sellest ajast alates arenenud nii kaugele, et alates 2011. aastast olid mitmed masintõlkesüsteemid avalikuks kasutamiseks saadaval. Täiesti täpset tõlget on masinate abil aga väga raske saavutada ja paljud väljakutsed selles valdkonnas olid veel lahendamata.

Masintõlkes kasutatav üldine tehnika seisneb arvutisõnastiku abil ühest keelest pärit sõnade teisendamiseks nende ekvivalentideks teises keeles. Inimkeeled on aga keerulised ja fraasidel võib sageli olla mitu tähendust, seega peavad tõhusad tõlkeprogrammid võtma arvesse terveid lauseid. Need programmid peavad arvutama iga sõna tähenduse. Näiteks võib sõna “raamat” olla nimisõna nagu “ta luges raamatut” või tegusõna, näiteks “ta broneerib lennu”. Konteksti analüüsides saavad programmid määrata tõlke jaoks parimad sõnad.

Masintõlkealgoritmid peavad arvestama ka sihtkeele grammatikastruktuuriga. Näiteks ingliskeelsete sõnade “red shirt” otsetõlge hispaania keelde on “roja camisa”. Korrektne hispaania keele grammatika asetab omadussõnad nimisõnade järele, nii et õige tõlge peab järgima seda grammatikareeglit ja muutma hispaaniakeelse tulemuse “camisa roja”. Grammatikareeglite rakendamine võib olla lihtne, kui tegemist on ainult kahe sõnaga, kuid need võivad muutuda keeruliseks ja masintõlke jaoks raskesti töödeldavaks, kui terveid lauseid ja lõike tuleb teisendada.

Hoolimata masintõlke edusammudest, olid 21. sajandi alguses arvutiprogrammid endiselt altid vigadele. Selle probleemi lahendamiseks on masintõlge, mille puhul professionaalsed inimtõlgid kasutavad seda programmi. Need spetsialistid on teadlikud masintõlke piirangutest, nii et nad suudavad leida ja parandada levinud vigu. Inim- ja masintõlketeenuste kombineerimine võimaldab suures koguses teksti teisendada nii kiiresti kui täpselt.