Mis on loomuliku keele töötlemine?

Loomuliku keele töötlemine (NLP) on viis tõlkimiseks arvutikeelte ja inimkeelte vahel. Selle välja eesmärk on võimaldada arvutitel mõista, mida tekst ütleb, ilma et neile oleks antud tekstis sisalduvate andmete jaoks täpseid väärtusi ja võrrandeid. Sisuliselt automatiseerib loomuliku keele töötlemine inim- ja arvutikeelte vahelise tõlkeprotsessi. Kuigi suur osa sellest valdkonnast tugineb fraasi tõenäolise tähenduse määramiseks statistikale ja mudelitele, on sellele probleemile palju erinevaid lähenemisviise. Selle valdkonna leide saab kasutada kõnetuvastuse, inimkeelte tõlkimise, teabeotsingu ja isegi tehisintellekti valdkonnas.

Arvutiteaduse ja lingvistika taustast välja arenenud loomuliku keeletöötlus seisab silmitsi paljude probleemidega, kuna keel ei ole alati järjepidev ja kõik tähenduse vihjed ei sisaldu keeles endas. Isegi keele kogu grammatika täielik ülevaade koos kõigi eranditega ei võimalda alati arvutil tekstis sisalduvat teavet sõeluda. Mõned laused on süntaktiliselt mitmetähenduslikud, sõnadel on sageli rohkem kui üks tähendus ja mõned häälikute või sümbolite kombinatsioonid muudavad oma tähendust olenevalt sõnade piiridest – see kõik võib konteksti mittemõistva arvuti jaoks probleeme tekitada. Veelgi olulisem on see, et suur osa keelest sõltub ühendusest füüsilise ja sotsiaalse universumiga – mõned laused, näiteks kõneaktid, ei edasta nii palju teavet kui mõjutavad maailma. Isegi kui arvutil on täiuslik arusaam inimkeele süntaksist ja semantikast, peab analüüsitav tekst olema vaba inimlikest vahenditest, nagu sarkasm või passiivne agressioon, et arvuti saaks õigesti aru, mida tekst tähendab.

Ideoloogiliselt on loomuliku keele töötlemine inimese ja arvuti interaktsiooni süsteem, mida juhib idee, et enamikule arvutikasutajatele on mugavam töötada arvutitega inimkeeles, mida nad juba oskavad, kui arvutikeelega kohaneda. See kasutab ära ka tõsiasja, et suur osa inimeste teadmistest on juba inimkeelde kodeeritud ja neid teadmisi sisaldavad tekstid saab tõlkida loogilisteks struktuurideks, mida saab arvuti jaoks sujuvamaks muuta. Kui paljud selle valdkonna projektid püüavad inimkeelsetest tekstidest arvutiga loetavate andmete eraldamist, siis loomuliku keele töötlust kasutatakse ka arvutiandmetest inimloetavate tekstide genereerimiseks. Nii mõistmis- kui ka genereerimisvõimalusi saab kasutada sama tehnoloogiaga, näiteks rakenduste puhul, mis tõlgivad ühest inimkeelest teise, dekodeerides teksti esmalt arvutikeelde, seejärel kodeerides selle teise inimkeelde. Loomuliku keele töötlemise püüdlustes saadud uuendused on silmatorkavalt rakendatavad ka tehisintellektiprojektide puhul, kuna inimesesarnast intelligentsust määratleb inimkeele keerukuse valdamine.