Arvutuslingvistika on üldvaldkond, mis hõlmab paljusid psühholoogia, lingvistika, loogika ja arvutiteaduse aspekte. Selle eesmärk on aidata arvutitel mõista keeleprobleeme, et automatiseerida paremini tõlkimise, genereerimise, kõne ja arusaamise aspekte.
Arvutuslingvistika sündis pärast mitmeid ebaõnnestunud automaattõlke katseid. 1940. aastate lõpus nägi USA valitsus vajadust tekstide, eriti venekeelsete tekstide masintõlke järele. Arvestades arvutite kohandamise lihtsust matemaatiliste probleemide lahendamiseks, eeldati, et nende keele tõlkimise õpetamine on lihtne. Kiiresti selgus, et probleem oli aga palju raskem, ja tekkis arvutilingvistika distsipliin.
Arvutuslingvistika algusaegadel domineerisid selles valdkonnas arvutiteadlased. Alates 1970. aastatest on aga ilmnenud, kui keeruline keel tegelikult on, ja tänapäevane arvutuslingvistika kasutab paljude valdkondade eksperte.
Masintõlge on alati olnud arvutuslingvistika peamine eesmärk ja see valdkond on teinud suuri edusamme. Ülesanne on väga keeruline, nõudes kõneosade tuvastamist, grammatika mõistmist, ulatuslikku sõnavara ning kõnekeele ja slängi käsitlemise mehhanisme. Masintõlge pole kaugeltki täiuslik, kuid iga aastaga muutuvad tõlked täpsemaks ja vähem sunnitud.
Kõnetuvastus on teine arvutuslingvistika valdkond, mis on pälvinud palju avalikku huvi. Pärast mõnda ebaõnnestunud katset kasutada tavalist kõnetuvastustarkvara 1990. aastate keskel, vaikis see valdkond mõneks ajaks. 21. sajandi alguses jõudis turule aga hulk uusi kõnetuvastustarkvara komplekte, millel on ulatuslikud õppesüsteemid ja kõrge täpsus. See on kaasa toonud avalikkuse taas huvi kõnetuvastustarkvara vastu ning sellega kaasnenud rahastamise ja teadustöö suurenemise.
Kõne genereerimine on arvutilingvistika seotud valdkond, mis on alates 1980. aastatest pidevalt arenenud. Kirjaliku teksti loomuliku lugemiseni jõudmine on väga keeruline probleem, kuid sellel on tohutult potentsiaalseid eeliseid. Mittenägevate kasutajate jaoks võib kõne genereerimise tarkvara olla digiajastu viljade nautimiseks ülioluline.
Arvutuslingvistika mängib suurt rolli ka automatiseeritud grammatikaparandussüsteemides, nagu need, mis on integreeritud kõige populaarsematesse tekstitöötlusprogrammidesse. Täpne grammatikakontroll nõuab keerulist kõneosade tuvastamise oskust ning põhjalikku grammatikareeglite ja erandite loendit. Kuigi enamikul tavagrammatika kontrollijatel on endiselt palju probleeme, on need juba uue põlvkonna jaoks muutumas asendamatuks.
Arvutuslingvistika on põnev valdkond paljudest teadusharudest. Probleeme, mida see lahendama peab, on palju ja ükski pole lihtne. Futuristlikud nägemused, mida ta aga ootavad, muudavad selle võitluse igati vaeva väärt. Alates unistusest universaalsest tõlgist kuni sõna täiusliku kõnetuvastuseni – arvutilingvistika eesmärgid ei suuda äratada imestust.