Mis on nimega olemi tuvastamine?

Kuigi lõppkasutaja seisukohast on andmete arvutisse sisestamise protsess üsna lihtne, käivitab protsess tegelikult mitmeid muid väiksemaid protsesse. Iga andmeosa puhul peab arvuti selle teabe tõlkima talle arusaadavasse keelde. Arvutid kasutavad sisemist keelt, mida tuntakse binaarsena, milles “1” ja “0” märkide kogum moodustavad koos, et öelda arvutile, mida teha. Nimega olemi tuvastamine on meetod tõlkeprotsessi sujuvamaks muutmiseks sisendilt andmetele, aidates arvutil lauseid nende osadeks jagada.

Kui sisestate andmeid enamiku arvutiprogrammide või veebilehtede abil, palub programm või veebileht teil üldjuhul sisestada igale väljale konkreetne teave, näiteks väljad “Nimi” või “Aadress”. Nimega olemituvastusprogramm kaotab suurema osa sellest, võimaldades lõppkasutajal sisestada tekstist stringe – lauseid –, pakkudes loomulikumat liidest. Programm võtab teie sisestatud andmed ja sorteerib need osadeks, mida see paremini mõistab.

Võtke näiteks lause “Joe tellis neli puuda banaane”. Traditsioonilises programmis peab lõppkasutaja sisestama väljale “Töötaja nimi” “Joe”, väljale “Ostutüüp” “Banaanid”, väljale “Kogus” “neli” ja väljale “bushels”. väljale “Ühikud”. Nimega olemi tuvastamise seadistuses sisestab lõppkasutaja lihtsalt kogu lause nii, nagu see on kirjutatud. Niipea, kui kasutaja klõpsab Esita, sorteerib arvuti lause tükkideks, teostades sama andmete jaotuse, mida kasutaja oleks varem kasutanud.

Kuigi see on palju sujuvam kui traditsiooniline väljade põhjal loodud sisestusprogramm, on sellel üks oluline puudus: tõlkealgoritmi võimalik rike. Vähem intelligentsed nimega olemituvastusalgoritmid võivad lauset mõista ainult ühel konkreetsel viisil. Teisisõnu, kui töötaja sõnastas lause ümber ja kirjutas “Neli puuda banaane tellis Joe”, võib programmil olla raskusi osade mõistmise ja sorteerimisega. Sel põhjusel, kuigi lõppkasutaja ei vastuta enam väljadele andmete sisestamise eest, ei ole see siiski nii vaba, kui süsteem esialgu võib tunduda.