Mis on hägune sobitamine?

Hägune sobitamine on meetod, mida kasutatakse mõnes arvutiprogrammis, eriti nendes, mis on loodud teksti automaatseks tõlkimiseks erinevate keelte vahel. See toimib olukordades, kus tarkvara kasutataval andmebaasil ei ole tekstiosale täpset vastet. Selle asemel otsib andmebaas lähedasi vasteid, kusjuures tavaliselt kontrollib inimene, kas see vaste on vastuvõetavalt täpne.

Enamik automaattõlkeprogramme võrdleb lihtsalt teksti varasemate tõlgete andmebaasiga. Seda andmebaasi tuntakse tavaliselt tõlkemäluna (TM). Iga uus ja kinnitatud tõlge lisatakse andmebaasi, mis tähendab, et tulevased tõlked on tavaliselt täpsemad ja kiiremad.

Tavaliselt töötab TM-põhine tõlge tervete lausetega. Näiteks kui kasutaja on eelnevalt kinnitanud teatud prantsusekeelse lause, mis on täpne tõlge lausele “Pood on avatud tööpäeviti 9–5, kuid suletakse kolmapäeval kell 2”, siis järgmisel korral kasutab tarkvara. palutakse see lause tõlkida, kasutab see automaatselt sama prantsuskeelset sõnastust nagu varem.

Hägune sobitamise tööriist töötab olukordades, kus konkreetne fraas pole varem süsteemi tõlgitud dokumentides esile kerkinud. Tööriist hõlmab kas tarkvara looja või lõppkasutaja, kes määrab vastuvõetava ebamäärase sobitamise taseme protsendilise vaste vormis. Kui fraas on piisavalt lähedane ühele varem tõlgitud fraasile, et see vastaks sellele protsendile, annab tarkvara kasutajale vastest nõu, esitab eelmise tõlke ja palub kasutajal pakutud tõlge kinnitada või seda muuta.

Eelmise näite jätkamiseks, kui ähmase sobitamise lävi määrati 90% ja uus ingliskeelne dokument sisaldas lauset “Pood avaneb tööpäeviti kell 9–5, kuid suletakse kolmapäeval kell 2. soovitaks varem kasutatud tõlget ja tõenäoliselt klõpsaks kasutaja selle kinnitamiseks. Kui uues dokumendis oleks lause “Pood on avatud tööpäeviti kell 9–5, aga suletakse neljapäeval kell 2”, soovitab tarkvara varem kasutatud tõlget ja kasutaja parandab seda tõlget, et lõpetada Prantsuse sõna neljapäeva jaoks. Kui uues dokumendis oleks lause “Kauplus on avatud kella 9-5 igal tööpäeval, välja arvatud kolmapäeval, mil see suletakse kell 2”, ei peaks tarkvara seda ebamääraseks vasteks, kuigi tähendus on sama. ja seega ei pakuks see lausele automaatset tõlget, jättes kasutaja selle käsitsi tõlkida.