Mis on Unicode’i tekstiredaktor?

Unicode’i tekstiredaktor on arvutitarkvara, mida saab kasutada mitmesugustes tähestikes tekstide loomiseks, redigeerimiseks või vaatamiseks. See salvestab teabe Unicode’is, arenevas rahvusvahelises inimkeelte esitamise standardis. Unicode’i tekstiredaktor on eriti kasulik mitte-ladina tähestikuga, sealhulgas paremalt vasakule loetavate tähestiku korral. Unicode’i redigeerijaid kasutatakse kogu maailmas dokumentide, veebilehtede sisu ja teksti loomiseks tarkvararakenduste jaoks paljudes keeltes.

Unicode’i standardi pakkusid esmakordselt välja 1980. aastate lõpus Unicode’i konsortsiumi esimesed liikmed; see mittetulundusühing koordineerib standardi väljatöötamist kogu maailmas. Unicode’i varasemad versioonid olid loodud enamiku tol ajal kasutusel olnud keelte jaoks. 1996. aastal suurenes selle maht üle ühe miljoni eristatava tähemärgini, võimaldades Unicode’i tekstiredaktoriga sisestada ja kuvada isegi iidseid Egiptuse hieroglüüfe. Unicode’i standard määratleb konkreetselt rohkem kui 107,000 XNUMX tähemärki. Nende eelmääratletud ehitusplokkide abil saab koostada veelgi keerukamaid tähti ja sümboleid.

Unicode on teatud määral toetatud enamikes kaasaegsetes veebibrauserites, arvutitarkvararakendustes ja operatsioonisüsteemides. Enne Unicode’i oli mitte-ladina tähestiku kujutamiseks palju erinevaid meetodeid, enamik neist ei sobinud omavahel kokku. See muutis teksti samaaegse sisestamise või kuvamise mitmes keeles väga keeruliseks. Unicode’i tekstiredaktor esindab ja salvestab sellist sisu järjepideval ja täpselt määratletud viisil – loodud teksti saab hõlpsasti jagada teiste Unicode’iga ühilduvate rakenduste ja veebilehtedega kogu maailmas.

Täisfunktsionaalne Unicode’i tekstiredaktor võimaldab üldiselt klaviatuurilt teavet sisestada viisil, mis on teatud keele jaoks loomulik. Näiteks heebrea, araabia ja teisi keeli, mis on kirjutatud paremalt vasakule, saab sisestada ja kuvada selles suunas Unicode’i redaktoriga. Samasse dokumenti saab lisada mitu keelt, isegi kui need on kirjutatud eri suundades. Kõiki märke ei saa lokaliseeritud klaviatuuri abil hõlpsasti sisestada – tavaliselt pakutakse alternatiivseid sisestusmeetodeid, sealhulgas ekraanil kuvatavast loendist valimine ja numbriline kõvakodeerimine.

Unicode’i tekstiredaktor võib importida faile erinevates vormingutes, näiteks Unified Hangul Code või Thai. Laadimise ajal saab kõik numbriliselt kodeeritud Unicode’i märgid automaatselt teisendada tegelikeks Unicode’i sümboliteks. Tekstifaile saab tavaliselt salvestada Unicode’is või Ameerika standardkoodis teabevahetuseks (ASCII), kus mitte-ladina tähemärgid on esitatud numbriliselt. Sisu saab sageli salvestada hüperteksti märgistuskeele (HTML) vormingus Unicode UTF-8 kodeeringuga, mis võimaldab tänapäevastes veebibrauserites õiget kuvamist.

Unicode’i tekstiredaktorid võimaldavad sageli valida üksikute keelte jaoks erinevaid fonte ja värve, muutes mitme sisuga töötamise lihtsamaks. “Märkide kombineerimine”, mida mõned keeled nõuavad üksikute sümbolite ühendamiseks, saab tavaliselt peita või kuvada. Redigeerimise ajal saab tekstiplokke ümber järjestada. Neid saab sageli teisendada ühest juhtumist teise või HTML-i olemitest Unicode’i tähemärkideks. Paljud toimetajad sisaldavad ka funktsioone, mis lihtsustavad Aasia keelte sisestamist ja redigeerimist, teksti teisendamist lihtsustatud hiina ja traditsioonilise hiina keele vahel või näiteks transliteratsioonide ja Unicode’i esituste vahel.
Paljud Unicode’i tekstiredaktorid on saadaval kaubanduslikult või avatud lähtekoodiga kogukonna kaudu. Enamik kaasaegseid patenteeritud ja avatud lähtekoodiga tekstitöötlusprogramme võivad toimida ka Unicode’i redigeerijatena. Seda teevad ka mitmed veebilehtede kujundamise tööriistad ja meiliredaktorid. Unicode’i tekstiredaktorid on üldiselt saadaval kõigi suuremate operatsioonisüsteemide jaoks ja olemas on ka mitmed veebipõhised tööriistad.