Mis on lai tegelane?

Lai märk on arvutimärk, mille suurus ületab standardse 8-bitise mõõtmise. Tähemärgid arvutis, näiteks universaalses märgistikus (USC), illustreerivad laia tähemärgi tüüpilist näidet, kuna USC-d saab kodeerida 16-bitises või 32-bitises vormingus. See erineb vanematest standardsetest märgikomplektidest, nagu Ameerika standardkood teabevahetuseks (ASCII), mis kasutab mitte rohkem kui 7-bitist tähemärki. Märgikomplektide kodeerimise eeliseks on see, et see annab rohkem hingamisruumi, kui on aeg lisada komplekti täiendavaid ja keerukaid sümboleid, andes tähemärkide kujundajatele suurema vabaduse. Puudused ilmnevad täiendava mälutarbimise näol, kuna laiad märgistikud kasutavad arvutis aktiivsena töötades rohkem süsteemimälu.

Märgikomplektid tuleb kohandada töötama konkreetsete operatsioonisüsteemidega ja lai tähemärgid ei erine. Windows® operatsioonisüsteemide puhul – nii 32- kui ka 64-bitiste versioonide puhul – peavad laiad märgistikud olema kohandatud nii, et need mahuksid 16-bitisesse raamistikku, pakkudes iga märgi jaoks kaks korda suuremat salvestusmahtu võrreldes „standardse” 8-bitise komplektiga. Unix® seevastu nõuab 32-bitisesse raamistikku mahutamiseks laia tähemärki, mis pakub neli korda suuremat mahtu kui põhimärgikomplekt.

Laiade märgikomplektide suurim eelis on see, et need võimaldavad kasutada mittestandardseid sümboleid ja suuremat mitmekülgsust erinevate keelte liidestesse kaasamisel. Näiteks võivad laiad märgistikud sisaldada standardset inglise tähestikku koos selliste keeltega nagu kirillitsa ja kreeka keel. See tähendab, et üksikisikute jaoks, kes hõlmavad mitut riiki, saab rakendada ühte laia tähemärkide komplekti, mitte aga iga üksiku keelepiirkonna jaoks unikaalset mittelaia tähemärgikomplekti.

Kuigi see on kasulik tarkvaraversioonide standardiseerimiseks erinevates keelepiirkondades, on laia tähemärkide komplektidel oma hind. See hind on mälu lisatasu. Kuigi 16-bitine märgistik pakub kahekordset mahtu kui tavaline 8-bitine komplekt, tarbib see ka kaks korda rohkem mälu. Sama kehtib 32-bitiste märgikomplektide kohta, mis neelavad oluliselt neli korda rohkem mälu kui tavalised märgistikud.

Arvutustehnika ja statistika seisukohast on see märkimisväärne “kulu” mälule. Praktikas ei ole kulu aga nii suur, kui võib tunduda. Kaasaegsed arvutid sisaldavad sageli neli või enam gigabaiti süsteemimälu, mistõttu isegi suure 32-bitise märgistiku salvestamine on praktikas üsna tühine. Ainult kõige ületöötatumad või alavõimsusega arvutid märkavad laiade tähemärkide komplektide kasutamisel märkimisväärset jõudlust.