Mis on faili tihendamine?

Failide tihendamine on meetod, mida arvutid kasutavad elektroonilise faili või failide rühma suuruse vähendamiseks võimalikult väikesele suurusele. ZIP-failid on tavaline failide tihendamise näide. Arvutiprogrammid kasutavad failide tihendamiseks palju tehnikaid, kuid kõige levinum meetod on korduvate jadade asendamine väiksemate järjestustega. Arvutid teevad seda, kataloogides esimese eksemplari ja viidates sellele järgmistel juhtudel tagasi. Näiteks sellele eelnevates lausetes on kolm korda esinenud tähed “compress”. Arvuti võib need tihendada, kataloogides esimese eksemplari ja võrdsustades kõik järgnevad eksemplarid sõnaga “&cmp”, vähendades nii vajalike tähtede või märkide arvu ja faili suurust. Suure faili puhul võib selline asendamine säästa palju ruumi. Tuleb aga märkida, et kasutaja seda ei näe – arvuti teeb kogu töö taustal.

Lühendatud asenduste jälgimiseks loovad arvutiprogrammid tihendatud faili jaoks ka sõnastiku. Failide tihendamise maailmas on sõnastik algsete fraaside ja nende asenduste loend. See sõnastik sisaldub aga faili suuruses, nii et see võtab ka ruumi, vähendades tihendamisega säästatavat ruumi. Sel põhjusel on ühe väikese faili tihendamine tavaliselt vähem tõhus kui suure faili või rühma tihendamine.

Failide tihendamist teostavad programmid töötavad veidi erineval viisil. Need erinevused tulenevad enamasti millestki, mida nimetatakse algoritmiks. Algoritm on matemaatiline konstruktsioon, mis otsib failidest kordusi ja lisab lihtsad viited. Programmeerijad loovad tihendusalgoritmid ja määratlevad tihendamiseks kasutatavad mustrid ja asendused. Erinevused võivad mõjutada kokkusurumise tõhusust. Näiteks fraasis “see oli parimad ajad, see oli halvim aeg” korratakse järjestusi “see oli aeg” ja “st of times”. Programmeerija võib valida, kas asendada iga fraas tervikuna või asendada “see” eraldi ja “aegadest” eraldi. Need väikesed erinevused algoritmides on põhjuseks, miks mõned failitihendusprogrammid töötavad mõne failitüübi puhul paremini kui teised.

Teatud tüüpi tihendatud failid on isepakkivad, mis tähendab, et need avanevad automaatselt, kui kasutaja neile klõpsab – nende lahtipakkimiseks pole vaja väliseid programme. Nende failide tegemiseks peab algne tihendusprogramm tihendatud failile lisakoodi lisama. Sel põhjusel on isepahanduv tihendatud fail sageli suurem kui sama fail, kui see oleks tavapäraselt tihendatud. Tavaliselt peetakse seda heaks kompromissiks ettevõtetele, kes annavad välja koduarvutitesse installitavaid programme. Muutes faili isepahanevaks, võimaldab see kodukasutajal sammu vahele jätta ja muudab tarkvara installimise tõenäolisemaks. Isepahanduvate failide lahtipakkimiseks on Internetist allalaadimiseks saadaval mitmed kolmandate osapoolte programmid.