Mis on ekraanikaabits?

Ekraanikaabits on arvutiprogramm, mis kogub märgipõhiseid andmeid teise programmi kuvaväljundist. Ekraanikaabitsad saavad otsitavad andmed eraldada ja esitada rikkalikumal kujul, näiteks graafikute või tabelitega, või lihtsalt indekseerida andmed salvestamiseks. Ekraanikaabitsatel on palju muid nimetusi, sealhulgas veebisaidi kaabits, sisu kaevandaja, veebisaidi rippija, veebi ekstraktija, automaatne andmekoguja ja HTML-kaabits.

Ekraanikaabits otsib veebisaidi koodist läbi ja filtreerib välja kõrvalise koodi, mis on paigas, et pakkuda lõppbrauserile kena välimusega esitlust. Selline kood on vajalik kogu lehe kavandatud paigutuse vaatamiseks, kuid kaabits otsib lihtsalt kasulikke andmeid. Need andmed kogutakse ja esitatakse lihtsa andmebaasina, ilma originaalse HTML-koodita kellade ja viledeta.

Hea näide ekraanikaabitsa töös on otsingumootori ämblikud. Need ämblikud pääsevad juurde sadadele tuhandetele veebisaitidele, millest igaüks sisaldab arvukalt lehti. Nende saitide märksõnaandmed kogutakse ja indekseeritakse ning esitatakse seejärel lõppkasutajale otsingumootori tulemustena.

Enamik ekraanikaabitsaid uurib teabe saamiseks veebisaidi HTML-koodi, kuid nad saavad otsida ka muudest skriptikeeltest, nagu JavaScript või PHP. Kaevandatud andmeid saab seejärel esitada HTML-ina, nii et kasutaja pääseb neile oma veebibrauseri kaudu juurde, või salvestada tekstiandmetena, millele kasutaja pääseb juurde võrguühenduseta.

Ettevõtted kasutavad erinevatelt märksõnadega seotud veebisaitidelt andmete kaevandamiseks ekraanikaabitsaid, et luua graafikuid, diagramme, arvutustabeleid ja võrdlusandmeid, mida kasutada aruannetes ja esitlustes. Ekraanikaabits säästab erakordselt palju aega, kuna sama ülesannet täitev töötaja peaks otsima asjakohaseid saite, klõpsama linke ja sirvima iga saiti eraldi, et leida ja salvestada vajalikud andmed. Ekraanikaabitsat saab kasutada ka siis, kui teave on salvestatud süsteemi, millele uuema riist- või tarkvaraga ühilduvusprobleemide tõttu enam juurde ei pääse.

Ekraanikaabitsad võivad saidiomanike ja veebis surfajate jaoks olla nii õnnistuseks kui needuseks. Kuigi need pakuvad ettevõtetele, otsingumootoritele ja teistele absoluutselt funktsionaalset teenust, saab ekraanikaabitsat kasutada ka vähem kui altruistlikel eesmärkidel. Näiteks ettevõtted või üksikisikud, kes kasutavad reklaamimeetodina rämpsposti, saavad veebilehtedelt e-posti aadresside kaevandamiseks kasutada ekraanikaabitsat.
Kuigi ekraanikaabits võib olla mugav tööriist, on veebikogukonnas arutelud nende kasutamise seaduslikkuse ja eetika üle. Autoriõigusega seotud probleemid muutuvad häguseks, kui ekraanikaabits võtab välja kellegi raske töö ja esitab selle mõnel muul veebisaidil muus vormingus. Saitidel, mille tulu teenimine sõltub reklaamidest, on probleeme, kui ekraanikaabits nende reklaamidest kõrvale lükkab. Selle tulemusena on mõned veebisaitide omanikud hakanud rakendama tööriistu, mis takistavad nende saitide kraapimist.