Mis on veebikaevandamine?

Veebi kaevandamine on teabe kogumise vorm, mis kehtib võrguallikatest kogutud andmete kohta. Interneti-allikatest andmete kogumine võimaldab kasutajatel koondada suurel hulgal teavet analüüsiks, et teha veebikeskkonnas olulisi äriotsuseid. Näiteks võib teadlane kasutada veebikaevandamist, et koguda teavet konkreetsete märksõnade kasutamise kohta veebisisus. Teise võimalusena kasutavad jaemüüjad ja teised turundusspetsialistid veebipõhist andmekaevet, et tuvastada veebiliikluse suundumusi, saidi külastajate muutmist ostjateks ja muud veebikasutust.

Andmete kogumise, sortimise ja analüüsimise osas jäljendab veebikaevandamine traditsioonilisi andmekaevetegevusi. Võrdluseks keskenduvad veebikaevandamise tegevused veebipõhisele teabele, mitte suurele ristlõikele teabeallikatest, nagu võrguühenduseta arvutiandmebaasid, kliendikirjed või paberkandjal raamatupidamisandmed, nagu tavaliselt toimub traditsioonilise andmekaevanduse puhul. Ainuüksi veebiallikatest andmete kogumisele keskendumine pakub veebiturunduse strateegiate, veebisaitide struktuuriotsuste ja sarnaste elektroonilise kaubandusega seotud otsuste tegemiseks vajalikku sihipärast analüüsi. Andmete kogumine veebikaevandamise kaudu annab ka laia rahvusvahelise demograafilise teabe eelise, kuna uurijatele ja teabekogujatele on kättesaadavad veebisaidid üle kogu maailma.

Tööalaselt jaguneb veebikaevandamine kolme konkreetsesse kategooriasse: veebistruktuuri kaevandamine, kasutuse kaevandamine ja veebisisu kaevandamine. Iga ala keskendub konkreetsele teabele, nagu konkreetse veebisaidi struktuur ja hüperlingid, serveri logiteave külastajate kasutamise kohta ja konkreetne võrgus saadaolev sisu. Veebisaitide analüütilised tarkvarapaketid ja teenused on suurepärane näide veebikasutuse kaevandamisest, pakkudes veebihalduritele teavet külastajaliikluse, kasutatud otsingutulemuste, klõpsatud linkide ja konkreetsete lehtedega suhtlemiseks kulutatud aja kohta. Struktuurikaevandamine seevastu annab üksikasjalikku teavet konkreetse veebisaidi sisestruktuuri kohta, sealhulgas hüperlinke, andmebaase ja päringufunktsioone.

Turundusprofessionaalile pakub veebikaevandamine turundustegevusega võrreldes palju kasutusvõimalusi. Väärtuslik teave on teadmine, kuidas saidi külastajad konkreetset veebisaiti kasutavad, kuidas konkurendid konkureeriva saidi loovad ja milline sisu on juba võrgus. Selline teave aitab peamistel otsustajatel koostada turundusstrateegia, mis põhineb eelnevalt tõestatud tehnikatel ja dokumenteeritud teabel.

Kolledžid ja ülikoolid kasutavad ka veebikaevandamist tarkvara kaudu, mis kontrollib, et üliõpilastööd on ainulaadsed ja neid ei plagiaadita. Kasutades veebisisu kaevandamise põhimõtteid, otsivad sellised hindamisabilised sarnast sisu kogu Internetist. Juhendajad laadivad üles õpilasdokumendi teksti ja annavad seejärel plagiaaditarkvarale ülesandeks otsida Internetist sarnaseid fraase või kopeeritud teksti. Tulemusi väljendatakse sageli sobiva teksti protsendina. Esitatakse lingid sarnastele tulemustele, et juhendajad saaksid külastada saite, et teha kindlaks, kas vasted on tõepoolest plagieeritud.