Mis on andmekaevandamise mudel?

Andmekaeve kirjeldab suurtest teabekogumitest andmete eraldamise ja ainulaadsel viisil esitamise protsessi. Seda protsessi leidub sageli äriteabe uuringutes, mille käigus eksperdid kaevandavad turu või ettevõtte tegevuse kohta suuri andmekogumeid ja püüavad avastada varem tundmatuid seoseid ja suundumusi. Andmekaevandamise mudel viitab tehnikatele, mida spetsialistid kasutavad teabe rühmitamiseks ja esitamiseks, samuti viise, kuidas nad saavad teavet teatud küsimuste ja probleemide puhul rakendada.

Paljud spetsialistid peavad andmekaeve regressiooni kõige elementaarsemaks ja sagedamini kasutatavaks andmekaevemudeliks. Selle protsessi käigus analüüsib ekspert andmekogumit ja loob seda kirjeldava valemi. Paljud finantsanalüütikud kasutavad seda tehnikat hindade ja turusuundumuste prognoosimiseks. See mudel töötab kõige paremini stsenaariumide puhul, mille puhul eeldatakse, et andmed jäävad järjepidevaks.

Teine populaarne andmekaevemudel põhineb seostamisel. Spetsialist saab analüüsida andmekogumeid, et teha kindlaks, millised komponendid sageli koos esinevad. Kui kaks komponenti on ikka ja jälle paaris, võib uurija eeldada, et nende vahel on mingi seos. Näiteks võib teadlane, kes kasutab andmekaevet, et saada teavet jaekaupluse toimivuse kohta, avastada, et tarbijad ostavad sageli pliiatseid ja pliiatseid paberi ostmisega samal ajal. Juht saab kasutada andmekaevemudelist saadud teavet müügi suurendamiseks, kuvades kõik seotud üksused ühes ruumis.

Faktoranalüüs on veel üks levinud andmekaevemudel. Selle protsessi käigus kogub teadlane mitmeid erinevaid muutujaid ja püüab leida tegurid, mis määravad väärtuse kõikumised. Näiteks turu-uurija saab kliendibaasilt õppida, kuidas ta hindab sarnaste toodete omadusi. Seejärel saab teadlane korraldada selle teabe, et illustreerida tegureid, mis määravad tarbijate funktsioonide väärtuse. Kuigi selle mudeli pooldajad usuvad, et see võib esile tuua näiliselt erinevate muutujate ühisuse, usuvad mõned kriitikud, et see mudel võib panna mõned tõlgendajad eeldama teatud nähtuste põhjuslikku seost, kui kogu põhjusliku seose kindlakstegemiseks vajalik teave ei pruugi olla kättesaadav.

Teadlased võivad lihtsamate probleemide puhul kasutada kategoriseerimisel põhinevat andmekaevemudelit. Seda tehnikat kasutades korraldavad spetsialistid andmeid oma klassifikatsioonide järgi ja kipuvad korraldama neid visuaalsel kujul, näiteks puus või diagrammis. Selline mudel on eriti kasulik stsenaariumide puhul, kus inimene peab valima igas kategoorias mitme valiku hulgast. Disainerile võib see mudel olla kasulik, kui ta saab protsessi igas etapis valida mitme materjali hulgast.