Mis vahe on andmekaevandamisel ja andmehoidlal?

Mõisted andmekaeve ja andmeladu ajavad sageli segamini nii äri- kui ka tehnilised töötajad. Kogu andmehalduse valdkond on andmekogumise tarkvaraprogrammide juurutamise ja arvutimälu odavnemise tõttu läbi elanud fenomenaalse kasvu. Mõlema funktsiooni peamine eesmärk on pakkuda tööriistu ja metoodikaid suure hulga andmete mustrite ja tähenduste uurimiseks.

Peamised erinevused andmekaeve ja andmehoidla vahel on süsteemi ülesehitus, kasutatav metoodika ja eesmärk. Andmekaevandamine on mustrituvastusloogika kasutamine näidisandmekogumi identiteedisuundumuste tuvastamiseks ja selle teabe ekstrapoleerimiseks suurema andmekogumi suhtes. Andmeladu on andmete hankimise ja salvestamise protsess, et hõlbustada aruandlust.

Andmekaeve on üldine termin, mida kasutatakse mitmesuguste äriprotsesside kirjeldamiseks, mis tuletavad andmetest mustreid. Tavaliselt kasutatakse statistilise analüüsi tarkvarapaketti konkreetsete mustrite tuvastamiseks, mis põhinevad andmestikul ja lõppkasutaja genereeritud päringutel. Andmekaeve tüüpiline kasutusala on sihitud turundusprogrammide loomine, finantspettuste tuvastamine ja ebatavaliste käitumismustrite märkimine turvaülevaatuse raames.

Suurepärane andmekaeve näide on protsess, mida telefonifirmad kasutavad toodete turustamiseks olemasolevatele klientidele. Telefoniettevõte kasutab oma klienditeabe andmebaasi pääsemiseks andmekaevetarkvara. Päring koostatakse, et tuvastada kliendid, kes on teatud aja jooksul tellinud telefoni põhipaketi ja Interneti-teenuse. Kui see andmekogum on valitud, kirjutatakse uus päring, et teha kindlaks, kui paljud neist klientidest kasutasid proovikampaania ajal tasuta telefoni lisafunktsioone. Selle andmekaeve harjutuse tulemused näitavad käitumismustreid, mis võivad juhtida või aidata täiustada turundusplaani, et suurendada täiendavate telefoniteenuste kasutamist.

Oluline on märkida, et andmekaeve peamine eesmärk on tuvastada andmetes mustreid. Valimikomplekti määratlemisel kasutatavatel spetsifikatsioonidel on tohutu mõju väljundi asjakohasusele ja analüüsi täpsusele. Tulles tagasi ülaltoodud näite juurde, kui andmekogum on piiratud kindlas geograafilises piirkonnas asuvate klientidega, erinevad tulemused ja mustrid laiemast andmekogumist. Kuigi nii andmekaevandamine kui ka andmehoidla töötavad suurte infomahtudega, on kasutatavad protsessid üsna erinevad.
Andmeladu on tarkvaratoode, mida kasutatakse suurte andmemahtude salvestamiseks ning spetsiaalselt loodud päringute ja aruannete käitamiseks. Ärianalüüs on kasvav õppevaldkond, mis keskendub andmehoidlale ja sellega seotud funktsionaalsusele. Need tööriistad on loodud andmete eraldamiseks ja nende salvestamiseks meetodil, mis on loodud süsteemi täiustatud jõudluse tagamiseks. Suur osa andmekaevandamise ja andmehoidla terminoloogiast on samad, mis põhjustab suuremat segadust.