Andmehoidla kaevandamine on ühes või mitmes andmebaasis sisalduva teabe analüüs, et muuta teave kasulikuks. Need andmebaasid ehk andmelaod on andmete keskne hoidla. Ettevõtted koondavad oma klientide kohta kogutud teabe andmelattu. Kui teave on kogutud, see “kaevandatakse” ja sellest eraldatakse kasulikku teavet, et saada teavet, mis võib aidata ettevõttel teha äriotsuseid, mis suurendavad kasumit või vähendavad kulusid. Jaemüüjad kasutavad klientide käitumise analüüsimiseks ja ennustamiseks sageli andmehoidla kaevandamist.
Näiteks kui ostleja läheb supermarketisse ja annab kassapidajale oma sagedase ostjakaardi, kogutakse tema ostude kohta teavet ja salvestatakse see ettevõtte andmelattu. Supermarketite kettil on miljoneid andmeid selle kohta, mida inimesed ostavad, millal, mis kogustes ja mis hinnaga. Pood võib küll teada, et eelmisel aastal müüdi 50,000 75 pakki külmutatud herneid, kuid sellest infost üksi pole erilist abi. Kui aga andmehoidla kaevandamise käigus selgub, et 10% külmutatud hernestest müüdi kuude jooksul, mil värskeid herneid ei olnud, või et XNUMX% hernestest müüdi kahe nädala jooksul enne tänupüha, võib ettevõte olla võimeline. kasutada seda teavet külmutatud herneste aastamüügi suurendamiseks.
Ettevõtted saavad tulevase müügi ennustamiseks kasutada andmehoidla kaevandamise tehnikaid. Andmekaevandamine võib samuti aidata neil hinnata varumis- ja hinnaotsuste mõju. Supermarketis võib andmekaevandamine hoida ära külmutatud herneste tühjaks saamine, kui värskete herneste saak konkreetsel aastal on kehv.
Andmekaeve regressioon on andmekaevandamise tehnika, mida kasutatakse selleks, et näidata, mis tõenäoliselt juhtub andmeväärtusega, kui võrrandis midagi muudetakse. Supermarketi näitel ennustaks regressioon külmutatud herne müügi taset, kui värske hernes kallineks. Regressioon kasutab ajaloolisi andmeid ja rakendab neile valemit, mis ennustab tulevast käitumist.
Ettevõtted kasutavad andmete kogumiseks ja kaevandamiseks sageli andmelao kaevandamise tarkvararakendust. Õige rakenduse määrab neil olevate andmete hulk ja analüüsi tüüp, mida nad soovivad teha. Õige andmekaevetööriista valimine on kasulike andmete kogumisel ja tõlgendamisel ülioluline.