Mis on andmelao arhitektuur?

Andmelao arhitektuur on kujundus, mis koondab ettevõtte keskkonna jaoks andmelao kõik küljed. Andmeladu on keskse domeeni loomine keerukate, detsentraliseeritud ettevõtteandmete salvestamiseks loogilisse üksusesse, mis võimaldab andmekaevet, äriteavet ja üldist juurdepääsu organisatsioonis kõikidele asjakohastele andmetele. Andmelao arhitektuur hõlmab kõiki aruandlusnõudeid, andmehaldust, turvanõudeid, ribalaiuse nõudeid ja salvestusnõudeid.

Andmelao arhitektuuri loomisel on oluline jagada arhitektuur konkreetseteks domeenideks, mis liidetakse terviklikuks lõplikuks kujunduseks. Seda kujundust tuleks pidada ettevõtte andmearhitektuuri esiteks. Eelkõige tuleks andmelao arhitektuuri kaalumisel arendada mitmeid peamisi valdkondi. Need valdkonnad on juurdepääs lähtesüsteemile, lavastusala protsess, andmete rikastamise protsess, andmearhitektuur, äriteabe protsess ja salvestusnõuded.

Andmeladu nõuab lähteandmete edastamist tehingust või kirjete andmebaasist andmelattu. See protsess on lihtsustatud terminiks Extract Transform and Load (ETL), mis hõlmab põhiliselt lähtesüsteemile juurdepääsu, andmete rikastamise ja andmearhitektuuri valdkondi. Selguse huvides on parem kujundada need arhitektuursed alad üksikasjalikult, mis annab ülevaate sellest, kuidas ETL-protsess saavutatakse. Kuigi osa andmeid on vaja lähtesüsteemidest, ei ole kõik andmed soovitavad, kuna need koormaksid üle ettevõtte ladu. Lähtesüsteemi kihi käsitlemisel on peamised murekohad andmetele juurdepääsu metoodikad, lähtesüsteemist nõutavad andmed ja värskendusnõuded.

Järgmine andmehoidla arhitektuurne kiht, mida tuleb arvestada, on lavastusala protsess. Kuna enamik lähtesüsteemidest pärinevaid andmeid nõuab valideerimist ja andmete puhastamist, on oluline luua lähteandmete jaoks sihttsoon enne andmelao ärireeglite kihti laadimist. Vahetusala säilitab lähtesüsteemide toorandmete vooge, mis on andmete värskesuse tagamiseks tavaliselt ajatembeldatud.

Andmete rikastamise või ärireeglite protsess on see, kus andmeid puhastatakse, et saavutada andmelao soovitud tulemus. Hea näide sellisest puhastusviisist on aadressipuhastusvahendite kasutamine; Kui lähtesüsteemis on valed andmed, käivitab andmete rikastamise protsess algandmete kogumi aadressi ärireeglite süsteemi, mis parandab kehtetud aadressid. See on ka aeg, mil ebatäpsed andmed kustutatakse või muudetakse, et tagada andmelao täielikkus.
Järgmine kiht, mida tuleb arvestada, on andmearhitektuuri kiht. See ala on koht, kus valmib ettevõtte andmelao tegelik kujundus või skeem. Andmeladu ei ole kõigi ettevõttesiseste andmehulkade kombinatsioon, vaid see on äsja määratletud andmebaas, mis on loodud selleks, et võimaldada ülevaadet kõigist ettevõtte äriüksustest.
See nõuab andmearhitektuurilt vastuseid küsimustele, mida äriteabe ja andmekaeve valdkonna ettevõte esitab. Sellisel viisil andmearhitektuuri loomisel muudetakse algandmekogumid faktitabeliteks, mis võimaldavad kasutajatel teha ad-hoc aruandlust kogu ettevõtte vaates, mitte konkreetses andmebaasis. See on ka ala, mis säilitab toorsüsteemi andmete metaandmeid, mis võivad sisaldada lähtesüsteemi nime või primaarvõtmeid.
Järgmine valdkond, mida tuleb arvesse võtta, on ärianalüüsi ja aruandlusnõuded. Seda kihti võib pidada andmehoidla kasutajate nõudeks. Tavaliselt sisaldab see ala salvestatud aruandeid, ad hoc aruandlusvõimalust ja ettevõtte juhtpaneele või hoiatusi. Tavaliselt pööratakse enim tähelepanu äriteabe kihtidele, kuna see on andmelaos ainus väljapoole suunatud komponent.
Viimane kaalutav kiht on üldised andmesalvestusnõuded ja hooldus. Kuna andmeladu kasvab ja laieneb, tuleb kasutajabaasi andmesalvestust rangelt hallata ja hooldada. Lisaks peaks andmelao arhitektuuri loomisel andma konstruktsioonis realistlikud hinnangud selle kohta, mida on vaja nii andmesalvestusmahust kui ka andmetele juurdepääsu võimsusega ribast. Need nõuded on kriitilised, kuna andmeladu hakatakse laialdaselt kasutama kogu ettevõttes.