Mis on andmete kaardistamine?

Andmete kaardistamine on protsess, mille käigus luuakse kaks erinevat andmemudelit ja määratletakse seos nende mudelite vahel. Andmemudelid võivad sisaldada metaandmeid, semantika seisukohast täpse tähendusega andmeühikut ja telekommunikatsiooni. Süsteem kasutab teavet sisaldava elektri omaduste mõõtmiseks aatomiühikute süsteemi. Andmete kaardistamist kasutatakse kõige hõlpsamini tarkvaratehnikas, et kirjeldada parimat viisi teabele juurdepääsuks või teabe esitamiseks. See toimib abstraktse mudelina suhete kindlaksmääramiseks teatud huvivaldkonnas. See on põhiline esimene samm konkreetse domeeni andmete integreerimisel.

Andmete kaardistamise peamised kasutusalad hõlmavad mitmesuguseid platvorme. Andmete teisendamist kasutatakse algse andmeallika ja nende andmete kasutamise sihtkoha vahelise suhte vahendamiseks. See on kasulik andmeliini analüüsi osade tuvastamisel, st viisi, kuidas andmed liiguvad ühest teabesektorist teise. Kaardistamine on oluline ka peidetud teabe ja tundlike andmete (nt sotsiaalkindlustuse numbrid) avastamisel, kui need on peidetud erinevasse identifitseerimisvormingusse. Seda nimetatakse andmete maskeerimiseks.

Andmete kaardistamisel rakendatakse teatud protseduurid. See võimaldab kasutajal luua või teisendada teavet sellisesse vormi, milles saab parimaid tulemusi välja otsida. Tavaliselt on see mõne graafilise kaardistamise tööriista kujul, mis suudab automaatselt tulemusi genereerida ja andmeid teisendada. Põhimõtteliselt saab kasutaja sõna otseses mõttes “tõmbama” joone ühelt väljalt teisele, tuvastades õige ühenduse. Seda nimetatakse käsitsi andmete kaardistamiseks.

Andmeelemendi põhilise kaardistamise tehnika puhul tuleb käsitleda mitmeid konkreetseid valemiga seotud kaalutlusi. Andmeelement ise tuleb identifitseerida ja nimetada, määrata andmete selge definitsioon ja loetleda väärtuste esitus. Mõnes mõistes on identifikaatorid esitatud andmebaasi kujul. Standardstruktuurid koostatakse põhiliste teabeühikutega, nagu nimed, aadressid või vanused.

Näiteks kui ettevõte ühineb teise ettevõttega, peavad nad ühendama mõlema kliendirühma andmed. Andmete kaardistamist saab kasutada ühe teabekogumi jälgimiseks ja selle ristviitamiseks teise andmekogumiga. See võimaldab mõlemal ettevõttel andmed üheks lõplikuks andmebaasiks liita.

Üks uusimaid andmekaardistamise tehnikaid hõlmab statistika samaaegset kasutamist kahe erineva andmeallika väärtusega. See võimaldab kahe andmekogumi vahel keerukamaid kaardistamistoiminguid. Seda saab kõrgelt hinnata spetsiifilisemate teabeaspektide, näiteks alamstringide avastamisel.