Mis on andmete koondamine?

Andmete liiasus on olukord, mis tekib andmebaasisüsteemides ja hõlmab tahtmatut dubleeritud andmete loomist, mis pole andmebaasi toimimiseks vajalikud. Kuigi koondamine on mõnes olukorras sageli soovitav omadus, ei vasta see andmebaasi funktsioonidele. Dubleeritud andmete olemasolu võib sageli süsteemi toimimisele negatiivselt mõjuda, mille tulemuseks on süsteemipäringutele vastusena teabe tagastamine, millest pole kasu. Andmehalduse üks põhifunktsioone on dubleeritud andmete tuvastamine ja nende dubleerimise eemaldamine.

Andmete liiasuse potentsiaali leidub peaaegu igat tüüpi andmebaasiprogrammides. Programmid, mida peetakse lamedaks (nt arvutustabelid) ja mis põhinevad andmete käsitsi sisestamisel, on eriti vastuvõtlikud teabe dubleerimisele, mis võib soovitud teabe hankimisel põhjustada komplikatsioone. Relatsioonistiili andmebaasid, näiteks müügikontaktide andmebaasid, sisaldavad sageli protsesse, mis aitavad minimeerida tahtmatu dubleerimise võimalust, näiteks kahe erineva kontaktifaili loomine samale kontaktile, mis on seotud sama ettevõttega. Isegi süsteemikontrollide kasutamisel andmete liiasuse vähendamiseks on endiselt võimalik probleeme, mistõttu tuleb perioodiliselt andmebaasis andmeid puhastada.

Parimal juhul tähendab andmete liiasus seda, et andmebaas on täis teavet, mis ei ole hädavajalik, kuid ei kujuta endast reaalset ohtu andmete leidmise võimalusele, millal ja kui vaja. Halvimal juhul aeglustab dubleeritud andmete olemasolu andmebaasi oluliste funktsioonide täitmist ja võib muuta andmebaasi kasutamise protsessi teatud ülesannete haldamiseks keerulisemaks. Näiteks üleliigse teabega ummistunud kliendiandmebaasi kasutamine postisiltide loomiseks tooks kaasa mitmete dubleeritud tasemete loomise, mistõttu tuleb enne siltide kasutamist duplikaadid kas sorteerida ja kõrvaldada või võtta aega andmebaasi puhastamiseks enne siltide genereerimist.

Õnneks on andmete liiasuse jälgimine ja parandamine midagi, mida paljud andmehaldussüsteemid saavad suhteliselt lihtsalt teostada. Mõned süsteemid märgistavad dubleeritud andmete sisendi, muutes tajutava dubleerimise hõlpsaks ülevaatamiseks ja otsustamiseks, kas need kustutada või jätta kehtima. On isegi tarkvaraprogramme, mida saab kasutada olemasoleva andmebaasi dubleerimise kontrollimiseks ja need üleliigsed kirjed suhteliselt hõlpsalt automaatselt eemaldada.