Mis on skeemi sobitamine?

Skeemi sobitamine on tehnika, mida kasutatakse kahe või enama keeruka andmebaasi või teabekogumi ühendamiseks. Kuna andmebaaside ja elektroonilise teabesalvestuse kasutamine muutub Interneti kaudu üha suuremaks ja keerukamaks, tuleb määratleda meetodid andmekogumite liitmiseks ühest andmebaasist teise ning skeemide sobitamine on üks selline tehnika. Idee on lihtne, kuid andmete ühendamise tegelikkus on üsna keeruline.

Mõistet “skeemide sobitamine” kasutatakse sünonüümina “skeemide vastendamisega”, kuna kasutajad tegelikult kaardistavad andmeid, mitte ei sobita neid. Kaks või enam andmebaasi kaardistatakse kokku ja iga andmebaasi sarnased aspektid kaardistatakse üksteisega. Kõige tavalisem viis andmete liitmiseks on täpsete viidete kasutamine. Selle liitmisstiili näide on ühe andmebaasi nimeveeru kombineerimine teise andmebaasi nimeveeruga.

Inimeste või arvutite ühendamine pole tavaliselt nii lihtne. Kuna nii palju andmeid tuleb filtreerida, kombineerida ja kasutada, on mitme andmebaasi asemel oluline omada ühte andmebaasi. Skeemi kaardistamine keskendub selle tüütu protsessi automatiseerimiseks ja tõhusamaks muutmisele. Näide selle kohta, kus skeemi sobitamine on vajalik, võib olla see, kui ühes andmebaasis on valdkond “üliõpilase eriala” ja teises andmebaasis on väli “üliõpilase eriala”. See on sama teave, kuid pisut erinevad pealkirjad raskendavad selle ühendamist.

Skeemi sobitamine jagab selle keeruka andmebaaside liitmise protsessi neljaks etapiks: eelintegreerimine, võrdlemine, vastavus ja liitmine. Enne mitme andmebaasi ühendamist tuleb neid sarnasuste ja erinevuste osas analüüsida. Skeemi sobitamise valdkonnas nimetatakse seda eelintegratsiooniks. Arvuti hakkab määrama kõige tõhusamat integreerimismeetodit.

Järgmisena hindab arvuti skeeme, võrreldes neid üksteisega üksikasjalikumal tasemel. Võrdlusetapil vaatab arvuti iga andmebaasi kirjet ja teeb kindlaks, kus võib esineda konflikte. Selle näiteks on see, kui väljal „õpilase huvid” on kirjas „arst” ja teises andmebaasis on see „arst”. Tõenäoliselt tunneb inimene teavet samana, kuid andmebaasitööriistade puhul on need kaks eraldi üksust.

Kui arvuti on kõik võimalikud konfliktid kindlaks teinud, võib ta edasi liikuda, püüdes probleeme lahendada. See võib olla sama lihtne, kui asendada kõik mõisted “arst” sõnaga “arst”. Tegelikult on protsess oluliselt keerulisem.
Kui kõik konfliktid on lahendatud, saab arvuti jätkata andmete liitmist skeemi sobitamise protsessis. Selles etapis liidetakse kaks või enam andmebaasi üheks suureks andmebaasiks. Kui kõik läheb hästi, ei teki integreerimisel ja edaspidisel andmebaasile juurdepääsul konflikte ega tõrkeid.