Mis on järjestuste kaevandamine?

Järjestuste kaevandamine on teatud tüüpi struktureeritud andmekaeve, mille käigus andmebaas ja administraator otsivad andmetes järjestusi või suundumusi. See andmekaeve on jagatud kaheks väljaks. Üksuste järjestuste kaevandamist kasutatakse tavaliselt turunduses ja stringide järjestuste kaevandamist bioloogiauuringutes. Jadade kaevandamine erineb tavalisest trendikaevandamisest, kuna andmed on spetsiifilisemad, mis muudab tõhusa andmebaasi loomise andmebaaside kujundajatele keeruliseks ja mõnikord võib see valesti minna, kui jada erineb tavalisest jadast.

Ühel või teisel hetkel kasutatakse kõiki andmebaase andmete kaevandamiseks. See kaevandamine aitab ettevõtetel ja uurimisrühmadel leida midagi, mida nad vajavad. Tavaliselt otsivad nad mingit trendi, kuid mis see trend on ja kui spetsiifiline teave on, sõltub andmebaasi kujundusest. Jadade kaevandamisel on andmebaas üles ehitatud väga spetsiifiliste jadade leidmiseks, millel on vähe või üldse mitte. See on ainulaadne struktureeritud andmekaeve vorm, mille puhul andmebaas otsib sarnasuste leidmiseks struktureeritud andmeid.

Järjestuskaevandamise võib jagada kahte kategooriasse. Itemset kaevandamist kasutatakse turunduses ja äritegevuses konkreetsete trendide leidmiseks müüginumbrites, tootetüüpides, toote paigutuses kaupluses ja toote kasutamises. Need arvud võetakse ja rakendatakse turundusalgoritmidele, et aidata turundusprojekti strateegiat koostada ja müüki suurendada. Teave toote ja selle kohta, kuidas see tavaliselt toimib, võetakse andmebaasist, kuid üksuste komplekti jadade kaevandamise määrav aspekt on see, et jada võetakse mitme sümboliga andmebaasi rakkudest.

Stringide kaevandamine on üksuste kaevandamise vastand, kuna see vaatleb iga sümbolit eraldi, mitte klastrina. Stringide kaevandamisel võib andmebaas olla seadistatud leidma järjestust valguallikast või geeniproovidest. See aitab võrrelda paljusid geeniproove, et näha, kas need on samad, või jagada suuri järjestusi ja leida, milliseid järjestusi need sisaldavad. Enamasti kasutavad seda bioloogilised ja meditsiinilised uurimisrühmad.

Andmebaasi loomine jadade kaevandamiseks võib olla keeruline, kuna erinevalt trendikaevandamisest ja muust struktureeritud andmete kaevandamisest peavad jadad üksteisega konkreetselt sobima. See toob kaasa ka jadade kaevandamise probleemi. Kui järjestus on erinev, siis seda ei tuvastata, mis võib üksuste komplekti kaevandamise keerulisemaks muuta. Stringide kaevandamine saab sellest tavaliselt kasu, sest vähimgi erinevus koeproovis võib muuta organismi – või mida iganes uurimisrühm uurib – teistest proovidest täiesti erinevaks.