Mis on teadmiste ammutamine?

Teadmiste ammutamine on erinevate teabeallikate kasutamine ühtse teadmistepanga loomiseks. Selle lähenemisviisi osana tugineb kaevandamine sageli nii struktureeritud kui ka struktureerimata allikatele. Kui teadmiste ammutamine õnnestub, saadakse kindlad andmed, mida antud programm saab hõlpsasti lugeda ja tõlgendada, võimaldades lõppkasutajal neid formaalseid teadmisi kasutada mis tahes eesmärgil, mida ta soovib.

Teadmiste ammutamise protsessis võib kasutada mitmeid erinevaid allikaid. Struktureeritud allikate raames võib andmeid eraldada erinevat tüüpi relatsiooniandmebaasidest või teatud tüüpi laiendatavast märgistuskeelest või XML-allikast. Ekstraheerimisprotsessi osana võib kasutada struktureerimata allikaid, nagu pilte, tekstitöötlusdokumentide erinevaid vorme, arvutustabeleid ja isegi märkmiku stiilis programmidega jäädvustatud teksti. Kuni allikad on teadmiste hankimise protsessi haldamiseks kasutatavale programmile loetavad, saab neid kasutada allikatena, mis laiendavad kaevandamise abil arendatava projekti potentsiaali ja võimaldavad toodetud lõplikke teadmisi kasutada. .

Teadmiste ammutamisel on mitu levinumat rakendust. Üks sagedane näide on võime koguda andmeid struktureerimata allikast ja lisada need teatud tüüpi struktureeritud teadmiste allikatesse. Relatsiooniandmebaasides leiduvate andmete eraldamine ja nende kasutamine uute dokumentide loomiseks või elektrooniliste dokumentide kasutamine andmete importimiseks relatsiooniandmebaasidesse on veel üks näide sellest, kuidas seda tüüpi ekstraktimine võib kiirendada formaalsete teadmiste jagamist, ilma et oleks vaja andmeid käsitsi sisestada. mis on juba mõnest muust allikast saadaval. Selline olemasolevate teadmiste taaskasutamine mõnes uues vormingus on sageli paljude stsenaariumide puhul väga kasulik, võimaldades neid teadmisi kasutada viisil, mis ei pruugi olla võimalik olemasoleva allikaga. Sel viisil saab kasutaja luua allikaid, mis sobivad ideaalselt paljude erinevate rakenduste jaoks, mitte ainult ametlike teadmiste algse kodu jaoks.

Andmete ekstraheerimise abil on võimalik kasutada tohutut andmeladu, mis võimaldab hõlpsasti andmeid importida ja eksportida, et luua uusi allikaid, mis on konkreetsel eesmärgil kasutatavad. Need vastloodud allikad leiavad omakorda koha ka andmelaos ning neid saab lõpuks kasutada uute väljavõtete loomisel, mida kasutatakse uuemate kasutusvajaduste rahuldamiseks. Seda silmas pidades võib teadmiste ammutamist pidada väga kasulikuks vahendiks, mis aitab kõiki praegu olemasolevaid ressursse maksimaalselt ära kasutada, lihtsustades paljusid ametlike teadmiste jagamisega seotud ülesandeid.