Data Mining vs OLAP
Podatkovno rudarjenje in OLAP sta dve običajni tehnologiji poslovne inteligence (BI). Poslovna inteligenca se nanaša na računalniške metode za prepoznavanje in pridobivanje koristnih informacij iz poslovnih podatkov. Podatkovno rudarjenje je področje računalništva, ki se ukvarja z pridobivanjem zanimivih vzorcev iz velikih naborov podatkov. Združuje številne metode iz umetne inteligence, statistike in upravljanja baz podatkov. OLAP (spletna analitična obdelava), kot že ime pove, je skupek načinov za poizvedovanje po večdimenzionalnih zbirkah podatkov.
Podatkovno rudarjenje je znano tudi kot Odkrivanje znanja v podatkih (KDD). Kot smo že omenili, gre za področje računalništva, ki se ukvarja z pridobivanjem prej neznanih in zanimivih informacij iz surovih podatkov. Zaradi eksponentne rasti podatkov, zlasti na področjih, kot je poslovanje, je pridobivanje podatkov postalo zelo pomembno orodje za pretvorbo tega velikega števila podatkov v poslovno inteligenco, saj je ročno pridobivanje vzorcev v zadnjih nekaj desetletjih postalo na videz nemogoče. Na primer, trenutno se uporablja za različne aplikacije, kot so analiza socialnih omrežij, odkrivanje prevar in trženje. Podatkovno rudarjenje se običajno ukvarja z naslednjimi štirimi nalogami: združevanje v skupine, klasifikacija, regresija in povezovanje. Grozdenje je prepoznavanje podobnih skupin iz nestrukturiranih podatkov. Klasifikacija je učna pravila, ki se lahko uporabijo za nove podatke in običajno vključujejo naslednje korake: predobdelava podatkov, oblikovanje modeliranja, učenje / izbira lastnosti in vrednotenje / potrjevanje. Regresija je iskanje funkcij z minimalno napako pri modeliranju podatkov. In združenje išče razmerja med spremenljivkami. Podatkovno rudarjenje se običajno uporablja za odgovore na vprašanja, na primer, kateri so glavni proizvodi, ki bi lahko pripomogli k visokemu dobičku prihodnje leto v Wal-Martu. Podatkovno rudarjenje se običajno uporablja za odgovore na vprašanja, na primer, kateri so glavni proizvodi, ki bi lahko pripomogli k visokemu dobičku prihodnje leto v Wal-Martu. Podatkovno rudarjenje se običajno uporablja za odgovore na vprašanja, na primer, kateri so glavni proizvodi, ki bi lahko pripomogli k visokemu dobičku prihodnje leto v Wal-Martu.
OLAP je razred sistemov, ki nudijo odgovore na večdimenzionalne poizvedbe. OLAP se običajno uporablja za trženje, pripravo proračuna, napovedovanje in podobne aplikacije. Samoumevno je, da so baze podatkov, ki se uporabljajo za OLAP, konfigurirane za zapletene in priložnostne poizvedbe z namenom hitrega delovanja. Običajno se matrika uporablja za prikaz izhoda OLAP. Vrstice in stolpci so oblikovani z dimenzijami poizvedbe. Za pridobivanje povzetkov pogosto uporabljajo metode združevanja v več tabelah. Z njo lahko na primer izvedete prodajo tega leta v Wal-Martu v primerjavi z lanskim letom? Kakšna je napoved prodaje v naslednjem četrtletju? Kaj lahko rečemo o trendu, če pogledamo odstotno spremembo?
Čeprav je očitno, da sta Podatkovno rudarjenje in OLAP podobna, ker delujeta na podatkih, da pridobita inteligenco, glavna razlika izvira iz tega, kako delujejo s podatki. Orodja OLAP zagotavljajo večdimenzionalno analizo podatkov in povzetke podatkov, nasprotno pa se rudarjenje podatkov osredotoča na razmerja, vzorce in vplive v naboru podatkov. To je dogovor OLAP z združevanjem, ki se sklicuje na delovanje podatkov prek »dodajanja«, vendar podatkovno rudarjenje ustreza »delitvi«. Druga opazna razlika je v tem, da medtem ko orodja za podatkovno rudarjenje modelirajo podatke in vračajo pravila, ki jih je mogoče uporabiti, bo OLAP v realnem času izvajal tehnike primerjave in kontrasta po poslovni dimenziji.