Zbirka podatkov in skladišče podatkov
Osnova za razliko med bazo podatkov in podatkovnim skladiščem izhaja iz dejstva, da je podatkovno skladišče vrsta baze podatkov, ki se uporablja za analizo podatkov. Baza podatkov je organizirano zbiranje podatkov, shranjenih v računalniškem sistemu. Podatki o učencih, učiteljih in razredih v šoli, shranjeni na mizi, so primer zbirke podatkov. Ker baze podatkov podpirajo veliko količino podatkov, sočasno obdelavo in učinkovito delovanje, se pogosto uporabljajo. Ker pa je baza podatkov pogosto podvržena posodobitvam, ni mogoče imeti ustreznega pogleda za analizo. Zato je treba za dosego tega uporabiti tehniko podatkovnega skladišča. Podatkovno skladišče je posebna vrsta zbirke podatkov, ki pa je optimizirana za poizvedbe in analizo. Ker podatkovno skladišče pridobiva podatke iz različnih virov in poročil,naredi tako, da je mogoče odločitve sprejeti z analizo. Oglejmo si jih in razliko med njimi podrobneje tukaj.
Kaj je baza podatkov?
Baza podatkov je zbirka povezanih podatkov, shranjenih v računalniškem sistemu. Ponavadi je baza podatkov organizirana in njeni podatki so povezani. Na primer, šolska baza podatkov bi imela več tabel kot učitelji, učenci in razredi, kjer bi vsaka tabela imela zapise, ki določajo informacije o vsakem elementu. Tu lahko vidimo, da je struktura organizirana na podlagi določenih meril, med tabelami pa obstajajo razmerja, saj vse pripadajo isti šoli. Baza podatkov se v računalniškem svetu pogosto uporablja. Zato je tako znan, da ga najdemo zelo veliko v različnih aplikacijah. Osnovna prednost baze podatkov je, da lahko zbirka podatkov shrani ogromno podatkov v zelo manjši prostor, hkrati pa zagotavlja zelo hitro in enostavno upravljanje s podatki.
Baza podatkov pogosto vključuje programski sistem, imenovan Database Management System (DBMS), ki je odgovoren za shranjevanje in upravljanje podatkov v bazi. MySQL, Oracle in Microsoft SQL Server so nekateri znani sistemi za upravljanje baz podatkov. Ko ustvarjamo bazo podatkov v računalniku, je prvi korak ustvariti logično strukturo shranjevanja, organiziranja in manipulacije podatkov na podlagi opisa sistema. To se imenuje modeliranje baz podatkov. Obstajajo različne tehnike modeliranja, kot so relacijski model, mrežni model, objektno usmerjeni model in hierarhični model, najbolj znan pa je relacijski model. Tudi MySQL, ki je eden najpogosteje uporabljenih sistemov za upravljanje baz podatkov, uporablja relacijski model za shranjevanje svojih podatkovnih baz.
Modeli zbirke podatkov
Baza podatkov podpira štiri funkcije, ki jih daje kratica CRUD, ki se nanaša na ustvarjanje, branje, posodabljanje in brisanje. V SQL vam create omogoča vstavljanje podatkov v tabelo. Branje vam omogoča, da povprašate, kaj želite pridobiti in posodobiti, vam omogoča spreminjanje podatkov, kadar je to potrebno. Izbriši omogoča brisanje podatkov, kadar je to treba storiti.
Kaj je skladišče podatkov?
Podatkovno skladišče je posebna vrsta zbirke podatkov, ki se uporablja za analizo podatkov. Za obdelavo transakcij se običajno uporablja splošna baza podatkov, zato ni optimizirana za analizo in poročanje. A podatkovno skladišče je posebej zasnovano in optimizirano za naloge analize. Podatkovno skladišče običajno pridobi podatke iz zgodovine sistema za obdelavo transakcij, medtem ko lahko prispevajo tudi različni drugi viri. Po pridobivanju podatkov iz različnih virov se o njih poroča v splošnem pogledu. Sistem za obdelavo transakcij vključuje veliko operacij na sekundo, zato se podatki pogosto posodabljajo, zato si jih nekdo na določeni točki težko ogleda in analizira, da sprejme odločitev. Podatkovno skladišče to natančno omogoča tako, da informacije izvleče in sporoči na čeden način, da jih lahko analizira, da sprejme odločitev.
Kakšna je razlika med podatkovno bazo in podatkovnim skladiščem?
Baza podatkov je organizirano zbiranje podatkov. Podatkovno skladišče je posebna vrsta zbirke podatkov, ki je optimizirana za poizvedovanje in poročanje in ne za obdelavo transakcij. Sledi primerjava splošne baze podatkov in podatkovnega skladišča.
• Baza podatkov hrani trenutne podatke, medtem ko podatkovno skladišče hrani zgodovinske podatke.
• Zbirka podatkov se pogosto spreminja zaradi pogostih posodobitev, zato je ni mogoče uporabiti za analizo ali sprejemanje odločitev. Skladišče podatkov izvleče podatke in jih poroča za analizo in sprejemanje odločitev.
• Za spletno transakcijsko obdelavo se uporablja splošna baza podatkov, medtem ko se podatkovno skladišče uporablja za spletno analitično obdelavo.
• Tabele v bazi podatkov so normalizirane, da se doseže učinkovito shranjevanje, medtem ko je podatkovno skladišče običajno demoralizirano, da se doseže hitrejše poizvedovanje.
• Analitične poizvedbe so veliko hitrejše v podatkovnem skladišču kot v zbirki podatkov.
• Baza podatkov vsebuje zelo podrobne podatke, medtem ko podatkovno skladišče vsebuje povzete podatke.
• Baza podatkov ponuja podroben relacijski pogled, medtem ko podatkovno skladišče ponuja povzeti večdimenzionalni pogled.
• Baza podatkov lahko opravi veliko sočasnih transakcij, medtem ko podatkovno skladišče ni zasnovano za takšne naloge.
Povzetek:
Skladišče podatkov v primerjavi z bazo podatkov
Baza podatkov je organizirana zbirka podatkov, shranjenih v računalniškem sistemu. Shranjuje veliko količino podatkov in ti se pogosto spreminjajo zaradi različnih posodobitev. Zato ga ni mogoče uporabiti za analizo za sprejetje odločitve. Torej se uporablja podatkovno skladišče. Podatkovno skladišče izvleče podatke iz različnih virov, vključno s splošnimi bazami podatkov, in jih nato na primeren način poroča za enostavno analizo. Pomembna razlika je v tem, da baza podatkov vsebuje trenutne podatke, medtem ko podatkovno skladišče vsebuje pretekle podatke. Baza podatkov se uporablja za obdelavo transakcij, medtem ko se podatkovno skladišče uporablja za analitično obdelavo.
Vljudnost slik:
- Kolaž petih vrst modelov baz podatkov, avtor Marcel Douwe Dekker (CC BY-SA 3.0)
- Skladišče podatkov prek Wikicommons (javna domena)