Kot gradnik za vaša poročila Excel morajo biti podatki v vaših podatkovnih modelih ustrezno strukturirani. Vsi nabori podatkov niso ustvarjeni enaki. Čeprav nekateri nabori podatkov delujejo v standardnem Excelovem okolju, morda ne bodo delovali za namene modeliranja podatkov. Preden zgradite svoj podatkovni model, se prepričajte, da so izvorni podatki ustrezno strukturirani za namene nadzorne plošče.
Zaradi nevarnosti prevelike poenostavitve so nabori podatkov, ki se običajno uporabljajo v Excelu, v treh osnovnih oblikah:
Bistvo je, da samo ploske podatkovne datoteke in tabelarni nabori podatkov omogočajo učinkovite podatkovne modele.
Poročila preglednic so neučinkoviti podatkovni modeli
Poročila v preglednicah prikazujejo zelo oblikovane, povzete podatke in so pogosto zasnovana kot predstavitvena orodja za vodstvene ali izvršne uporabnike. Tipično poročilo s preglednico smiselno uporablja prazen prostor za oblikovanje, ponavlja podatke za estetske namene in predstavlja samo analizo na visoki ravni. Naslednja slika prikazuje poročilo s preglednico.
Poročilo s preglednico.
Čeprav je poročilo v preglednici morda videti lepo, ne pomeni učinkovitega podatkovnega modela. zakaj? Glavni razlog je, da vam ta poročila ne ponujajo ločevanja podatkov, analize in predstavitve. V bistvu ste zaklenjeni v eno analizo.
Čeprav bi lahko naredili grafikone iz prikazanega poročila, bi bilo nepraktično uporabiti kakršno koli analizo zunaj tistega, kar je že tam. Kako bi na primer izračunali in predstavili povprečje vseh prodaj koles s tem posebnim poročilom? Kako bi izračunali seznam desetih najbolj uspešnih trgov?
S to nastavitvijo ste prisiljeni v zelo ročne postopke, ki jih je težko vzdrževati iz meseca v mesec. Vsaka analiza izven tistih na visoki ravni, ki so že v poročilu, je v najboljšem primeru osnovna – tudi z izmišljenimi formulami. Poleg tega, kaj se zgodi, ko morate prikazati prodajo koles po mesecih? Ko vaš podatkovni model zahteva analizo s podatki, ki niso v poročilu preglednice, boste morali poiskati drug nabor podatkov.
Ploščate podatkovne datoteke so primerne za podatkovne modele
Druga vrsta zapisa datoteke je ravna datoteka. Ploske datoteke so podatkovna skladišča, organizirana po vrsticah in stolpcih. Vsaka vrstica ustreza nizu podatkovnih elementov ali zapisu. Vsak stolpec je polje. Polje ustreza edinstvenemu podatkovnemu elementu v zapisu. Naslednja slika vsebuje enake podatke kot prejšnje poročilo, vendar izražene v ploščati obliki podatkovne datoteke.
Ploščata podatkovna datoteka.
Upoštevajte, da ima vsako podatkovno polje stolpec in vsak stolpec ustreza enemu podatkovnemu elementu. Poleg tega ni dodatnega razmika in vsaka vrstica (ali zapis) ustreza edinstvenemu naboru informacij. Toda ključni atribut, zaradi katerega je to ploščata datoteka, je, da nobeno polje ne identificira zapis. Pravzaprav bi morali določiti štiri ločena polja (regija, trg, poslovni segment in mesečni znesek prodaje), preden bi lahko enolično identificirali zapis.
Ploščate datoteke so primerne za modeliranje podatkov v Excelu, saj so lahko dovolj podrobne, da hranijo podatke, ki jih potrebujete, in so še vedno koristne za širok nabor analiz s preprostimi formulami – SUM, AVERAGE, VLOOKUP in SUMIF, če naštejemo le nekaj .
Tablični nabori podatkov so kot nalašč za podatkovne modele, ki jih poganja vrtilna tabela
Številne učinkovite podatkovne modele poganjajo predvsem vrtilne tabele. Vrtilne tabele so vrhunska Excelova orodja za analizo. Za tiste, ki ste uporabljali vrtilne tabele, veste, da ponujajo odličen način za povzemanje in oblikovanje podatkov za uporabo s komponentami poročanja, kot so grafikoni in tabele.
Tablični nabori podatkov so idealni za podatkovne modele, ki jih poganja vrtilna tabela. Naslednja slika prikazuje tabelarni nabor podatkov. Upoštevajte, da je glavna razlika med tabelarnim naborom podatkov in ploščato podatkovno datoteko ta, da v tabeličnih naborih podatkov oznake stolpcev ne delujejo kot dejanski podatki. Na primer, stolpec Obdobje prodaje vsebuje identifikator meseca. Ta subtilna razlika v strukturi je tisto, zaradi česar so tabelarni nabori podatkov optimalni viri podatkov za vrtilne tabele. Ta struktura zagotavlja, da ključne funkcije vrtilne tabele, kot sta razvrščanje in združevanje, delujejo tako, kot bi morale.
Tabelarni nabor podatkov.
Atributi tabelarnega nabora podatkov so naslednji:
-
Prva vrstica nabora podatkov vsebuje oznake polj, ki opisujejo informacije v vsakem stolpcu.
-
Oznake stolpcev nimajo dvojne dolžnosti kot podatkovne postavke, ki jih je mogoče uporabiti kot filtre ali merila poizvedbe (kot so meseci, datumi, leta, regije ali trgi).
-
Ni praznih vrstic ali stolpcev – vsak stolpec ima naslov in vrednost je v vsaki vrstici.
-
Vsak stolpec predstavlja edinstveno kategorijo podatkov.
-
Vsaka vrstica predstavlja posamezne postavke v vsakem stolpcu.