Kao temeljni blok za vaša Excel izvješća, podaci u vašim modelima podataka moraju biti prikladno strukturirani. Nisu svi skupovi podataka stvoreni jednaki. Iako neki skupovi podataka rade u standardnom Excel okruženju, možda neće raditi u svrhe modeliranja podataka. Prije izgradnje modela podataka, provjerite jesu li izvorni podaci prikladno strukturirani za potrebe nadzorne ploče.
Uz rizik od prevelikog pojednostavljivanja, skupovi podataka koji se obično koriste u Excelu dolaze u tri osnovna oblika:
Glavna stvar je da samo ravne podatkovne datoteke i tablični skupovi podataka čine učinkovite modele podataka.
Izvješća proračunskih tablica čine neučinkovite modele podataka
Izvješća proračunskih tablica prikazuju visoko formatirane, sažete podatke i često su dizajnirana kao alati za prezentaciju za rukovodstvo ili izvršne korisnike. Tipično izvješće proračunske tablice razumno koristi prazan prostor za formatiranje, ponavlja podatke u estetske svrhe i predstavlja samo analizu visoke razine. Sljedeća slika ilustrira izvješće proračunske tablice.
Izvješće proračunske tablice.
Iako izvješće proračunske tablice može izgledati lijepo, ono ne predstavlja učinkovit model podataka. Zašto? Primarni razlog je taj što vam ova izvješća ne nude odvajanje podataka, analize i prezentacije. U biti ste zaključani u jednoj analizi.
Iako možete napraviti grafikone iz prikazanog izvješća, bilo bi nepraktično primijeniti bilo kakvu analizu izvan onoga što je već tamo. Na primjer, kako biste izračunali i predstavili prosjek svih prodaja bicikala pomoću ovog izvješća? Kako biste izračunali popis deset najučinkovitijih tržišta?
S ovim postavljanjem prisiljeni ste na vrlo ručne procese koje je teško održavati iz mjeseca u mjesec. Svaka analiza izvan onih na visokoj razini koja se već nalazi u izvješću je u najboljem slučaju osnovna — čak i s otmjenim formulama. Nadalje, što se događa kada se od vas traži da prikažete prodaju bicikala po mjesecima? Kada vaš podatkovni model zahtijeva analizu s podacima koji se ne nalaze u izvješću proračunske tablice, prisiljeni ste tražiti drugi skup podataka.
Ravne podatkovne datoteke dobro su prikladne za modele podataka
Druga vrsta formata datoteke je ravna datoteka. Ravne datoteke su spremišta podataka organizirana po retku i stupcu. Svaki redak odgovara skupu elemenata podataka ili zapisu. Svaki stupac je polje. Polje odgovara jedinstvenom elementu podataka u zapisu. Sljedeća slika sadrži iste podatke kao i prethodno izvješće, ali izražene u formatu datoteke s ravnim podacima.
Ravna datoteka s podacima.
Primijetite da svako podatkovno polje ima stupac, a svaki stupac odgovara jednom elementu podataka. Nadalje, nema dodatnog razmaka, a svaki redak (ili zapis) odgovara jedinstvenom skupu informacija. Ali ključni atribut koji ovu datoteku čini ravnom je da niti jedno polje ne identificira zapis na jedinstven način. Zapravo, morali biste navesti četiri zasebna polja (Regija, Tržište, Poslovni segment i mjesečni iznos prodaje) da biste mogli jedinstveno identificirati zapis.
Ravne datoteke izvrsno su prikladne za modeliranje podataka u Excelu jer mogu biti dovoljno detaljne da sadrže podatke koje su vam potrebne, a i dalje pogodne za široku lepezu analiza s jednostavnim formulama - ZBIR, PROSJEČNIK, VLOOKUP i SUMIF, da spomenemo samo neke .
Tablični skupovi podataka savršeni su za modele podataka vođene zaokretnom tablicom
Mnogi učinkoviti modeli podataka prvenstveno su vođeni zaokretnim tablicama. Zaokretne tablice su glavni Excel alati za analizu. Za one od vas koji su koristili zaokretne tablice, znate da one nude izvrstan način za sažimanje i oblikovanje podataka za korištenje komponentama izvješćivanja, kao što su grafikoni i tablice.
Tablični skupovi podataka idealni su za modele podataka vođene zaokretnom tablicom. Sljedeća slika ilustrira tabelarni skup podataka. Imajte na umu da je primarna razlika između tabličnog skupa podataka i ravne podatkovne datoteke ta što se u tabličnim skupovima podataka oznake stupaca ne udvostručuju kao stvarni podaci. Na primjer, stupac Razdoblje prodaje sadrži identifikator mjeseca. Ova suptilna razlika u strukturi je ono što tablične skupove podataka čini optimalnim izvorima podataka za zaokretne tablice. Ova struktura osigurava da ključne funkcije zaokretne tablice, kao što su sortiranje i grupiranje, rade kako bi trebale.
Tablični skup podataka.
Atributi tabelarnog skupa podataka su sljedeći:
-
Prvi red skupa podataka sadrži oznake polja koje opisuju informacije u svakom stupcu.
-
Oznake stupaca ne povlače dvostruku dužnost kao stavke podataka koje se mogu koristiti kao filtri ili kriteriji upita (kao što su mjeseci, datumi, godine, regije ili tržišta).
-
Nema praznih redaka ili stupaca — svaki stupac ima naslov, a vrijednost je u svakom retku.
-
Svaki stupac predstavlja jedinstvenu kategoriju podataka.
-
Svaki redak predstavlja pojedinačne stavke u svakom stupcu.