Možno ste sa dočítali, že opatrenia použité na tabuli Excelu by absolútne mali podporovať pôvodný účel tejto tabule. Rovnaký koncept platí pre back-end dátový model. Mali by ste importovať iba údaje, ktoré sú potrebné na splnenie účelu vášho informačného panela alebo zostavy.
V snahe mať čo najviac údajov na dosah ruky mnohí používatelia Excelu vkladajú do svojich tabuliek všetky údaje, ktoré sa im dostanú pod ruku. Týchto ľudí spoznáte podľa 40-megabajtových súborov, ktoré posielajú e-mailom. Už ste videli tieto tabuľky – dve karty, ktoré obsahujú nejaké rozhranie na vytváranie prehľadov alebo dashboardu, a potom šesť skrytých kariet, ktoré obsahujú tisíce riadkov údajov (väčšina z nich sa nepoužíva). V podstate vytvárajú databázu vo svojej tabuľke.
Čo je zlé na využití čo najväčšieho množstva údajov? No, tu je niekoľko problémov:
-
Agregovaním údajov v programe Excel sa zvyšuje počet vzorcov. Ak prinášate všetky nespracované údaje, musíte tieto údaje agregovať v Exceli. To nevyhnutne spôsobí, že budete exponenciálne zvyšovať počet vzorcov, ktoré musíte používať a udržiavať.
Pamätajte, že váš dátový model je prostriedkom na prezentáciu analýz, nie na spracovanie nespracovaných údajov. Údaje, ktoré najlepšie fungujú v mechanizmoch vytvárania prehľadov, sú tie, ktoré už boli agregované a zhrnuté do užitočných zobrazení, ktoré možno navigovať a pridávať do komponentov dashboardu. Oveľa lepšie je importovanie údajov, ktoré už boli agregované, čo najviac.
Ak napríklad potrebujete vytvoriť prehľad o výnosoch podľa regiónu a mesiaca, nie je potrebné importovať predajné transakcie do vášho dátového modelu. Namiesto toho použite agregovanú tabuľku pozostávajúcu z Región, Mesiac a Suma výnosov.
-
Váš dátový model bude distribuovaný s vaším informačným panelom. Inými slovami, pretože váš dashboard je napájaný vaším dátovým modelom, musíte pri distribúcii dashboardu udržiavať model v zákulisí (pravdepodobne na skrytých kartách). Okrem toho, že to spôsobuje, že veľkosť súboru je nepraktická, zahrnutie príliš veľkého množstva údajov do vášho dátového modelu môže skutočne znížiť výkon vášho dashboardu. prečo?
Keď otvoríte súbor Excel, celý súbor sa načíta do pamäte, aby sa zabezpečilo rýchle spracovanie údajov a prístup. Nevýhodou tohto správania je, že Excel vyžaduje veľké množstvo pamäte RAM na spracovanie aj najmenšej zmeny v tabuľke. Možno ste si všimli, že keď sa pokúsite vykonať akciu na veľkej množine údajov, ktorá je náročná na vzorce, Excel pomaly reaguje a na stavovom riadku sa zobrazí indikátor Výpočtov. Čím väčšia je vaša množina údajov, tým menej efektívne je drvenie údajov v Exceli.
-
Veľké množiny údajov môžu spôsobiť ťažkosti so škálovateľnosťou. Predstavte si, že pracujete v malej spoločnosti a vo svojom dátovom modeli používate mesačné transakcie. Každý mesiac obsahuje 80 000 riadkov údajov. Postupom času vytvárate robustný proces so všetkými vzorcami, kontingenčnými tabuľkami a makrami, ktoré potrebujete na analýzu údajov uložených na vašej prehľadne udržiavanej karte.
Čo sa stane po roku? Založíte novú kartu? Ako analyzujete dve množiny údajov na dvoch rôznych kartách ako jednu entitu? Sú vaše vzorce stále dobré? Musíte písať nové makrá?
To všetko sú problémy, ktorým sa možno vyhnúť importovaním iba súhrnných a súhrnných údajov, ktoré sú užitočné pre hlavný účel vašich potrieb vytvárania prehľadov.