Možná jste se dočetli, že opatření použitá na řídicím panelu aplikace Excel by absolutně měla podporovat původní účel tohoto řídicího panelu. Stejný koncept platí pro datový model typu back-end. Měli byste importovat pouze data, která jsou nezbytná ke splnění účelu vašeho řídicího panelu nebo sestavy.
Ve snaze mít co nejvíce dat na dosah ruky mnoho uživatelů Excelu vnáší do svých tabulek všechna data, která se jim dostane pod ruku. Tyto lidi poznáte podle 40megabajtových souborů, které posílají e-mailem. Už jste viděli tyto tabulky – dvě karty, které obsahují nějaké rozhraní pro vytváření přehledů nebo řídicího panelu, a potom šest skrytých karet, které obsahují tisíce řádků dat (z nichž většina se nepoužívá). V podstatě vytvářejí databázi ve své tabulce.
Co je špatného na využití co největšího množství dat? No, tady je několik problémů:
-
Agregace dat v Excelu zvyšuje počet vzorců. Pokud přinášíte všechna nezpracovaná data, musíte tato data agregovat v Excelu. To nevyhnutelně způsobuje, že exponenciálně zvyšujete počet vzorců, které musíte používat a udržovat.
Pamatujte, že váš datový model je prostředkem pro prezentaci analýz, nikoli pro zpracování nezpracovaných dat. Data, která nejlépe fungují v mechanismech hlášení, jsou ta, která již byla agregována a shrnuta do užitečných zobrazení, která lze procházet a předávat do komponent řídicího panelu. Import dat, která již byla agregována, je mnohem lepší.
Pokud například potřebujete vytvářet přehledy o tržbách podle regionu a měsíce, není třeba importovat prodejní transakce do vašeho datového modelu. Místo toho použijte agregovanou tabulku skládající se z Region, Měsíc a Součet tržeb.
-
Váš datový model bude distribuován s vaším řídicím panelem. Jinými slovy, protože váš řídicí panel je napájen vaším datovým modelem, musíte při distribuci řídicího panelu udržovat model v zákulisí (pravděpodobně na skrytých kartách). Kromě skutečnosti, že velikost souboru je nepraktická, může zahrnutí příliš velkého množství dat do vašeho datového modelu ve skutečnosti snížit výkon vašeho řídicího panelu. Proč?
Když otevřete soubor Excel, celý soubor se načte do paměti, aby bylo zajištěno rychlé zpracování dat a přístup. Nevýhodou tohoto chování je, že Excel vyžaduje velké množství paměti RAM ke zpracování i té nejmenší změny v tabulce. Možná jste si všimli, že když se pokusíte provést akci na velké datové sadě náročné na vzorce, Excel pomalu reaguje a na stavovém řádku se zobrazí indikátor výpočtu. Čím větší je vaše datová sada, tím méně efektivní je drcení dat v Excelu.
-
Velké datové sady mohou způsobit potíže se škálovatelností. Představte si, že pracujete v malé firmě a ve svém datovém modelu používáte měsíční transakce. Každý měsíc obsahuje 80 000 řádků dat. Postupem času vytváříte robustní proces se všemi vzorci, kontingenčními tabulkami a makry, které potřebujete k analýze dat uložených na vaší úhledně udržované kartě.
Co se stane po roce? Spouštíte novou kartu? Jak analyzujete dvě datové sady na dvou různých kartách jako jednu entitu? Jsou vaše vzorce stále dobré? Musíte psát nová makra?
To vše jsou problémy, kterým se lze vyhnout importováním pouze agregovaných a souhrnných dat, která jsou užitečná pro hlavní účel vašich potřeb vytváření přehledů.