Du har måske læst, at foranstaltninger, der bruges på et Excel-dashboard, absolut burde understøtte det oprindelige formål med dette dashboard. Det samme koncept gælder for back-end-datamodellen. Du bør kun importere data, der er nødvendige for at opfylde formålet med dit dashboard eller din rapport.
I et forsøg på at have så mange data som muligt lige ved hånden, bringer mange Excel-brugere hvert stykke data ind i deres regneark, de kan få fingrene i. Du kan se disse mennesker på de 40 megabyte filer, de sender via e-mail. Du har set disse regneark — to faner, der indeholder en eller anden rapport- eller dashboard-grænseflade og derefter seks skjulte faner, der indeholder tusindvis af linjer med data (hvoraf de fleste ikke bruges). De bygger i det væsentlige en database i deres regneark.
Hvad er der galt med at bruge så meget data som muligt? Nå, her er et par problemer:
-
Aggregering af data i Excel øger antallet af formler. Hvis du henter alle rådata, skal du samle disse data i Excel. Dette får dig uundgåeligt til eksponentielt at øge antallet af formler, du skal bruge og vedligeholde.
Husk, at din datamodel er et redskab til at præsentere analyser, ikke at behandle rådata. De data, der fungerer bedst i rapporteringsmekanismer, er det, der allerede er blevet aggregeret og opsummeret i nyttige visninger, der kan navigeres og føres til dashboard-komponenter. Det er langt bedre at importere data, der allerede er blevet samlet så meget som muligt.
Hvis du f.eks. skal rapportere om omsætning efter region og måned, er der ingen grund til at importere salgstransaktioner til din datamodel. Brug i stedet en aggregeret tabel bestående af region, måned og sum af omsætning.
-
Din datamodel vil blive distribueret med dit dashboard. Med andre ord, fordi dit dashboard er fodret af din datamodel, skal du vedligeholde modellen bag kulisserne (sandsynligvis i skjulte faner), når du distribuerer dashboardet. Udover det faktum, at det får filstørrelsen til at være uhåndterlig, kan inklusiv for mange data i din datamodel faktisk forringe ydeevnen af dit dashboard. Hvorfor?
Når du åbner en Excel-fil, indlæses hele filen i hukommelsen for at sikre hurtig databehandling og adgang. Ulempen ved denne adfærd er, at Excel kræver meget RAM for at behandle selv den mindste ændring i dit regneark. Du har måske bemærket, at når du forsøger at udføre en handling på et stort, formel-intensivt datasæt, er Excel langsom til at reagere, hvilket giver dig en beregnende indikator på statuslinjen. Jo større dit datasæt er, jo mindre effektiv er dataknusningen i Excel.
-
Store datasæt kan forårsage vanskeligheder med skalerbarhed. Forestil dig, at du arbejder i en lille virksomhed, og du bruger månedlige transaktioner i din datamodel. Hver måned rummer 80.000 linjer med data. Som tiden går, bygger du en robust proces komplet med alle de formler, pivottabeller og makroer, du har brug for til at analysere de data, der er gemt på din pænt vedligeholdte fane.
Hvad sker der nu efter et år? Starter du en ny fane? Hvordan analyserer man to datasæt på to forskellige faner som én enhed? Er dine formler stadig gode? Skal du skrive nye makroer?
Disse er alle problemer, der kan undgås ved kun at importere aggregerede og opsummerede data, der er nyttige i forhold til kerneformålet med dine rapporteringsbehov.