Може би сте прочели, че мерките, използвани в таблото за управление на Excel, абсолютно трябва да поддържат първоначалната цел на това табло. Същата концепция важи и за задния модел на данни. Трябва да импортирате само данни, които са необходими за изпълнение на целта на вашето табло или отчет.
В стремежа си да имат възможно най-много данни на една ръка разстояние, много потребители на Excel въвеждат в своите електронни таблици всяка част от данни, която могат да получат. Можете да забележите тези хора по 40-мегабайтните файлове, които изпращат по имейл. Виждали сте тези електронни таблици — два раздела, които съдържат някакъв интерфейс за отчети или табло за управление и след това шест скрити раздела, които съдържат хиляди редове данни (повечето от които не се използват). Те по същество изграждат база данни в електронната си таблица.
Какво лошо има в използването на възможно най-много данни? Е, ето няколко проблема:
-
Агрегирането на данни в Excel увеличава броя на формулите. Ако въвеждате всички необработени данни, трябва да обобщите тези данни в Excel. Това неизбежно ви кара да увеличавате експоненциално броя на формулите, които трябва да използвате и поддържате.
Не забравяйте, че вашият модел на данни е средство за представяне на анализи, а не за обработка на необработени данни. Данните, които работят най-добре в механизмите за отчитане, са това, което вече е обобщено и обобщено в полезни изгледи, които могат да бъдат навигирани и подавани към компонентите на таблото за управление. Импортирането на данни, които вече са агрегирани колкото е възможно повече, е много по-добре.
Например, ако трябва да отчитате приходи по регион и месец, няма нужда да импортирате транзакции за продажби във вашия модел на данни. Вместо това използвайте обобщена таблица, състояща се от регион, месец и сума на приходите.
-
Вашият модел на данни ще бъде разпространен с вашето табло. С други думи, тъй като вашето табло се захранва от вашия модел на данни, трябва да поддържате модела зад кулисите (вероятно в скрити раздели), когато разпространявате таблото. Освен факта, че размерът на файла е тромав, включването на твърде много данни във вашия модел на данни може действително да влоши производителността на вашето табло. Защо?
Когато отворите файл на Excel, целият файл се зарежда в паметта, за да се осигури бърза обработка на данни и достъп. Недостатъкът на това поведение е, че Excel изисква много RAM, за да обработи дори най-малката промяна във вашата електронна таблица. Може да сте забелязали, че когато се опитате да извършите действие върху голям набор от данни с интензивна формула, Excel реагира бавно, като ви дава индикатор за изчисляване в лентата на състоянието. Колкото по-голям е вашият набор от данни, толкова по-малко ефикасно хрускането на данни в Excel.
-
Големите набори от данни могат да причинят трудности при мащабируемостта. Представете си, че работите в малка компания и използвате месечни транзакции във вашия модел на данни. Всеки месец съдържа 80 000 реда данни. С течение на времето вие изграждате стабилен процес, пълен с всички формули, обобщени таблици и макроси, от които се нуждаете, за да анализирате данните, които се съхраняват във вашия добре поддържан раздел.
Сега какво се случва след една година? Започвате ли нов раздел? Как анализирате два набора от данни в два различни раздела като едно цяло? Все още ли са добри формулите ви? Трябва ли да пишете нови макроси?
Това са всички проблеми, които могат да бъдат избегнати чрез импортиране само на обобщени и обобщени данни, които са полезни за основната цел на вашите нужди от отчитане.