Škálovatelnost je schopnost aplikace vyvíjet se flexibilně, aby splňovala požadavky na růst a složitost. V kontextu Excelu se škálovatelnost týká schopnosti Excelu zpracovávat stále rostoucí objemy dat.
Většina nadšenců Excelu rychle poukazuje na to, že od Excelu 2007 můžete do jednoho excelového listu umístit 1 048 576 řádků dat – což je ohromný nárůst oproti omezení 65 536 řádků, které zavedly předchozí verze Excelu. Toto zvýšení kapacity však neřeší všechny problémy se škálovatelností, které zaplavují Excel.
Představte si, že pracujete v malé společnosti a používáte Excel k analýze jejích každodenních transakcí. Postupem času vytváříte robustní proces se všemi vzorci, kontingenčními tabulkami a makry, které potřebujete k analýze dat uložených ve vašem přehledně udržovaném listu.
S rostoucím množstvím dat si nejprve všimnete problémů s výkonem. Načítání tabulky se zpomalí a poté se zpomalí i výpočet.
proč se to děje? Souvisí to se způsobem, jakým Excel zachází s pamětí. Po načtení souboru aplikace Excel se celý soubor načte do paměti RAM. Excel to dělá, aby umožnil rychlé zpracování dat a přístup. Nevýhodou tohoto chování je, že pokaždé, když se data v tabulce změní, musí Excel znovu načíst celý dokument do paměti RAM. Čistým výsledkem velké tabulky je to, že ke zpracování i té nejmenší změny je potřeba velké množství paměti RAM. Nakonec každé akci, kterou v obrovském pracovním listu provedete, předchází mučivé čekání.
Vaše kontingenční tabulky budou vyžadovat větší kontingenční mezipaměti, což téměř zdvojnásobí velikost souboru excelového sešitu. Nakonec se sešit stane příliš velkým, aby jej bylo možné snadno distribuovat. Můžete dokonce zvážit rozdělení sešitu na menší sešity (možná jeden pro každou oblast). To způsobí, že budete duplikovat svou práci.
Časem můžete nakonec dosáhnout limitu 1 048 576 řádků listu. co se stane potom? Začínáte s novým pracovním listem? Jak analyzujete dvě datové sady na dvou různých listech jako jednu entitu? Jsou vaše vzorce stále dobré? Budete muset psát nová makra?
To všechno jsou problémy, které je třeba řešit.
Samozřejmě se setkáte i s výkonnými zákazníky Excelu, kteří najdou různé chytré způsoby, jak tato omezení obejít. Nakonec však tyto metody budou vždy pouze řešením. Nakonec i tito velcí zákazníci začnou méně přemýšlet o nejúčinnějším způsobu, jak provádět a prezentovat analýzu svých dat, a více přemýšlet o tom, jak data „zapadnout“ do Excelu, aniž by narušili jejich vzorce a funkce.
Excel je dostatečně flexibilní, takže zdatný zákazník dokáže většinu věcí přizpůsobit. Když však zákazníci myslí pouze na Excel, nepochybně se omezují, i když neuvěřitelně funkčním způsobem.
Tato kapacitní omezení navíc často nutí zákazníky Excelu nechat si data připravit. To znamená, že někdo jiný extrahuje velké kusy dat z velké databáze a poté je agreguje a tvaruje pro použití v Excelu.
Měla by seriózní analytička vždy záviset na někom jiném, pokud jde o její datové potřeby? Co kdyby analytik mohl získat nástroje pro přístup k obrovskému množství dat, aniž by se spoléhal na to, že data poskytují ostatní? Mohl by být tento analytik pro organizaci cennější? Mohl by se tento analytik zaměřit na přesnost analýzy a kvalitu prezentace místo toho, aby směroval údržbu dat v Excelu?
Relační databázový systém (jako je Access nebo SQL Server) je dalším logickým krokem pro analytika, který čelí stále rostoucímu objemu dat. Databázové systémy obvykle nemají dopad na výkon s velkým množstvím uložených dat a jsou navrženy tak, aby řešily velké objemy dat. Analytik pak může zpracovávat větší datové sady, aniž by musel data shrnout nebo připravit tak, aby se vešla do Excelu.
Pokud se proces někdy stane pro organizaci důležitější a bude třeba jej sledovat v prostředí přijatelnějším pro podniky, bude snazší upgradovat a škálovat, pokud je tento proces již v relačním databázovém systému.