Skalerbarhed er en applikations evne til at udvikle sig fleksibelt for at imødekomme vækst- og kompleksitetskrav. I forbindelse med Excel refererer skalerbarhed til Excels evne til at håndtere stadigt stigende mængder af data.
De fleste Excel-tilhængere er hurtige til at påpege, at fra og med Excel 2007 kan du placere 1.048.576 rækker af data i et enkelt Excel-regneark - en overvældende stigning fra begrænsningen på 65.536 rækker, som tidligere versioner af Excel har pålagt. Denne kapacitetsforøgelse løser dog ikke alle de skalerbarhedsproblemer, der oversvømmer Excel.
Forestil dig, at du arbejder i en lille virksomhed og bruger Excel til at analysere dens daglige transaktioner. Som tiden går, bygger du en robust proces komplet med alle de formler, pivottabeller og makroer, du har brug for for at analysere de data, der er gemt i dit pænt vedligeholdte regneark.
Efterhånden som mængden af data vokser, vil du først bemærke præstationsproblemer. Regnearket bliver langsomt til at indlæse og derefter langsomt til at beregne.
Hvorfor sker dette? Det har at gøre med den måde, Excel håndterer hukommelse på. Når en Excel-fil indlæses, indlæses hele filen i RAM. Excel gør dette for at give mulighed for hurtig databehandling og adgang. Ulempen ved denne adfærd er, at hver gang dataene i dit regneark ændres, skal Excel genindlæse hele dokumentet i RAM. Nettoresultatet i et stort regneark er, at det kræver meget RAM at behandle selv den mindste ændring. Til sidst bliver hver handling, du foretager dig i det gigantiske regneark, forudgået af en ulidelig ventetid.
Dine pivottabeller vil kræve større pivot-caches, hvilket næsten fordobler Excel-projektmappens filstørrelse. Til sidst vil projektmappen blive for stor til let at distribuere. Du kan endda overveje at opdele projektmappen i mindre projektmapper (eventuelt en for hver region). Dette får dig til at duplikere dit arbejde.
Med tiden kan du med tiden nå grænsen på 1.048.576 rækker i regnearket. Hvad sker der så? Starter du et nyt arbejdsark? Hvordan analyserer man to datasæt på to forskellige regneark som én enhed? Er dine formler stadig gode? Skal du skrive nye makroer?
Det er alle spørgsmål, der skal løses.
Du vil selvfølgelig også støde på Excel-power-kunderne, som vil finde forskellige smarte måder at omgå disse begrænsninger på. I sidste ende vil disse metoder dog altid være en simpel løsning. Til sidst vil selv disse strømkunder begynde at tænke mindre på den mest effektive måde at udføre og præsentere analyser af deres data på og mere på, hvordan man får data til at "passe" ind i Excel uden at bryde deres formler og funktioner.
Excel er fleksibelt nok til, at en dygtig kunde kan få det meste til at passe fint. Men når kunder kun tænker i Excel, begrænser de sig uden tvivl, om end på en utrolig funktionel måde.
Derudover tvinger disse kapacitetsbegrænsninger ofte Excel-kunder til at få forberedt dataene til dem. Det vil sige, at en anden udtrækker store bidder af data fra en stor database og derefter aggregerer og former dataene til brug i Excel.
Skal den seriøse analytiker altid være afhængig af en anden for sit databehov? Hvad hvis en analytiker kunne få værktøjerne til at få adgang til enorme mængder data uden at være afhængig af andre til at levere data? Kunne den analytiker være mere værdifuld for organisationen? Kunne den analytiker fokusere på nøjagtigheden af analysen og kvaliteten af præsentationen i stedet for at dirigere Excel-datavedligeholdelse?
Et relationelt databasesystem (såsom Access eller SQL Server) er et logisk næste skridt for analytikeren, der står over for en stadigt større datapulje. Databasesystemer har normalt ikke præstationsimplikationer med store mængder lagrede data og er bygget til at adressere store mængder data. En analytiker kan derefter håndtere større datasæt uden at kræve, at dataene skal opsummeres eller forberedes til at passe ind i Excel.
Desuden, hvis en proces nogensinde bliver mere afgørende for organisationen og skal spores i et mere virksomhedsacceptabelt miljø, vil det være lettere at opgradere og skalere op, hvis denne proces allerede er i et relationelt databasesystem.