Hvordan ved du, om en prognosetrend er reel? Hvis du ser en basislinje, der ser ud til at glide op eller ned, repræsenterer det en reel tendens, eller er det bare tilfældig variation? For at besvare disse spørgsmål skal du komme ind på sandsynlighed og statistik. Heldigvis behøver du ikke komme for langt ind i dem - måske håndledsdybt.
Den grundlæggende tankegang lyder således:
Brug Excel til at fortælle dig, hvad sammenhængen er mellem salgsindtægter og deres tilknyttede tidsperioder.
Det er lige meget, om jeg repræsenterer den periode som januar 2011, februar 2011, marts 2011. . . december 2016, eller som 1, 2, 3. . . 72.
Hvis der ikke er nogen sammenhæng, målt ved korrelationen, mellem omsætning og tidsperiode, er der ingen tendens, og du behøver ikke bekymre dig om det.
Hvis der er en sammenhæng mellem omsætning og tidsperioder, skal du vælge den bedste måde at håndtere tendensen på.
Efter at Excel har beregnet korrelationen, skal du beslutte, om det repræsenterer et reelt forhold mellem tidsperiode og indtægtsbeløb, eller om det blot er et lykkeskud.
Hvis sandsynligheden for, at det bare er held, er mindre end 5 procent, er det en reel tendens. (Der er heller ikke noget magisk omkring 5 procent – det er konventionelt. Nogle mennesker foretrækker at bruge 1 procent som deres kriterium – det er mere konservativt end 5 procent, og de føler sig lidt sikrere.) Dette rejser spørgsmålet om statistisk signifikans: Hvilket sandsynlighedsniveau kræver du, før du beslutter dig for, at noget (her, en sammenhæng) er den rigtige McCoy?
Der findes forskellige metoder til at teste den statistiske signifikans af en korrelationskoefficient. Her er tre populære metoder:
- Test korrelationen direkte og sammenlign resultatet med normalfordelingen.
- Test korrelationen direkte og sammenlign resultatet med t-fordelingen (t-fordelingen, selvom den ligner normalkurven, antager, at du bruger en lille stikprøve i stedet for en uendelig stor population).
- Konverter korrelationen med Fisher-transformationen (som konverterer en korrelationskoefficient til en værdi, der passer ind i normalkurven) og sammenlign resultatet med normalfordelingen.
Der findes andre populære metoder til at teste den statistiske signifikans af en korrelationskoefficient. Hver returnerer et lidt anderledes resultat. I praksis vil du næsten altid træffe den samme beslutning (korrelationen er eller er ikke væsentlig forskellig fra nul), uanset hvilken metode du vælger.
Hvis du konkluderer, at tendensen, som korrelationen måler, er reel (og når sandsynligheden er mindre end 1 procent for, at korrelationen er et spøgelse, bør du sandsynligvis acceptere den konklusion), har du yderligere to spørgsmål at stille dig selv:
- Skal du bruge en prognosetilgang, der håndterer trends godt? Du skulle tro, at hvis du opdagede en tendens, bør du bruge en prognosetilgang, der håndterer tendenser godt. Det er ofte rigtigt, men ikke nødvendigvis. Antag, at du i stedet for at bruge tidsperiode som en af variablerne i din korrelationsanalyse, brugte noget såsom salgsindtægter fra konkurrenterne.
Hvis konkurrencens indtægter falder som din (eller hvis begge sæt indtægter vokser), vil du sandsynligvis finde en signifikant sammenhæng mellem dine indtægter og konkurrenternes. Men det er meget muligt - endda sandsynligt - at der ikke er nogen reel årsagssammenhæng mellem deres indtægter og dine. Det kan være, at både dit og deres er korreleret med den reelle årsagsfaktor: Størrelsen af det samlede marked er under forandring. I så fald ville du sandsynligvis være meget bedre stillet ved at bruge et mål for den samlede markedsstørrelse som din forudsigelsesvariabel. I dette scenarie har markedsstørrelse et direkte årsagsforhold til din omsætning, hvorimod dine konkurrenters omsætning kun har et indirekte forhold til din omsætning.
- Skal du afskrække dataene? En skjult variabel, såsom en konsekvent ændring i den overordnede størrelse af et marked, kan få dig til at tro, at en forudsigelsesvariabel og den variabel, du ønsker at forudsige, er direkte relateret, mens de faktisk ikke er det. Eller forudsigeren og prognosen kan ændre sig på lignende måder, fordi de begge er relateret til tid.
Måden at håndtere denne form for situation på er at afskrække begge variabler først ved hjælp af en transformation.
Eller du foretrækker måske at lave din prognose ved hjælp af en tilgang, der ikke nødvendigvis håndterer tendenser godt, såsom glidende gennemsnit eller simpel eksponentiel udjævning. En grund til at gøre dette er, at du måske finder ud af, at regressionstilgangen med dit datasæt ikke er en så nøjagtig prognoser som glidende gennemsnit eller udjævning. Se igen, om du kan transformere dataene for at fjerne tendensen.