Hvordan vet du om en prognosetrend er reell? Hvis du ser en grunnlinje som ser ut som den driver opp eller ned, representerer det en reell trend eller er det bare tilfeldig variasjon? For å svare på disse spørsmålene, må du gå inn på sannsynlighet og statistikk. Heldigvis trenger du ikke gå for langt inn i dem - kanskje håndleddsdyp.
Den grunnleggende tankegangen går slik:
Bruk Excel til å fortelle deg hva korrelasjonen er mellom salgsinntekter og tilhørende tidsperioder.
Det spiller ingen rolle om jeg representerer den tidsperioden som januar 2011, februar 2011, mars 2011. . . desember 2016, eller som 1, 2, 3 . . . 72.
Hvis det ikke er noen sammenheng, målt ved korrelasjonen, mellom inntekter og tidsperiode, er det ingen trend, og du trenger ikke å bekymre deg for det.
Hvis det er en sammenheng mellom inntekter og tidsperioder, må du velge den beste måten å håndtere trenden på.
Etter at Excel har beregnet korrelasjonen, må du bestemme om den representerer et reelt forhold mellom tidsperiode og inntektsbeløp, eller om det bare er et lykkeskudd.
Hvis sannsynligheten for at det bare er flaks er mindre enn 5 prosent, er det en reell trend. (Ingenting magisk om 5 prosent heller – det er konvensjonelt. Noen mennesker foretrekker å bruke 1 prosent som kriterium – det er mer konservativt enn 5 prosent, og de føler seg litt tryggere.) Dette reiser spørsmålet om statistisk signifikans: Hvilket sannsynlighetsnivå trenger du før du bestemmer deg for at noe (her, en korrelasjon) er den virkelige McCoy?
Det finnes ulike metoder for å teste den statistiske signifikansen til en korrelasjonskoeffisient. Her er tre populære metoder:
- Test korrelasjonen direkte og sammenlign resultatet med normalfordelingen.
- Test korrelasjonen direkte og sammenlign resultatet med t-fordelingen (t-fordelingen, selv om den ligner normalkurven, antar at du bruker et lite utvalg i stedet for en uendelig stor populasjon).
- Konverter korrelasjonen med Fisher-transformasjonen (som konverterer en korrelasjonskoeffisient til en verdi som passer i normalkurven) og sammenlign resultatet med normalfordelingen.
Det finnes andre populære metoder for å teste den statistiske signifikansen til en korrelasjonskoeffisient. Hver gir et litt forskjellig resultat. I praksis vil du nesten alltid ta den samme avgjørelsen (korrelasjonen er eller er ikke vesentlig forskjellig fra null), uavhengig av metoden du velger.
Hvis du konkluderer med at trenden korrelasjonen måler er reell (og når sannsynligheten er mindre enn 1 prosent for at korrelasjonen er et spøkelse, bør du sannsynligvis akseptere den konklusjonen), har du to spørsmål til å stille deg selv:
- Bør du bruke en prognosetilnærming som håndterer trender godt? Du skulle tro at hvis du oppdaget en trend, bør du bruke en prognosetilnærming som håndterer trender godt. Det er ofte sant, men ikke nødvendigvis. Anta at i stedet for å bruke tidsperiode som en av variablene i korrelasjonsanalysen, brukte du noe som for eksempel salgsinntekter fra konkurrentene.
Hvis konkurransens inntekter faller som dine (eller hvis begge sett med inntekter vokser), vil du finne en sannsynlig betydelig sammenheng mellom inntektene dine og konkurrentenes. Men det er ganske mulig - til og med sannsynlig - at det ikke er noen reell årsakssammenheng mellom inntektene deres og dine. Det kan være at både din og deres er korrelert med den reelle årsaksfaktoren: Størrelsen på det totale markedet er i endring. I så fall vil du sannsynligvis ha det mye bedre å bruke et mål på total markedsstørrelse som prediktorvariabel. I dette scenariet har markedsstørrelse et direkte årsaksforhold til inntektene dine, mens konkurrentenes inntekter bare har et indirekte forhold til inntektene dine.
- Bør du avskrekke dataene? En skjult variabel, for eksempel en konsekvent endring i den totale størrelsen på et marked, kan få deg til å tro at en prediktorvariabel og variabelen du ønsker å forutsi er direkte relatert, mens de faktisk ikke er det. Eller prediktoren og prognosen kan endre seg på lignende måter fordi de begge er relatert til tid.
Måten å håndtere denne typen situasjoner på er å avskrekke begge variablene først ved hjelp av en transformasjon.
Eller du foretrekker kanskje å lage prognosen din ved å bruke en tilnærming som ikke nødvendigvis håndterer trender godt, for eksempel glidende gjennomsnitt eller enkel eksponentiell utjevning. En grunn til å gjøre dette er at du kan finne at regresjonstilnærmingen med datasettet ditt ikke er en like nøyaktig prognosemaker som glidende gjennomsnitt eller utjevning. Igjen, se om du kan transformere dataene for å fjerne trenden.