Kako veste, ali je trend napovedovanja resničen? Če vidite osnovno črto, ki je videti, kot da se premika navzgor ali navzdol, ali to predstavlja pravi trend ali je to le naključna sprememba? Če želite odgovoriti na ta vprašanja, se morate poglobiti v verjetnost in statistiko. Na srečo vam ni treba iti predaleč – morda do zapestja.
Osnovni tok misli gre takole:
Z Excelom lahko poveste, kakšna je povezava med prihodki od prodaje in povezanimi časovnimi obdobji.
Ni pomembno, ali to časovno obdobje predstavljam kot januar 2011, februar 2011, marec 2011 . . . decembra 2016 ali kot 1, 2, 3 . . . 72.
Če ni povezave, merjeno s korelacijo, med prihodki in časovnim obdobjem, ni trenda in vam ni treba skrbeti za to.
Če pa je razmerje med prihodki in časovnih obdobjih, morate izbrati najboljši način za ravnanje trend.
Ko Excel izračuna korelacijo, se morate odločiti, ali predstavlja resnično razmerje med časovnim obdobjem in zneskom prihodka ali pa gre le za srečo.
Če je verjetnost, da je to le sreča, manjša od 5 odstotkov, je to pravi trend. (Tudi pri 5 odstotkih ni nič čudnega – to je običajno. Nekateri ljudje raje uporabljajo 1 odstotek kot merilo – je bolj konzervativen kot 5 odstotkov in se počutijo nekoliko varnejše.) To odpira vprašanje statistične pomembnosti: kakšna stopnja verjetnosti ali potrebuješ, preden se odločiš, da je nekaj (tukaj korelacija) pravi McCoy?
Obstajajo različne metode za testiranje statistične pomembnosti korelacijskega koeficienta. Tu so tri priljubljene metode:
- Neposredno preizkusite korelacijo in primerjajte rezultat z normalno porazdelitvijo.
- Neposredno preizkusite korelacijo in primerjajte rezultat s t-distribucijo (t-distribucija, čeprav je podobna normalni krivulji, predpostavlja, da uporabljate majhen vzorec in ne neskončno veliko populacijo).
- Pretvorite korelacijo s Fisherjevo transformacijo (ki pretvori korelacijski koeficient v vrednost, ki ustreza normalni krivulji) in primerjajte rezultat z normalno porazdelitvijo.
Obstajajo tudi druge priljubljene metode za testiranje statistične pomembnosti korelacijskega koeficienta. Vsaka vrne nekoliko drugačen rezultat. V praksi boste skoraj vedno sprejeli isto odločitev (korelacija je ali ni bistveno drugačna od nič), ne glede na metodo, ki jo izberete.
Če ugotovite, da je trend korelacijskih mer resničen (in ko je verjetnost, da je korelacija duhovita, manjša od 1 odstotka, bi verjetno morali sprejeti ta sklep), si morate zastaviti še dve vprašanji:
- Ali bi morali uporabiti pristop napovedovanja, ki dobro obvladuje trende? Mislili bi, da če zaznate trend, bi morali uporabiti pristop napovedovanja, ki dobro obvladuje trende. To je pogosto res, ni pa nujno. Recimo, da ste namesto časovnega obdobja kot eno od spremenljivk v vaši korelacijski analizi uporabili nekaj, kot so prihodki od prodaje, ki jih ustvari konkurenca.
Če prihodki konkurence zdrsnejo tako kot vaši (ali če oba niza prihodkov rasteta), boste ugotovili verjetno pomembno korelacijo med vašimi prihodki in prihodki konkurence. Vendar je povsem mogoče – celo verjetno –, da med njihovimi in vašimi prihodki ni resnične vzročne zveze. Morda sta tako vaša kot njihova povezana z resničnim vzročnim dejavnikom: velikost celotnega trga se spreminja. V tem primeru bi bilo verjetno veliko bolje, če bi kot spremenljivko napovedovalca uporabili merilo celotne velikosti trga. V tem scenariju ima velikost trga neposredno, vzročno zvezo z vašimi prihodki, medtem ko ima prihodek vaše konkurence le posredno povezavo z vašimi prihodki.
- Ali bi morali podatke opustiti? Skrita spremenljivka, kot je dosledna sprememba celotne velikosti trga, vas lahko pripelje do prepričanja, da sta spremenljivka napovedovalca in spremenljivka, ki jo želite napovedati, neposredno povezani, čeprav v resnici nista. Ali pa se lahko napovednik in napoved spremenita na podoben način, ker sta oba povezana s časom.
Način za ravnanje s tovrstno situacijo je, da najprej s transformacijo odstranimo obe spremenljivki.
Ali pa boste morda raje naredili svojo napoved z uporabo pristopa, ki ne obvladuje nujno trendov dobro, kot so drseča povprečja ali preprosto eksponentno glajenje. Eden od razlogov za to je, da boste morda ugotovili, da regresijski pristop z vašim naborom podatkov ni tako natančen napovedovalec kot drseča povprečja ali glajenje. Ponovno preverite, ali lahko spremenite podatke, da odstranite trend.