Како знате да ли је тренд предвиђања стваран? Ако видите основну линију која изгледа као да се креће горе или доле, да ли то представља прави тренд или је то само насумична варијација? Да бисте одговорили на та питања, морате ући у вероватноћу и статистику. Срећом, не морате да улазите предалеко у њих - можда до зглоба.
Основни ток мисли иде овако:
Користите Екцел да вам каже каква је корелација између прихода од продаје и повезаних временских периода.
Није битно да ли тај временски период представљам као јануар 2011, фебруар 2011, март 2011. . . децембра 2016. или као 1, 2, 3 . . . 72.
Ако нема везе, мерено корелацијом, између прихода и временског периода, нема тренда и не морате да бринете о томе.
Ако постоји је однос између прихода и временским периодима, морате да изаберете најбољи начин да се тај тренд.
Након што Екцел израчуна корелацију, морате да одлучите да ли она представља стварну везу између временског периода и износа прихода, или је то само срећа.
Ако је вероватноћа да је то само срећа мања од 5 процената, то је прави тренд. (Ништа магично ни око 5 процената — то је конвенционално. Неки људи више воле да користе 1 проценат као критеријум — конзервативнији је од 5 процената, и осећају се мало сигурније.) Ово поставља питање статистичког значаја: који ниво вероватноће да ли вам је потребно пре него што одлучите да је нешто (овде, корелација) прави Мекој?
Постоје различите методе за тестирање статистичке значајности коефицијента корелације. Ево три популарне методе:
- Тестирајте директно корелацију и упоредите резултат са нормалном дистрибуцијом.
- Тестирајте директно корелацију и упоредите резултат са т-дистрибуцијом (т-дистрибуција, иако слична нормалној кривој, претпоставља да користите мали узорак, а не бесконачно велику популацију).
- Претворите корелацију са Фишеровом трансформацијом (која конвертује коефицијент корелације у вредност која се уклапа у нормалну криву) и упоредите резултат са нормалном дистрибуцијом.
Постоје и друге популарне методе за тестирање статистичке значајности коефицијента корелације. Сваки враћа мало другачији резултат. У пракси, скоро увек ћете донети исту одлуку (корелација је или није значајно различита од нуле), без обзира на метод који одаберете.
Ако закључите да је тренд мере корелације стваран (и када је вероватноћа мања од 1 процента да је корелација дух, вероватно би требало да прихватите тај закључак), имате још два питања која треба да поставите себи:
- Да ли треба да користите приступ предвиђања који добро управља трендовима? Помислили бисте да ако откријете тренд, требало би да користите приступ предвиђања који добро управља трендовима. То је често тачно, али не нужно. Претпоставимо да уместо да користите временски период као једну од варијабли у вашој корелационој анализи, користите нешто попут прихода од продаје које остварује конкуренција.
Ако приходи конкуренције опадају као и ваши (или ако оба скупа прихода расту), открићете вероватно значајну корелацију између ваших прихода и прихода конкуренције. Али сасвим је могуће — чак и вероватно — да не постоји стварна, узрочна веза између њихових и ваших прихода. Можда су и ваше и њихово у корелацији са стварним узрочним фактором: величина укупног тржишта се мења. У том случају, вероватно би вам било много боље да користите меру укупне величине тржишта као променљиву предиктора. У овом сценарију, величина тржишта има директну, узрочну везу са вашим приходом, док приход ваше конкуренције има само индиректну везу са вашим приходом.
- Да ли би требало да смањите тренд података? Скривена променљива, као што је конзистентна промена укупне величине тржишта, може да вас наведе да верујете да су променљива предиктора и варијабла коју желите да предвидите директно повезане, иако у ствари нису. Или се предиктор и прогноза могу променити на сличан начин јер су обоје повезани са временом.
Начин да се реши оваква ситуација је да се обе варијабле прво детрендирају помоћу трансформације.
Или бисте можда радије направили своју прогнозу користећи приступ који не мора нужно да се носи са трендовима добро, као што су покретни просеци или једноставно експоненцијално изглађивање. Један од разлога за ово је тај што ћете можда открити да приступ регресије са вашим скупом података није тако прецизан прогнозер као покретни просеци или изглађивање. Опет, погледајте да ли можете да трансформишете податке да бисте уклонили тренд.