Ako viete, či je predpovedaný trend skutočný? Ak vidíte základnú líniu, ktorá vyzerá, že sa posúva nahor alebo nadol, predstavuje to skutočný trend alebo je to len náhodná odchýlka? Ak chcete odpovedať na tieto otázky, musíte sa dostať do pravdepodobnosti a štatistiky. Našťastie sa do nich nemusíte dostať príliš ďaleko – možno až po zápästie.
Základný myšlienkový pochod vyzerá takto:
Pomocou Excelu zistíte, aká je korelácia medzi príjmami z predaja a súvisiacimi časovými obdobiami.
Nezáleží na tom, či uvádzam toto obdobie ako január 2011, február 2011, marec 2011 . . . decembra 2016, alebo ako 1., 2., 3. . . 72.
Ak medzi výnosmi a časovým obdobím neexistuje žiadny vzťah, meraný koreláciou, neexistuje žiadny trend a nemusíte sa o to starať.
V prípade, že je vzťah medzi príjmami a časových období, budete musieť vybrať najlepší spôsob, ako zvládnuť tento trend.
Potom, čo Excel vypočíta koreláciu, musíte sa rozhodnúť, či predstavuje skutočný vzťah medzi časovým obdobím a sumou výnosov, alebo či je to len šťastný pokus.
Ak je pravdepodobnosť, že je to len šťastie, menšia ako 5 percent, ide o skutočný trend. (Na 5 percentách tiež nie je nič magické – je to bežné. Niektorí ľudia uprednostňujú použitie 1 percenta ako svoje kritérium – je to konzervatívnejšie ako 5 percent a cítia sa o niečo bezpečnejšie.) To vyvoláva problém štatistickej významnosti: Aká úroveň pravdepodobnosti vyžadujete predtým, než sa rozhodnete, že niečo (tu, korelácia) je skutočný McCoy?
Existujú rôzne metódy na testovanie štatistickej významnosti korelačného koeficientu. Tu sú tri populárne metódy:
- Otestujte priamo koreláciu a porovnajte výsledok s normálnym rozdelením.
- Otestujte koreláciu priamo a porovnajte výsledok s t-distribúciou (t-distribúcia, hoci je podobná normálnej krivke, predpokladá, že používate menšiu vzorku a nie nekonečne veľkú populáciu).
- Preveďte koreláciu pomocou Fisherovej transformácie (ktorá prevedie korelačný koeficient na hodnotu, ktorá zapadá do normálnej krivky) a porovnajte výsledok s normálnym rozdelením.
Existujú aj iné populárne metódy na testovanie štatistickej významnosti korelačného koeficientu. Každý vráti trochu iný výsledok. V praxi sa takmer vždy rozhodnete rovnako (korelácia je alebo nie je výrazne odlišná od nuly), bez ohľadu na metódu, ktorú si vyberiete.
Ak dospejete k záveru, že trend korelačných meraní je skutočný (a keď je pravdepodobnosť menšia ako 1 percento, že korelácia je duch, pravdepodobne by ste mali prijať tento záver), musíte si položiť ďalšie dve otázky:
- Mali by ste použiť prognostický prístup, ktorý dobre zvláda trendy? Mysleli by ste si, že ak ste zachytili trend, mali by ste použiť prognostický prístup, ktorý dobre zvláda trendy. To je často pravda, ale nie nevyhnutne. Predpokladajme, že namiesto použitia časového obdobia ako jednej z premenných vo vašej korelačnej analýze ste použili niečo, ako napríklad tržby z predaja konkurencie.
Ak príjmy konkurencie klesajú ako vaše (alebo ak obe skupiny príjmov rastú), zistíte pravdepodobnú významnú koreláciu medzi vašimi príjmami a príjmami konkurencie. Ale je celkom možné – dokonca pravdepodobné – že medzi ich a vašimi príjmami neexistuje žiadny skutočný, príčinný vzťah. Môže sa stať, že váš aj ich korelujú so skutočným kauzálnym faktorom: Veľkosť celkového trhu sa mení. V takom prípade by pre vás bolo pravdepodobne oveľa lepšie použiť ako predikčnú premennú mieru celkovej veľkosti trhu. V tomto scenári má veľkosť trhu priamy, príčinný vzťah k vašim príjmom, zatiaľ čo príjmy vašej konkurencie majú k vašim príjmom iba nepriamy vzťah.
- Mali by ste sa zbaviť údajov? Skrytá premenná, ako je konzistentná zmena celkovej veľkosti trhu, vás môže viesť k presvedčeniu, že prediktorová premenná a premenná, ktorú chcete predpovedať, spolu priamo súvisia, hoci v skutočnosti nie sú. Alebo sa prediktor a predpoveď môžu meniť podobným spôsobom, pretože obe súvisia s časom.
Spôsob, ako zvládnuť tento druh situácie, je najprv odstrániť trend oboch premenných pomocou transformácie.
Alebo môžete radšej vytvoriť svoju prognózu pomocou prístupu, ktorý nemusí nevyhnutne dobre zvládnuť trendy, ako sú kĺzavé priemery alebo jednoduché exponenciálne vyhladzovanie. Jedným z dôvodov je to, že možno zistíte, že regresný prístup s vaším súborom údajov nie je taký presný prognostik ako kĺzavé priemery alebo vyhladzovanie. Znova skontrolujte, či môžete transformovať údaje na odstránenie trendu.