Jak poznáte, zda je předpovědní trend skutečný? Pokud vidíte základní linii, která vypadá, že se pohybuje nahoru nebo dolů, představuje to skutečný trend nebo je to jen náhodná variace? Chcete-li odpovědět na tyto otázky, musíte se dostat do pravděpodobnosti a statistiky. Naštěstí se do nich nemusíte dostat příliš daleko – možná až po zápěstí.
Základní myšlenkový pochod vypadá takto:
Pomocí Excelu zjistíte, jaká je korelace mezi příjmy z prodeje a souvisejícími časovými obdobími.
Nezáleží na tom, jestli to časové období uvádím jako leden 2011, únor 2011, březen 2011 . . . prosince 2016 nebo jako 1., 2., 3. . . 72.
Pokud neexistuje žádný vztah, měřeno korelací, mezi výnosy a časovým obdobím, neexistuje žádný trend a nemusíte se o něj starat.
V případě, že je vztah mezi příjmy a časových období, budete muset vybrat nejlepší způsob, jak zvládnout tento trend.
Poté, co Excel vypočítá korelaci, musíte se rozhodnout, zda představuje skutečný vztah mezi časovým obdobím a výší tržeb, nebo zda je to jen náhoda.
Pokud je pravděpodobnost, že je to jen štěstí, menší než 5 procent, je to skutečný trend. (Na 5 procentech také není nic magického – je to konvenční. Někteří lidé dávají přednost použití 1 procenta jako svého kritéria – je to konzervativnější než 5 procent a cítí se trochu bezpečněji.) To vyvolává problém statistické významnosti: Jaká úroveň pravděpodobnosti vyžadujete, než se rozhodnete, že něco (zde korelace) je skutečný McCoy?
Existují různé metody pro testování statistické významnosti korelačního koeficientu. Zde jsou tři oblíbené metody:
- Otestujte přímo korelaci a porovnejte výsledek s normálním rozdělením.
- Otestujte přímo korelaci a porovnejte výsledek s t-rozdělením (t-rozdělení, i když je podobné normální křivce, předpokládá, že používáte spíše menší vzorek než nekonečně velkou populaci).
- Převeďte korelaci pomocí Fisherovy transformace (která převádí korelační koeficient na hodnotu, která se vejde do normální křivky) a porovnejte výsledek s normálním rozdělením.
Existují další populární metody pro testování statistické významnosti korelačního koeficientu. Každá vrátí trochu jiný výsledek. V praxi se téměř vždy rozhodnete stejně (korelace je nebo není výrazně odlišná od nuly), bez ohledu na zvolenou metodu.
Pokud dojdete k závěru, že trend korelačních měření je skutečný (a když je pravděpodobnost menší než 1 procento, že korelace je duch, pravděpodobně byste tento závěr měli přijmout), musíte si položit další dvě otázky:
- Měli byste používat předpovědní přístup, který dobře zvládá trendy? Řekli byste si, že pokud zjistíte trend, měli byste použít předpovědní přístup, který dobře zvládá trendy. To je často pravda, ale ne nutně. Předpokládejme, že místo použití časového období jako jedné z proměnných ve vaší korelační analýze jste použili něco, jako jsou tržby z prodeje konkurence.
Pokud příjmy konkurence klesají stejně jako vaše (nebo rostou obě skupiny příjmů), zjistíte pravděpodobně významnou korelaci mezi vašimi příjmy a příjmy konkurence. Ale je docela možné – dokonce pravděpodobné – že mezi jejich příjmy a vašimi neexistuje žádný skutečný, kauzální vztah. Může se stát, že vaše i jejich korelují se skutečným kauzálním faktorem: Velikost celkového trhu se mění. V takovém případě by pro vás bylo pravděpodobně mnohem lepší použít jako predikční proměnnou míru celkové velikosti trhu. V tomto scénáři má velikost trhu přímý, kauzální vztah k vašim příjmům, zatímco tržby vaší konkurence mají k vašim příjmům pouze nepřímý vztah.
- Měli byste se bránit datům? Skrytá proměnná, jako je konzistentní změna celkové velikosti trhu, vás může vést k domněnce, že proměnná prediktoru a proměnná, kterou chcete předpovídat, spolu přímo souvisí, i když ve skutečnosti nejsou. Nebo se prediktor a předpověď mohou měnit podobným způsobem, protože oba souvisí s časem.
Způsob, jak zvládnout tento druh situace, je nejprve odstranit obě proměnné pomocí transformace.
Nebo můžete upřednostnit vytvoření prognózy pomocí přístupu, který nezbytně dobře nezvládá trendy, jako jsou klouzavé průměry nebo jednoduché exponenciální vyhlazování. Jedním z důvodů, proč to udělat, je, že můžete zjistit, že regresní přístup s vaším souborem dat není tak přesný prognostik jako klouzavé průměry nebo vyhlazování. Znovu se podívejte, zda můžete transformovat data a odstranit trend.