Как да разберете дали дадена прогнозна тенденция е реална? Ако видите базова линия, която изглежда, че се движи нагоре или надолу, това представлява ли реална тенденция или е просто произволна вариация? За да отговорите на тези въпроси, трябва да влезете в вероятността и статистиката. За щастие, не е нужно да навлизате в тях твърде далеч - може би до китката.
Основният ход на мисли върви така:
Използвайте Excel, за да ви каже каква е връзката между приходите от продажби и свързаните с тях периоди от време.
Няма значение дали представям този период като януари 2011 г., февруари 2011 г., март 2011 г. . . декември 2016 г. или като 1, 2, 3 . . . 72.
Ако няма връзка, измерена чрез корелацията, между приходите и периода от време, няма тенденция и не е нужно да се притеснявате за това.
Ако има е връзката между приходите и периоди от време, трябва да се избере най-добрият начин да се справят с тази тенденция.
След като Excel изчисли корелацията, трябва да решите дали тя представлява реална връзка между периода от време и размера на приходите, или е просто късмет.
Ако вероятността това да е просто късмет е по-малка от 5 процента, това е реална тенденция. (Нищо вълшебно за 5 процента също — конвенционално е. Някои хора предпочитат да използват 1 процент като свой критерий — той е по-консервативен от 5 процента и се чувстват малко по-сигурни.) Това повдига въпроса за статистическата значимост: какво ниво на вероятност имате ли нужда, преди да решите, че нещо (тук, корелация) е истинският Маккой?
Съществуват различни методи за тестване на статистическата значимост на коефициента на корелация. Ето три популярни метода:
- Тествайте директно корелацията и сравнете резултата с нормалното разпределение.
- Тествайте директно корелацията и сравнете резултата с t-разпределението (t-разпределението, макар и подобно на нормалната крива, предполага, че използвате малка извадка, а не безкрайно голяма популация).
- Преобразувайте корелацията с трансформацията на Фишер (която преобразува коефициента на корелация в стойност, която се вписва в нормалната крива) и сравнете резултата с нормалното разпределение.
Съществуват и други популярни методи за тестване на статистическата значимост на коефициента на корелация. Всеки връща малко по-различен резултат. На практика почти винаги ще взимате едно и също решение (корелацията е или не е значително различна от нула), независимо от метода, който изберете.
Ако заключите, че тенденцията на корелационните мерки е реална (и когато вероятността е по-малка от 1 процент, че корелацията е призрак, вероятно трябва да приемете това заключение), имате още два въпроса, които да си зададете:
- Трябва ли да използвате подход за прогнозиране, който се справя добре с тенденциите? Бихте си помислили, че ако откриете тенденция, трябва да използвате подход за прогнозиране, който се справя добре с тенденциите. Това често е вярно, но не е задължително. Да предположим, че вместо да използвате период от време като една от променливите във вашия корелационен анализ, сте използвали нещо като приходи от продажби, направени от конкуренцията.
Ако приходите на конкуренцията намаляват като вашите (или ако и двата набора от приходи растат), ще откриете вероятно значителна корелация между вашите приходи и тези на конкуренцията. Но е напълно възможно — дори вероятно — да няма реална причинно-следствена връзка между техните приходи и вашите. Възможно е и вашето, и тяхното да са свързани с истинския причинно-следствен фактор: Размерът на цялостния пазар се променя. В този случай вероятно ще бъде много по-добре да използвате мярка за общия размер на пазара като променлива за прогнозиране. В този сценарий размерът на пазара има пряка, причинно-следствена връзка с вашите приходи, докато приходите на вашата конкуренция имат само непряка връзка с вашите приходи.
- Трябва ли да намалите тренда на данните? Скрита променлива, като последователна промяна в общия размер на пазара, може да ви накара да повярвате, че променливата за прогнозиране и променливата, която искате да прогнозирате, са пряко свързани, но всъщност не са. Или предикторът и прогнозата могат да се променят по сходен начин, защото и двете са свързани с времето.
Начинът за справяне с този вид ситуация е първо да се отклонят и двете променливи чрез трансформация.
Или може да предпочетете да направите прогнозата си, като използвате подход, който не е задължително да се справя добре с тенденциите, като пълзящи средни или просто експоненциално изглаждане. Една от причините да направите това е, че може да откриете, че регресионният подход с вашия набор от данни не е толкова точен прогнозист, колкото пълзящите средни или изглаждането. Отново вижте дали можете да трансформирате данните, за да премахнете тенденцията.