Excel е чудесен инструмент, когато трябва да използвате статистика. Ако никога не сте били изложени на статистически данни в училище или са минали десетилетие или две откакто сте били, нека тези съвети ви помогнат да използвате някои от статистическите инструменти, които Excel предоставя.
Описателната статистика е ясна
Първото нещо, което трябва да знаете, е, че някои статистически анализи и някои статистически мерки са доста ясни. Описателните статистики, които включват неща като кръстосаните таблици на централната таблица, както и някои от статистическите функции, имат смисъл дори за някой, който не е толкова количествен.
Понякога средните стойности не са толкова прости
Когато някой използва термина средна стойност, това , към което обикновено се позовава, е най-често срещаното средно измерване, което е средна стойност. Разбирането, че терминът среден е неточен, прави голяма част от статистическата функционалност на Excel по-разбираема.
За да направите тази дискусия по-конкретна, приемете, че разглеждате малък набор от стойности: 1, 2, 3, 4 и 5. Както може би знаете, средната стойност в този малък набор от стойности е 3. Можете да изчислите средната стойност чрез събиране на всички числа в набора (1+2+3+4+5) и след това разделяне на тази сума (15) на общия брой стойности в набора (5).
В средната стойност е стойността, която разделя най-големите стойности от най-малките стойности. В набора от данни 1, 2, 3, 4 и 5 медианата е 3. Стойността 3 разделя най-големите стойности (4 и 5) от най-малките стойности (1 и 2).
Не е нужно да разбирате различни средни измервания, но трябва да запомните, че терминът среден е доста неточен.
Стандартните отклонения описват дисперсията
Формулата за стандартно отклонение и логиката са доста лесни за разбиране.
А стандартно отклонение описва как стойности в масива от данни варират около средната стойност. Хубавото нещо на статистическите мерки като стандартно отклонение, често получавате реална представа за характеристиките на данните, които разглеждате. Друго нещо е, че с тези два бита данни често можете да правите изводи за данните, като разглеждате извадки.
Наблюдението си е наблюдение
Наблюдението е един от термините, които ще срещнете, ако прочетете нещо за статистиката. Наблюдението е просто наблюдение. Един от начините за дефиниране на термина наблюдение е така: Всеки път, когато действително присвоите стойност на една от вашите произволни променливи, вие създавате наблюдение.
Извадката е подмножество от стойности
А проба е колекция от наблюдения от една популация. Например, ако създадете набор от данни, който записва дневната висока температура във вашия квартал, вашата малка колекция от наблюдения е извадка.
За сравнение, извадката не е популация. Една популация включва всички възможни наблюдения.
Статистиката за изводи е готина, но сложна
Ако погледнете извадка от стойности от съвкупност и извадката е достатъчно представителна и голяма, можете да направите заключения за популацията въз основа на характеристиките на извадката.
Статистиката за изводи, макар и много мощна, притежава две качества, които трябва да знаете:
Функциите за разпределение на вероятностите не винаги са объркващи
Функцията за разпределение на вероятността P звучи доста сложно; но всъщност можете да разберете интуитивно какво представлява функцията за разпределение на вероятностите с няколко полезни примера.
Едно често срещано разпределение, за което чувате в статистическите класове, например, е T разпределение. A T разпределение по същество е нормално разпределение освен с по-тежки, дебели опашки.
Една обща функция за разпределение на вероятностите е равномерното разпределение. При равномерно разпределение всяко събитие има еднаква вероятност за настъпване. Уникалното в тази дистрибуция е, че всичко е на адски ниво.
Друг често срещан тип функция за разпределение на вероятностите е нормалното разпределение, известно също като крива на камбана или гаусово разпределение.
Нормалното разпределение се среща естествено в много ситуации. Например, коефициентите на интелигентност (IQ) се разпределят нормално.
Параметрите не са толкова сложни
Един параметър е вход за функцията на вероятностно разпределение. С други думи, формулата или функцията или уравнението, които описват крива на разпределението на вероятностите, се нуждаят от входни данни. В статистиката тези входове се наричат параметри.
Някои функции за разпределение на вероятностите се нуждаят само от един прост параметър. Например, за да работите с еднакво разпределение, всичко, от което наистина се нуждаете, е броят на стойностите в набора от данни. Шестостранен зар например има само шест възможности.
Изкривяването и ексцесът описват формата на разпределението на вероятностите
Няколко други полезни статистически термина, които трябва да знаете, са изкривяване и ексцес. Изкривяването определя количествено липсата на симетрия в разпределението на вероятностите. При идеално симетрично разпределение, подобно на нормалното разпределение, асиметрия е равна на нула. Ако разпределението на вероятностите се наклони надясно или наляво, обаче, асиметрия е равна на някаква стойност, различна от нула, и стойността определя количествено липсата на симетрия.
Куртозата определя количествено тежестта на опашките в разпределението. При нормално разпределение ексцесът е равен на нула. На опашката е нещо, което е отправено към левия или десния. Въпреки това, ако опашката в разпределението е по-тежка от нормалното разпределение, ексцесът е положително число. Ако опашките в разпределението са по-слаби, отколкото при нормално разпределение, ексцесът е отрицателно число.
На пръв поглед интервалите на доверие изглеждат сложни, но са полезни
Вероятностите често объркват хората. Важно нещо, което трябва да се разбере за нивата на доверие, е, че те са свързани с границата на грешка.
Друго важно нещо, което трябва да разберете за нивата на доверие, е, че колкото по-голям е размерът на извадката, толкова по-малка е границата на грешката ви, използвайки същото ниво на доверие.
Като един пример да речем, че имате данни от Google Анализ за две различни уеб реклами, които пускате, за да популяризирате малкия си бизнес, и искате да знаете коя реклама е по-ефективна. Можете да използвате формулата на доверителния интервал, за да разберете колко време трябва да се показват рекламите ви, преди Google да събере достатъчно данни, за да разберете коя реклама е наистина по-добра.