Екцел је одличан алат када треба да користите статистику. Ако никада нисте били изложени статистици у школи или је прошло деценију или две откако сте били, нека вам ови савети помогну да користите неке од статистичких алата које Екцел пружа.
Дескриптивна статистика је једноставна
Прва ствар коју треба да знате је да су неке статистичке анализе и неке статистичке мере прилично једноставне. Дескриптивна статистика, која укључује ствари као што су унакрсне табеле заокретне табеле, као и неке од статистичких функција, имају смисла чак и за некога ко није толико квантитативан.
Просеци понекад нису тако једноставни
Када неко користи израз просек, оно на шта обично мисли је најчешће просечно мерење, а то је средња вредност. Разумевање да је термин просек непрецизан чини већи део статистичке функционалности Екцел-а разумљивијим.
Да бисте ову дискусију учинили конкретнијом, претпоставите да гледате у мали скуп вредности: 1, 2, 3, 4 и 5. Као што можда знате, средња вредност у овом малом скупу вредности је 3. Можете израчунати средњу вредност тако што се саберу сви бројеви у скупу (1+2+3+4+5), а затим се овај збир (15) подели са укупним бројем вредности у скупу (5).
Средња вредност је вредност која раздваја највеће вредности од најмањих вредности. У скупу података 1, 2, 3, 4 и 5, медијана је 3. Вредност 3 одваја највеће вредности (4 и 5) од најмањих вредности (1 и 2).
Не морате да разумете различита просечна мерења, али треба да запамтите да је термин просек прилично непрецизан.
Стандардне девијације описују дисперзију
Формула за стандардну девијацију и логика су прилично лаки за разумевање.
Стандардна девијација описује како вредности у скупу података варирају око средњи. Згодна ствар у вези са статистичким мерама као што је стандардна девијација, често добијате прави увид у карактеристике података које гледате. Друга ствар је да са ова два бита података често можете извући закључке о подацима гледајући узорке.
Запажање је запажање
Посматрање је један од појмова са којима ћете се сусрести ако прочитате било шта о статистици. Запажање је само запажање. Један од начина да дефинишете термин посматрање је следећи: Кад год заиста доделите вредност једној од ваших насумичних променљивих, ви креирате запажање.
Узорак је подскуп вредности
Узорак је скуп опсервација из популације. На пример, ако креирате скуп података који бележи дневну високу температуру у вашем крају, ваша мала збирка запажања је узорак.
За поређење, узорак није популација. Становништво обухвата све могуће запажања.
Инференцијална статистика је кул, али компликована
Ако погледате узорак вредности из популације и узорак је репрезентативан и довољно велик, можете извући закључке о популацији на основу карактеристика узорка.
Инференцијална статистика, иако веома моћна, поседује две квалитете које треба да знате:
-
Проблеми са прецизношћу
-
Стрма крива учења
Функције дистрибуције вероватноће нису увек збуњујуће
Функција расподеле П робности звучи прилично незгодно; али заправо можете интуитивно разумети шта је функција дистрибуције вероватноће са неколико корисних примера.
Једна уобичајена дистрибуција о којој чујете у часовима статистике, на пример, је Т дистрибуција. Т расподела је у суштини нормална дистрибуција, осим са тежим, дебље репове.
Једна уобичајена функција расподеле вероватноће је униформна расподела. У униформној дистрибуцији, сваки догађај има исту вероватноћу да се догоди. Јединствена ствар у вези са овом дистрибуцијом је да је све прилично проклето на нивоу.
Други уобичајени тип функције расподеле вероватноће је нормална расподела, такође позната као звонаста крива или Гаусова расподела.
Нормална дистрибуција се јавља природно у многим ситуацијама. На пример, квоцијент интелигенције (ИК) се нормално дистрибуира.
Параметри нису тако компликовани
Параметар је улаз на функцију расподеле вероватноће. Другим речима, формула или функција или једначина која описује криву расподеле вероватноће захтева уносе. У статистици, ти улази се називају параметри.
Неким функцијама расподеле вероватноће потребан је само један једноставан параметар. На пример, да бисте радили са униформном дистрибуцијом, све што вам је заиста потребно је број вредности у скупу података. Шестострана коцка, на пример, има само шест могућности.
Искривљеност и куртозис описују облик дистрибуције вероватноће
Неколико других корисних статистичких термина које треба знати су искривљеност и ексцес. Искривљеност квантификује недостатак симетрије у дистрибуцији вероватноће. У савршено симетричној расподели, попут нормалне дистрибуције, асиметрија је једнака нули. Међутим, ако се дистрибуција вероватноће нагиње удесно или улево, искривљеност је једнака некој вредности која није нула, а вредност квантификује недостатак симетрије.
Куртозис квантификује тежину репова у дистрибуцији. У нормалној дистрибуцији, ексцес је једнак нули. Реп је оно што допире до лево или десно. Међутим, ако је реп у дистрибуцији тежи од нормалне дистрибуције, ексцес је позитиван број. Ако су репови у дистрибуцији мршавији него у нормалној дистрибуцији, ексцес је негативан број.
Интервали поверења у почетку изгледају компликовано, али су корисни
Вероватноће често збуњују људе. Важна ствар коју треба разумети о нивоима поверења је да су они повезани са маргином грешке.
Још једна важна ствар коју треба разумети у вези са нивоима поверења је да што је већи узорак, то ће мања ваша маргина грешке користити исти ниво поверења.
Као само један пример, рецимо да имате неке податке Гоогле аналитике о два различита веб огласа која приказујете да бисте промовисали своје мало предузеће и желите да знате који оглас је ефикаснији. Можете да користите формулу интервала поверења да бисте утврдили колико дуго треба да се приказују ваши огласи пре него што Гоогле прикупи довољно података да бисте знали који је оглас заиста бољи.