(Přibližně) Simulace centrální limitní věty v Excelu

Abychom vám pomohli porozumět statistické analýze v Excelu, pomůže vám simulovat Centrální limitní teorém. Skoro to nezní správně. Jak může populace, která není normálně distribuována, vyústit v normálně distribuovanou distribuci vzorkování?

Abyste měli představu, jak funguje Centrální limitní věta, existuje simulace. Tato simulace vytváří něco jako vzorkování distribuce průměru pro velmi malý vzorek na základě populace, která není normálně rozdělena. Jak uvidíte, i když populace není normální rozdělení, a přestože je vzorek malý, výběrové rozdělení průměru vypadá docela jako normální rozdělení.

Představte si obrovskou populaci, která se skládá pouze ze tří skóre – 1, 2 a 3 – a každé z nich se stejně pravděpodobně objeví ve vzorku. Představte si také, že můžete náhodně vybrat vzorek tří skóre z této populace.

Všechny možné vzorky tří skóre (a jejich průměry) z populace sestávající ze skóre 1, 2 a 3

Vzorek Znamenat Vzorek Znamenat Vzorek Znamenat
1,1,1 1,00 2,1,1 1.33 3,1,1 1,67
1,1,2 1.33 2,1,2 1,67 3,1,2 2,00
1,1,3 1,67 2,1,3 2,00 3,1,3 2.33
1,2,1 1.33 2,2,1 1,67 3,2,1 2,00
1,2,2 1,67 2,2,2 2,00 3,2,2 2.33
1,2,3 2,00 2,2,3 2.33 3,2,3 2.67
1,3,1 1,67 2,3,1 2,00 3,3,1 2.33
1,3,2 2,00 2,3,2 2.33 3,3,2 2.67
1,3,3 2.33 2,3,3 2.67 3,3,3 3,00

Když se pozorně podíváte na tabulku, můžete téměř vidět, co se v simulaci děje. Nejčastěji se objevující průměr vzorku je 2,00. Vzorové prostředky, které se objevují nejméně často, jsou 1,00 a 3,00. Hmmm . . .

V simulaci bylo náhodně vybráno skóre z populace a poté náhodně vybrány další dvě. Tato skupina tří skóre je vzorek. Pak vypočítáte průměr tohoto vzorku. Tento proces byl opakován pro celkem 60 vzorků, což vedlo k 60 průměrům vzorků. Nakonec vykreslíte graf distribuce průměrů vzorku.

Jak vypadá simulované vzorkování rozdělení střední hodnoty? Níže uvedený obrázek ukazuje pracovní list, který odpovídá na tuto otázku.

V listu je každý řádek ukázkou. Sloupce označené x1, x2 a x3 ukazují tři skóre pro každý vzorek. Sloupec E ukazuje průměr pro vzorek v každém řádku. Sloupec G ukazuje všechny možné hodnoty pro průměr vzorku a sloupec H ukazuje, jak často se každý průměr objevuje v 60 vzorcích. Sloupce G a H a graf ukazují, že rozdělení má maximální frekvenci, když je průměr vzorku 2,00. Frekvence se snižují, jak se vzorkovací prostředky stále více vzdalují od 2,00.

Pointou toho všeho je, že populace nevypadá jako normální rozdělení a velikost vzorku je velmi malá. I při těchto omezeních začíná výběrové rozdělení průměru založeného na 60 vzorcích vypadat velmi podobně jako normální rozdělení.

(Přibližně) Simulace centrální limitní věty v Excelu

A co parametry, které Centrální limitní teorém předpovídá pro distribuci vzorkování? Začněte s populací. Průměr populace je 2,00 a standardní odchylka populace je 0,67. (Tento druh populace vyžaduje trochu fantazijní matematiky pro zjištění parametrů.)

Ještě k distribuci vzorkování. Průměr 60 průměrů je 1,98 a jejich standardní odchylka (odhad standardní chyby průměru) je 0,48. Tato čísla se těsně blíží parametrům předpovězeným Centrálním limitním teorémem pro výběrové rozdělení průměru, 2,00 (rovná se průměru populace) a 0,47 (směrodatná odchylka, 0,67, děleno druhou odmocninou ze 3, velikost vzorku) .

V případě, že máte zájem o provedení této simulace, zde jsou kroky:

Vyberte buňku pro první náhodně vybrané číslo.
Vyberte buňku B2.

Pomocí funkce listu RANDBETWEEN vyberte 1, 2 nebo 3.
To simuluje vytažení čísla ze základního souboru sestávajícího z čísel 1, 2 a 3, kde máte stejnou šanci vybrat každé číslo. Můžete buď vybrat VZORCE | Math & Trig | RANDBETWEEN a použijte dialogové okno Argumenty funkcí nebo jednoduše zadejte =RANDBETWEEN(1,3) v B2 a stiskněte Enter. První argument je nejmenší číslo, které RANDBETWEEN vrátí, a druhý argument je největší číslo.

Vyberte buňku napravo od původní buňky a vyberte další náhodné číslo mezi 1 a 3. Udělejte to znovu pro třetí náhodné číslo v buňce napravo od druhého.
Nejjednodušší způsob, jak toho dosáhnout, je automaticky vyplnit dvě buňky napravo od původní buňky. V tomto listu jsou tyto dvě buňky C2 a D2.

Považujte tyto tři buňky za vzorek a vypočítejte jejich průměr v buňce napravo od třetí buňky.
Nejjednodušší způsob, jak to udělat, je napsat =AVERAGE(B2:D2) do buňky E2 a stisknout Enter.

Tento proces opakujte pro tolik vzorků, kolik chcete do simulace zahrnout. Nechte každý řádek odpovídat vzorku.

Bylo zde použito 60 vzorků. Rychlý a snadný způsob, jak toho dosáhnout, je vybrat první řádek ze tří náhodně vybraných čísel a jejich střední hodnotu a poté automaticky vyplnit zbývající řádky. Soubor průměrů vzorků ve sloupci E je simulované rozdělení průměru vzorku. Použijte AVERAGE a STDEV.P k nalezení střední hodnoty a standardní odchylky.

Chcete-li vidět, jak tato simulovaná distribuce vzorkování vypadá, použijte funkci pole FREQUENCY na vzorcích ve sloupci E. Postupujte takto:

Zadejte možné hodnoty střední hodnoty vzorku do pole.
K tomu můžete použít sloupec G. Možné hodnoty střední hodnoty vzorku můžete vyjádřit ve formě zlomků (3/3, 4/3, 5/3, 6/3, 7/3, 8/3 a 9/3), jako jsou hodnoty zadané do buněk G2 až G8. Excel je převede do desítkové podoby. Ujistěte se, že tyto buňky jsou ve formátu čísla.

Vyberte pole pro frekvence možných hodnot střední hodnoty vzorku.
Sloupec H můžete použít k uložení frekvencí, výběrem buněk H2 až H8.

Z nabídky Statistické funkce vyberte FREKVENCE a otevřete dialogové okno Argumenty funkcí pro FREKVENCE

V dialogovém okně Argumenty funkce zadejte příslušné hodnoty pro argumenty.
Do pole Data_array zadejte buňky, které obsahují prostředek vzorku. V tomto příkladu je to E2:E61.

Identifikujte pole, které obsahuje možné hodnoty střední hodnoty vzorku.
FREQUENCY obsahuje toto pole v poli Bins_array. Pro tento list přejde G2:G8 do pole Bins_array. Po identifikaci obou polí se v dialogovém okně Argumenty funkcí zobrazí frekvence uvnitř dvojice složených závorek.(Přibližně) Simulace centrální limitní věty v Excelu

Stisknutím Ctrl+Shift+Enter zavřete dialogové okno Argumenty funkcí a zobrazíte frekvence.
Použijte tuto kombinaci kláves, protože FREQUENCY je funkce pole.

Nakonec se zvýrazněným H2:H8 vyberte Vložit | Doporučené grafy a zvolte rozvržení Clustered Column pro vytvoření grafu frekvencí. Váš graf bude pravděpodobně vypadat poněkud jinak než můj, protože pravděpodobně skončíte s jiným náhodným číslem.

Mimochodem, Excel opakuje proces náhodného výběru, kdykoli uděláte něco, co způsobí, že Excel přepočítá list. Výsledkem je, že čísla se mohou měnit, jak se přes to propracujete. (To znamená, že znovu spustíte simulaci.) Pokud se například vrátíte zpět a znovu automaticky vyplníte jeden z řádků, změní se čísla a změní se graf.


Jak zablokovat aplikaci Microsoft Word v otevírání souborů v režimu pouze pro čtení v systému Windows

Jak zablokovat aplikaci Microsoft Word v otevírání souborů v režimu pouze pro čtení v systému Windows

Jak zablokovat aplikaci Microsoft Word v otevírání souborů v režimu pouze pro čtení v systému Windows Aplikace Microsoft Word otevírá soubory v režimu pouze pro čtení, takže je nelze upravovat? Nebojte se, metody jsou uvedeny níže

Jak opravit nesprávný tisk dokumentů Microsoft Word

Jak opravit nesprávný tisk dokumentů Microsoft Word

Jak opravit chyby při tisku nesprávných dokumentů Microsoft Word Chyby při tisku dokumentů Word se změněným písmem, chaotickými odstavci, chybějícím textem nebo ztraceným obsahem jsou poměrně časté. Nicméně ne

Vymažte kresby perem a zvýrazňovačem na snímcích PowerPoint

Vymažte kresby perem a zvýrazňovačem na snímcích PowerPoint

Pokud jste použili pero nebo zvýrazňovač ke kreslení na snímky aplikace PowerPoint během prezentace, můžete kresby uložit pro další prezentaci nebo je vymazat, takže až ji příště ukážete, začnete s čistými snímky aplikace PowerPoint. Chcete-li vymazat kresby perem a zvýrazňovačem, postupujte podle těchto pokynů: Mazání čar jedna na […]

Obsah knihovny stylů v SharePointu 2010

Obsah knihovny stylů v SharePointu 2010

Knihovna stylů obsahuje soubory CSS, soubory XSL (Extensible Stylesheet Language) a obrázky používané předdefinovanými vzorovými stránkami, rozvržení stránek a ovládací prvky v SharePointu 2010. Chcete-li najít soubory CSS v knihovně stylů webu pro publikování: Vyberte Akce webu→ Zobrazit Veškerý obsah webu. Zobrazí se obsah webu. Knihovna stylů se nachází v […]

Formátování čísel v tisících a milionech v sestavách Excel

Formátování čísel v tisících a milionech v sestavách Excel

Nezahlcujte své publikum gargantuovskými čísly. V aplikaci Microsoft Excel můžete zlepšit čitelnost řídicích panelů a sestav formátováním čísel tak, aby se zobrazovaly v tisících nebo milionech.

Jak sdílet a sledovat weby SharePoint

Jak sdílet a sledovat weby SharePoint

Naučte se používat nástroje sociálních sítí SharePoints, které umožňují jednotlivcům a skupinám komunikovat, spolupracovat, sdílet a propojovat se.

Jak převést data do juliánských formátů v aplikaci Excel

Jak převést data do juliánských formátů v aplikaci Excel

Juliánská data se často používají ve výrobním prostředí jako časové razítko a rychlý odkaz pro číslo šarže. Tento typ kódování data umožňuje maloobchodníkům, spotřebitelům a servisním zástupcům identifikovat, kdy byl produkt vyroben, a tím i stáří produktu. Juliánská data se také používají v programování, armádě a astronomii. Odlišný […]

Jak vytvořit webovou aplikaci Access

Jak vytvořit webovou aplikaci Access

Webovou aplikaci můžete vytvořit v Accessu 2016. Co je tedy vlastně webová aplikace? Web znamená, že je online, a aplikace je jen zkratka pro „aplikaci“. Vlastní webová aplikace je online databázová aplikace přístupná z cloudu pomocí prohlížeče. Webovou aplikaci vytváříte a udržujete ve verzi pro počítače […]

Panel rychlého spuštění v SharePointu 2010

Panel rychlého spuštění v SharePointu 2010

Většina stránek v SharePointu 2010 zobrazuje seznam navigačních odkazů na panelu Snadné spuštění na levé straně stránky. Panel Snadné spuštění zobrazuje odkazy na doporučený obsah webu, jako jsou seznamy, knihovny, weby a stránky publikování. Panel Snadné spuštění obsahuje dva velmi důležité odkazy: Odkaz na veškerý obsah webu: […]

Co znamenají chybové zprávy Řešitel v Excelu?

Co znamenají chybové zprávy Řešitel v Excelu?

U jednoduchých problémů Řešitel v Excelu obvykle rychle najde optimální hodnoty proměnné Řešitel pro účelovou funkci. Ale v některých případech má Řešitel problém najít hodnoty proměnné Řešitel, které optimalizují účelovou funkci. V těchto případech Řešitel obvykle zobrazí zprávu nebo chybovou zprávu, která popisuje nebo popisuje problém, který […]