Az Excel statisztikai elemzésének megértéséhez segít szimulálni a Központi határérték-tételt. Szinte nem hangzik jól. Hogyan eredményezhet normális eloszlású mintavételi eloszlást egy nem normálisan eloszló sokaság?
Ahhoz, hogy képet kapjunk a központi határtétel működéséről, van egy szimuláció. Ez a szimuláció valami olyasmit hoz létre, mint egy nagyon kis minta átlagának mintavételi eloszlása, olyan sokaság alapján, amely nem normális eloszlású. Amint látni fogja, annak ellenére, hogy a sokaság nem normális eloszlás, és bár a minta kicsi, az átlag mintavételi eloszlása meglehetősen hasonlít egy normál eloszlásra.
Képzeljünk el egy hatalmas populációt, amely mindössze három pontból áll – 1, 2 és 3 –, és mindegyik egyenlő valószínűséggel megjelenik a mintában. Képzelje el azt is, hogy ebből a sokaságból véletlenszerűen kiválaszthat egy három pontból álló mintát.
Az 1-es, 2-es és 3-as pontszámokból álló populációból származó három pontszám összes lehetséges mintája (és azok átlaga)
| Minta |
Átlagos |
Minta |
Átlagos |
Minta |
Átlagos |
| 1,1,1 |
1.00 |
2,1,1 |
1.33 |
3,1,1 |
1.67 |
| 1,1,2 |
1.33 |
2,1,2 |
1.67 |
3,1,2 |
2.00 |
| 1,1,3 |
1.67 |
2,1,3 |
2.00 |
3,1,3 |
2.33 |
| 1,2,1 |
1.33 |
2,2,1 |
1.67 |
3,2,1 |
2.00 |
| 1,2,2 |
1.67 |
2,2,2 |
2.00 |
3,2,2 |
2.33 |
| 1,2,3 |
2.00 |
2,2,3 |
2.33 |
3,2,3 |
2.67 |
| 1,3,1 |
1.67 |
2,3,1 |
2.00 |
3,3,1 |
2.33 |
| 1,3,2 |
2.00 |
2,3,2 |
2.33 |
3,3,2 |
2.67 |
| 1,3,3 |
2.33 |
2,3,3 |
2.67 |
3,3,3 |
3.00 |
Ha alaposan megnézed a táblázatot, szinte láthatod, mi fog történni a szimulációban. A leggyakrabban megjelenő mintaátlag 2,00. A legritkábban megjelenő mintaátlagok az 1,00 és a 3,00. Hmmm. . . .
A szimuláció során véletlenszerűen kiválasztottak egy pontszámot a populációból, majd véletlenszerűen választottak ki további kettőt. Ez a három pontszámból álló csoport egy minta. Ezután kiszámítja a minta átlagát. Ezt a folyamatot összesen 60 mintán megismételtük, ami 60 mintaátlagot eredményezett. Végül grafikonon ábrázolja a mintaátlagok eloszlását.
Hogyan néz ki az átlag szimulált mintavételi eloszlása? Az alábbi képen egy munkalap látható, amely választ ad erre a kérdésre.
A munkalapon minden sor egy minta. Az x1, x2 és x3 címkével ellátott oszlopok az egyes minták három pontszámát mutatják. Az E oszlop az egyes sorok mintájának átlagát mutatja. A G oszlop a mintaátlag összes lehetséges értékét mutatja, a H oszlop pedig azt, hogy az egyes átlagok milyen gyakran jelennek meg a 60 mintában. A G és H oszlopok, valamint a grafikon azt mutatják, hogy az eloszlás akkor éri el a legnagyobb gyakoriságot, ha a minta átlaga 2,00. A frekvenciák csökkennek, ahogy a minta átlaga egyre távolabb kerül 2.00-tól.
Mindennek az a lényege, hogy a sokaság nem hasonlít normális eloszlásra, és a minta mérete nagyon kicsi. A 60 mintán alapuló átlag mintavételi eloszlása még ilyen megszorítások mellett is nagyon hasonlít egy normál eloszlásra.

Mi a helyzet azokkal a paraméterekkel, amelyeket a Central Limit Theorem megjósolt a mintavételi eloszlásra? Kezdje a lakossággal. A populáció átlaga 2,00, a populáció szórása 0,67. (Ez a fajta sokaság némi enyhe matematikát igényel a paraméterek meghatározásához.)
Tovább a mintavételi elosztásra. A 60 átlag átlaga 1,98, szórása (az átlag standard hibájának becslése) 0,48. Ezek a számok közel állnak a Központi Határ-tétel által előre jelzett paraméterekhez az átlag mintavételi eloszlására, 2,00 (egyenlő a sokaság átlagával) és 0,47 (a szórás, 0,67, osztva 3 négyzetgyökével, a minta méretével). .
Abban az esetben, ha szeretné ezt a szimulációt elvégezni, kövesse az alábbi lépéseket:
Válasszon ki egy cellát az első véletlenszerűen kiválasztott számhoz.
Válassza ki a B2 cellát.
Használja a RANDBETWEEN munkalapfüggvényt az 1, 2 vagy 3 kiválasztásához.
Ez szimulálja egy szám rajzolását az 1, 2 és 3 számokból álló sokaságból, ahol egyenlő esély van az egyes számok kiválasztására. Választhat a FORMULAS | Math & Trig | RANDBETWEEN és használja a Függvényargumentumok párbeszédpanelt, vagy írja be a =RANDBETWEEN(1,3) értéket a B2-be, és nyomja meg az Enter billentyűt. Az első argumentum a RANDBETWEEN legkisebb szám, a második pedig a legnagyobb szám.
Jelölje ki az eredeti cellától jobbra lévő cellát, és válasszon egy másik véletlen számot 1 és 3 között. Ismételje meg ezt a harmadik véletlenszámmal a másodiktól jobbra lévő cellában.
Ennek legegyszerűbb módja, ha automatikusan kitölti az eredeti cellától jobbra lévő két cellát. Ezen a munkalapon ez a két cella a C2 és a D2.
Tekintsük ezt a három cellát mintának, és számítsuk ki átlagukat a harmadik cellától jobbra lévő cellában.
Ennek legegyszerűbb módja, ha az E2-es cellába írja be az =AVERAGE(B2:D2) értéket, és nyomja meg az Enter billentyűt.
Ismételje meg ezt a folyamatot annyi mintával, amennyit be szeretne vonni a szimulációba. Minden sor egy mintának feleljen meg.
Itt 60 mintát használtak fel. Ennek gyors és egyszerű módja az, hogy három véletlenszerűen kiválasztott szám első sorát és azok átlagát választja ki, majd automatikusan kitölti a fennmaradó sorokat. A mintaátlagok halmaza az E oszlopban az átlag szimulált mintavételi eloszlása. Az AVERAGE és a STDEV.P segítségével keresse meg az átlagot és a szórását.
Ha meg szeretné tekinteni, hogyan néz ki ez a szimulált mintavételi eloszlás, használja a FREQUENCY tömbfüggvényt az E oszlopban található mintaértékeken. Kövesse az alábbi lépéseket:
Írja be a mintaátlag lehetséges értékeit egy tömbbe.
Ehhez használhatja a G oszlopot. A mintaátlag lehetséges értékeit tört alakban (3/3, 4/3, 5/3, 6/3, 7/3, 8/3 és 9/3) fejezheti ki, mint a cellákba írt értékeket. G2-től G8-ig. Az Excel ezeket decimális formává alakítja. Győződjön meg arról, hogy ezek a cellák számformátumúak.
Válasszon ki egy tömböt a mintaátlag lehetséges értékeinek gyakoriságaihoz.
A H oszlopban tárolhatja a frekvenciákat, kiválasztva a H2-H8 cellákat.
A Statisztikai függvények menüben válassza a FREQUENCY lehetőséget, hogy megnyissa a FREQUENCY funkcióhoz tartozó függvényargumentumok párbeszédpanelt.
A Függvényargumentumok párbeszédpanelen adja meg az argumentumok megfelelő értékeit.
A Data_array mezőbe írja be a mintaeszközt tartalmazó cellákat. Ebben a példában ez E2:E61.
Határozza meg azt a tömböt, amely a mintaátlag lehetséges értékeit tartalmazza.
A FREQUENCY ezt a tömböt a Bins_array mezőben tartja. Ezen a munkalapon a G2:G8 a Bins_array mezőbe kerül. Miután azonosította mindkét tömböt, a Függvényargumentumok párbeszédpanelen láthatóak a frekvenciák egy pár szögletes zárójelben.
Nyomja meg a Ctrl+Shift+Enter billentyűkombinációt a Függvényargumentumok párbeszédpanel bezárásához és a gyakoriságok megjelenítéséhez.
Használja ezt a billentyűkombinációt, mert a FREQUENCY egy tömbfüggvény.
Végül a H2:H8 kiemeléssel válassza a Beszúrás | lehetőséget Javasolt diagramok, és válassza ki a Clustered Column elrendezést a gyakoriságok grafikonjának elkészítéséhez. Az Ön grafikonja valószínűleg kissé eltér az enyémtől, mert valószínűleg más véletlenszámot fog kapni.
Mellesleg, az Excel megismétli a véletlenszerű kiválasztási folyamatot, valahányszor olyan műveletet hajt végre, amely miatt az Excel újraszámítja a munkalapot. Ennek az a hatása, hogy a számok változhatnak, ahogy ezt végigdolgozod. (Azaz újrafuttatja a szimulációt.) Például, ha visszalép, és újra automatikusan kitölti valamelyik sort, a számok megváltoznak, és a grafikon megváltozik.