Excel 2007 má skvělé nástroje pro analýzu dat. Můžete vytvořit jakoukoli statistiku, kterou chcete; jen se ujistěte, že víte, co statistika znamená. K tomu potřebujete znát dostupné statistické ukazatele, booleovské výrazy, které Excel 2007 používá, a databázové funkce Excelu 2007.
Databázové funkce aplikace Excel 2007
Nástroje pro analýzu dat aplikace Excel 2007 zahrnují sadu databázových funkcí pro provádění statistických výpočtů pomocí informací ze seznamů. Následující tabulka ukazuje tyto funkce a vysvětluje, co každá dělá:
Funkce |
Popis |
DAVERAGE |
Vypočítá aritmetický průměr |
DCOUNT |
Spočítá počet buněk s hodnotami |
DCOUNTA |
Spočítá počet buněk, které nejsou prázdné |
DGET |
Vrátí hodnotu ze seznamu databáze |
DMAX |
Vyhledá největší hodnotu v seznamu |
DMIN |
Vyhledá nejmenší hodnotu v seznamu |
DPRODUCT |
Vypočítá součin hodnot odpovídajících kritériím |
DSTDEV |
Vypočítá směrodatnou odchylku vzorku |
DSTDEVP |
Vypočítá směrodatnou odchylku základního souboru |
DSUM |
Vypočítá součet hodnot odpovídajících kritériím |
DVAR |
Vypočítá rozptyl vzorku |
DVARP |
Vypočítá rozptyl populace |
Všechny tyto databázové funkce používají standardní syntaxi se třemi argumenty. Například funkce DAVERAGE vypadá takto: =DAVERAGE(databáze,pole,kritéria) kde databáze je odkaz na rozsah na seznam Excel, který obsahuje hodnotu, kterou chcete prozkoumat, pole říká Excelu, který sloupec v databázi má prozkoumat a kritéria je odkaz na rozsah, který identifikuje pole a hodnoty použité k definování kritérií výběru. Argument pole může být odkaz na buňku obsahující název pole, název pole uzavřený v uvozovkách nebo číslo, které sloupec identifikuje (1 pro první sloupec, 2 pro druhý sloupec atd.).
Rychlá analýza dat aplikace Excel 2007 ze stavového řádku
Excel 2007 vám může říct docela dost o vybraném rozsahu buněk právě ze stavového řádku. Když vyberete buňky, které obsahují data, stavový řádek Excelu vám může sdělit užitečné informace o těchto buňkách. Když klepnete pravým tlačítkem na stavový řádek, Excel zobrazí vyskakovací nabídku, která obsahuje několik statistických měření, která můžete provést ve vybraném rozsahu; jsou uvedeny v následující tabulce:
Možnost statistických měření |
Co to dělá |
Možnost statistických měření |
Co to dělá |
[Žádný] |
Řekne Excelu, že nechcete, aby to počítal a poté zobrazil
statistiku na stavovém řádku. |
Maximum |
Vyhledá největší hodnotu ve vybraném rozsahu |
Průměrný |
Vyhledá průměr hodnot ve zvoleném rozsahu. |
Minimální |
Vyhledá nejmenší hodnotu ve zvoleném rozsahu |
Počet |
Sečte buňky, které obsahují štítky, hodnoty nebo vzorce. Použijte
to, když chcete spočítat počet buněk, které nejsou
prázdné. |
Součet |
Přidá hodnoty ve vybraném rozsahu |
Číselný počet |
Sečte počet buněk ve vybraném rozsahu, které obsahují
hodnoty nebo vzorce. |
|
|
Použití booleovských výrazů v analýze dat v aplikaci Excel 2007
Nástroje pro analýzu dat aplikace Excel 2007 samozřejmě zahrnují booleovské výrazy. Chcete-li vytvořit booleovský výraz, například když filtrujete kritéria, použijte operátor porovnání a poté hodnotu v porovnání (například >5). Následující tabulka ukazuje porovnávací operátory Excelu a co představují:
Porovnávací operátor |
Co to znamená |
= |
Se rovná |
> |
Větší než |
>= |
Větší než nebo rovno |
< |
Méně než |
<= |
Menší nebo rovno |
<> |
Nerovná se |
Pojmy statistiky, které je třeba znát při používání nástrojů pro analýzu dat aplikace Excel 2007
Pomocí nástrojů pro analýzu dat, které jsou k dispozici v aplikaci Excel 2007, můžete vytvářet tabulky, které zobrazují podrobnosti o jakékoli statistice, pro kterou můžete vytvořit vzorec k nalezení – a můžete najít jakékoli číslo. Pomáhá vědět, co hledáte a co můžete očekávat, a termíny v následujícím seznamu vám pomohou pochopit, jaké druhy statistik můžete vytvářet.
-
průměr: Průměr je obvykle aritmetický průměr pro sadu hodnot. Excel nabízí několik průměrných funkcí.
-
chí-kvadrát: Použijte chí-kvadrát k porovnání pozorovaných hodnot s očekávanými hodnotami, čímž vrátíte hladinu významnosti nebo pravděpodobnosti (také nazývanou p-hodnota ). P-hodnota vám pomůže posoudit, zda rozdíly mezi pozorovanými a očekávanými hodnotami představují náhodu.
-
křížová tabulka: Jedná se o analytickou techniku, která shrnuje data dvěma nebo více způsoby. Shrnutí informací o prodeji podle zákazníka a produktu je křížová tabulka.
-
popisná statistika: Popisná statistika pouze popisuje hodnoty v sadě. Pokud například sečtete sadu hodnot, bude tento součet popisnou statistikou. Nalezení největší hodnoty nebo nejmenší hodnoty v souboru čísel je také popisná statistika.
-
exponenciální vyhlazování: Exponenciální vyhlazování vypočítává klouzavý průměr, ale váží hodnoty zahrnuté ve výpočtech klouzavého průměru, takže novější hodnoty mají větší účinek.
-
inferenční statistika: Inferenční statistika je založena na velmi užitečné, intuitivní myšlence, že pokud se podíváte na vzorek hodnot z populace a vzorek je dostatečně reprezentativní a velký, můžete vyvodit závěry o populaci na základě charakteristik vzorku.
-
špičatost: Toto je míra ocasů v distribuci hodnot.
-
medián: Medián je střední hodnota v souboru hodnot. Polovina hodnot spadá pod medián a polovina hodnot spadá nad medián.
-
režim: Režim je nejběžnější hodnota v sadě.
-
klouzavý průměr: Klouzavý průměr se vypočítává pouze pomocí zadané sady hodnot, jako je průměr založený pouze na posledních třech hodnotách.
-
normální rozdělení: Také známé jako Gaussovo rozdělení, normální rozdělení je nechvalně známá zvonová křivka.
-
p-hodnota: p-hodnota je hladina významnosti neboli pravděpodobnosti.
-
regresní analýza: Regresní analýza zahrnuje vynesení párů nezávislých a závislých proměnných do grafu XY a poté nalezení lineární nebo exponenciální rovnice, která nejlépe popisuje vynesená data.
-
šikmost: Toto je míra symetrie distribuce hodnot.
-
standardní odchylka: Směrodatná odchylka popisuje rozptyl kolem průměru souboru dat. Můžete si tak trochu představit standardní odchylku jako průměrnou odchylku od průměru.
-
rozptyl: Rozptyl popisuje rozptyl kolem průměru souboru dat. Rozptyl je druhou mocninou směrodatné odchylky; směrodatná odchylka je druhá odmocnina z rozptylu.
-
z-hodnota : Toto je vzdálenost mezi hodnotou a průměrem ve smyslu standardních odchylek.