Excel 2007 har fantastiske dataanalyseværktøjer. Du kan oprette enhver statistik, du ønsker; bare sørg for, at du ved, hvad statistikken betyder. Til det skal du kende de tilgængelige statistiske mål, de boolske udtryk, Excel 2007 bruger, og Excel 2007-databasefunktionerne.
Excel 2007-databasefunktioner
Excel 2007's dataanalyseværktøjer inkluderer et sæt databasefunktioner til at lave statistiske beregninger ved hjælp af information fra lister. Følgende tabel viser disse funktioner og forklarer, hvad hver gør:
Fungere |
Beskrivelse |
DAGENS |
Beregner aritmetisk middelværdi |
DCOUNT |
Tæller antallet af celler med værdier |
DCOUNTA |
Tæller antallet af celler, der ikke er tomme |
DGET |
Returnerer en værdi fra en databaseliste |
DMAX |
Finder den største værdi på en liste |
DMIN |
Finder den mindste værdi på en liste |
DPRODUKT |
Beregner produktet af værdier, der matcher kriterier |
DSTDEV |
Beregner standardafvigelsen for en prøve |
DSTDEVP |
Beregner standardafvigelsen for en population |
DSUM |
Beregner summen af værdier, der matcher kriterier |
DVAR |
Beregner variansen af en prøve |
DVARP |
Beregner variansen af en population |
Alle disse databasefunktioner bruger en standard syntaks med tre argumenter. For eksempel ser FAVERAGE-funktionen sådan ud: =DAVERAGE(database,felt,kriterier) hvor databasen er en intervalreference til Excel-listen, der indeholder den værdi, du vil undersøge, feltet fortæller Excel, hvilken kolonne i databasen, der skal undersøges, og kriterier er en intervalreference, der identificerer de felter og værdier, der bruges til at definere dine udvælgelseskriterier. Det felt argument kan være en celle Referenceholdetiden feltnavnet, feltnavnet i anførselstegn, eller et tal, der identificerer søjlen (1 for den første kolonne, 2 til den anden kolonne, og så videre).
Excel 2007's hurtige dataanalyse fra statuslinjen
Excel 2007 kan fortælle dig en hel del om et udvalgt celleområde blot fra statuslinjen. Når du vælger celler, der har data i dem, kan Excels statuslinje fortælle dig nogle nyttige oplysninger om disse celler. Når du højreklikker på statuslinjen, viser Excel en pop op-menu, der indeholder flere statistiske mål, som du kan foretage på det valgte område; de er vist i følgende tabel:
Mulighed for statistiske foranstaltninger |
Hvad det gør |
Mulighed for statistiske foranstaltninger |
Hvad det gør |
[Ingen] |
Fortæller Excel, at du ikke vil have den til at beregne og derefter vise en
statistik på statuslinjen. |
Maksimum |
Finder den største værdi i det valgte område |
Gennemsnit |
Finder middelværdien af værdier i det valgte område. |
Minimum |
Finder den mindste værdi i det valgte område |
Tælle |
Tæller de celler, der indeholder etiketter, værdier eller formler. Brug
dette, når du vil tælle antallet af celler, der ikke er
tomme. |
Sum |
Tilføjer værdierne i det valgte område |
Numerisk optælling |
Tæller antallet af celler i et valgt område, der indeholder
værdier eller formler. |
|
|
Brug af booleske udtryk i dataanalyse med Excel 2007
Excel 2007 dataanalyseværktøjer inkluderer naturligvis boolske udtryk. For at konstruere et boolsk udtryk, som når du filtrerer kriterier, skal du bruge en sammenligningsoperator og derefter en værdi i sammenligningen (for eksempel >5). Følgende tabel viser Excel-sammenligningsoperatorerne, og hvad de repræsenterer:
Sammenligningsoperatør |
Hvad det betyder |
= |
Lige med |
> |
Bedre end |
>= |
Større end eller lig med |
< |
Mindre end |
<= |
Mindre end eller lig med |
<> |
Ikke lig med |
Statistikvilkår, du skal kende, når du bruger Excel 2007-dataanalyseværktøjer
Med de tilgængelige dataanalyseværktøjer i Excel 2007 kan du oprette regneark, der viser detaljerne i enhver statistik, du kan oprette en formel for at finde - og du kan finde et hvilket som helst tal. Det hjælper at vide, hvad du leder efter, og hvad du kan forvente, og vilkårene i den følgende liste hjælper dig med at forstå, hvilken slags statistik du kan producere.
-
gennemsnit: Et gennemsnit er typisk det aritmetiske middelværdi for et sæt værdier. Excel leverer flere gennemsnitlige funktioner.
-
chi-kvadrat: Brug chi-kvadrat til at sammenligne observerede værdier med forventede værdier, hvilket returnerer niveauet af signifikans eller sandsynlighed (også kaldet en p-værdi ). En p-værdi hjælper dig med at vurdere, om forskelle mellem de observerede og forventede værdier repræsenterer tilfældigheder.
-
krydstabulering: Dette er en analyseteknik, der opsummerer data på to eller flere måder. Opsummering af salgsoplysninger både efter kunde og produkt er en krydstabulering.
-
beskrivende statistik: Beskrivende statistik beskriver blot værdierne i et sæt. Hvis du f.eks. summerer et sæt værdier, er denne sum en beskrivende statistik. At finde den største værdi eller den mindste værdi i et sæt tal er også en beskrivende statistik.
-
eksponentiel udjævning: Eksponentiel udjævning beregner det glidende gennemsnit, men vægter de værdier, der indgår i beregningerne af det glidende gennemsnit, så nyere værdier har en større effekt.
-
Inferentiel statistik: Inferentiel statistik er baseret på den meget nyttige, intuitive idé, at hvis du ser på et udsnit af værdier fra en population, og stikprøven er repræsentativ og stor nok, kan du drage konklusioner om populationen baseret på karakteristika ved stikprøven.
-
kurtosis: Dette er et mål for halerne i en fordeling af værdier.
-
median: Medianen er den midterste værdi i et sæt værdier. Halvdelen af værdierne falder under medianen, og halvdelen af værdierne falder over medianen.
-
tilstand: Mode er den mest almindelige værdi i et sæt.
-
glidende gennemsnit: Et glidende gennemsnit beregnes kun ved hjælp af et specificeret sæt værdier, såsom et gennemsnit baseret på kun de sidste tre værdier.
-
normalfordeling: Også kendt som en Gauss-fordeling, normalfordeling er den berygtede klokkekurve.
-
p-værdi: En p-værdi er niveauet af signifikans eller sandsynlighed.
-
regressionsanalyse: Regressionsanalyse involverer at plotte par af uafhængige og afhængige variable i et XY-diagram og derefter finde en lineær eller eksponentiel ligning, der bedst beskriver de plottede data.
-
skævhed: Dette er et mål for symmetrien af en fordeling af værdier.
-
standardafvigelse: En standardafvigelse beskriver spredning omkring datasættets middelværdi. Du kan lidt tænke på en standardafvigelse som en gennemsnitlig afvigelse fra middelværdien.
-
varians: En varians beskriver spredning omkring datasættets middelværdi. Variansen er kvadratet af standardafvigelsen; standardafvigelsen er kvadratroden af variansen.
-
z-værdi : Dette er afstanden mellem en værdi og middelværdien i form af standardafvigelser.