Το Excel είναι ένα υπέροχο εργαλείο όταν χρειάζεται να χρησιμοποιήσετε στατιστικά. Εάν δεν έχετε εκτεθεί ποτέ σε στατιστικά στο σχολείο ή έχουν περάσει μια ή δύο δεκαετίες από τότε, αφήστε αυτές τις συμβουλές να σας βοηθήσουν να χρησιμοποιήσετε μερικά από τα στατιστικά εργαλεία που παρέχει το Excel.
Οι περιγραφικές στατιστικές είναι απλές
Το πρώτο πράγμα που πρέπει να γνωρίζετε είναι ότι ορισμένες στατιστικές αναλύσεις και ορισμένα στατιστικά μέτρα είναι αρκετά ξεκάθαρα. Τα περιγραφικά στατιστικά στοιχεία, τα οποία περιλαμβάνουν πράγματα όπως οι διασταυρούμενοι πίνακας συγκεντρωτικών πινάκων, καθώς και ορισμένες από τις στατιστικές συναρτήσεις, έχουν νόημα ακόμη και για κάποιον που δεν είναι και τόσο ποσοτικός.
Οι μέσοι όροι δεν είναι τόσο απλοί μερικές φορές
Όταν κάποιος χρησιμοποιεί τον όρο μέσος όρος, αυτό στο οποίο συνήθως αναφέρεται είναι η πιο κοινή μέση μέτρηση, που είναι ένας μέσος όρος. Η κατανόηση του γεγονότος ότι ο όρος μέσος όρος είναι ανακριβής κάνει ένα μεγάλο μέρος της στατιστικής λειτουργικότητας του Excel πιο κατανοητό.
Για να κάνετε αυτή τη συζήτηση πιο συγκεκριμένη, υποθέστε ότι εξετάζετε ένα μικρό σύνολο τιμών: 1, 2, 3, 4 και 5. Όπως ίσως γνωρίζετε, ο μέσος όρος σε αυτό το μικρό σύνολο τιμών είναι 3. Μπορείτε να υπολογίσετε ο μέσος όρος προσθέτοντας όλους τους αριθμούς του συνόλου (1+2+3+4+5) και στη συνέχεια διαιρώντας αυτό το άθροισμα (15) με τον συνολικό αριθμό των τιμών του συνόλου (5).
Η διάμεση τιμή είναι η τιμή που διαχωρίζει τις μεγαλύτερες από τις μικρότερες τιμές. Στο σύνολο δεδομένων 1, 2, 3, 4 και 5, η διάμεσος είναι 3. Η τιμή 3 διαχωρίζει τις μεγαλύτερες τιμές (4 και 5) από τις μικρότερες τιμές (1 και 2).
Δεν χρειάζεται να κατανοήσετε διαφορετικές μετρήσεις μέσου όρου, αλλά θα πρέπει να θυμάστε ότι ο όρος μέσος όρος είναι αρκετά ανακριβής.
Οι τυπικές αποκλίσεις περιγράφουν τη διασπορά
Ο τύπος για την τυπική απόκλιση και η λογική είναι αρκετά εύκολα κατανοητοί.
Μια τυπική απόκλιση περιγράφει πώς οι τιμές σε ένα σύνολο δεδομένων ποικίλλουν γύρω από τη μέση τιμή. Το καλό με τα στατιστικά μέτρα, όπως η τυπική απόκλιση, είναι ότι συχνά αποκτάτε πραγματικές γνώσεις για τα χαρακτηριστικά των δεδομένων που εξετάζετε. Ένα άλλο πράγμα είναι ότι με αυτά τα δύο bit δεδομένων, μπορείτε συχνά να βγάλετε συμπεράσματα σχετικά με τα δεδομένα κοιτάζοντας δείγματα.
Μια παρατήρηση είναι μια παρατήρηση
Η παρατήρηση είναι ένας από τους όρους που θα συναντήσετε αν διαβάσετε κάτι σχετικά με τα στατιστικά στοιχεία. Μια παρατήρηση είναι απλώς μια παρατήρηση. Ένας τρόπος για να ορίσετε τον όρο παρατήρηση είναι ο εξής: Όποτε εκχωρείτε πραγματικά μια τιμή σε μια από τις τυχαίες μεταβλητές σας, δημιουργείτε μια παρατήρηση.
Ένα δείγμα είναι ένα υποσύνολο τιμών
Ένα δείγμα είναι μια συλλογή παρατηρήσεων από έναν πληθυσμό. Για παράδειγμα, εάν δημιουργήσετε ένα σύνολο δεδομένων που καταγράφει την ημερήσια υψηλή θερμοκρασία στη γειτονιά σας, η μικρή σας συλλογή παρατηρήσεων είναι ένα δείγμα.
Συγκριτικά, ένα δείγμα δεν είναι πληθυσμός. Ένας πληθυσμός περιλαμβάνει όλες τις πιθανές παρατηρήσεις.
Τα συμπεράσματα στατιστικά στοιχεία είναι ωραία αλλά πολύπλοκα
Εάν κοιτάξετε ένα δείγμα τιμών από έναν πληθυσμό και το δείγμα είναι αντιπροσωπευτικό και αρκετά μεγάλο, μπορείτε να βγάλετε συμπεράσματα σχετικά με τον πληθυσμό με βάση τα χαρακτηριστικά του δείγματος.
Τα επαγωγικά στατιστικά στοιχεία, αν και πολύ ισχυρά, διαθέτουν δύο ιδιότητες που πρέπει να γνωρίζετε:
Οι συναρτήσεις κατανομής πιθανοτήτων δεν προκαλούν πάντα σύγχυση
Η συνάρτηση κατανομής πιθανοτήτων ακούγεται αρκετά δύσκολη. αλλά μπορείτε πραγματικά να καταλάβετε διαισθητικά τι είναι μια συνάρτηση κατανομής πιθανότητας με μερικά χρήσιμα παραδείγματα.
Μια κοινή κατανομή για την οποία ακούτε για παράδειγμα σε τάξεις στατιστικής, είναι μια κατανομή Τ. Μια κατανομή Τ είναι ουσιαστικά μια κανονική κατανομή εκτός από βαρύτερες, παχύτερες ουρές.
Μια κοινή συνάρτηση κατανομής πιθανότητας είναι μια ομοιόμορφη κατανομή. Σε μια ομοιόμορφη κατανομή, κάθε γεγονός έχει την ίδια πιθανότητα να συμβεί. Το μοναδικό με αυτή τη διανομή είναι ότι όλα είναι σε πολύ μεγάλο επίπεδο.
Ένας άλλος κοινός τύπος συνάρτησης κατανομής πιθανότητας είναι η κανονική κατανομή, επίσης γνωστή ως καμπύλη καμπάνας ή κατανομή Gauss.
Μια κανονική κατανομή εμφανίζεται φυσικά σε πολλές καταστάσεις. Για παράδειγμα, τα πηλίκα νοημοσύνης (IQ) κατανέμονται κανονικά.
Οι παράμετροι δεν είναι τόσο περίπλοκες
Μια παράμετρος είναι μια είσοδος στη συνάρτηση κατανομής πιθανότητας. Με άλλα λόγια, ο τύπος ή η συνάρτηση ή η εξίσωση που περιγράφει μια καμπύλη κατανομής πιθανότητας χρειάζεται εισόδους. Στη στατιστική, αυτές οι είσοδοι ονομάζονται παράμετροι.
Ορισμένες συναρτήσεις κατανομής πιθανότητας χρειάζονται μόνο μια απλή παράμετρο. Για παράδειγμα, για να εργαστείτε με μια ομοιόμορφη κατανομή, το μόνο που χρειάζεστε είναι ο αριθμός των τιμών στο σύνολο δεδομένων. Μια μήτρα έξι όψεων, για παράδειγμα, έχει μόνο έξι δυνατότητες.
Η λοξότητα και η κύρτωση περιγράφουν το σχήμα μιας κατανομής πιθανότητας
Μερικοί άλλοι χρήσιμοι στατιστικοί όροι που πρέπει να γνωρίζετε είναι η λοξότητα και η κύρτωση. Η λοξότητα ποσοτικοποιεί την έλλειψη συμμετρίας σε μια κατανομή πιθανοτήτων. Σε μια απολύτως συμμετρική κατανομή, όπως η κανονική κατανομή, η λοξότητα ισούται με μηδέν. Εάν μια κατανομή πιθανότητας κλίνει προς τα δεξιά ή προς τα αριστερά, ωστόσο, η λοξότητα ισούται με κάποια τιμή διαφορετική από το μηδέν και η τιμή ποσοτικοποιεί την έλλειψη συμμετρίας.
Το Kurtosis ποσοτικοποιεί το βάρος των ουρών σε μια κατανομή. Σε μια κανονική κατανομή, η κύρτωση ισούται με μηδέν. Η ουρά είναι αυτό που απλώνεται αριστερά ή δεξιά. Ωστόσο, εάν μια ουρά σε μια κατανομή είναι βαρύτερη από μια κανονική κατανομή, η κύρτωση είναι ένας θετικός αριθμός. Εάν οι ουρές σε μια κατανομή είναι πιο αδύνατες από ό,τι σε μια κανονική κατανομή, η κύρτωση είναι αρνητικός αριθμός.
Τα διαστήματα εμπιστοσύνης στην αρχή φαίνονται περίπλοκα, αλλά είναι χρήσιμα
Οι πιθανότητες συχνά μπερδεύουν τους ανθρώπους. Ένα σημαντικό πράγμα που πρέπει να κατανοήσετε σχετικά με τα επίπεδα εμπιστοσύνης είναι ότι συνδέονται με το περιθώριο σφάλματος.
Ένα άλλο σημαντικό πράγμα που πρέπει να κατανοήσετε σχετικά με τα επίπεδα εμπιστοσύνης είναι ότι όσο μεγαλύτερο κάνετε το μέγεθος του δείγματός σας, τόσο μικρότερο θα είναι το περιθώριο σφάλματος χρησιμοποιώντας το ίδιο επίπεδο εμπιστοσύνης.
Ως ένα μόνο παράδειγμα, ας πούμε ότι είχατε ορισμένα δεδομένα του Google Analytics σε δύο διαφορετικές διαφημίσεις ιστού που προβάλλετε για την προώθηση της μικρής επιχείρησής σας και θέλετε να μάθετε ποια διαφήμιση είναι πιο αποτελεσματική. Μπορείτε να χρησιμοποιήσετε τον τύπο του διαστήματος εμπιστοσύνης για να υπολογίσετε πόσο χρόνο χρειάζονται οι διαφημίσεις σας για να προβληθούν προτού η Google συλλέξει αρκετά δεδομένα ώστε να γνωρίζετε ποια διαφήμιση είναι πραγματικά καλύτερη.