Ακολουθεί μια τυπική ερώτηση ανάλυσης δεδομένων που λαμβάνουμε κατά καιρούς:
Έχω ένα υπολογιστικό φύλλο με περισσότερες από 100.000 σειρές υπολογιστικό φύλλο Excel που έχει μια δέσμη πληροφοριών πελατών που πρέπει να καθαρίσω για διπλότυπα. Υπολογίζω ότι θα χρειαστούν μερικές μέρες για να καθαρίσω τη λίστα με το χέρι. Ένας συνάδελφος μου είπε ότι πιθανότατα θα χρειαστώ μια μακροεντολή Excel για να το κάνω αυτό. Ο τεχνικός μας πληροφορικής, ο οποίος είναι εξοικειωμένος με την ανάπτυξη Macro, είναι σε άδεια, οπότε πρέπει να το λύσω μόνος μου. Υπάρχει τρόπος να λυθεί αυτό το πρόβλημα χωρίς να ξέρετε πώς να προγραμματίσετε;
Ναι, υπάρχει τρόπος να το λύσετε αυτό στο Excel και δεν χρειάζεται να είστε επαγγελματίας με τον προγραμματισμό της Visual Basic. Ας προχωρήσουμε και ας το λύσουμε γρήγορα για εσάς.
Διαγράψτε τις διπλότυπες σειρές του Excel
Δείτε πώς μπορείτε να απαλλαγείτε από τις περιττές καταχωρήσεις στο υπολογιστικό φύλλο σας:
- Αρχικά, δημιουργήστε ένα αντίγραφο του βιβλίου εργασίας σας, ώστε να έχετε ένα αντίγραφο ασφαλείας σε περίπτωση που κάτι πάει στραβά.
- Στη συνέχεια, ανοίξτε το υπολογιστικό φύλλο του Excel.
- Στην επάνω Κορδέλα, πατήστε την καρτέλα Δεδομένα .
- Τώρα προχωρήστε και επιλέξτε το εύρος δεδομένων που θέλετε να καθαρίσετε. Βεβαιωθείτε ότι έχετε επιλέξει και τις κεφαλίδες του πίνακα εάν είναι διαθέσιμες.
- Στην ενότητα Εργαλεία δεδομένων, πατήστε το κουμπί Κατάργηση διπλότυπων .
- Τώρα, προχωρήστε και ελέγξτε τη σχετική στήλη που θα σας βοηθήσει να προσδιορίσετε εάν μια καταχώριση στη λίστα σας είναι διπλότυπη. Στην περίπτωσή μας, χρησιμοποιώντας το επίδειξη του συνόλου δεδομένων Στόχων πωλήσεων, θα χρησιμοποιήσουμε τις πρώτες 3 στήλες για να αναγνωρίσουμε διπλότυπες σειρές.
- Πατήστε ΟΚ .
- Θα εμφανιστεί ένα μήνυμα με λεπτομέρειες σχετικά με τον αριθμό των εγγραφών που καταργήθηκαν και αυτές που διατηρούνται στον πίνακα.
- Πατήστε OK και επιθεωρήστε το τροποποιημένο σύνολο δεδομένων σας για ορθότητα.
- Εάν είστε ικανοποιημένοι με το αποτέλεσμα, προχωρήστε και αποθηκεύστε το αρχείο σας. Διαφορετικά, μπορείτε να αναιρέσετε την αλλαγή σας ( Επεξεργασία >> Αναίρεση ).
Προηγμένες συμβουλές:
- Παρόμοια δυνατότητα είναι διαθέσιμη στο Excel PowerQuery, το οποίο σας επιτρέπει να μεταμορφώνετε σημαντικά μεγαλύτερα σύνολα δεδομένων.
- Εάν είστε εξοικειωμένοι με τη γλώσσα Python, μπορείτε εύκολα να απορρίψετε διπλότυπες σειρές από ένα σύνολο δεδομένων χρησιμοποιώντας τη βιβλιοθήκη Pandas.
Απολαύστε την ανάλυση των δεδομένων σας 😉