Štai tipiškas duomenų analizės klausimas, kurį retkarčiais gauname:
Turiu skaičiuoklę su daugiau nei 100 000 eilučių „Excel“ skaičiuokle, kurioje yra daug klientų informacijos, kurią reikia išvalyti, kad neatsirastų dublikatų. Apskaičiavau, kad man prireiks kelių dienų, kol sąrašą ištrinsiu rankiniu būdu. Kolega man pasakė, kad greičiausiai man reikės „Excel“ makrokomandos, kad tai atlikčiau. Mūsų IT specialistas, susipažinęs su makrokomandų kūrimu, atostogauja, todėl turiu tai išspręsti pačiam. Ar yra būdas išspręsti šią problemą nežinant, kaip programuoti?
Taip, yra būdas tai išspręsti programoje „Excel“, ir tam nereikės mokėti „Visual Basic“ programuoti. Eikime į priekį ir greitai išspręskime tai už jus.
Ištrinkite „Excel“ pasikartojančias eilutes
Štai kaip atsikratyti nereikalingų įrašų skaičiuoklėje:
- Pirmiausia padarykite savo darbaknygės kopiją, kad turėtumėte atsarginę kopiją, jei kas nors nutiktų.
- Tada atidarykite „Excel“ skaičiuoklę.
- Viršutinėje juostoje spustelėkite skirtuką Duomenys .
- Dabar eikite į priekį ir pasirinkite duomenų diapazoną, kurį norite išvalyti. Įsitikinkite, kad pasirinkote ir lentelės antraštes, jei jos yra.
- Skiltyje Duomenų įrankiai paspauskite mygtuką Pašalinti dublikatus .
- Dabar eikite į priekį ir patikrinkite atitinkamą stulpelį, kuris padės nustatyti, ar jūsų sąrašo įrašas nepasikartoja. Mūsų atveju, naudodami demonstracinį pardavimo tikslų duomenų rinkinį, naudosime pirmuosius 3 stulpelius, kad nustatytų pasikartojančias eilutes.
- Paspauskite OK .
- Bus rodomas pranešimas, nurodantis pašalintų ir lentelėje saugomų įrašų skaičių.
- Spustelėkite Gerai ir patikrinkite, ar pakeistas duomenų rinkinys yra teisingas.
- Jei esate patenkinti rezultatu, eikite į priekį ir išsaugokite failą. Kitu atveju galite anuliuoti pakeitimą ( Redaguoti >> Anuliuoti ).
Išplėstiniai patarimai:
- Panaši galimybė yra programoje „Excel PowerQuery“, kuri leidžia transformuoti reikšmingus didesnius duomenų rinkinius.
- Jei mokate Python kalbą, galite lengvai išmesti pasikartojančias eilutes iš duomenų rinkinio naudodami Pandas biblioteką.
Mėgaukitės savo duomenų analize 😉