Tu je tipično vprašanje za analizo podatkov, ki ga občasno dobimo:
Imam preglednico z več kot 100.000 vrsticami Excelovo preglednico, ki vsebuje kup informacij o strankah, ki jih moram očistiti za dvojnike. Ocenjujem, da bom potreboval nekaj dni, da ročno počistim seznam. Kolega mi je rekel, da bom najverjetneje potreboval Excelov makro, da to naredim. Naš informatik, ki je seznanjen z razvojem makrov, je na dopustu, zato moram to rešiti sam. Ali obstaja način za rešitev te težave brez znanja programiranja?
Da, obstaja način, kako to rešiti v Excelu in ne bo treba biti obvladati programiranja v Visual Basicu. Pojdimo naprej in to res hitro rešimo namesto vas.
Izbrišite podvojene vrstice v Excelu
Tako se lahko znebite nepotrebnih vnosov v preglednici:
- Najprej naredite kopijo svojega delovnega zvezka, da boste imeli varnostno kopijo, če gre kaj narobe.
- Nato odprite preglednico Excel.
- V zgornjem traku pritisnite zavihek Podatki .
- Zdaj nadaljujte in izberite obseg podatkov, ki ga želite očistiti. Prepričajte se, da ste izbrali tudi glave tabele, če so na voljo.
- V razdelku Podatkovna orodja pritisnite gumb Odstrani dvojnike .
- Zdaj pa preverite ustrezen stolpec, ki vam bo pomagal ugotoviti, ali je vnos na vašem seznamu podvojen. V našem primeru bomo z uporabo našega predstavitvenega nabora podatkov o prodajnih ciljih uporabili prve 3 stolpce za prepoznavanje podvojenih vrstic.
- Pritisnite OK .
- Prikaže se sporočilo s podrobnostmi o številu odstranjenih vnosov in tistih, ki so shranjeni v tabeli.
- Pritisnite V redu in preverite pravilnost spremenjenega nabora podatkov.
- Če ste zadovoljni z rezultatom, nadaljujte in shranite datoteko. V nasprotnem primeru lahko razveljavite svojo spremembo ( Uredi >> Razveljavi ).
Napredni nasveti:
- Podobna zmožnost je na voljo v Excelu PowerQuery, ki vam omogoča preoblikovanje pomembnih večjih naborov podatkov.
- Če poznate jezik Python, lahko preprosto odstranite podvojene vrstice iz nabora podatkov s pomočjo knjižnice Pandas.
Uživajte v analizi podatkov 😉