Datové sady v Pandách s ProfileReport() | Python v LuckyTemplates

Jednou z nejčastějších otázek, se kterou se jako datový analytik setkáte, je, jaký je nejlepší způsob, jak prozkoumat daný soubor dat. To je důležité především tehdy, chcete-li dát všechna data dohromady do sestavy, kterou budete snadno interpretovat vy nebo váš tým. V tomto tutoriálu ukážu, jak můžete efektivně prozkoumat datové sady v Pandas pomocí ProfileReport(). Celé video tohoto tutoriálu si můžete prohlédnout ve spodní části tohoto blogu.

Když dostanete soubor dat, co uděláte? Jak prozkoumáváte soubor dat? Především, pokud to chcete dát dohromady do snadno čitelné zprávy pro sebe, pro spolupracovníky atd., musíte zvážit spoustu věcí.

Nejprve přemýšlejte o tom, jaké druhy proměnných to jsou, protože to ovlivní, jak je analyzujete a jak s nimi zacházíte. Data znamenají to, co je dáno. Takže to, co chybí, budou data, která nemáme. Další věcí je vizualizace těchto vztahů. Jak vypadají? Tuto vizualizační sílu chceme využívat brzy a často.

Jedná se o mnoho vzájemně propojených složitých otázek. Dobrá věc je, že je k dispozici tato funkce profilování, která nám tyto odpovědi poskytne. Podívejme se na to všechno v Pythonu.

Obsah

Prozkoumejte datové sady v Pandas pomocí funkce ProfileReport().

Nejprve načteme datovou sadu.

Datové sady v Pandách s ProfileReport() |  Python v LuckyTemplates

Poté z pandas_profiling importujeme věc zvanou profilová zpráva. Nyní, pokud se zde zobrazí chyba, pravděpodobně jej budete muset nainstalovat. Používám Anacondu. Navrhuji, abyste to také použili. Spusťte to a pak to vytiskněte.

Datové sady v Pandách s ProfileReport() |  Python v LuckyTemplates

Tak tady to je. Máme přehled . To nám dává rozpis typů proměnných. Máme statistiku datového souboru. Vidíme počet řádkových sloupců, tak dále a tak dále. Pěkné na této zprávě je, že je jako jediné kontaktní místo a také vypadá opravdu pěkně. Má velmi přitažlivou prezentaci.

Datové sady v Pandách s ProfileReport() |  Python v LuckyTemplates

Srolujeme sem dolů a máme. Získáme vizualizaci a můžeme přepínat další podrobnosti o proměnné. Máme vlajky, které upozorňují na věci, které mohou být trochu neobvyklé. Máme také tato upozornění a mnoho dalších funkcí, které nám poskytnou další informace. A to platí pro každou jednotlivou proměnnou.

Datové sady v Pandách s ProfileReport() |  Python v LuckyTemplates

Jak pokračujeme v rolování dolů, najdeme Interactions, kde jsou vytvořeny bodové grafy pro vizualizaci dat.

Datové sady v Pandách s ProfileReport() |  Python v LuckyTemplates

A pak tu máme Korelace , které shrnuly vztah.

Datové sady v Pandách s ProfileReport() |  Python v LuckyTemplates

Další je, které jsou velmi důležité. Jak vidíte, některé hodnoty zde chybí a chceme vědět proč. Tyto vizualizace nám k tomu mají pomoci. Můžeme se proklikat každým vizuálem a analyzovat data.

Datové sady v Pandách s ProfileReport() |  Python v LuckyTemplates

Nakonec tu máme ukázku. Mohli bychom to získat mnoha způsoby, ale stačí jen vytisknout několik prvních řádků, což je dobré vědět.

Datové sady v Pandách s ProfileReport() |  Python v LuckyTemplates




Závěr

Takto prozkoumáváte datové sady v Pandas pomocí funkce ProfileReport(). Existuje mnoho způsobů, jak data rozdělit na kousky. Přemýšlejte o všech kombinacích permutací dat. Tohle za vás nebude moct udělat všechno, ale je to opravdu dobrý začátek.

Když zkoumáme data, je to opravdu iterativní proces. Neexistuje žádná jednorázová magická pilulka, kterou bychom mohli chtít. ProfilerReport() je však opravdu skvělý nástroj. Získáváme spoustu informací a pouze jeden řádek kódu. Toto je bezplatný nástroj, takže doufám, že jej můžete použít ve své vlastní práci. Dejte nám vědět, jak to děláte.

Vše nejlepší!


Čo je to Power Query a jazyk M: podrobný prehľad

Čo je to Power Query a jazyk M: podrobný prehľad

Tento tutoriál poskytuje prehľad o editore Power Query a jazyku M na pracovnej ploche LuckyTemplates.

Vytvorte stránkovanú správu: Pridávanie textov a obrázkov

Vytvorte stránkovanú správu: Pridávanie textov a obrázkov

Zistite, ako vytvoriť stránkovanú správu, pridať texty a obrázky a potom exportovať správu do rôznych formátov dokumentov.

Funkcia SharePoint Automate | Predstavenie

Funkcia SharePoint Automate | Predstavenie

Zistite, ako používať funkciu automatizácie SharePointu na vytváranie pracovných postupov a ako pomôcť pri mikromanažovaní používateľov, knižníc a zoznamov SharePointu.

Vyriešte výzvu na analýzu dát s akcelerátorom LuckyTemplates

Vyriešte výzvu na analýzu dát s akcelerátorom LuckyTemplates

Zdokonaľte svoje zručnosti v oblasti vývoja zostáv zapojením sa do výzvy v oblasti analýzy údajov. Accelerator vám môže pomôcť stať sa super používateľom LuckyTemplates!

Spuštění součtů v LuckyTemplates pomocí DAX

Spuštění součtů v LuckyTemplates pomocí DAX

Naučte se, jak vypočítat průběžné součty v LuckyTemplates pomocí DAX. Průběžné součty vám umožní nezabřednout do žádného jednotlivého výsledku.

LuckyTemplates Dax proměnné jsou konstantní: Co to znamená?

LuckyTemplates Dax proměnné jsou konstantní: Co to znamená?

Pochopte koncept proměnných v jazyce DAX v rámci LuckyTemplates a důsledky proměnných pro způsob výpočtu vašich mír.

LuckyTemplates Sloping Chart: Prehľad

LuckyTemplates Sloping Chart: Prehľad

Získajte viac informácií o vlastnom vizuáli nazývanom graf LuckyTemplates Slope, ktorý sa používa na zobrazenie nárastu/zníženia pre jednu alebo viacero metrík.

Farebné motívy LuckyTemplates pre jednotné vizualizácie

Farebné motívy LuckyTemplates pre jednotné vizualizácie

Objavte farebné motívy v LuckyTemplates. Sú nevyhnutné, aby vaše zostavy a vizualizácie vyzerali a fungovali bez problémov.

Výpočet priemeru v LuckyTemplates: Izolácia výsledkov cez týždeň alebo cez víkend pomocou DAX

Výpočet priemeru v LuckyTemplates: Izolácia výsledkov cez týždeň alebo cez víkend pomocou DAX

Výpočet priemeru v LuckyTemplates možno vykonať mnohými spôsobmi, aby ste získali presné informácie pre vaše obchodné správy.

Motiv LuckyTemplates | Standardní motiv LuckyTemplates Desktop

Motiv LuckyTemplates | Standardní motiv LuckyTemplates Desktop

Pojďme se ponořit do standardního motivu LuckyTemplates a prohlédnout si některé funkce zabudované do samotné aplikace LuckyTemplates Desktop.