Čo je to Power Query a jazyk M: podrobný prehľad
Tento tutoriál poskytuje prehľad o editore Power Query a jazyku M na pracovnej ploche LuckyTemplates.
Jednou z nejčastějších otázek, se kterou se jako datový analytik setkáte, je, jaký je nejlepší způsob, jak prozkoumat daný soubor dat. To je důležité především tehdy, chcete-li dát všechna data dohromady do sestavy, kterou budete snadno interpretovat vy nebo váš tým. V tomto tutoriálu ukážu, jak můžete efektivně prozkoumat datové sady v Pandas pomocí ProfileReport(). Celé video tohoto tutoriálu si můžete prohlédnout ve spodní části tohoto blogu.
Když dostanete soubor dat, co uděláte? Jak prozkoumáváte soubor dat? Především, pokud to chcete dát dohromady do snadno čitelné zprávy pro sebe, pro spolupracovníky atd., musíte zvážit spoustu věcí.
Nejprve přemýšlejte o tom, jaké druhy proměnných to jsou, protože to ovlivní, jak je analyzujete a jak s nimi zacházíte. Data znamenají to, co je dáno. Takže to, co chybí, budou data, která nemáme. Další věcí je vizualizace těchto vztahů. Jak vypadají? Tuto vizualizační sílu chceme využívat brzy a často.
Jedná se o mnoho vzájemně propojených složitých otázek. Dobrá věc je, že je k dispozici tato funkce profilování, která nám tyto odpovědi poskytne. Podívejme se na to všechno v Pythonu.
Obsah
Prozkoumejte datové sady v Pandas pomocí funkce ProfileReport().
Nejprve načteme datovou sadu.
Poté z pandas_profiling importujeme věc zvanou profilová zpráva. Nyní, pokud se zde zobrazí chyba, pravděpodobně jej budete muset nainstalovat. Používám Anacondu. Navrhuji, abyste to také použili. Spusťte to a pak to vytiskněte.
Tak tady to je. Máme přehled . To nám dává rozpis typů proměnných. Máme statistiku datového souboru. Vidíme počet řádkových sloupců, tak dále a tak dále. Pěkné na této zprávě je, že je jako jediné kontaktní místo a také vypadá opravdu pěkně. Má velmi přitažlivou prezentaci.
Srolujeme sem dolů a máme. Získáme vizualizaci a můžeme přepínat další podrobnosti o proměnné. Máme vlajky, které upozorňují na věci, které mohou být trochu neobvyklé. Máme také tato upozornění a mnoho dalších funkcí, které nám poskytnou další informace. A to platí pro každou jednotlivou proměnnou.
Jak pokračujeme v rolování dolů, najdeme Interactions, kde jsou vytvořeny bodové grafy pro vizualizaci dat.
A pak tu máme Korelace , které shrnuly vztah.
Další je, které jsou velmi důležité. Jak vidíte, některé hodnoty zde chybí a chceme vědět proč. Tyto vizualizace nám k tomu mají pomoci. Můžeme se proklikat každým vizuálem a analyzovat data.
Nakonec tu máme ukázku. Mohli bychom to získat mnoha způsoby, ale stačí jen vytisknout několik prvních řádků, což je dobré vědět.
Závěr
Takto prozkoumáváte datové sady v Pandas pomocí funkce ProfileReport(). Existuje mnoho způsobů, jak data rozdělit na kousky. Přemýšlejte o všech kombinacích permutací dat. Tohle za vás nebude moct udělat všechno, ale je to opravdu dobrý začátek.
Když zkoumáme data, je to opravdu iterativní proces. Neexistuje žádná jednorázová magická pilulka, kterou bychom mohli chtít. ProfilerReport() je však opravdu skvělý nástroj. Získáváme spoustu informací a pouze jeden řádek kódu. Toto je bezplatný nástroj, takže doufám, že jej můžete použít ve své vlastní práci. Dejte nám vědět, jak to děláte.
Vše nejlepší!
Tento tutoriál poskytuje prehľad o editore Power Query a jazyku M na pracovnej ploche LuckyTemplates.
Zistite, ako vytvoriť stránkovanú správu, pridať texty a obrázky a potom exportovať správu do rôznych formátov dokumentov.
Zistite, ako používať funkciu automatizácie SharePointu na vytváranie pracovných postupov a ako pomôcť pri mikromanažovaní používateľov, knižníc a zoznamov SharePointu.
Zdokonaľte svoje zručnosti v oblasti vývoja zostáv zapojením sa do výzvy v oblasti analýzy údajov. Accelerator vám môže pomôcť stať sa super používateľom LuckyTemplates!
Naučte se, jak vypočítat průběžné součty v LuckyTemplates pomocí DAX. Průběžné součty vám umožní nezabřednout do žádného jednotlivého výsledku.
Pochopte koncept proměnných v jazyce DAX v rámci LuckyTemplates a důsledky proměnných pro způsob výpočtu vašich mír.
Získajte viac informácií o vlastnom vizuáli nazývanom graf LuckyTemplates Slope, ktorý sa používa na zobrazenie nárastu/zníženia pre jednu alebo viacero metrík.
Objavte farebné motívy v LuckyTemplates. Sú nevyhnutné, aby vaše zostavy a vizualizácie vyzerali a fungovali bez problémov.
Výpočet priemeru v LuckyTemplates možno vykonať mnohými spôsobmi, aby ste získali presné informácie pre vaše obchodné správy.
Pojďme se ponořit do standardního motivu LuckyTemplates a prohlédnout si některé funkce zabudované do samotné aplikace LuckyTemplates Desktop.