R Notebooky na komunikáciu výskumu

V tomto blogovom príspevku sa pozrieme na komunikáciu výskumu a prezentáciu týchto výsledkov pomocou R notebookov. Dúfame, že to, čo získate z tohto tutoriálu, je rámec, ktorý vám umožní nahlásiť a oznámiť akékoľvek výsledky výskumu pomocou notebookov R.

Toto má niekoľko veľkých výhod, najmä pokiaľ ide o myšlienku reprodukovateľného výskumu . Budeme diskutovať o tom, čo to znamená a ako to urobiť v notebookoch R.

R Notebooky na komunikáciu výskumu

Obsah

Čo je reprodukovateľnosť?

Myšlienka reprodukovateľnosti spočíva v tom, že ktokoľvek môže kontrolovať vaše zistenia a vzhľadom na vstupy a procesy, ktoré ste použili, by mal byť schopný prejsť celou vecou. Existuje niekoľko spôsobov, ako sa to môže prejaviť v súvislosti s našimi potrebami v oblasti analýzy údajov: prostredie, ktoré umožňuje reprodukovať veci, zaisťuje, že ľudia môžu vidieť, čo bolo pridané, možnosť jednoducho auditovať súbor a mať reprodukovateľného vydavateľa.

V ideálnom prípade môže niekto presne vidieť, ako ste sa dostali k správe a ako sa vygeneroval graf alebo tabuľka, ktorú ste použili, aby bolo všetko v plne reprodukovateľnom prostredí.

Možno sa teraz pýtate, ako do toho zapadá niečo ako LuckyTemplates alebo Excel . Povedal by som, že je to uprostred tohto reprodukovateľného pracovného postupu. Keď sa zamyslíme najmä nad dotazom na výkon , je to celkom dobré z hľadiska reprodukovateľnosti. Zamyslite sa nad aplikovanými krokmi , kde je veľmi zrejmé, že sú zahrnuté procesy.

Čo sa týka vizualizácií a reportov, tu sú veci trochu chlpatejšie. Notebooky R sú súčasťou RStudio. Na portáli LuckyTemplates máme kurz, ktorý vás rozbehne. Konkrétne ide o R Markdown a R Notebooks .

Ak teda poznáte poznámkový blok Jupyter , myšlienkou je, že dokážeme preložiť text a kód, aby sme vytvorili dokument rozprávania príbehov pre náš výskum.

Tieto výsledky budeme môcť vykresliť v množstve rôznych výstupov. Či už potrebujete vytvoriť PDF alebo ho vykresliť do HTML, R Notebooks možno použiť pre rôzne formáty súborov.

R Notebooky na komunikáciu výskumu

Ak chcete začať, otvorte svoj notebook R a prejdite na Súbor, Nový súbor a potom R Notebook v RStudio. Budeme pracovať so starším súborom údajov v zdrojoch s touto skutočne jednoduchou výskumnou otázkou:

Závisí vôbec cena počítača od toho, či má alebo nemá CD-ROM?

Táto otázka je zastaraná, ale všetci musíme niekde začať. Taktiež vložíme kostru výskumnej správy a predložíme výsledky výskumu pomocou tohto základného rámca.

R Notebooky na komunikáciu výskumu

Niečo také uvidíme v RStudio a toto sa nazýva súbor .rmd, čo je prípona súboru R markdown. To môže byť trochu rušivé, najmä ak na to nie ste zvyknutí, ale existuje spôsob, ako si prezrieť vyleštený konečný produkt.

R Notebooky na komunikáciu výskumu

Táto časť poznámkového bloku je metadáta nazývaná súbor YAML.

R Notebooky na komunikáciu výskumu

Po tejto časti sú tieto zadné texty, kam pôjdu vaše kódy. Potom je tu textová časť dokumentu pomocou R Markdown . Ak ste už predtým používali Markdown, R markdown je dosť podobný. Na označenie a vykreslenie našich textov môžeme použiť veci ako hviezdičky a znaky hash.

Poďme do R Studio a R Notebooks a potom si spolu prejdime túto analýzu. Kliknite na ozubené koliesko a uistite sa, že je tam uvedené Ukážka na table prehliadača .

R Notebooky na komunikáciu výskumu

Spustenie notebooku R

Klikneme na tlačidlo Preview a požiada nás o uloženie. Opäť ide o súbor RMD, takže ho budeme musieť najskôr uložiť. Na ľavej table uvidíme vykreslený výstup. Ak by sme tu niečo zmenili a povedali by sme niečo ako Počítačová analýza a pridali meno autora ako George Mount , bude to musieť byť v úvodzovkách.

Po kliknutí na Uložiť sa automaticky aktualizuje na toto.

R Notebooky na komunikáciu výskumu

Poďme sa teda pohrať s týmto. Už tu je niekoľko zástupných symbolov, čo je v poriadku. Prvá vec, ktorú urobíme, je napísať "Ovplyvňuje CD-ROM predajnú cenu?" Keď to uložíme, bude to Hlavička1. Ale ak to máme zmeniť na dve značky hash, zmení sa to na Header2 a bude menšie.

R Notebooky na komunikáciu výskumu

Ďalším krokom je urobiť Úvod , kde môžeme zadať, prečo na týchto veciach záleží. Napríklad môžeme povedať, že CD-ROM je ďalšia najlepšia vec alebo niečo podobné. Ak pracujete na spotrebiteľských správach alebo pracujete na marketingovom oddelení, snažíte sa pochopiť, aké funkcie sú skutočne dôležité alebo čo spotrebitelia hľadajú.

Zavoláme na balíky R a začneme. Jedna pekná vec, ktorú tu milujem, je, že v R Notebook môžeme skutočne používať HTML. Napríklad, ak chceme zanechať komentár pre seba, môžeme urobiť niečo takéto.

R Notebooky na komunikáciu výskumu

Keď to uložíme, vôbec sa to nezobrazí. Takže to nechávame len ako komentár v texte pre seba. Toto je niečo, čo by som si prial, aby sme mohli robiť na miestach, ako je MS Word.

Predstavujeme balíky v notebookoch R

Ďalším krokom je použitie tohto grafu kódu tu a pridanie niekoľkých nastavení. Môžeme použiť Python a SQL, ale v tomto príklade používame R.

Prečítame si všetky balíčky, ktoré potrebujeme. Ak ich v počítači nemáte, možno ich budete musieť nainštalovať.

R Notebooky na komunikáciu výskumu

Toto opäť nie je úplná správa. Prejdeme sa cez kostru, aby sme vám ukázali pár vecí, ktoré by ste mali vedieť o R Markdown.

Takže teraz vám predstavíme, odkiaľ získavame naše údaje a prečo sú dôležité. V tomto prípade by sme mohli povedať, že naším zdrojom je Journal of Applied Econometrics. Keď urobíme túto vec s hviezdičkou, zmení sa na kurzívu.

R Notebooky na komunikáciu výskumu

Potom si prečítame súbor v Exceli a použijeme R na jeho vloženie. Ako môžete vidieť, dáta už vyzerajú celkom dobre, čo je ďalšia skvelá vec na R Notebookoch.

R Notebooky na komunikáciu výskumu

V závislosti od výstupného formátu sa to môže dokonca zobraziť. Ak používate HTML, váš používateľ by si v skutočnosti mohol prelistovať údaje a vykonať nejakú základnú interakciu. Je skvelé, že to naozaj dokážeme v živých dokumentoch.

R Notebooky na komunikáciu výskumu

Pridanie dynamickej referencie do notebookov R

Teraz povedzme, že chceme do textu údajov zahrnúť dynamickú referenciu. Chceme, aby sa to pravidelne aktualizovalo, pretože to nemusí byť vždy rovnaké, keď sme v prehľade, však? Takže urobíme dynamickú referenciu tu v rade, priamo v texte.

Pre všetky tieto kódy existuje cheat sheet a referenčná príručka. Prejdite do Pomocníka a vyberte to pre R Markdown, aby ste mohli vyhľadať všetky rôzne nastavenia. Pravdepodobne nestojí za to, aby ste si ich zapamätali, pretože je ich veľa a namiesto toho môžete použiť toto.

R Notebooky na komunikáciu výskumu

Znovu vložíme časť R a zahrnieme FALSE , nrows a ncols .

R Notebooky na komunikáciu výskumu

Keď to bolo spustené a spustené, mohli by sme dokonca prejsť do prostredia R, aby sme videli, či sa zmenilo na objekty.

R Notebooky na komunikáciu výskumu

Ďalšia vec, ktorá je fajn, je, že ak len tak hádžete nápady a chcete vedieť, ako to bude v skutočnosti vyzerať, stačí použiť konzolu dole v spodnej časti. Môžeme to spustiť na konzole a uvidíme, ako vyzerá výstup.

R Notebooky na komunikáciu výskumu

Vráťme sa k nášmu zobrazovaciemu panelu. Teraz sa táto sekcia v prehľade vôbec nezobrazuje. Je to pekné, ak chcete použiť nejaký objekt, ale nechcete zobrazovať žiadny kód.

R Notebooky na komunikáciu výskumu

Tieto spätné texty používame na nrows a ncols, aby veci zostali dynamické. Ak máte správu vo formáte PDF a potrebujete tieto čísla automaticky zmeniť, namiesto ich tvrdého kódovania týždeň po týždni môžete použiť tieto vložené odkazy.

R Notebooky na komunikáciu výskumu

Sme v procese opätovného skúmania údajov a kontroly ceny počítačov.

R Notebooky na komunikáciu výskumu

Po spustení tohto kódu môžeme vidieť popisné štatistiky, ktoré sú všetky pekne naformátované. V závislosti od veľkosti údajov je dosť citlivý a reaktívny na veľkosť súboru.

R Notebooky na komunikáciu výskumu

Záver

V rámci tohto tutoriálu sme diskutovali o dôležitosti rozvoja reprodukovateľného výskumu a zefektívnenia procesu oznamovania výsledkov výskumu prostredníctvom používania notebookov R. Týmto spôsobom môžeme rýchlo a jednoducho reprodukovať pôvodné výsledky a spätne sledovať, ako boli odvodené. 

Prosím, dávajte pozor na pokračovanie tohto návodu v časti 2 tejto série.

George Mount


Ako nainštalovať DAX Studio & Tabular Editor v LuckyTemplates

Ako nainštalovať DAX Studio & Tabular Editor v LuckyTemplates

Zistite, ako stiahnuť a nainštalovať DAX Studio a Tabular Editor 3 a ako ich nakonfigurovať na použitie v LuckyTemplates a v Exceli.

LuckyTemplates Vizualizácia tvarovej mapy pre priestorovú analýzu

LuckyTemplates Vizualizácia tvarovej mapy pre priestorovú analýzu

Tento blog obsahuje vizualizáciu Shape Map pre priestorovú analýzu v LuckyTemplates. Ukážem vám, ako môžete efektívne využiť túto vizualizáciu s jej funkciami a prvkami.

LuckyTemplates Finančné výkazníctvo: Prideľovanie výsledkov šablónam v každom jednom riadku

LuckyTemplates Finančné výkazníctvo: Prideľovanie výsledkov šablónam v každom jednom riadku

V tomto návode predstavujem jedinečný nápad týkajúci sa finančného výkazníctva, ktorý spočíva v prideľovaní výsledkov na vopred určené šablóny tabuliek v rámci LuckyTemplates.

DAX měří v LuckyTemplates pomocí Measure Branching

DAX měří v LuckyTemplates pomocí Measure Branching

Vytvářejte míry DAX v LuckyTemplates pomocí existujících mír nebo vzorců. Tomu říkám technika větvení opatření.

Najvýkonnejšie volanie funkcie v LuckyTemplates

Najvýkonnejšie volanie funkcie v LuckyTemplates

V tomto blogu preskúmajte množinu údajov LuckyTemplates, najvýkonnejšie volanie funkcií, ktoré vám prináša tisíce funkcií M a DAX na dosah ruky.

Techniky modelovania údajov na organizáciu opatrení DAX

Techniky modelovania údajov na organizáciu opatrení DAX

V dnešnom návode sa podelím o niekoľko techník modelovania údajov o tom, ako lepšie usporiadať vaše merania DAX pre efektívnejší pracovný tok.

LuckyTemplates Financial Dashboard: Kompletné tipy na prispôsobenie tabuľky

LuckyTemplates Financial Dashboard: Kompletné tipy na prispôsobenie tabuľky

LuckyTemplates je skvelý nástroj pre finančné výkazníctvo. Tu je návod, ako vytvoriť prispôsobené tabuľky pre váš finančný dashboard LuckyTemplates.

Osvedčené postupy toku jazyka Power Query

Osvedčené postupy toku jazyka Power Query

V tomto návode sa bude diskutovať o toku jazyka Power Query a o tom, ako môže pomôcť vytvoriť hladkú a efektívnu zostavu údajov.

LuckyTemplates vlastní ikony | Vizualizační technika PBI

LuckyTemplates vlastní ikony | Vizualizační technika PBI

Budu diskutovat o jedné z mých oblíbených technik kolem vlastních ikon LuckyTemplates, která používá vlastní ikony dynamickým způsobem ve vizuálech LuckyTemplates.

Vytváření tabulek LuckyTemplates pomocí funkce UNION & ROW

Vytváření tabulek LuckyTemplates pomocí funkce UNION & ROW

V tomto blogu vám ukážu, jak můžete vytvořit tabulky LuckyTemplates pomocí vzorce, který kombinuje funkci UNION a funkci ROW.