Komunikácia výskumu s R Notebookom – 2. časť

Dnes budeme pokračovať v téme komunikácie výskumu pomocou R Notebooku. Budeme pokračovať v práci na základnom rámci, ktorý môžete použiť na komunikáciu výsledkov výskumu pomocou R. Pre prvú časť tejto série, skontrolovať to .

Obsah

Tvorba hypotézy

Ďalším krokom v našej správe je vytvorenie hypotézy . Na table prehliadača vytvoríme ďalšiu sekciu a ostatné zbalíme, aby sme mohli vidieť prehľady na vysokej úrovni.

Pre hypotézu si napíšeme, že nie je rozdiel v predajnej cene počítačov s CD-ROM a bez neho.

Komunikácia výskumu s R Notebookom – 2. časť

Vytváranie metód v notebooku R

Prejdeme k metódam , ktoré sa budú zaoberať skutočnými technikami, ktoré použijeme na zodpovedanie tejto hypotézy. Možno nebudeme musieť robiť žiadnu inferenčnú štatistiku. V závislosti od publika budeme v tomto scenári robiť výskumnú správu na vysokej úrovni.

Povieme, že vykonáme vzorové testy na úrovni spoľahlivosti 95 % a vizuálne skontrolujeme distribúciu cien. Ak sú približne normálne, vykonáme test.

Komunikácia výskumu s R Notebookom – 2. časť

Po uložení našej hypotézy a metód ich môžeme vykresliť ako súbor HTML , dokument PDF alebo dokument programu Word na karte Náhľad .

Komunikácia výskumu s R Notebookom – 2. časť

Keď to pošleme ako HTML, toto uvidíme v poli renderu.

Komunikácia výskumu s R Notebookom – 2. časť

Hovorí sa tu, že výstup bol vytvorený, takže prejdeme do Prieskumníka súborov, aby sme to skontrolovali. Keď to otvoríme v našom súbore HTML, môžeme vidieť, že to vyzerá naozaj podobne ako to, čo sme mali v tlačidle Náhľad.

Komunikácia výskumu s R Notebookom – 2. časť

V tomto bode nevidíme žiadne chybové hlásenia a vidíme aj priestor na prispôsobenie. Pomocou týchto nástrojov s R Markdown a R Notebooks môžeme dokonca napísať celú knihu alebo webovú stránku .

Vráťme sa k nášmu scenáru a pokračujeme ďalej. Zapíšeme si metódy, ktoré použijeme, ako aj naše výsledky. V zásade otvorene získavame náš plán a dávame jasne najavo, že nehádžeme veci na stenu len preto, aby sme videli, čo sa na nás nalepí. Keď sa dostaneme k údajom, neimprovizujeme; vlastne máme plán.

Vyskúšať veľa rôznych vecí má nejakú výhodu, však? Ale v tomto prístupe zámerne hovoríme: "Toto urobíme a potom to urobíme."

Komunikácia výskumu s R Notebookom – 2. časť

Práca na popisnej štatistike v notebooku R

Urobme si popisnú štatistiku . Chceme zistiť cenu pre každú skupinu s CD-ROM a bez neho. Môžeme to urobiť niekoľkými spôsobmi. Nazveme toa priviesť tohto prevádzkovateľa potrubia. Ak nie ste oboznámení s operátorom potrubia, môžete si pozrieť zdroje, o ktorých som hovoril predtým.

Potom zhrnieme a spočítame záznamy , aby sme našli priemernú cenu = strednú cenu . Nakoniec budeme chcieť vytlačiť tento súhrn skupiny a potom spustiť toto.

Komunikácia výskumu s R Notebookom – 2. časť

A tu to máme. Teraz máme náš stôl.

Komunikácia výskumu s R Notebookom – 2. časť

Ako som už povedal, chceme vedieť, koľko pozorovaní je v každej skupine a aká je priemerná cena. Môžeme to urobiť úplne dynamickým pomocou inline referencie.

Urobíme skupinové zhrnutie a použijeme tidyverse operácie. Tento riadok odfiltrujeme a potom vezmeme jednu z týchto hodnôt a zmeníme ju na niečo, čo sa skutočne vykreslí v našom vloženom odkaze tu.

Komunikácia výskumu s R Notebookom – 2. časť

Po uložení prejdite do ukážky poznámkového bloku a pozrite si výsledok.

Komunikácia výskumu s R Notebookom – 2. časť

Komunikácia výskumu s R Notebookom – 2. časť

Budovanie vizualizácií v R Notebooku

R je veľmi dobre známy pre svoje vizualizačné schopnosti. Pre našu vizualizáciu použijeme ggplot . Cenu umiestnime na os X a potom vytvoríme histogram . Vytvoríme tiež malé násobky pre fazetu, čo je v ggplot vlastne celkom jednoduché .

Komunikácia výskumu s R Notebookom – 2. časť

Komunikácia výskumu s R Notebookom – 2. časť

Mohli by sme tu zmeniť veľa vecí, ako napríklad názov, pozadie, farbu atď. Keď to uložíme, môžeme vidieť zápletku. Toto momentálne nie je interaktívne, ale existuje veľa spôsobov, ako to urobiť interaktívnym v R. V tomto príklade robíme len statický graf.

Komunikácia výskumu s R Notebookom – 2. časť

Naše výsledky ukazujú niečo, čo vyzerá ako rozloženie zvonovej krivky, čo znamená, že by sme mali pokračovať v našej analýze.

Spustíme výsledky T-testu a vložíme ich do správy. Pridáme ďalší R kus a nazveme ho cd_test . Ak to spustíme teraz, výsledok bude obsahovať veľa informácií a bude veľmi ťažké z neho vytiahnuť jednotlivé prvky.

Použijeme adať to do tabuľkového formátu. Akonáhle urobíme poriadok cd_test , zmení všetko na peknú štruktúru tabuľky. Mohli by sme to tiež vytlačiť, aby sme to skutočne ukázali v našej správe.

Komunikácia výskumu s R Notebookom – 2. časť

Ďalšia vec, ktorú by sme mohli urobiť, je nájsť dolný a horný interval spoľahlivosti. Túto časť nechceme zobrazovať, pretože ide len o inscenáciu.

Komunikácia výskumu s R Notebookom – 2. časť

Celkovo to vyzerá ako živý a dynamický dokument a je to oveľa lepšie ako kopírovanie a vkladanie jednotlivých údajových bodov a tabuliek do zostavy. Môžete to poslať kolegovi a v ideálnom prípade môže kliknúť na ukážku, aby vedel, čo ste urobili, a mohol na tom stavať.

Koniec Záverom

Blížime sa ku koncu našej správy, takže napíšeme záver.

Komunikácia výskumu s R Notebookom – 2. časť

Mohli by sme sem zahrnúť aj prílohu, aby sme ukázali naše zdroje. Pekná vec na tom, že máte prílohu, je, že ak to niekomu predložíte alebo ukážete, spýta sa, kto je váš zdroj údajov alebo ako sa niečo meralo. To všetko sú platné otázky a mať prílohu so zdrojmi je skutočne užitočné, pretože potom môžete na prílohu len ukázať.

Komunikácia výskumu s R Notebookom – 2. časť

Mohli by sme zahrnúť aj obrázok a použiť alternatívny text . Toto je dobrá prax na v podstate opísanie toho, čo obrázok zobrazuje. Ak ste používateľom HTML, môžete tento obrázok vložiť pomocou HTML.

Komunikácia výskumu s R Notebookom – 2. časť

Záver

Pre tento tutoriál sme si prešli celú správu. Toto je veľmi hrubý návrh, ale podarilo sa nám použiť R Markdown na vytvorenie štruktúry pre našu výskumnú správu.

Začali sme rozprávaním o reprodukovateľnosti, kde je všetko zdokumentované. R Markdown a tento rámec môžete použiť na vytváranie vecí, ako sú webové stránky, knihy a blogy. Pomocou RStudio je možné vytvoriť takmer akýkoľvek druh produktu, ktorý potrebujete postaviť ako analytik.

Pre ďalšie čítanie si pokojne pozrite moju knihu s názvom. Toto je dobrý základný úvod do analýzy údajov a štatistickej analýzy pomocou programov Excel, Python a R. Mám tiež kurzy R pre používateľov LuckyTemplates . V určitom okamihu môžete vidieť aj tretí kurz v tejto sérii.

Komunikácia výskumu s R Notebookom – 2. časť

Dúfam, že ste sa z tohto tutoriálu R Notebook naučili nejaké veci a rád by som videl, ako nakoniec použijete tieto nástroje.

George Mount


Ako nainštalovať DAX Studio & Tabular Editor v LuckyTemplates

Ako nainštalovať DAX Studio & Tabular Editor v LuckyTemplates

Zistite, ako stiahnuť a nainštalovať DAX Studio a Tabular Editor 3 a ako ich nakonfigurovať na použitie v LuckyTemplates a v Exceli.

LuckyTemplates Vizualizácia tvarovej mapy pre priestorovú analýzu

LuckyTemplates Vizualizácia tvarovej mapy pre priestorovú analýzu

Tento blog obsahuje vizualizáciu Shape Map pre priestorovú analýzu v LuckyTemplates. Ukážem vám, ako môžete efektívne využiť túto vizualizáciu s jej funkciami a prvkami.

LuckyTemplates Finančné výkazníctvo: Prideľovanie výsledkov šablónam v každom jednom riadku

LuckyTemplates Finančné výkazníctvo: Prideľovanie výsledkov šablónam v každom jednom riadku

V tomto návode predstavujem jedinečný nápad týkajúci sa finančného výkazníctva, ktorý spočíva v prideľovaní výsledkov na vopred určené šablóny tabuliek v rámci LuckyTemplates.

DAX měří v LuckyTemplates pomocí Measure Branching

DAX měří v LuckyTemplates pomocí Measure Branching

Vytvářejte míry DAX v LuckyTemplates pomocí existujících mír nebo vzorců. Tomu říkám technika větvení opatření.

Najvýkonnejšie volanie funkcie v LuckyTemplates

Najvýkonnejšie volanie funkcie v LuckyTemplates

V tomto blogu preskúmajte množinu údajov LuckyTemplates, najvýkonnejšie volanie funkcií, ktoré vám prináša tisíce funkcií M a DAX na dosah ruky.

Techniky modelovania údajov na organizáciu opatrení DAX

Techniky modelovania údajov na organizáciu opatrení DAX

V dnešnom návode sa podelím o niekoľko techník modelovania údajov o tom, ako lepšie usporiadať vaše merania DAX pre efektívnejší pracovný tok.

LuckyTemplates Financial Dashboard: Kompletné tipy na prispôsobenie tabuľky

LuckyTemplates Financial Dashboard: Kompletné tipy na prispôsobenie tabuľky

LuckyTemplates je skvelý nástroj pre finančné výkazníctvo. Tu je návod, ako vytvoriť prispôsobené tabuľky pre váš finančný dashboard LuckyTemplates.

Osvedčené postupy toku jazyka Power Query

Osvedčené postupy toku jazyka Power Query

V tomto návode sa bude diskutovať o toku jazyka Power Query a o tom, ako môže pomôcť vytvoriť hladkú a efektívnu zostavu údajov.

LuckyTemplates vlastní ikony | Vizualizační technika PBI

LuckyTemplates vlastní ikony | Vizualizační technika PBI

Budu diskutovat o jedné z mých oblíbených technik kolem vlastních ikon LuckyTemplates, která používá vlastní ikony dynamickým způsobem ve vizuálech LuckyTemplates.

Vytváření tabulek LuckyTemplates pomocí funkce UNION & ROW

Vytváření tabulek LuckyTemplates pomocí funkce UNION & ROW

V tomto blogu vám ukážu, jak můžete vytvořit tabulky LuckyTemplates pomocí vzorce, který kombinuje funkci UNION a funkci ROW.