Kommunikation af forskning med R Notebook – Del 2

I dag vil vi fortsætte med emnet formidling af forskning ved hjælp af R Notebook. Vi vil fortsætte med at arbejde på en grundlæggende ramme, som du kan bruge til at kommunikere forskningsresultater ved hjælp af R. For første del af denne serie om, tjek det ud.

Indholdsfortegnelse

At lave hypotesen

Det næste trin i vores rapport er at lave hypotesen . Vi vil oprette endnu en sektion i fremviserruden og skjule de andre, så vi kan se rapporter på højt niveau.

Til hypotesen vil vi skrive, at der ikke er nogen forskel i salgsprisen på computere med og uden cd-rom.

Kommunikation af forskning med R Notebook – Del 2

Oprettelse af metoderne i R Notebook

Vi går videre til metoderne , som vil tage fat på de faktiske teknikker, som vi vil bruge til at besvare denne hypotese. Vi behøver måske ikke lave nogen form for slutningsstatistikker. Afhængigt af publikum vil vi lave en forskningsrapport på højt niveau i dette scenarie.

Vi vil sige, at vi vil udføre prøvetest på 95 % konfidensniveau, og vi vil visuelt inspicere distributionen af ​​priser. Hvis de er nogenlunde normale, udfører vi testen.

Kommunikation af forskning med R Notebook – Del 2

Når vi har gemt vores hypotese og metoder, kan vi gengive dem som en HTML-fil , PDF-dokument eller Word-dokument fra fanen Eksempel .

Kommunikation af forskning med R Notebook – Del 2

Når vi sender dette ud som HTML, er det det, vi vil se i gengivelsesboksen.

Kommunikation af forskning med R Notebook – Del 2

Der står her, at outputtet er blevet oprettet, så lad os gå over til vores File Explorer for at tjekke dette ud. Når vi har åbnet dette i vores HTML-fil, kan vi se, at det ligner det, vi havde i Preview-knappen.

Kommunikation af forskning med R Notebook – Del 2

Vi ser ingen fejlmeddelelser på nuværende tidspunkt, og vi ser også plads til tilpasning. Vi kan endda skrive en hel bog eller et websted ved hjælp af disse værktøjer med R Markdown og R Notebooks .

Lad os vende tilbage til vores manuskript og fortsætte. Vi vil skrive ned de metoder, vi vil bruge, samt vores resultater. Vi er dybest set åbne for vores plan, og vi gør det klart, at vi ikke smider ting på en væg bare for at se, hvad der hænger ved. Vi improviserer ikke, når vi kommer til dataene; vi har faktisk en plan.

Der er en fordel ved at prøve mange forskellige ting, ikke? Men i denne tilgang siger vi målrettet: "Dette er, hvad vi vil gøre, og så vil vi gøre det."

Kommunikation af forskning med R Notebook – Del 2

Arbejder på beskrivende statistik i R Notebook

Lad os lave vores beskrivende statistik . Vi ønsker at finde prisen for hver gruppe med og uden cd-rom. Der er et par måder, vi kan gøre dette på. Vi kalder detteog tag denne røroperatør ind. Hvis du ikke er bekendt med røroperatøren, kan du tjekke de ressourcer, som jeg talte om tidligere.

Derefter vil vi opsummere og tælle poster for at finde den gennemsnitlige pris = middelpris . Til sidst vil vi gerne udskrive denne gruppeoversigt og derefter køre denne.

Kommunikation af forskning med R Notebook – Del 2

Og her går vi. Vi har nu vores bord.

Kommunikation af forskning med R Notebook – Del 2

Som jeg sagde tidligere, vil vi gerne vide, hvor mange observationer der er i hver gruppe, og hvad gennemsnitsprisen er. Vi kan gøre dette totalt dynamisk med en inline reference.

Vi laver et grupperesumé og bruger ryddelige operationer. Vi filtrerer denne række og tager derefter en af ​​disse værdier og forvandler den til noget, der rent faktisk gengives i vores inline-reference her.

Kommunikation af forskning med R Notebook – Del 2

Når du har gemt, skal du gå til Preview Notebook for at se resultatet.

Kommunikation af forskning med R Notebook – Del 2

Kommunikation af forskning med R Notebook – Del 2

Bygningsvisualiseringer i R Notebook

R er meget kendt for sin visualiseringsevne. Til vores visualisering bruger vi ggplot . Vi sætter prisen på X-aksen og opretter derefter et histogram . Vi vil også oprette små multipler til facetten, hvilket faktisk er ret nemt at gøre i ggplot .

Kommunikation af forskning med R Notebook – Del 2

Kommunikation af forskning med R Notebook – Del 2

Vi kunne ændre en masse ting her, såsom titel, baggrund, farve osv. Når vi har gemt dette, kan vi se plottet. Dette er ikke interaktivt lige nu, men der er mange måder at gøre det interaktivt i R. For dette eksempel laver vi kun et statisk plot.

Kommunikation af forskning med R Notebook – Del 2

Vores resultater viser noget, der ligner en klokkekurvefordeling, hvilket betyder, at vi bør fortsætte med vores analyse.

Vi kører T-testresultaterne og tilslutter dem til rapporten. Vi tilføjer endnu en R-chunk og kalder den cd_test . Hvis vi kører dette nu, vil resultatet indeholde en masse information, og det vil være meget svært at trække enkelte elementer ud af det.

Vi bruger enat sætte dette i et tabelformat. Når vi har lavet en ryddelig cd_test , vil den gøre alt til en flot tabelstruktur. Vi kunne også udskrive dette for faktisk at vise det i vores rapport.

Kommunikation af forskning med R Notebook – Del 2

En anden ting, vi kunne gøre, er at finde de nedre og øvre konfidensintervaller. Vi ønsker ikke at vise denne del, fordi dette kun er iscenesættelse.

Kommunikation af forskning med R Notebook – Del 2

Samlet set ligner det et levende og dynamisk dokument og er så meget bedre end at kopiere og indsætte individuelle datapunkter og tabeller i en rapport. Du kan sende dette til en kollega, og ideelt set kan de bare klikke på Preview for at vide, hvad du gjorde og være i stand til at bygge videre på dette.

Slutter med en konklusion

Vi nærmer os slutningen af ​​vores rapport, så vi skriver konklusionen.

Kommunikation af forskning med R Notebook – Del 2

Vi kunne også inkludere et appendiks her for at vise vores ressourcer. Det gode ved at have et bilag er, at hvis du ender med at præsentere dette eller vise det til nogen, vil de spørge, hvem din datakilde er, eller hvordan noget blev målt. Det er alle gyldige spørgsmål, og det er virkelig nyttigt at have et bilag med ressourcer, for så kan du bare pege på bilaget.

Kommunikation af forskning med R Notebook – Del 2

Vi kunne også inkludere et billede og bruge alternativ tekst . Dette er en god praksis til grundlæggende at beskrive, hvad et billede viser. Hvis du er HTML-bruger, kan du indlejre dette billede ved hjælp af HTML.

Kommunikation af forskning med R Notebook – Del 2

Konklusion

Til denne tutorial gennemgik vi faktisk en hel rapport. Dette er et meget groft udkast, men vi har formået at bruge R Markdown til at skabe en struktur for vores forskningsrapport.

Vi startede med at tale om reproducerbarhed, hvor alt er dokumenteret. Du kan bruge R Markdown og denne ramme til at skabe ting som websteder, bøger og blogs. Næsten enhver form for produkt, som du skal bygge som analytiker, kan oprettes ved hjælp af RStudio.

For yderligere læsning er du velkommen til at tjekke min bog kaldet. Dette er en god, grundlæggende introduktion til dataanalyse og statistisk analyse ved hjælp af Excel, Python og R. Jeg har også kurser om R for LuckyTemplates-brugere . Du vil muligvis også se et tredje kursus i denne serie på et tidspunkt.

Kommunikation af forskning med R Notebook – Del 2

Jeg håber, du har lært nogle ting fra denne R Notebook-tutorial, og ville elske at se, hvordan du ender med at bruge disse værktøjer.

George Mount


Pipe In R: Tilslutningsfunktioner med Dplyr

Pipe In R: Tilslutningsfunktioner med Dplyr

I denne øvelse lærer du, hvordan du kæder funktioner sammen ved hjælp af dplyr-røroperatoren i programmeringssproget R.

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX fra LuckyTemplates giver dig mulighed for at returnere rangeringen af ​​et specifikt tal i hver tabelrække, der udgør en del af en liste over tal.

Udpakning af LuckyTemplates-temaer og -billeder fra PBIX

Udpakning af LuckyTemplates-temaer og -billeder fra PBIX

Lær, hvordan du adskiller en PBIX-fil for at udtrække LuckyTemplates-temaer og -billeder fra baggrunden og bruge den til at oprette din rapport!

Excel Formler Snydeark: Mellemvejledning

Excel Formler Snydeark: Mellemvejledning

Excel Formler Snydeark: Mellemvejledning

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

Python i LuckyTemplates: Sådan installeres og konfigureres

Python i LuckyTemplates: Sådan installeres og konfigureres

Lær, hvordan du installerer programmeringssproget Python i LuckyTemplates, og hvordan du bruger dets værktøjer til at skrive koder og vise billeder.

Beregning af dynamiske fortjenestemargener – nem analyse af LuckyTemplates med DAX

Beregning af dynamiske fortjenestemargener – nem analyse af LuckyTemplates med DAX

Lær, hvordan du beregner dynamiske fortjenstmargener ved siden af ​​LuckyTemplates, og hvordan du kan få mere indsigt ved at grave dybere ned i resultaterne.

Sortering af datotabelkolonner i LuckyTemplates

Sortering af datotabelkolonner i LuckyTemplates

Lær, hvordan du sorterer felterne fra kolonner med udvidet datotabel korrekt. Dette er en god strategi at gøre for vanskelige felter.

Find dine topprodukter for hver region i LuckyTemplates ved hjælp af DAX

Find dine topprodukter for hver region i LuckyTemplates ved hjælp af DAX

I denne artikel gennemgår jeg, hvordan du kan finde dine topprodukter pr. region ved hjælp af DAX-beregninger i LuckyTemplates, herunder funktionerne TOPN og CALCUATE.

Junk Dimension: Hvad er det, og hvorfor det er alt andet end junk

Junk Dimension: Hvad er det, og hvorfor det er alt andet end junk

Lær, hvordan du bruger en uønsket dimension til flag med lav kardinalitet, som du ønsker at inkorporere i din datamodel på en effektiv måde.