R Notatbøker for formidling av forskning

I dette blogginnlegget skal vi se på å formidle forskning og presentere disse resultatene ved hjelp av R-notatbøker. Vi håper at det du får ut av denne opplæringen er et rammeverk for deg til å rapportere og kommunisere alle slags forskningsfunn ved hjelp av R-notatbøker.

Det er noen store fordeler ved å gjøre dette, spesielt når det kommer til ideen om reproduserbar forskning . Vi vil diskutere hva dette betyr og hvordan du gjør det i R-notatbøker.

R Notatbøker for formidling av forskning

Innholdsfortegnelse

Hva er reproduserbarhet?

Ideen med reproduserbarhet er at hvem som helst kan revidere funnene dine, og gitt inputene og prosessene du brukte, burde de kunne gå gjennom hele greia. Det er noen måter dette spiller inn for våre dataanalysebehov: et miljø som gjør ting reproduserbare, sørger for at folk kan se hva som ble bidratt, enkelt kunne revidere en fil og ha en reproduserbar utgiver.

Ideelt sett kan noen se nøyaktig hvordan du kom til rapporten og hvordan plottet eller tabellen du brukte ble generert slik at alt er i et fullt reproduserbart miljø.

Nå lurer du kanskje på hvordan noe som LuckyTemplates eller Excel passer inn i dette. Jeg vil si det er midtveis i denne reproduserbare arbeidsflyten. Når vi tenker på kraftspørring spesielt, er den ganske god på reproduserbarhet. Tenk på Applied Steps hvor det er veldig tydelig å se prosessene involvert.

Når det kommer til visualiseringer og rapporter, er det her ting blir litt hårete. R Notebooks er en del av RStudio. Vi har et kurs på LuckyTemplates-portalen for å komme deg i gang. Dette er spesielt snakk om R Markdown og R Notebooks spesielt.

Så hvis du er kjent med en Jupyter-notisbok , er ideen at vi er i stand til å blande tekst og kode for å lage et historiefortellingsdokument for forskningen vår.

Vi vil være i stand til å gjengi disse resultatene i en haug med forskjellige utdata. Enten du trenger å lage en PDF eller gjengi den til HTML, kan R Notebooks brukes til forskjellige filformater.

R Notatbøker for formidling av forskning

For å starte, åpne R-notatboken og gå til Fil, Ny fil og deretter R Notebook i RStudio. Vi skal jobbe med et eldre datasett i ressursene, med dette veldig enkle forskningsspørsmålet:

Er prisen på en datamaskin i det hele tatt avhengig av om den har en CD-ROM eller ikke?

Dette spørsmålet er utdatert, men vi må alle starte et sted. Vi vil også sette skjelettet til en forskningsrapport og presentere forskningsfunnene ved hjelp av dette grunnleggende rammeverket.

R Notatbøker for formidling av forskning

Vi vil se noe slikt i RStudio, og dette er det som kalles en .rmd-fil, som er en R markdown-filtype. Dette kan være litt skurrende, spesielt hvis du ikke er vant til det, men det er en måte å forhåndsvise det polerte sluttproduktet på.

R Notatbøker for formidling av forskning

Denne delen av notatboken er metadataene kalt YAML-filen.

R Notatbøker for formidling av forskning

Etter den delen er disse baktekstene hvor kodene dine vil gå. Så er det tekstdelen av dokumentet med R Markdown . Hvis du har brukt Markdown før, er R markdown ganske lik. Vi kan bruke ting som stjerner og hasjtegn for å markere og gjengi tekstene våre.

La oss gå til R Studio og R Notebooks, og deretter gå gjennom denne analysen sammen. Klikk på tannhjulet og sørg for at det står Forhåndsvisning i visningsruten .

R Notatbøker for formidling av forskning

Starte en R-notatbok

Vi klikker på forhåndsvisningsknappen og den vil be oss om å lagre den. Igjen, dette er en RMD-fil, så vi må lagre den først. Over på venstre rute ser vi den gjengitte utgangen. Nå, hvis vi skulle endre noe her og si noe som Dataanalyse og legge til et forfatternavn som George Mount , må det gå i anførselstegn.

Når vi klikker på Lagre , oppdateres den automatisk til dette.

R Notatbøker for formidling av forskning

Så la oss leke med dette. Det er allerede et par plassholdere her, noe som er greit. Det første vi skal gjøre er å skrive "Påvirker en CD-ROM salgsprisen?" Når vi lagrer dette, blir det Header1. Men hvis vi skal gjøre dette om til to hash-merker, blir det til Header2 og det blir mindre.

R Notatbøker for formidling av forskning

Det neste trinnet er å gjøre en introduksjon , der vi kan legge inn hvorfor dette er viktig. For eksempel kan vi si at CD-ROM er det nest beste eller noe sånt. Hvis du jobber med forbrukerrapporter eller jobber i en markedsavdeling, prøver du å få en følelse av hvilke funksjoner som virkelig er viktige eller hva forbrukerne ser etter.

Vi ringer til R-pakker og setter i gang. Den ene fine tingen jeg elsker her er at vi faktisk kan bruke HTML i R Notebook. Hvis vi for eksempel vil legge igjen en kommentar til oss selv, kan vi gjøre noe slikt.

R Notatbøker for formidling av forskning

Når vi lagrer dette, vises det ikke i det hele tatt. Så vi overlater bare dette som en kommentar til oss selv i teksten. Dette er noe jeg skulle ønske vi kunne gjøre på steder som MS Word.

Vi introduserer pakkene i R-notebooks

Det neste trinnet er å bruke dette kodeplottet her og legge til et par innstillinger. Vi kan bruke Python og SQL, men vi bruker R for dette eksemplet.

Vi leser alle pakkene vi trenger. Hvis du ikke har disse på datamaskinen, må du kanskje installere dem.

R Notatbøker for formidling av forskning

Igjen, dette er ikke en fullstendig rapport. Vi går gjennom et skjelett for å vise deg et par ting du bør vite om R Markdown.

Så nå skal vi introdusere hvor vi får dataene våre, og hva som gjør det viktig. I dette tilfellet kan vi si at vår kilde er Journal of Applied Econometrics. Når vi gjør denne stjernetingen, vil den gjøre den til kursiv.

R Notatbøker for formidling av forskning

Så leser vi en fil i Excel og bruker R for å hente den inn. Som du ser ser dataene allerede ganske bra ut, noe som er en annen kul ting med R Notebooks.

R Notatbøker for formidling av forskning

Avhengig av utdataformatet kan dette til og med dukke opp. Hvis du bruker HTML, kan brukeren faktisk bla gjennom dataene og gjøre noen grunnleggende interaksjoner. Det er flott at vi virkelig kan gjøre dette i levende dokumenter.

R Notatbøker for formidling av forskning

Legge til en dynamisk referanse i R-notatbøker

La oss nå si at vi ønsker å inkludere en dynamisk referanse i teksten til dataene. Vi vil at dette skal oppdateres regelmessig fordi dette kanskje ikke er det samme hver gang vi er på rapporten, ikke sant? Så vi vil lage en dynamisk referanse her på linje, rett i teksten.

Det er et jukseark og referanseguide for alle disse kodene. Gå til Hjelp og velg den for R Markdown slik at du kan slå opp alle de forskjellige innstillingene. Det er sannsynligvis ikke verdt å prøve å lære dem utenat fordi det er mange og du kan bare bruke dette i stedet.

R Notatbøker for formidling av forskning

Vi setter inn R-delen igjen og inkluderer FALSE , nrows og ncols .

R Notatbøker for formidling av forskning

Når dette er kjørt og utført, kan vi til og med gå til R-miljøet for å se om det har blitt omgjort til objekter.

R Notatbøker for formidling av forskning

En annen ting som er fint er at hvis du bare slenger rundt deg med ideer og du vil vite hvordan det faktisk vil se ut, kan du bare bruke konsollen nede i bunnen. Vi kan kjøre den på konsollen og se hvordan utgangen ser ut.

R Notatbøker for formidling av forskning

Vi går tilbake til visningsruten. Nå vises ikke denne delen her i rapporten i det hele tatt. Dette er fint hvis du vil bruke et objekt, men ikke vil vise noe av koden.

R Notatbøker for formidling av forskning

Vi bruker disse baktekstene på nrows og ncols for å holde ting dynamisk. Hvis du har en PDF-rapport og du trenger å endre disse tallene automatisk, i stedet for å hardkode dem uke etter uke, kan du bruke disse innebygde referansene.

R Notatbøker for formidling av forskning

Vi er i ferd med å utforske dataene på nytt og sjekke prisen på datamaskinene.

R Notatbøker for formidling av forskning

Når vi kjører denne koden, kan vi se den beskrivende statistikken som alle er pent formatert. Avhengig av størrelsen på dataene, er den ganske responsiv og reaktiv på størrelsen på filen.

R Notatbøker for formidling av forskning

Konklusjon

For denne opplæringen har vi diskutert viktigheten av å utvikle reproduserbar forskning og effektivisere prosessen med å formidle forskningsresultater gjennom bruk av R Notebooks. På denne måten kan vi raskt og enkelt reprodusere de opprinnelige resultatene og spore tilbake for å finne ut hvordan de ble utledet. 

Se opp for fortsettelsen av denne opplæringen i del 2 av denne serien.

George Mount


LuckyTemplates What-If-parameterfunksjon

LuckyTemplates What-If-parameterfunksjon

Denne bloggen introduserer den nye funksjonen i LuckyTemplates, What-If-analyseparameteren. Du vil se hvordan det gjør alt raskt og enkelt for scenarioanalysen din.

Bruk LuckyTemplates Mål forgrening for å sjekke om marginene dine øker ettersom inntektene vokser

Bruk LuckyTemplates Mål forgrening for å sjekke om marginene dine øker ettersom inntektene vokser

Finn ut hvordan du kan finne ut om inntektsveksten din er god ved å sjekke om marginene dine økte ved å bruke LuckyTemplates som måler forgrening.

LuckyTemplates Parameters Via Query Editor

LuckyTemplates Parameters Via Query Editor

Lær og forstå hvordan du kan lage og bruke LuckyTemplates Parameters som er en kraftig funksjon i spørringsredigereren.

Rundt stolpediagram – en visualisering for dashbordet ditt

Rundt stolpediagram – en visualisering for dashbordet ditt

Denne opplæringen vil diskutere hvordan du lager et rundt søylediagram ved hjelp av Charticulator. Du vil lære hvordan du designer dem for LuckyTemplates-rapporten.

PowerApps funksjoner og formler | En introduksjon

PowerApps funksjoner og formler | En introduksjon

Lær hvordan du bruker PowerApps-funksjoner og -formler for å forbedre funksjonaliteten og endre atferd i Power Apps-lerretsappen vår.

Pipe In R: Koblingsfunksjoner med Dplyr

Pipe In R: Koblingsfunksjoner med Dplyr

I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.

RANKX Deep Dive: A LuckyTemplates DAX-funksjon

RANKX Deep Dive: A LuckyTemplates DAX-funksjon

RANKX fra LuckyTemplates lar deg returnere rangeringen til et spesifikt tall i hver tabellrad som utgjør en del av en liste med tall.

Trekker ut LuckyTemplates-temaer og bilder fra PBIX

Trekker ut LuckyTemplates-temaer og bilder fra PBIX

Lær hvordan du demonterer en PBIX-fil for å trekke ut LuckyTemplates-temaer og bilder fra bakgrunnen og bruke den til å lage rapporten din!

Excel Formulas Cheat Sheet: Mellomveiledning

Excel Formulas Cheat Sheet: Mellomveiledning

Excel Formulas Cheat Sheet: Mellomveiledning

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det