Pipe In R: Anslutningsfunktioner med Dplyr
I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.
I den här handledningen får du lära dig hur du kör och tolkar t-testet med parade prover med hjälp av Excel. Du kan se hela videon av denna handledning längst ner på den här bloggen .
Det parade provet t-test kommer att kontrollera om det finns en skillnad i medelvärdet för observationer. Så vi har att göra med kvantitativa data mellan en tidsperiod och en annan. Vi har också att göra med tidsseriedata.
Det här kommer att bli ett hypotestest med alla tillbehör som hör till det. Om du vill lära dig mer om hur du gör ett hypotestest i Excel kan du kolla in min bok Advancing Into Analytics .
Vi kommer inte gå in för mycket på teorin, men vi kommer att använda analysverktygspaketet i Excel, där vi kommer att testa på 95 % signifikansnivå och använda en peer-reviewed datamängd från Plos One .
I grund och botten är det vi vill ta reda på om det finns en skillnad i medelvärdet för grupp 1 mellan tid 1 och tid 2. Vi ska försöka återskapa en forskningsstudie.
Innehållsförteckning
Exekvera & tolka T-test för parade prover
Låt oss gå vidare och dyka in i . Vi kan köra detta per provtest och sedan omgrupperar vi och går därifrån.
I dessa data är det individuella patienter. De mättes under en period som kallas Volym 1 och gavs sedan ytterligare en mätning i Volym 2 .
Vi måste känna till mätningarna vid båda perioderna annars kan vi inte använda dessa patienter eller dessa observationer. Det är en sak att veta om t-testet med parade prover.
Låt oss ta genomsnittet av volym 1 och volym 2 data och sedan få skillnaden mellan de två. Det ser ut som att Volym 2 är lite högre med 14.07.
Det fina med att använda hypotestestning är att vi verkligen kan gräva i det här och avgöra om det vi ser bara är en lyckträff eller inte.
Nästa sak att göra är att gå till avsnittet Data och sedan välja Data Analysis Tools . Om du inte är bekant med verktygspaketet kan du kolla in boken för att lära dig hur du installerar det eller göra en webbsökning.
Från alternativen, välj t-Test: Paired Two Sample for Means och klicka sedan på OK- knappen.
För det här fönstret måste vi ange två intervall.
För Variable 1 Range , välj hela intervallet av volym 1-data genom att trycka på CTRL+Skift+pil nedåt . Låt oss också välja hela intervallet för Volym 2 för fältet Variable 2 Range .
Vi fick samma antal observationer i varje grupp, vilket är vettigt eftersom vi behöver dessa observationer för varje patient.
Eftersom vi har etiketter i den första raden, låt oss markera kryssrutan Etiketter och sedan lämna den tom för Hypoteserad medelskillnad . Det kommer att anta att medelskillnaden är signifikant annorlunda än noll. Vi kan också kontrollera om det är annorlunda än 5 eller -10, men 0 är det vanligaste.
För utdataintervallet kan vi lägga detta i samma kalkylblad och klicka sedan på OK .
Märkbart är detta ett mycket menydrivet tillvägagångssätt för att hitta skillnaden på detta test. Vi kan se samma siffror som vi gjorde tidigare.
Därefter vill jag att du fokuserar din uppmärksamhet på P(T<=t)>- värdet, som är 0,751 . Det betyder att det förmodligen inte är någon signifikant skillnad även om denna siffra är lite högre statistiskt sett. Vi kan inte säga att det sannolikt är annorlunda än 0.
Återigen är målet att ta din analys till nästa nivå genom att tillämpa hypotestestning på den.
Slutligen, låt oss kolla in data för grupp 1.
Baserat på tabellen kan vi se från Plos One Journal att p-värdet är 0,751. Det betyder att vi kunde återskapa forskningsresultaten från denna rapport, vilket är fantastiskt!
Kudos till forskarna också för att deras data publiceras och görs tillgängliga för allmänheten så att vem som helst kan komma åt detta.
Oftast används det parade provets t-test när det finns en intervention, oavsett om det är inom medicin, marknadsföring eller utbildning. Därför är detta ofta ett samhällsvetenskapligt test att använda och veta om det har skett någon förändring i interventionen.
Men den svåra sidan av det är att vi måste ha observationerna för både före och efter intervention, vilket är svårt att göra ofta i affärsmiljöer.
Slutsats
Ett t-test med parade sampel är en statistisk procedur som används för att jämföra medelvärdet för två relaterade grupper eller prover. Det används ofta i situationer där du har två relaterade prover som du vill jämföra.
Detta gör det till ett lättillgängligt och bekvämt verktyg för forskare och analytiker som snabbt och exakt behöver jämföra två relaterade gruppers medel.
Sammantaget är detta ett viktigt verktyg för alla som arbetar med data och försöker dra meningsfulla slutsatser från den.
Med vänliga hälsningar,
George Mount
I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.
RANKX från LuckyTemplates låter dig returnera rankningen av ett specifikt nummer i varje tabellrad som utgör en del av en lista med nummer.
Lär dig hur du tar isär en PBIX-fil för att extrahera LuckyTemplates-teman och bilder från bakgrunden och använda den för att skapa din rapport!
Excel Formler Fuskblad: Mellanvägledning
LuckyTemplates Kalendertabell: Vad är det och hur man använder det
Lär dig hur du installerar programmeringsspråket Python i LuckyTemplates och hur du använder dess verktyg för att skriva koder och visa bilder.
Lär dig hur du beräknar dynamiska vinstmarginaler vid sidan av LuckyTemplates och hur du kan få fler insikter genom att gräva djupare i resultaten.
Lär dig hur du sorterar fälten från en utökad datumtabells kolumner korrekt. Detta är en bra strategi att göra för svåra fält.
I den här artikeln går jag igenom hur du kan hitta dina toppprodukter per region med hjälp av DAX-beräkningar i LuckyTemplates, inklusive TOPN- och CALCULATE-funktionerna.
Lär dig hur du använder en skräpdimension för flaggor med låg kardinalitet som du vill infoga i din datamodell på ett effektivt sätt.