Hur man kommenterar i Python – En snabbguide för nybörjare
Hur man kommenterar i Python – En snabbguide för nybörjare
I den här handledningen får du lära dig hur du kör och tolkar t-testet med parade prover med hjälp av Excel. Du kan se hela videon av denna handledning längst ner på den här bloggen .
Det parade provet t-test kommer att kontrollera om det finns en skillnad i medelvärdet för observationer. Så vi har att göra med kvantitativa data mellan en tidsperiod och en annan. Vi har också att göra med tidsseriedata.
Det här kommer att bli ett hypotestest med alla tillbehör som hör till det. Om du vill lära dig mer om hur du gör ett hypotestest i Excel kan du kolla in min bok Advancing Into Analytics .
Vi kommer inte gå in för mycket på teorin, men vi kommer att använda analysverktygspaketet i Excel, där vi kommer att testa på 95 % signifikansnivå och använda en peer-reviewed datamängd från Plos One .
I grund och botten är det vi vill ta reda på om det finns en skillnad i medelvärdet för grupp 1 mellan tid 1 och tid 2. Vi ska försöka återskapa en forskningsstudie.
Innehållsförteckning
Exekvera & tolka T-test för parade prover
Låt oss gå vidare och dyka in i . Vi kan köra detta per provtest och sedan omgrupperar vi och går därifrån.
I dessa data är det individuella patienter. De mättes under en period som kallas Volym 1 och gavs sedan ytterligare en mätning i Volym 2 .
Vi måste känna till mätningarna vid båda perioderna annars kan vi inte använda dessa patienter eller dessa observationer. Det är en sak att veta om t-testet med parade prover.
Låt oss ta genomsnittet av volym 1 och volym 2 data och sedan få skillnaden mellan de två. Det ser ut som att Volym 2 är lite högre med 14.07.
Det fina med att använda hypotestestning är att vi verkligen kan gräva i det här och avgöra om det vi ser bara är en lyckträff eller inte.
Nästa sak att göra är att gå till avsnittet Data och sedan välja Data Analysis Tools . Om du inte är bekant med verktygspaketet kan du kolla in boken för att lära dig hur du installerar det eller göra en webbsökning.
Från alternativen, välj t-Test: Paired Two Sample for Means och klicka sedan på OK- knappen.
För det här fönstret måste vi ange två intervall.
För Variable 1 Range , välj hela intervallet av volym 1-data genom att trycka på CTRL+Skift+pil nedåt . Låt oss också välja hela intervallet för Volym 2 för fältet Variable 2 Range .
Vi fick samma antal observationer i varje grupp, vilket är vettigt eftersom vi behöver dessa observationer för varje patient.
Eftersom vi har etiketter i den första raden, låt oss markera kryssrutan Etiketter och sedan lämna den tom för Hypoteserad medelskillnad . Det kommer att anta att medelskillnaden är signifikant annorlunda än noll. Vi kan också kontrollera om det är annorlunda än 5 eller -10, men 0 är det vanligaste.
För utdataintervallet kan vi lägga detta i samma kalkylblad och klicka sedan på OK .
Märkbart är detta ett mycket menydrivet tillvägagångssätt för att hitta skillnaden på detta test. Vi kan se samma siffror som vi gjorde tidigare.
Därefter vill jag att du fokuserar din uppmärksamhet på P(T<=t)>- värdet, som är 0,751 . Det betyder att det förmodligen inte är någon signifikant skillnad även om denna siffra är lite högre statistiskt sett. Vi kan inte säga att det sannolikt är annorlunda än 0.
Återigen är målet att ta din analys till nästa nivå genom att tillämpa hypotestestning på den.
Slutligen, låt oss kolla in data för grupp 1.
Baserat på tabellen kan vi se från Plos One Journal att p-värdet är 0,751. Det betyder att vi kunde återskapa forskningsresultaten från denna rapport, vilket är fantastiskt!
Kudos till forskarna också för att deras data publiceras och görs tillgängliga för allmänheten så att vem som helst kan komma åt detta.
Oftast används det parade provets t-test när det finns en intervention, oavsett om det är inom medicin, marknadsföring eller utbildning. Därför är detta ofta ett samhällsvetenskapligt test att använda och veta om det har skett någon förändring i interventionen.
Men den svåra sidan av det är att vi måste ha observationerna för både före och efter intervention, vilket är svårt att göra ofta i affärsmiljöer.
Slutsats
Ett t-test med parade sampel är en statistisk procedur som används för att jämföra medelvärdet för två relaterade grupper eller prover. Det används ofta i situationer där du har två relaterade prover som du vill jämföra.
Detta gör det till ett lättillgängligt och bekvämt verktyg för forskare och analytiker som snabbt och exakt behöver jämföra två relaterade gruppers medel.
Sammantaget är detta ett viktigt verktyg för alla som arbetar med data och försöker dra meningsfulla slutsatser från den.
Med vänliga hälsningar,
George Mount
Hur man kommenterar i Python – En snabbguide för nybörjare
Denna handledning ger en översikt över Power Query Editor och M-språket på LuckyTemplates-skrivbordet.
Lär dig hur du skapar en sidnumrerad rapport, lägger till texter och bilder och sedan exporterar din rapport till olika dokumentformat.
Lär dig hur du använder SharePoint-automatiseringsfunktionen för att skapa arbetsflöden och hjälpa dig att mikrohantera SharePoint-användare, bibliotek och listor.
Finslipa dina färdigheter i rapportutveckling genom att gå med i en dataanalysutmaning. Acceleratorn kan hjälpa dig att bli en LuckyTemplates superanvändare!
Lär dig hur du beräknar löpande summor i LuckyTemplates med DAX. Löpande summor låter dig inte fastna i ett individuellt resultat.
Förstå konceptet med variabler i DAX inom LuckyTemplates och konsekvenserna av variabler för hur dina mått beräknas.
Lär dig mer om den anpassade visual som kallas LuckyTemplates Slope-diagram, som används för att visa ökning/minskning för en enstaka eller flera mätvärden.
Upptäck färgteman i LuckyTemplates. Dessa är viktiga för att dina rapporter och visualiseringar ska se ut och fungera sömlöst.
Att beräkna ett genomsnitt i LuckyTemplates kan göras på många sätt för att ge dig exakt information för dina affärsrapporter.