Chi-Square-test i Excel: Sammenligning af variabler

I dette indlæg skal vi vise dig, hvordan du bruger Chi-square-testen i Excel til at sammenligne variabler. .

Chi-kvadrattesten for uafhængighed har to kategoriske variable. Vi vil finde ud af, om der er nogen sammenhæng mellem disse variable.

Vi vil bruge rammen for hypotesetestning. Hvis du ikke er bekendt med dette, så tjek den  Bestil. Dette er en avanceret analyseteknik, der bruger , R og Python.

Til vores demo vil vi bruge et boligdatasæt i Excel. Vi skal få de faktiske værdier ved hjælp af pivottabellen og derefter sammenligne dette med de forventede værdier ved hjælp af formler.

Vi vil også tjekke signifikansniveauet på 95 %, og om der er en sammenhæng mellem klimaanlægget og det foretrukne område.

Indholdsfortegnelse

Brug af Chi-square-test i Excel til at sammenligne variabler

Lad os springe ind i Excel. Det er de boligpriser, der kom fra Journal of Applied Econometrics.

Chi-Square-test i Excel: Sammenligning af variabler

Indsæt en, og klik derefter på  OK for at bruge en indekskolonne til at tælle observationer.

Chi-Square-test i Excel: Sammenligning af variabler

Fra pivottabelfelterne skal du trække ' id '  ind i sektionen Værdier. Vælg  Tæl  fra værdifeltindstillingerne, da disse alle er unikke værdier. 

Det næste er at trække ' prefarea ' ind i kolonner og derefter trække ' airco ' ind i rækkesektionerne for at se de faktiske værdier.

Vi har i alt 546 observationer. De 298 er hverken aircondition eller foretrukket område, mens 53 er begge og så videre.

Chi-Square-test i Excel: Sammenligning af variabler

Lad os oprette to tabeller og mærke dem som Faktisk og Forventet .

Chi-Square-test i Excel: Sammenligning af variabler

For at få de forventede værdier for hverken klimaanlæg eller foretrukket område skal du gange  D5  med  B7 og derefter dividere det med  D7 .

Chi-Square-test i Excel: Sammenligning af variabler

Det næste er at få den forventede værdi af enten klimaanlægget eller det foretrukne område, gange  D5  med  C7 og derefter dividere det med  D7 .

Chi-Square-test i Excel: Sammenligning af variabler

Nu for den forventede værdi af enten det foretrukne område eller aircondition, gange  D6  med  B7 og divider det med  D7 .

Chi-Square-test i Excel: Sammenligning af variabler

Lad os endelig beregne den forventede værdi af både aircondition og det foretrukne område. Multiplicer  D6  med  C7 , og divider det derefter med  D7 .

Chi-Square-test i Excel: Sammenligning af variabler

Fremhæv området for de forventede værdier for at finde ud af summen, som skal være 546.

Chi-Square-test i Excel: Sammenligning af variabler

Nu vil vi finde sammenhængen mellem de faktiske og forventede værdier. Lad os tjekke, om de har tendens til at flytte sammen på en måde.

For at finde betydningen skal du skrive  =CHISQ.TEST . Fremhæv området for de faktiske værdier, tilføj et komma, og fremhæv derefter området for de forventede værdier for at få  p-værdien .

Chi-Square-test i Excel: Sammenligning af variabler

Baseret på resultatet er dette en lille tilfældig chance. Der synes at være en sammenhæng mellem den foretrukne områdevariabel og airconditionvariablen.

Chi-Square-test i Excel: Sammenligning af variabler




Konklusion

Dettest er en almindelig teknik, der hjælper os med at kende forskellen på kategori, og er et godt eksempel på A/B-test.

En anden ting at huske er, at observationerne skal være uafhængige. Baseret på vores eksempel ser vi på to binære variable, en specifik type kategorisk variabel.

Lad os endelig være opmærksomme på, at det kan blive svært, når vi har mange kategorier.

Jeg håber, at dette er noget, du kan bruge til A/B-test, hvad enten det er i eller Python.

Alt det bedste,


Pipe In R: Tilslutningsfunktioner med Dplyr

Pipe In R: Tilslutningsfunktioner med Dplyr

I denne øvelse lærer du, hvordan du kæder funktioner sammen ved hjælp af dplyr-røroperatoren i programmeringssproget R.

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX fra LuckyTemplates giver dig mulighed for at returnere rangeringen af ​​et specifikt tal i hver tabelrække, der udgør en del af en liste over tal.

Udpakning af LuckyTemplates-temaer og -billeder fra PBIX

Udpakning af LuckyTemplates-temaer og -billeder fra PBIX

Lær, hvordan du adskiller en PBIX-fil for at udtrække LuckyTemplates-temaer og -billeder fra baggrunden og bruge den til at oprette din rapport!

Excel Formler Snydeark: Mellemvejledning

Excel Formler Snydeark: Mellemvejledning

Excel Formler Snydeark: Mellemvejledning

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

Python i LuckyTemplates: Sådan installeres og konfigureres

Python i LuckyTemplates: Sådan installeres og konfigureres

Lær, hvordan du installerer programmeringssproget Python i LuckyTemplates, og hvordan du bruger dets værktøjer til at skrive koder og vise billeder.

Beregning af dynamiske fortjenestemargener – nem analyse af LuckyTemplates med DAX

Beregning af dynamiske fortjenestemargener – nem analyse af LuckyTemplates med DAX

Lær, hvordan du beregner dynamiske fortjenstmargener ved siden af ​​LuckyTemplates, og hvordan du kan få mere indsigt ved at grave dybere ned i resultaterne.

Sortering af datotabelkolonner i LuckyTemplates

Sortering af datotabelkolonner i LuckyTemplates

Lær, hvordan du sorterer felterne fra kolonner med udvidet datotabel korrekt. Dette er en god strategi at gøre for vanskelige felter.

Find dine topprodukter for hver region i LuckyTemplates ved hjælp af DAX

Find dine topprodukter for hver region i LuckyTemplates ved hjælp af DAX

I denne artikel gennemgår jeg, hvordan du kan finde dine topprodukter pr. region ved hjælp af DAX-beregninger i LuckyTemplates, herunder funktionerne TOPN og CALCUATE.

Junk Dimension: Hvad er det, og hvorfor det er alt andet end junk

Junk Dimension: Hvad er det, og hvorfor det er alt andet end junk

Lær, hvordan du bruger en uønsket dimension til flag med lav kardinalitet, som du ønsker at inkorporere i din datamodel på en effektiv måde.