Pipe In R: Tilslutningsfunktioner med Dplyr
I denne øvelse lærer du, hvordan du kæder funktioner sammen ved hjælp af dplyr-røroperatoren i programmeringssproget R.
I dette indlæg skal vi vise dig, hvordan du bruger Chi-square-testen i Excel til at sammenligne variabler. .
Chi-kvadrattesten for uafhængighed har to kategoriske variable. Vi vil finde ud af, om der er nogen sammenhæng mellem disse variable.
Vi vil bruge rammen for hypotesetestning. Hvis du ikke er bekendt med dette, så tjek den Bestil. Dette er en avanceret analyseteknik, der bruger , R og Python.
Til vores demo vil vi bruge et boligdatasæt i Excel. Vi skal få de faktiske værdier ved hjælp af pivottabellen og derefter sammenligne dette med de forventede værdier ved hjælp af formler.
Vi vil også tjekke signifikansniveauet på 95 %, og om der er en sammenhæng mellem klimaanlægget og det foretrukne område.
Indholdsfortegnelse
Brug af Chi-square-test i Excel til at sammenligne variabler
Lad os springe ind i Excel. Det er de boligpriser, der kom fra Journal of Applied Econometrics.
Indsæt en, og klik derefter på OK for at bruge en indekskolonne til at tælle observationer.
Fra pivottabelfelterne skal du trække ' id ' ind i sektionen Værdier. Vælg Tæl fra værdifeltindstillingerne, da disse alle er unikke værdier.
Det næste er at trække ' prefarea ' ind i kolonner og derefter trække ' airco ' ind i rækkesektionerne for at se de faktiske værdier.
Vi har i alt 546 observationer. De 298 er hverken aircondition eller foretrukket område, mens 53 er begge og så videre.
Lad os oprette to tabeller og mærke dem som Faktisk og Forventet .
For at få de forventede værdier for hverken klimaanlæg eller foretrukket område skal du gange D5 med B7 og derefter dividere det med D7 .
Det næste er at få den forventede værdi af enten klimaanlægget eller det foretrukne område, gange D5 med C7 og derefter dividere det med D7 .
Nu for den forventede værdi af enten det foretrukne område eller aircondition, gange D6 med B7 og divider det med D7 .
Lad os endelig beregne den forventede værdi af både aircondition og det foretrukne område. Multiplicer D6 med C7 , og divider det derefter med D7 .
Fremhæv området for de forventede værdier for at finde ud af summen, som skal være 546.
Nu vil vi finde sammenhængen mellem de faktiske og forventede værdier. Lad os tjekke, om de har tendens til at flytte sammen på en måde.
For at finde betydningen skal du skrive =CHISQ.TEST . Fremhæv området for de faktiske værdier, tilføj et komma, og fremhæv derefter området for de forventede værdier for at få p-værdien .
Baseret på resultatet er dette en lille tilfældig chance. Der synes at være en sammenhæng mellem den foretrukne områdevariabel og airconditionvariablen.
Konklusion
Dettest er en almindelig teknik, der hjælper os med at kende forskellen på kategori, og er et godt eksempel på A/B-test.
En anden ting at huske er, at observationerne skal være uafhængige. Baseret på vores eksempel ser vi på to binære variable, en specifik type kategorisk variabel.
Lad os endelig være opmærksomme på, at det kan blive svært, når vi har mange kategorier.
Jeg håber, at dette er noget, du kan bruge til A/B-test, hvad enten det er i eller Python.
Alt det bedste,
I denne øvelse lærer du, hvordan du kæder funktioner sammen ved hjælp af dplyr-røroperatoren i programmeringssproget R.
RANKX fra LuckyTemplates giver dig mulighed for at returnere rangeringen af et specifikt tal i hver tabelrække, der udgør en del af en liste over tal.
Lær, hvordan du adskiller en PBIX-fil for at udtrække LuckyTemplates-temaer og -billeder fra baggrunden og bruge den til at oprette din rapport!
Excel Formler Snydeark: Mellemvejledning
LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det
Lær, hvordan du installerer programmeringssproget Python i LuckyTemplates, og hvordan du bruger dets værktøjer til at skrive koder og vise billeder.
Lær, hvordan du beregner dynamiske fortjenstmargener ved siden af LuckyTemplates, og hvordan du kan få mere indsigt ved at grave dybere ned i resultaterne.
Lær, hvordan du sorterer felterne fra kolonner med udvidet datotabel korrekt. Dette er en god strategi at gøre for vanskelige felter.
I denne artikel gennemgår jeg, hvordan du kan finde dine topprodukter pr. region ved hjælp af DAX-beregninger i LuckyTemplates, herunder funktionerne TOPN og CALCUATE.
Lær, hvordan du bruger en uønsket dimension til flag med lav kardinalitet, som du ønsker at inkorporere i din datamodel på en effektiv måde.