Pipe In R: Tilslutningsfunktioner med Dplyr
I denne øvelse lærer du, hvordan du kæder funktioner sammen ved hjælp af dplyr-røroperatoren i programmeringssproget R.
Når man arbejder med beregnede data, vil det nogle gange være nødvendigt at sammenligne forskellige datasæt. Jeg vil vise dig, hvordan du gør det ved at kombinere forskellige tabelfunktioner. Du kan se den fulde video af denne tutorial nederst på denne blog.
Detfunktion er den bedste ting at bruge i tilfælde som disse. Nogle vil måske også sige deter lige så nyttig til at sammenligne beregnede data. Men når du først finder ud af, hvordan du bruger INTERSECT , følger det, hvad du også vil kunne anvende på EXCEPT -funktionen i dine beregninger.
Indholdsfortegnelse
Eksempeldata
For at vise, hvad INTERSECT kan, vil jeg vise dig, hvordan du sammenligner kunder fra to forskellige tidsperioder.
I eksemplet nedenfor har jeg en dateskærer til at hjælpe mig med at finde den tidsramme, jeg har brug for. Jeg har også en kolonne for de stater, hvor kunderne afgiver deres ordrer. Selvfølgelig kan dette være en helt anden dimension afhængigt af den indsigt, du forsøger at få.
Jeg har også min samlede omsætning for hver stat, som også vises i visualiseringen.
Nu vil jeg se, hvor mange af de kunder, der foretog et køb på en bestemt dato sidste år, også foretog et køb på samme dato i år. Det betyder, at jeg kigger på to specifikke lister over kunder, der har foretaget et køb på samme dato, men i forskellige år . Derfra skal jeg finde ud af, hvor mange kunder der optræder på begge lister.
Sammenligning af kunder fra to tidsperioder
Før jeg kan sammenligne de to kundelister, skal jeg først komme med de samlede kunder .
Det samlede antal kunder inkluderer dem, der har foretaget køb i forskellige butikker i forskellige stater inden for den angivne tidsramme. Jeg brugte en simpel formel til at komme frem til dette resultat.
Jeg brugtefunktion, fordi den viser en enkelt liste over unikke værdier. I dette tilfælde vil den vise os de kunder, der har købt produkter på den angivne tidsramme.
Jeg brugte ogsåfungere. Dette vil tælle antallet af unikke værdier fra listen.
Jeg henviser til salgstabellen for denne foranstaltning.
Hvorfor ikke bruge kundetabellen i stedet?
Hvis jeg refererer direkte til kundetabellen, ender jeg kun med at tælle hver enkelt kunde uanset tidsrammen. Jeg skal sikre mig, at den rigtige kontekst bliver brugt. Ved at bruge Salgstabellen får jeg ikke kun kunderne, jeg får også information om hvor og hvornår de har foretaget deres køb.
Nu hvor jeg har det samlede antal kunder , kan jeg komme med listen over kunder fra samme dato, men sidste år. Det er her foranstaltningen bliver en smule mere kompliceret.
Lad mig gå ind på hver del af denne foranstaltning lidt efter lidt.
Husk, at jeg forsøger at ændre tabellens kontekst. Det er derfor, jeg vil brugefungere.
er en velkendt funktion, fordi jeg bruger den i mine eksempler det meste af tiden. Det ændrer konteksten for en specifik beregning. CALCULATETABLE ændrer på den anden side konteksten for en hel tabel .
Da jeg vil ændre tidsrammen, vil jeg brugefungere.
Ved at bruge CALCULATETABLE kan jeg tilføje filterparametre . Ved at bruge DATESBETWEEN- funktionen kan jeg zone ind på en tidsramme, der falder 365 dage underogdatoer. Kort sagt skubber det tidsrammen tilbage til sidste år og opretter endnu en liste over kunder derfra.
Igen bruger jeg COUNTROWS- funktionen til at beregne antallet af kunder, efter at de ekstra filtre er blevet anvendt.
Nu hvor jeg har to lister, kan jeg bringe de målinger, jeg lavede, ind i INTERSECT- funktionen.
INTERSECT-funktionen vil virtuelt se på listen, der henvises til. I dette tilfælde er det kundenavneindekset. Den vil gennemgå hver enkelt af disse kunder og sammenligne dem med den anden liste fra et år siden.
Når den sammenligner de beregnede data, ser den på dem, der vises på begge lister. For eksempel viser tabellen nedenfor, at 224 kunder foretog køb på samme dato på to forskellige år i Californien.
Konklusion
Forhåbentlig kan du nu forestille dig andre scenarier, hvor INTERSECT- funktionen kan bruges til at sammenligne to sæt beregnede data.
Du kan endda præsentere sammenligningen i procenter og anvende nogle forgreningsteknikker. Du kan se på de kunder, der ikke kom tilbage og sende noget markedsføringsmateriale ud til dem.
Dette viser virkelig, hvor meget indsigt du kan få, når du først har fået styr på at bruge forskellige DAX-funktioner i LuckyTemplates.
Alt det bedste,
I denne øvelse lærer du, hvordan du kæder funktioner sammen ved hjælp af dplyr-røroperatoren i programmeringssproget R.
RANKX fra LuckyTemplates giver dig mulighed for at returnere rangeringen af et specifikt tal i hver tabelrække, der udgør en del af en liste over tal.
Lær, hvordan du adskiller en PBIX-fil for at udtrække LuckyTemplates-temaer og -billeder fra baggrunden og bruge den til at oprette din rapport!
Excel Formler Snydeark: Mellemvejledning
LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det
Lær, hvordan du installerer programmeringssproget Python i LuckyTemplates, og hvordan du bruger dets værktøjer til at skrive koder og vise billeder.
Lær, hvordan du beregner dynamiske fortjenstmargener ved siden af LuckyTemplates, og hvordan du kan få mere indsigt ved at grave dybere ned i resultaterne.
Lær, hvordan du sorterer felterne fra kolonner med udvidet datotabel korrekt. Dette er en god strategi at gøre for vanskelige felter.
I denne artikel gennemgår jeg, hvordan du kan finde dine topprodukter pr. region ved hjælp af DAX-beregninger i LuckyTemplates, herunder funktionerne TOPN og CALCUATE.
Lær, hvordan du bruger en uønsket dimension til flag med lav kardinalitet, som du ønsker at inkorporere i din datamodel på en effektiv måde.