Pipe In R: Tilslutningsfunktioner med Dplyr
I denne øvelse lærer du, hvordan du kæder funktioner sammen ved hjælp af dplyr-røroperatoren i programmeringssproget R.
I denne tutorial vil jeg vise dig, hvordan en kraftfuld data-outlier- og anomalitypeanalyse ved hjælp af dynamiske outlier-triggerpunkter. Du kan se den fulde video af denne tutorial nederst på denne blog.
Hvad er vigtigheden af dynamiske outliers?
Nå, se på dette eksempel.
Se på tallet 10.000 i punktdiagrammet. Hvis salget var over 10.000 eller mere end 30 % i et bestemt kvartal eller kvartal, ville det blive betragtet som en outlier.
Denne indsigt er især relevant for banker eller forsikringsselskaber, der har kreditkontrol, eller for fabrikker, der ønsker at kende antallet af defekte kontra ikke-defekte varer, som de producerer. Disse dataudlignere er dog normalt statiske tal.
Der er lejligheder, hvor outliers vil være mere nyttige, hvis de var dynamiske, eller at de kan ændres automatisk med en simpel brug af en slicer og endda når der skiftes fra en tidsramme til en anden.
Sådan gør du det.
Indholdsfortegnelse
Gennemgang af de statiske formler
Målet er at gøre 10.000 og 30% afvigelser dynamiske. Dette vil gøre dig i stand til at afgøre, hvilke kunder der er outliers i et bestemt kvartal.
Du vil være i stand til at vælge i en udsnitsmaskine for at kende triggerpunkterne.
I dette punktdiagram kan du bore i ikke-outliers og outliers, fordi det er en dynamisk beregning.
For dette eksempel ermål er nøglen.
Nu skal du oprette en anden foranstaltning, der ligner denne. Og de to ting, du skal være opmærksom på og justere, er Outlier Sales og Non-Outlier Sales .
Jeg har oprettet en helt ny målegruppe, der indeholder nye formler, hvoraf en af dem har kaldt Dynamic Non-Outlier Sales .
Du skal sub i forskellige mængder og mål inde i formlen for at få dette til at fungere på en dynamisk måde.
Dette er hoveddelen af formlen:
I hver enkelt af disse formler er der en OutlierSalesMin og OutlierMarginsMin . Det er henholdsvis de 10.000 og de 30 %. Jeg vil bruge en arbejdsparameter og indsætte den i denne del af formlen.
Dette vil være et dynamisk tal baseret på dets valg. Og så vil du være i stand til at se diagrammet bevæge sig dynamisk baseret på et udsnitsvalg.
Oprettelse af nye dynamiske parametre
Lad os gå til modelleringsområdet og klikke på Ny parameter .
Navngiv den nye parameter Sales Outliers . Skifttil 20.0000 og stigningen til 1.000, så den kan justeres på en granulær måde. Sørg for, at afkrydsningsfeltet Tilføj udsnit på sidens afkrydsningsfelt er markeret, og klik derefter på OK.
Når du kigger på siden, vil du se, at udskæreren nu er dynamisk.
Se nu i den nyoprettede tabel kaldet Sales Outliers . Træk Sales Outliers-værdien til siden, og skift den til en anden visualisering.
Jeg vil oprette en anden parameter kaldet Margin Outliers . Skift datatypen til decimaltal. Max er 0,45 eller 45 % , og stigningen vil være 0,05 eller 5 %. Skift standard til 0,3 eller 30 %.
Du kan se, at Margin Outliers nu vises i felter-ruden i højre side. Igen skal du trække Margin Outliers-værdien ind på siden og ændre den til en anden visualisering.
Inden vi fortsætter, lad os først rette formateringen.
Ændre marginoutliers-værdien til en procentdel.
Ændre Sales Outliers-værdien til Dollars.
Nu er der to tiltag. Salgs -outliers-værdien og margin-outliers-værdien .
Ændring af de statiske formler til dynamiske
Den næste ting at gøre er at sub i de nye værdier til det korrekte sted inde i formlerne.
Nu lægger disse variabler tingene ud på en langt mere effektiv måde sammenlignet med at sprænge alt ind i formlen.
For den dynamiske outlier-salgsformel skal du indtaste Sales Outliers-værdi .
Gør det samme for Marginer, og indtast Margin Outliers Value .
Kopier derefter denne redigerede del af formlen og underordnet den i formlen Dynamic Non-Outlier Sales .
Tryk derefter på enter. Dette tal revurderes nu til skæremaskinerne.
Få diagrammet til at vise dynamiske outliers
Den sidste ting at gøre er at kopiere formlen for Salgsgruppering , vælge Ny mål for at oprette en ny formel og indsætte den der. Denne nye formel kaldes Dynamic Outliers . Udskift nu indholdet med de nye dynamiske formler, Dynamic Outliers Sales og Dynamic Non-Outlier Sales .
Vælg diagrammet. Nu, i stedet for Salgsgruppering , skal du erstatte det med Dynamic Outliers .
Se nu på diagrammet. Du kan se, at det nu dynamisk kan ændres baseret på, hvad der er valgt ved hjælp af sliceren.
Det er nu nemmere at vide, hvilke punkter der er Outliers, og hvilke der er ikke-outliers.
Du kan også ændre tidsrammen og triggerpunkter. Du kan ændre det over sommer- og vinterperioden, eller i tilfælde, hvor der kan være lidt nedetid med dit udstyr.
Konklusion
Der er så mange måder, du kan bruge denne teknik på.
Jeg håber, at denne tutorial har ryddet op i dine spørgsmål vedrørende dynamiske outliers.
Med lidt øvelse vil du nemt kunne bruge disse teknikker i dine egne modeller og analyser.
Vi tales snart med dig.
I denne øvelse lærer du, hvordan du kæder funktioner sammen ved hjælp af dplyr-røroperatoren i programmeringssproget R.
RANKX fra LuckyTemplates giver dig mulighed for at returnere rangeringen af et specifikt tal i hver tabelrække, der udgør en del af en liste over tal.
Lær, hvordan du adskiller en PBIX-fil for at udtrække LuckyTemplates-temaer og -billeder fra baggrunden og bruge den til at oprette din rapport!
Excel Formler Snydeark: Mellemvejledning
LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det
Lær, hvordan du installerer programmeringssproget Python i LuckyTemplates, og hvordan du bruger dets værktøjer til at skrive koder og vise billeder.
Lær, hvordan du beregner dynamiske fortjenstmargener ved siden af LuckyTemplates, og hvordan du kan få mere indsigt ved at grave dybere ned i resultaterne.
Lær, hvordan du sorterer felterne fra kolonner med udvidet datotabel korrekt. Dette er en god strategi at gøre for vanskelige felter.
I denne artikel gennemgår jeg, hvordan du kan finde dine topprodukter pr. region ved hjælp af DAX-beregninger i LuckyTemplates, herunder funktionerne TOPN og CALCUATE.
Lær, hvordan du bruger en uønsket dimension til flag med lav kardinalitet, som du ønsker at inkorporere i din datamodel på en effektiv måde.