Pipe In R: Koblingsfunksjoner med Dplyr
I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.
I denne opplæringen lærer du hvordan du utfører datamaskering for sensitiv informasjon i LuckyTemplates ved hjelp av Power Query . Du kan se hele videoen av denne opplæringen nederst på denne bloggen.
Datamaskering lar deg skjule eller fjerne konfidensiell eller identifiserbar informasjon i LuckyTemplates-datamodellene dine.
Diskusjonen vil fokusere på disse punktene:
Og denne grunnleggende modellen vil bli brukt som eksempel:
Når du anonymiserer dataene dine, må du først identifisere hvilken informasjon som er og ikke er en viktig løsning.
Innholdsfortegnelse
Anonymisering av et kundebord
I denne kundetabellen er ikke kolonnene Stat og Selskap essensielle løsninger.
Så du må gå tilog fjern disse to kolonnene, og la bare kunde-ID og navn være igjen.
I dette eksemplet må du anonymisere Navn- kolonnen.
For å starte, gå til Legg til kolonne, klikk på Indekskolonne, og velg deretter Fra 1.
Fra Indekskolonnen som ble lagt til, velg Legg til kolonne fra eksempler .
Navngi deretter kolonnen Kundenavn , og skriv deretter inn Kunde 1 som en informasjon. Power Query vil automatisk fortsette informasjonen.
Siden du har kolonnen Kundenavn som proxy for det faktiske kundenavnet, kan du nå fjerne Navn- og Indeks-kolonnene fra tabellen.
Anonymisering av en salgstabell
I denne salgstabellen er alle 3 kolonnene essensielle løsninger i dine data. Beløp- kolonnen har imidlertid informasjon som må anonymiseres.
For å gjøre dette, legg til en indekskolonne som starter fra 1.
Deretter oppretter du en egendefinert kolonne, gir den navnet salgsbeløp, og følger deretter denne formelen:
Denne formelen randomiserer området mellom 0 og 5000.
Med denne vil du da se en Salgsbeløp- kolonne med tilfeldige tall i tabellen din.
For å forhindre at disse tallene tilbakestilles til et vanlig tall, legger du til en annen indekskolonne og endrer deretter salgsbeløpstypen til Helnummer .
Denne faktatabellen har 5000 rader. Men selv om det er randomisert og anonymisert, må du fortsatt ta ut 90 % av dataene.
Så gå til Hjem-fanen og velg Fjern rader . Deretter velger du Fjern alternative rader .
Skriv inn følgende informasjon:
Dette vil fjerne 9 av hver 10 rad i tabellen din. Så fra 5000 sitter du igjen med 500 rader.
Bryte koblingen for å forhindre avmaskering av data
Du kan angre trinnene du har gjort i tabellen ved hjelp av Power Query. Det gjør den imidlertid utsatt for å bli tuklet med. Noen kan angre arbeidet ditt for å uanonymisere dataene dine.
Slik forhindrer du at det skjer:
Velg først Lukk og bruk .
Klikk deretter Kundetabellen i datavisningen og velg Kopier tabell .
Lim inn tabellen i det tilsvarende arket og fanen i MS Excel. Gjør det samme med salgstabellen og lagre filen. For dette eksemplet er filnavnet som brukes "Anonymiserte data".
Gå tilbake til datavisningen og slett kunde- og salgstabellen.
Når du har slettet kunde- og salgstabellen, trekker du deg tilbake og åpner informasjonen fra Excel-filen.
Deretter sjekker du kunde- og salgstabellene, og klikker på Transform data.
Salgstabellen har nå kolonner som er i et gyldig dato- og numerisk felt.
For Kunder-tabellen er kolonnene i et numerisk og tekstfelt.
For å sjekke om du har forhindret at dataene dine blir demaskert, gå tilbake til Kilde under de anvendte trinnene.
I formellinjen ser du at tabellen kommer fra Excel-filen.
Dette betyr at datamaskeringen ikke lenger kan angres.
Når du er ferdig med å implementere disse trinnene, klikker du Lukk og bruk.
Opprette den manglende lenken i datotabellen
Gå tilbake til modellen din og gjenskap den manglende koblingen til Dato-tabellen ved å dra Dato i Dato-tabellen til Dato i Sales-tabellen.
Du har nå en fullstendig anonymisert modell uten frykt for å avsløre konfidensielle data.
Konklusjon
Denne generelle tilnærmingen anonymiserer konfidensielle data ved å fjerne tall og navn, og ved å bryte koblingen ved å bruke Power Query Applied Steps gjennom Microsoft Excel-transformasjon.
Denne tilnærmingen maskerer imidlertid ikke bare dataene dine, den gjør den også uoppnåelig for andre mennesker.
Husk å bruke denne metoden for å beskytte og sikre konfidensiell informasjon i datamodellen din.
Beste ønsker,
I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.
RANKX fra LuckyTemplates lar deg returnere rangeringen til et spesifikt tall i hver tabellrad som utgjør en del av en liste med tall.
Lær hvordan du demonterer en PBIX-fil for å trekke ut LuckyTemplates-temaer og bilder fra bakgrunnen og bruke den til å lage rapporten din!
Excel Formulas Cheat Sheet: Mellomveiledning
LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det
Lær hvordan du installerer programmeringsspråket Python i LuckyTemplates og hvordan du bruker verktøyene til å skrive koder og vise visuelle elementer.
Lær hvordan du beregner dynamiske fortjenestemarginer ved siden av LuckyTemplates og hvordan du kan få mer innsikt ved å grave dypere inn i resultatene.
Lær hvordan du sorterer feltene fra kolonner med utvidet datotabell på riktig måte. Dette er en god strategi å gjøre for vanskelige felt.
I denne artikkelen går jeg gjennom hvordan du kan finne de beste produktene dine per region ved å bruke DAX-beregninger i LuckyTemplates, inkludert TOPN- og CALCUATE-funksjonene.
Lær hvordan du bruker en søppeldimensjon for flagg med lav kardinalitet som du ønsker å inkludere i datamodellen din på en effektiv måte.