Pipe In R: Anslutningsfunktioner med Dplyr
I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.
I den här handledningen lär du dig hur du utför datamaskering för känslig information i LuckyTemplates med hjälp av Power Query . Du kan se hela videon av denna handledning längst ner på den här bloggen.
Datamaskering låter dig dölja eller ta bort konfidentiell eller identifierbar information i dina LuckyTemplates-datamodeller.
Diskussionen kommer att fokusera på dessa punkter:
Och denna grundläggande modell kommer att användas som exempel:
När du anonymiserar dina uppgifter måste du först identifiera vilken information som är och inte är en nödvändig lösning.
Innehållsförteckning
Anonymisera ett kundbord
I denna kundtabell är kolumnerna Stat och Företag inte väsentliga lösningar.
Så du måste gå tilloch ta bort dessa två kolumner, lämna bara kund-ID och namn.
I det här exemplet måste du anonymisera kolumnen Namn .
För att börja, gå till Lägg till kolumn, klicka på Indexkolumn och välj sedan Från 1.
Välj Lägg till kolumn från exempel i Indexkolumnen som lades till .
Namnge sedan kolumnen Kundnamn och skriv sedan in Kund 1 som information. Power Query fortsätter automatiskt med informationen.
Eftersom du har kolumnen Kundnamn som proxy för det faktiska kundnamnet kan du nu ta bort kolumnerna Namn och Index från tabellen.
Anonymisera en försäljningstabell
I denna försäljningstabell är alla tre kolumnerna viktiga lösningar i din data. Kolumnen Belopp har dock information som behöver anonymiseras.
För att göra detta, lägg till en Index-kolumn som börjar från 1.
Skapa sedan en anpassad kolumn, döp den till försäljningsbelopp och följ sedan den här formeln:
Denna formel randomiserar intervallet mellan 0 och 5000.
Med detta kommer du sedan att se en kolumn Försäljningsbelopp med slumptal i din tabell.
För att förhindra att dessa siffror återställs till ett gemensamt nummer, lägg till ytterligare en indexkolumn och ändra sedan typen Försäljningsbelopp till Helnummer .
Denna faktatabell har 5 000 rader. Men även om det har randomiserats och anonymiserats behöver du fortfarande ta ut 90 % av datan.
Så gå till fliken Hem och välj Ta bort rader . Välj sedan Ta bort alternativa rader .
Ange följande information:
Detta tar bort 9 av var 10:e rad i din tabell. Så från 5 000 har du 500 rader kvar.
Bryter länken för att förhindra avmaskering av data
Du kan ångra stegen du har gjort för din tabell med hjälp av Power Query. Det gör det dock känsligt för att bli manipulerad. Någon kan ångra ditt arbete för att göra din data unanonymiserad.
Så här förhindrar du att det händer:
Välj först Stäng och använd .
Klicka sedan på Kundtabellen i datavyn och välj Kopiera tabell .
Klistra in tabellen i motsvarande ark och flik i MS Excel. Gör samma sak med tabellen Försäljning och spara filen. För det här exemplet är filnamnet som används "Anonymiserade data".
Gå tillbaka till datavyn och ta bort Kund- och försäljningstabellen.
När du har tagit bort kund- och försäljningstabellen drar du tillbaka och öppnar informationen från Excel-filen.
Kontrollera sedan tabellerna Kunder och Försäljning och klicka på Transformera data.
Tabellen Försäljning har nu kolumner som finns i ett giltigt datum- och numeriskt fält.
För tabellen Kunder finns kolumnerna i ett numeriskt och textfält.
För att kontrollera om du lyckats förhindra att din data demaskeras, gå tillbaka till Källa under Tillämpade steg.
I formelfältet ser du att tabellen kommer från Excel-filen.
Detta innebär att datamaskeringen inte längre kan ångras.
När du är klar med att implementera dessa steg klickar du på Stäng och tillämpa.
Skapar den saknade länken i datumtabellen
Gå tillbaka till din modell och återskapa den saknade länken till datumtabellen genom att dra datumet i datumtabellen till datumet i försäljningstabellen.
Du har nu en helt anonymiserad modell utan rädsla för att avslöja konfidentiell data.
Slutsats
Detta allmänna tillvägagångssätt anonymiserar konfidentiell data genom att ta bort nummer och namn och genom att bryta länken med Power Query Applied Steps genom Microsoft Excel-transformation.
Men detta tillvägagångssätt maskerar inte bara dina data, det gör det också oåtkomligt för andra människor.
Kom ihåg att använda den här metoden för att skydda och säkra konfidentiell information i din datamodell.
Med vänliga hälsningar,
I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.
RANKX från LuckyTemplates låter dig returnera rankningen av ett specifikt nummer i varje tabellrad som utgör en del av en lista med nummer.
Lär dig hur du tar isär en PBIX-fil för att extrahera LuckyTemplates-teman och bilder från bakgrunden och använda den för att skapa din rapport!
Excel Formler Fuskblad: Mellanvägledning
LuckyTemplates Kalendertabell: Vad är det och hur man använder det
Lär dig hur du installerar programmeringsspråket Python i LuckyTemplates och hur du använder dess verktyg för att skriva koder och visa bilder.
Lär dig hur du beräknar dynamiska vinstmarginaler vid sidan av LuckyTemplates och hur du kan få fler insikter genom att gräva djupare i resultaten.
Lär dig hur du sorterar fälten från en utökad datumtabells kolumner korrekt. Detta är en bra strategi att göra för svåra fält.
I den här artikeln går jag igenom hur du kan hitta dina toppprodukter per region med hjälp av DAX-beräkningar i LuckyTemplates, inklusive TOPN- och CALCULATE-funktionerna.
Lär dig hur du använder en skräpdimension för flaggor med låg kardinalitet som du vill infoga i din datamodell på ett effektivt sätt.