Textanalys med Python: Hur man identifierar delar av tal

I den här bloggen kommer vi att visa dig hur du använder Python för att identifiera delar av tal i textdata inom LuckyTemplates. Vi kommer att täcka stegen för att använda Python för textanalys och ge exempel och tips som hjälper dig att komma igång med dina egna textanalysprojekt. Du kan se hela videon av denna handledning längst ner på den här bloggen.

Innehållsförteckning

Källdata
Textanalys med Python
Fixar koden för textanalys i Python
Slutsats

Källdata

I den här handledningen kommer vi att använda ett out-of-the-box ordmoln som innehåller de texter som vi kommer att utvärdera. Detta visas på vänster sida av bilden nedan. På höger sida har vi filtren för att identifiera de olika delarna av talet, till exempel adjektiv eller verb.

Textanalys med Python: Hur man identifierar delar av tal

Vi kan filtrera bort ord som är adverb, substantiv, olika typer av substantiv eller verb och verbbaser. Detta är mycket användbart när du skapar en marknadsföringskampanj och letar efter ord i dina kundrecensioner.

Låt oss börja med att öppna vår redaktör.

I vår källdata har vi kolumner för ID, ålder, titel och recensionstext. Vi kommer att fokusera på kolumnen Granska text , och vi kommer att analysera den för att göra vår textanalys. Det finns även andra kategorier som kan vara användbara i vår analys.

Textanalys med Python: Hur man identifierar delar av tal

Textanalys med Python

Låt oss börja med den normala data som vi tog in. Det första vi ska göra är att filtrera raderna eftersom vi har mycket data, och när vi gör textanalys tar det tid.

För att filtrera våra data, ta de första 50 raderna för att göra textanalysen lite snabbare.

Textanalys med Python: Hur man identifierar delar av tal

När du har filtrerat bort, gå till Transform and Run script. Vi kommer att koda allt här eftersom det inte finns mycket kod.

Textanalys med Python: Hur man identifierar delar av tal

Importera paketen

Låt oss ta in två paket för vår Python-textanalys med vår editor. Vi kommer att "importera pandor som pd" , vårt datamanipuleringsbibliotek som ska sparas som variabel pd. Och sedan “ från textblob ” kommer vi att “ importera TextBlob” med ett versal mellan orden.

Vi kan alltid dokumentera vad vi gör genom att lägga en dokumentsträng. Låt oss skriva #bring in de väsentliga biblioteken ovanpå våra paket.

Textanalys med Python: Hur man identifierar delar av tal

Byter namn på variabeln

På den första raden i vårt skript finns den här raden från LuckyTemplates som säger att # 'dataset' innehåller indata för detta skript. Den här raden säger att vår data kallas ett dataset.

Så låt oss ändra det eftersom det tar för lång tid att skriva "dataset". Skriv in #change datasetvariabeln och df = dataset på nästa rad.

Textanalys med Python: Hur man identifierar delar av tal

Nu är det kortare att skriva vår variabel.

Gör textanalysen

Låt oss fortsätta med vår textanalys. Kom ihåg att våra recensionstexter finns i en kolumn med enskilda celler. Den här inställningen är inte till stor hjälp för oss eftersom vi vill ha alla texter tillsammans så att vi kan göra en analys av den.

Men vi vill inte att de ska sammanfogas utan ett mellanslag, så låt oss börja vår kod med ett mellanslag inom ett dubbla citattecken .

Låt oss sedan lägga till .join och isolera vår granskningstextkolumn genom att använda vår df -variabel, som innehåller datamängden. Skriv "Review Text" placerad inom en parentes som isolerar kolumnen.

Den här koden kommer att förena allt, men vi måste spara den så låt oss skapa en variabel som heter ord.

Textanalys med Python: Hur man identifierar delar av tal

När vi har samlat alla orden kan vi använda vår textklump för att börja analysera orden.

Det första du ska göra är att skapa våra orddelar med hjälp av klumpvariabeln som vi behöver för att skicka ut ord till en textklump. Vi kommer att använda den där textblobben och passera i texten, vilket är våra ord . Detta skrivs som blob = TextBlob(ord).

Nu när vi har den bloben kommer vi att ta den och skapa vår parts_of_speech -variabel med blob.tags . Taggarna kommer att vara förkortningarna för var och en av delarna av talet.

Vad vi ska göra härnäst är att spara detta som en dataram med Pandas som vi tog in. Låt oss kalla det vår data som är lika med pd.DataFrame och vi tar in våra parts_of_speech .

Textanalys med Python: Hur man identifierar delar av tal

Låt oss klicka på OK för att köra vår kod. Efter att ha kört vår kod bör vi få en tabell över våra variabler. Vi har datauppsättningen eller vår ursprungliga data. Vi har även våra data och df .

Textanalys med Python: Hur man identifierar delar av tal

Om du inte fick de avsedda resultaten visar vi dig de olika sätten att undvika vissa fel som du kan få i koden.

Fixar koden för textanalys i Python

Ibland kan vi behöva vara mycket tydliga när vi ändrar formatet på texten som vi är angelägna om.

Vi kan göra det genom att anropa vår df -variabel, isolera 'Review Text ' placerad inom en parentesnotation och sedan ändra typen till strängar med .astype('str') . Sedan är det bara att spara detta igen i variabeln df .

Textanalys med Python: Hur man identifierar delar av tal

Klicka på OK för att köra koden igen. Vi borde få samma resultat som vi fick tidigare.

Nu vill vi öppna vår data , den sista variabeln som vi tog in för att se hur det ser ut.

Textanalys med Python: Hur man identifierar delar av tal

Vi borde få alla våra ord uppdelade i orddelar. Vi har inte namngett våra kolumner ännu, men det kan vi enkelt göra.

Textanalys med Python: Hur man identifierar delar av tal

I den gamla versionen av samma textanalys kallade jag den första kolumnen som Word och den andra som Förkortning .

Textanalys med Python: Hur man identifierar delar av tal

I ordspråksfrågan tar vi in de faktiska orden som är för dessa förkortningar och kopplar samman dem alla.

Textanalys med Python: Hur man identifierar delar av tal

Låt oss nu stänga och ansöka .

Textanalys med Python: Hur man identifierar delar av tal

Stegen vi gjorde gjorde det möjligt för oss att filtrera igenom de olika delar av tal som vi identifierade med en enkel kod. Det ger oss den här visuella bilden i LuckyTemplates där vi enkelt kan filtrera vår text baserat på vilken kategori av tal de faller in i.

Textanalys med Python: Hur man identifierar delar av tal

Slutsats

Som , kan du stöta på behovet av att extrahera insikter och mening från stora mängder ostrukturerad textdata. Det du lärde dig är en användbar metod för att förstå textdata genom textanalys.

Nu kan du enkelt dela upp text i mindre enheter som ord och meningar och sedan analysera dessa enheter för mönster och samband. Du kan uppnå alla dessa mål med hjälp av textanalys i Python och LuckyTemplates.

Med vänliga hälsningar,

Lämna en kommentar

Skapa en datumtabell i LuckyTemplates

Ta reda på varför det är viktigt att ha en dedikerad datumtabell i LuckyTemplates och lär dig det snabbaste och mest effektiva sättet att göra det.

LuckyTemplates mobilrapporteringstips och tekniker

Denna korta handledning belyser LuckyTemplates mobilrapporteringsfunktion. Jag ska visa dig hur du kan utveckla rapporter effektivt för mobila enheter.

Professional Service Analytics-rapporter i LuckyTemplates

I denna LuckyTemplates Showcase går vi igenom rapporter som visar professionell serviceanalys från ett företag som har flera kontrakt och kundengagemang.

Vanliga SQL-funktioner: En översikt

Upptäck några vanliga SQL-funktioner som vi kan använda som sträng, datum och några avancerade funktioner för att bearbeta eller manipulera data.

Microsoft Power Platform-uppdateringar | Microsoft Ignite 2021

Gå igenom de viktigaste uppdateringarna för Power Apps och Power Automate och deras fördelar och konsekvenser för Microsoft Power Platform.

Fältparametrar och små multiplar i LuckyTemplates

I den här bloggen kommer vi att visa hur man lager fältparametrar med små multiplar för att skapa otroligt användbara insikter och bilder.

LuckyTemplates Skapa mall: Guide och tips

I den här handledningen kommer du att lära dig hur du skapar din perfekta LuckyTemplates-mall som är konfigurerad efter dina behov och preferenser.

LuckyTemplates Rank och anpassad gruppering

I den här bloggen kommer du att lära dig hur du använder LuckyTemplates ranknings- och anpassade grupperingsfunktioner för att segmentera en exempeldata och rangordna den enligt kriterier.

Punktdiagram: Avancerade anpassade bilder för LuckyTemplates

Lär dig hur du skapar och anpassar punktdiagram i LuckyTemplates, som huvudsakligen används för att mäta prestanda mot mål eller tidigare år.

Visar kumulativ total endast upp till ett visst datum i LuckyTemplates

I den här handledningen kommer jag att täcka en specifik teknik kring hur man visar Kumulativ total endast upp till ett specifikt datum i dina bilder i LuckyTemplates.