Lematisering i Python | En nybörjarguide

I den här handledningen kommer vi att diskutera lemmatisering i vilket är en metod som används för att gruppera de olika elementen i ett ord. Lemmatisering syftar också till att minska ordböjningen och fokuserar på att tillhandahålla grund- eller basformen till ett ord som är vad ordet lemma betyder.

Innehållsförteckning

Lematisering vs stamning

Lemmatisering liknar stemming som också fungerar för att minska böjningar i ord. Den enda skillnaden är att lemmatisering använder ordboksbaserade ord som resultat.

Å andra sidan tar stemming bara bort affixen från ett böjt ord, vilket kan resultera i ord som inte finns.

Till exempel, om vi använder stemming till ordet studier kommer det att ge ordet studi som en utdata eftersom det syftar till att ta bort suffixet es från ordet studier .

Å andra sidan, om lemmatisering används, kommer ordstudien att ges som ett resultat eftersom det fokuserar på att tillhandahålla basformen för ett ord.

Saker att tänka på när du använder lemmatisering

  • Den använder ordboksbaserade ord. Med termen lemma som betyder roten eller basformen av ett ord, syftar lemmatisering till att ge basformen för ett ord snarare än att bara ta bort böjningarna av ett ord.
  • Det beror helt på orddelar för att hitta ett basord. Utan att specificera talets delar kanske lemmatisering inte fungerar bra och du kanske inte får det resultat du letar efter.
  • Det är långsammare än att stamma men det är mer kraftfullt. Eftersom lemmatisering inte följer en algoritm för att prestera på ord och behovet av att tillhandahålla delar av tal, anses den vara långsammare än stemming. Men det är mer kraftfullt på ett sätt att det använder ordboksbaserade ord för resultat. 
  • Det har högre noggrannhet när det gäller att leta efter grundordet. Eftersom lemmatisering använder ordboksbaserade ord för att lägga ut resultat från ett böjt ord, har du större chanser att få korrekta utdata.

Förberedelsestadiet för lemmatisering i Python

Innan vi fortsätter med att implementera lemmatisering, låt oss börja med att importera Word- biblioteket från textblob .

Lematisering i Python |  En nybörjarguide

Efter det ska vi skapa ett ordobjekt. 

Lematisering i Python |  En nybörjarguide

För att skapa ett ordobjekt skapade vi en variabel med namnet w . Sedan lagrade vi Word-biblioteket som innehåller vårt ordobjekt som är octopi , pluralformen av ordet bläckfisk. Observera att när du skickar ett element med hjälp av Word-biblioteket är det viktigt att omsluta det elementet med enstaka citattecken.

Låt oss initiera variabeln w för att se om den innehåller ordobjektet som vi just skapade.

Lematisering i Python |  En nybörjarguide

När vi kör variabeln w får vi ordet objekt octopi som ett resultat.

Implementering av lemmatisering i Python

Därefter ska vi implementera lemmatisering genom att använda .lemmatize -funktionen. 

Lematisering i Python |  En nybörjarguide

I det här steget använde vi variabeln w som innehåller ordet objekt octopi och vi använde .lemmatize -funktionen för att tillämpa lemmatisering. Som ett resultat fick vi ordet bläckfisk som är roten eller basformen till ordet bläckfisk .

Efter det, låt oss försöka tillämpa lemmatisering med ordet bättre .

Lematisering i Python |  En nybörjarguide

I det föregående exemplet uppdaterade vi vårt ordobjekt från octopi till better . Sedan lemmatiserade vi det med .lemmatize -funktionen. Resultatet vi fick är alltså detsamma som ordet objekt som vi använde.

Genom att använda .lemmatize-funktionen kan du ändra sättet för dess lemmatisering genom att skicka in en del av tal. Som ett exempel, låt oss försöka skicka in a till .lemmatize-funktionen som står för adjektiv i orddelar. 

Lematisering i Python |  En nybörjarguide

Efter att ha lagt till en del av tal till .lemmatize-funktionen kan vi få basordet bra som ett resultat.

Låt oss ändra vårt ordobjekt igen till att köra . Låt oss också ändra orddelen som vi kommer att överföra till .lemmatize-funktionen till v som står för verb.

Lematisering i Python |  En nybörjarguide

Efter att ha gjort ändringarna och initialiserat .lemmatize-funktionen fick vi rotordet till ordet igång som körs som ett resultat. De flesta lemmatiserare är inte kapabla att utföra de metoder som vi just gjorde när vi använde .lemmatize-funktionen.

Emellertid är .lemmatize-funktionen ett avsevärt verktyg att använda när man utför vissa typer av för att få basformen av ett ord.




Slutsats

Kort sagt, vi kan förstå användningen av lemmatisering i och hur det fungerar. Vi har diskuterat likheten och skillnaderna mellan lemmatisering och härkomst också. Vi kan också skapa ett ordobjekt med hjälp av Word- biblioteket och hur man använder .lemmatize -funktionen.

Dessutom har vi lärt oss hur man tillämpar olika delar av tal i .lemmatize-funktionen. Genom att implementera lemmatisering i dina dagliga textanalysuppgifter kommer du avsevärt att minska tiden och ansträngningen för att söka efter basordet i ett specifikt ord.

Med vänliga hälsningar,

Gaellim

Leave a Comment

Skapa en datumtabell i LuckyTemplates

Skapa en datumtabell i LuckyTemplates

Ta reda på varför det är viktigt att ha en dedikerad datumtabell i LuckyTemplates och lär dig det snabbaste och mest effektiva sättet att göra det.

LuckyTemplates mobilrapporteringstips och tekniker

LuckyTemplates mobilrapporteringstips och tekniker

Denna korta handledning belyser LuckyTemplates mobilrapporteringsfunktion. Jag ska visa dig hur du kan utveckla rapporter effektivt för mobila enheter.

Professional Service Analytics-rapporter i LuckyTemplates

Professional Service Analytics-rapporter i LuckyTemplates

I denna LuckyTemplates Showcase går vi igenom rapporter som visar professionell serviceanalys från ett företag som har flera kontrakt och kundengagemang.

Microsoft Power Platform-uppdateringar | Microsoft Ignite 2021

Microsoft Power Platform-uppdateringar | Microsoft Ignite 2021

Gå igenom de viktigaste uppdateringarna för Power Apps och Power Automate och deras fördelar och konsekvenser för Microsoft Power Platform.

Vanliga SQL-funktioner: En översikt

Vanliga SQL-funktioner: En översikt

Upptäck några vanliga SQL-funktioner som vi kan använda som sträng, datum och några avancerade funktioner för att bearbeta eller manipulera data.

LuckyTemplates Skapa mall: Guide och tips

LuckyTemplates Skapa mall: Guide och tips

I den här handledningen kommer du att lära dig hur du skapar din perfekta LuckyTemplates-mall som är konfigurerad efter dina behov och preferenser.

Fältparametrar och små multiplar i LuckyTemplates

Fältparametrar och små multiplar i LuckyTemplates

I den här bloggen kommer vi att visa hur man lager fältparametrar med små multiplar för att skapa otroligt användbara insikter och bilder.

LuckyTemplates Rank och anpassad gruppering

LuckyTemplates Rank och anpassad gruppering

I den här bloggen kommer du att lära dig hur du använder LuckyTemplates ranknings- och anpassade grupperingsfunktioner för att segmentera en exempeldata och rangordna den enligt kriterier.

Visar kumulativ total endast upp till ett visst datum i LuckyTemplates

Visar kumulativ total endast upp till ett visst datum i LuckyTemplates

I den här handledningen kommer jag att täcka en specifik teknik kring hur man visar Kumulativ total endast upp till ett specifikt datum i dina bilder i LuckyTemplates.

Punktdiagram: Avancerade anpassade bilder för LuckyTemplates

Punktdiagram: Avancerade anpassade bilder för LuckyTemplates

Lär dig hur du skapar och anpassar punktdiagram i LuckyTemplates, som huvudsakligen används för att mäta prestanda mot mål eller tidigare år.