Lematisering i Python | En nybegynnerguide

I denne opplæringen skal vi diskutere lemmatisering, som er en metode som brukes til å gruppere de forskjellige elementene i et ord. Lemmatisering har også som mål å redusere ordbøyningen og fokuserer på å gi rot- eller grunnformen til et ord som er det ordet lemma betyr.

Innholdsfortegnelse

Lematisering vs stamme

Lemmatisering ligner på stemming som også fungerer for å redusere bøyninger i ord. Den eneste forskjellen er at lemmatisering bruker ordbokbaserte ord som resultat.

På den annen side fjerner stammestamming bare affiksene fra et bøyd ord som kan resultere i ord som ikke eksisterer.

For eksempel, hvis vi bruker stamme fra ordet studier , vil det gi ordet studi som en utgang siden det tar sikte på å fjerne suffikset es fra ordet studier .

På den annen side, hvis lemmatisering brukes, vil ordstudien bli gitt som et resultat siden den fokuserer på å gi grunnformen til et ord.

Ting å vurdere ved bruk av lemmatisering

  • Den bruker ordbokbaserte ord. Med begrepet lemma som betyr roten eller grunnformen til et ord, har lemmatisering som mål å gi grunnformen til et ord i stedet for bare å fjerne bøyningene til et ord.
  • Det avhenger helt av deler av tale for å finne et grunnord. Uten å spesifisere delene av talen), kan det hende at lemmatisering ikke fungerer bra, og du får kanskje ikke det resultatet du leter etter.
  • Den er tregere enn stammen, men den er kraftigere. Siden lemmatisering ikke følger en algoritme for å prestere på ord og behovet for å gi deler av tale, anses det som tregere enn stammer. Den er imidlertid kraftigere på en måte at den bruker ordbokbaserte ord for resultater. 
  • Det har høyere nøyaktighet når det gjelder å lete etter rotordet. Ettersom lemmatisering bruker ordbokbaserte ord i å legge ut resultater fra et bøyd ord, vil du ha større sjanser for å få nøyaktige utdata.

Forberedelsesstadiet for lemmatisering i Python

Før vi fortsetter med å implementere lemmatisering, la oss begynne med å importere Word- biblioteket fra textblob .

Lematisering i Python |  En nybegynnerguide

Etter det skal vi lage et ordobjekt. 

Lematisering i Python |  En nybegynnerguide

For å lage et ordobjekt laget vi en variabel kalt w . Deretter lagret vi Word-biblioteket som inneholder vårt ordobjekt som er blekksprut , flertallsformen av ordet blekksprut. Vær oppmerksom på at når du sender et element ved hjelp av Word-biblioteket, er det viktig å omslutte det elementet med enkeltsitater.

La oss initialisere variabelen w for å se om den inneholder ordobjektet vi nettopp opprettet.

Lematisering i Python |  En nybegynnerguide

Ved utføring av w- variabelen får vi ordet objekt blekksprut som et resultat.

Implementering av lemmatisering i Python

Deretter skal vi implementere lemmatisering ved å bruke .lemmatize -funksjonen. 

Lematisering i Python |  En nybegynnerguide

I dette trinnet brukte vi w- variabelen som inneholder ordet objekt octopi og vi brukte .lemmatize -funksjonen for å bruke lemmatisering. Som et resultat fikk vi ordet blekksprut som er roten eller grunnformen til ordet blekksprut .

Etter det, la oss prøve å bruke lemmatisering med ordet bedre .

Lematisering i Python |  En nybegynnerguide

I det forrige eksemplet oppdaterte vi ordobjektet vårt fra blekksprut til bedre . Deretter lemmatiserte vi den med .lemmatize -funksjonen. Dermed er resultatet vi fikk det samme som ordet objekt som vi brukte.

Ved å bruke .lemmatize-funksjonen kan du endre måten dens lemmatisering på ved å gi inn en del av tale. Som et eksempel, la oss prøve å overføre a til funksjonen .lemmatize som står for adjektiv i orddelene. 

Lematisering i Python |  En nybegynnerguide

Etter å ha lagt til en del av tale til .lemmatize-funksjonen, er vi i stand til å få grunnordet bra som et resultat.

La oss endre ordobjektet vårt igjen til å kjøre . La oss også endre den delen av tale som vi skal overføre til .lemmatize-funksjonen til v som står for verb.

Lematisering i Python |  En nybegynnerguide

Etter å ha gjort endringene og initialisert .lemmatize-funksjonen, fikk vi rotordet til ordet kjører som kjøres som et resultat. De fleste lemmatisatorene er ikke i stand til å utføre metodene som vi nettopp gjorde ved å bruke .lemmatize-funksjonen.

Imidlertid er .lemmatize-funksjonen et betydelig verktøy å bruke når du utfører visse typer for å få grunnformen til et ord.




Konklusjon

Kort sagt, vi er i stand til å forstå bruken av lemmatisering i og hvordan det fungerer. Vi har diskutert likheten og forskjellene mellom lemmatisering og stammer også. Vi kan også lage et ordobjekt ved hjelp av Word- biblioteket og hvordan du bruker .lemmatize -funksjonen.

I tillegg har vi lært hvordan du bruker forskjellige deler av tale i .lemmatize-funksjonen. Å implementere lemmatisering i dine daglige tekstanalyseoppgaver vil i stor grad hjelpe deg med å redusere tiden og kreftene på å søke etter grunnordet til et spesifikt ord.

Beste ønsker,

Gaellim


DAX Studio EVALUATE Nøkkelord: Grunnleggende eksempler

DAX Studio EVALUATE Nøkkelord: Grunnleggende eksempler

Lær å bruke DAX Studio EVALUATE nøkkelordet med grunnleggende eksempler og få en bedre forståelse av hvordan dette kan hjelpe deg med databehandling.

Opprette en datotabell i LuckyTemplates

Opprette en datotabell i LuckyTemplates

Finn ut hvorfor det er viktig å ha en dedikert datotabell i LuckyTemplates, og lær den raskeste og mest effektive måten å gjøre det på.

LuckyTemplates Mobile Reporting Tips og teknikker

LuckyTemplates Mobile Reporting Tips og teknikker

Denne korte opplæringen fremhever LuckyTemplates mobilrapporteringsfunksjon. Jeg skal vise deg hvordan du kan utvikle rapporter effektivt for mobil.

Profesjonelle tjenesteanalyserapporter i LuckyTemplates

Profesjonelle tjenesteanalyserapporter i LuckyTemplates

I denne LuckyTemplates-utstillingen vil vi gå gjennom rapporter som viser profesjonell tjenesteanalyse fra et firma som har flere kontrakter og kundeengasjementer.

Microsoft Power Platform-oppdateringer | Microsoft Ignite 2021

Microsoft Power Platform-oppdateringer | Microsoft Ignite 2021

Gå gjennom de viktigste oppdateringene for Power Apps og Power Automate og deres fordeler og implikasjoner for Microsoft Power Platform.

Vanlige SQL-funksjoner: en oversikt

Vanlige SQL-funksjoner: en oversikt

Oppdag noen vanlige SQL-funksjoner som vi kan bruke som streng, dato og noen avanserte funksjoner for å behandle eller manipulere data.

LuckyTemplates Template Creation: Guide og tips

LuckyTemplates Template Creation: Guide og tips

I denne opplæringen lærer du hvordan du lager din perfekte LuckyTemplates-mal som er konfigurert til dine behov og preferanser.

Feltparametre og små multipler i LuckyTemplates

Feltparametre og små multipler i LuckyTemplates

I denne bloggen vil vi demonstrere hvordan du legger feltparametere sammen med små multipler for å skape utrolig nyttig innsikt og grafikk.

LuckyTemplates-rangering og tilpasset gruppering

LuckyTemplates-rangering og tilpasset gruppering

I denne bloggen vil du lære hvordan du bruker LuckyTemplates rangering og tilpassede grupperingsfunksjoner for å segmentere et eksempeldata og rangere det i henhold til kriterier.

Viser kun kumulativ total opp til en bestemt dato i LuckyTemplates

Viser kun kumulativ total opp til en bestemt dato i LuckyTemplates

I denne opplæringen skal jeg dekke en spesifikk teknikk rundt hvordan du viser kumulativ total kun opp til en bestemt dato i grafikken i LuckyTemplates.