Lematisering i Python | En nybegynnerguide

I denne opplæringen skal vi diskutere lemmatisering, som er en metode som brukes til å gruppere de forskjellige elementene i et ord. Lemmatisering har også som mål å redusere ordbøyningen og fokuserer på å gi rot- eller grunnformen til et ord som er det ordet lemma betyr.

Innholdsfortegnelse

Lematisering vs stamme

Lemmatisering ligner på stemming som også fungerer for å redusere bøyninger i ord. Den eneste forskjellen er at lemmatisering bruker ordbokbaserte ord som resultat.

På den annen side fjerner stammestamming bare affiksene fra et bøyd ord som kan resultere i ord som ikke eksisterer.

For eksempel, hvis vi bruker stamme fra ordet studier , vil det gi ordet studi som en utgang siden det tar sikte på å fjerne suffikset es fra ordet studier .

På den annen side, hvis lemmatisering brukes, vil ordstudien bli gitt som et resultat siden den fokuserer på å gi grunnformen til et ord.

Ting å vurdere ved bruk av lemmatisering

  • Den bruker ordbokbaserte ord. Med begrepet lemma som betyr roten eller grunnformen til et ord, har lemmatisering som mål å gi grunnformen til et ord i stedet for bare å fjerne bøyningene til et ord.
  • Det avhenger helt av deler av tale for å finne et grunnord. Uten å spesifisere delene av talen), kan det hende at lemmatisering ikke fungerer bra, og du får kanskje ikke det resultatet du leter etter.
  • Den er tregere enn stammen, men den er kraftigere. Siden lemmatisering ikke følger en algoritme for å prestere på ord og behovet for å gi deler av tale, anses det som tregere enn stammer. Den er imidlertid kraftigere på en måte at den bruker ordbokbaserte ord for resultater. 
  • Det har høyere nøyaktighet når det gjelder å lete etter rotordet. Ettersom lemmatisering bruker ordbokbaserte ord i å legge ut resultater fra et bøyd ord, vil du ha større sjanser for å få nøyaktige utdata.

Forberedelsesstadiet for lemmatisering i Python

Før vi fortsetter med å implementere lemmatisering, la oss begynne med å importere Word- biblioteket fra textblob .

Lematisering i Python |  En nybegynnerguide

Etter det skal vi lage et ordobjekt. 

Lematisering i Python |  En nybegynnerguide

For å lage et ordobjekt laget vi en variabel kalt w . Deretter lagret vi Word-biblioteket som inneholder vårt ordobjekt som er blekksprut , flertallsformen av ordet blekksprut. Vær oppmerksom på at når du sender et element ved hjelp av Word-biblioteket, er det viktig å omslutte det elementet med enkeltsitater.

La oss initialisere variabelen w for å se om den inneholder ordobjektet vi nettopp opprettet.

Lematisering i Python |  En nybegynnerguide

Ved utføring av w- variabelen får vi ordet objekt blekksprut som et resultat.

Implementering av lemmatisering i Python

Deretter skal vi implementere lemmatisering ved å bruke .lemmatize -funksjonen. 

Lematisering i Python |  En nybegynnerguide

I dette trinnet brukte vi w- variabelen som inneholder ordet objekt octopi og vi brukte .lemmatize -funksjonen for å bruke lemmatisering. Som et resultat fikk vi ordet blekksprut som er roten eller grunnformen til ordet blekksprut .

Etter det, la oss prøve å bruke lemmatisering med ordet bedre .

Lematisering i Python |  En nybegynnerguide

I det forrige eksemplet oppdaterte vi ordobjektet vårt fra blekksprut til bedre . Deretter lemmatiserte vi den med .lemmatize -funksjonen. Dermed er resultatet vi fikk det samme som ordet objekt som vi brukte.

Ved å bruke .lemmatize-funksjonen kan du endre måten dens lemmatisering på ved å gi inn en del av tale. Som et eksempel, la oss prøve å overføre a til funksjonen .lemmatize som står for adjektiv i orddelene. 

Lematisering i Python |  En nybegynnerguide

Etter å ha lagt til en del av tale til .lemmatize-funksjonen, er vi i stand til å få grunnordet bra som et resultat.

La oss endre ordobjektet vårt igjen til å kjøre . La oss også endre den delen av tale som vi skal overføre til .lemmatize-funksjonen til v som står for verb.

Lematisering i Python |  En nybegynnerguide

Etter å ha gjort endringene og initialisert .lemmatize-funksjonen, fikk vi rotordet til ordet kjører som kjøres som et resultat. De fleste lemmatisatorene er ikke i stand til å utføre metodene som vi nettopp gjorde ved å bruke .lemmatize-funksjonen.

Imidlertid er .lemmatize-funksjonen et betydelig verktøy å bruke når du utfører visse typer for å få grunnformen til et ord.




Konklusjon

Kort sagt, vi er i stand til å forstå bruken av lemmatisering i og hvordan det fungerer. Vi har diskutert likheten og forskjellene mellom lemmatisering og stammer også. Vi kan også lage et ordobjekt ved hjelp av Word- biblioteket og hvordan du bruker .lemmatize -funksjonen.

I tillegg har vi lært hvordan du bruker forskjellige deler av tale i .lemmatize-funksjonen. Å implementere lemmatisering i dine daglige tekstanalyseoppgaver vil i stor grad hjelpe deg med å redusere tiden og kreftene på å søke etter grunnordet til et spesifikt ord.

Beste ønsker,

Gaellim


Variabler og uttrykk i Power Query Editor

Variabler og uttrykk i Power Query Editor

Denne opplæringen vil diskutere om variabler og uttrykk i Power Query Editor. Du lærer hvordan du skriver og bygger dem riktig.

Hvordan lage et Lucky Templates-varmekart

Hvordan lage et Lucky Templates-varmekart

Et LuckyTemplates-varmekart er en type visualisering som brukes til å vise datatetthet på et kart. I denne opplæringen vil jeg diskutere hvordan vi kan lage en – ikke gå glipp av noe!

Opprette et Pareto-diagram i LuckyTemplates – Avansert DAX

Opprette et Pareto-diagram i LuckyTemplates – Avansert DAX

Jeg skal lære deg et veldig interessant eksempel rundt Pareto-prinsippet og hvordan du lager et Pareto-diagram ved hjelp av viktige DAX-formler.

Egendefinert stolpediagram i LuckyTemplates: varianter og modifikasjoner

Egendefinert stolpediagram i LuckyTemplates: varianter og modifikasjoner

Lær hvordan et tilpasset stolpediagram på markedsplassen kan brukes til datasammenligning og hvordan du kan lage dem ved å bruke eksempler i LuckyTemplates.

Kraftautomatisering av statiske resultater: En oversikt

Kraftautomatisering av statiske resultater: En oversikt

Lær hvordan Power Automate Static Results-funksjonen fungerer og hvorfor det er bra å bli lagt til de beste praksisene når du lager flytdiagrammer.

LuckyTemplates Python-opplæring: Hvordan oversette tekster

LuckyTemplates Python-opplæring: Hvordan oversette tekster

eDNA demonstrerer hvordan du utfører språk- eller tekstoversettelse ved hjelp av Python og overfører det til LuckyTemplates. LuckyTemplates Python-opplæring.

Lag et Gantt-diagram i LuckyTemplates Report Builder

Lag et Gantt-diagram i LuckyTemplates Report Builder

I denne opplæringen lærer du hvordan du bruker Gauge Bullet Graph til å lage et Gantt-diagram i LuckyTemplates Report Builder.

Lag 3D-spredningsplott ved å bruke Python i LuckyTemplates

Lag 3D-spredningsplott ved å bruke Python i LuckyTemplates

I denne opplæringen lærer du hvordan du lager et tredimensjonalt (3D) spredningsplott ved å bruke Python i LuckyTemplates.

Effektiv LuckyTemplates-rapportering – øktgjennomgang og ressursnedlasting

Effektiv LuckyTemplates-rapportering – øktgjennomgang og ressursnedlasting

Effektiv LuckyTemplates-rapportering – øktgjennomgang og ressursnedlasting

Ny kundeanalyse med LuckyTemplates – Neste medlemsbegivenhet

Ny kundeanalyse med LuckyTemplates – Neste medlemsbegivenhet

Ny kundeanalyse med LuckyTemplates – Neste medlemsbegivenhet