Лематизація в Python | Посібник для початківців

У цьому підручнику ми збираємося обговорити лематизацію, яка є методом, який використовується для групування разом різних елементів слова. Лематизація також має на меті зменшити флексію слова та зосереджується на наданні кореневої або основної форми слова, що означає слово лема .

Зміст

Лематизація проти коріння

Лематизація подібна до коріння, яке також функціонує для зменшення флексій у словах. Єдина відмінність полягає в тому, що лематизація використовує слова зі словника як результат.

З іншого боку, коріння лише видаляє афікси зі змінюваного слова, що може призвести до слів, яких не існує.

Наприклад, якщо ми використовуємо похідні слова до слова studies , це дасть слово studi як результат, оскільки воно спрямоване на видалення суфікса es зі слова studies .

З іншого боку, якщо використовується лематизація , як результат буде надано дослідження слова, оскільки воно зосереджується на забезпеченні основної форми слова.

Речі, які слід враховувати при використанні лемматизації

  • Він використовує слова зі словника. З терміном лема , який означає корінь або основну форму слова, лематизація має на меті забезпечити основну форму слова, а не просто усунути флексії слова.
  • Пошук основного слова повністю залежить від частин мови. Без визначення частин мови) лемматизація може не працювати добре, і ви можете не отримати результат, який шукаєте.
  • Це повільніше, ніж стемінг, але потужніше. Оскільки лемматизація не дотримується алгоритму для виконання слів і потребує надання частин мови, вона вважається повільнішою, ніж коріння. Однак він потужніший у тому сенсі, що для отримання результатів використовує слова зі словника. 
  • Він має вищу точність у пошуку кореня слова. Оскільки лемматизація використовує слова зі словника для викладення результатів зі змінюваного слова, у вас буде більше шансів отримати точні результати.

Етап підготовки до лематизації в Python

Перш ніж перейти до впровадження лематизації, давайте почнемо з імпорту бібліотеки Word із textblob .

Лематизація в Python |  Посібник для початківців

Після цього ми створимо об’єкт Word. 

Лематизація в Python |  Посібник для початківців

Щоб створити об’єкт Word, ми створили змінну з іменем w . Потім ми зберегли бібліотеку Word, яка зберігає наш об’єкт word, який є octopi , форма множини слова octopus. Зверніть увагу, що під час передачі елемента за допомогою бібліотеки Word важливо взяти його в одинарні лапки.

Давайте ініціалізуємо змінну w , щоб побачити, чи містить вона щойно створений об’єкт слова.

Лематизація в Python |  Посібник для початківців

Після виконання змінної w в результаті ми отримуємо об’єкт word octopi .

Реалізація лемматизації в Python

Далі ми збираємося реалізувати лематизацію за допомогою функції .lemmatize

Лематизація в Python |  Посібник для початківців

На цьому кроці ми використали змінну w , яка містить слово об’єкт octopi , і використали функцію .lemmatize для застосування лематизації. В результаті ми отримали слово восьминіг , яке є коренем або основою слова восьминіг .

Після цього спробуємо застосувати лематизацію зі словом краще .

Лематизація в Python |  Посібник для початківців

У попередньому прикладі ми оновили наш об’єкт word з octopi на better . Потім ми лематизували це за допомогою функції .lemmatize . Таким чином, результат, який ми отримали, такий самий, як слово об’єкт, яке ми використали.

Використовуючи функцію .lemmatize, ви можете змінити спосіб її лемматизації, передавши частину мови. Як приклад, давайте спробуємо передати a до функції .lemmatize, яка означає прикметник у частинах мови. 

Лематизація в Python |  Посібник для початківців

Після додавання частини мови до функції .lemmatize ми можемо в результаті отримати базове слово good .

Давайте знову змінимо наш об’єкт word на runing . Давайте також змінимо частину мови, яку ми передамо функції .lemmatize, на v , що позначає дієслово.

Лематизація в Python |  Посібник для початківців

Після внесення змін та ініціалізації функції .lemmatize ми отримали корінь слова running , яке запускається в результаті. Більшість лемматизаторів не здатні виконувати методи, які ми щойно зробили, використовуючи функцію .lemmatize.

Однак функція .lemmatize є значним інструментом для використання під час виконання певних типів для отримання основної форми слова.




Висновок

Коротше кажучи, ми можемо зрозуміти використання лематизації в і як вона працює. Ми також обговорювали схожість і відмінності лемматизації від коріння . Ми також можемо створити об’єкт Word за допомогою бібліотеки Word і як використовувати функцію .lemmatize .

Крім того, ми навчилися застосовувати різні частини мови у функції .lemmatize. Впровадження лемматизації у ваших повсякденних завданнях аналізу тексту значно допоможе вам зменшити час і зусилля на пошук основного слова певного слова.

Все найкраще,

Гаеллім


Змінні та вирази в редакторі Power Query

Змінні та вирази в редакторі Power Query

У цьому посібнику обговорюватимуться змінні та вирази в редакторі Power Query. Ви навчитеся правильно їх писати та будувати.

Як створити теплову карту LuckyTemplates

Як створити теплову карту LuckyTemplates

Теплова карта LuckyTemplates — це тип візуалізації, який використовується для відображення щільності даних на карті. У цьому підручнику я розповім, як ми можемо створити один – не пропустіть!

Створення діаграми Парето в LuckyTemplates – Advanced DAX

Створення діаграми Парето в LuckyTemplates – Advanced DAX

Я збираюся навчити вас справді цікавому прикладу принципу Парето та тому, як створити діаграму Парето за допомогою важливих формул DAX.

Власна гістограма в LuckyTemplates: різновиди та модифікація

Власна гістограма в LuckyTemplates: різновиди та модифікація

Дізнайтеся, як користувацьку гістограму на ринку можна використовувати для порівняння даних і як ви можете створити їх за допомогою прикладів у LuckyTemplates.

Статичні результати Power Automate: огляд

Статичні результати Power Automate: огляд

Дізнайтеся, як працює функція Power Automate Static Results і чому її корисно додати до найкращих методів створення блок-схем.

Підручник LuckyTemplates Python: як перекладати тексти

Підручник LuckyTemplates Python: як перекладати тексти

eDNA демонструє, як виконувати переклад мови або тексту за допомогою Python і передавати це в LuckyTemplates. Підручник LuckyTemplates Python.

Створіть діаграму Ганта в конструкторі звітів LuckyTemplates

Створіть діаграму Ганта в конструкторі звітів LuckyTemplates

У цьому підручнику ви дізнаєтеся, як використовувати Gauge Bullet Graph для створення діаграми Ганта в LuckyTemplates Report Builder.

Створіть тривимірну точкову діаграму за допомогою Python у LuckyTemplates

Створіть тривимірну точкову діаграму за допомогою Python у LuckyTemplates

У цьому підручнику ви дізнаєтесь, як створити тривимірну (3D) точкову діаграму за допомогою Python у LuckyTemplates.

Ефективне звітування LuckyTemplates – огляд сеансу та завантаження ресурсу

Ефективне звітування LuckyTemplates – огляд сеансу та завантаження ресурсу

Ефективне звітування LuckyTemplates – огляд сеансу та завантаження ресурсу

Аналіз нових клієнтів за допомогою LuckyTemplates – наступна подія лише для учасників

Аналіз нових клієнтів за допомогою LuckyTemplates – наступна подія лише для учасників

Аналіз нових клієнтів за допомогою LuckyTemplates – наступна подія лише для учасників