Лематизація в Python | Посібник для початківців

У цьому підручнику ми збираємося обговорити лематизацію, яка є методом, який використовується для групування разом різних елементів слова. Лематизація також має на меті зменшити флексію слова та зосереджується на наданні кореневої або основної форми слова, що означає слово лема .

Зміст

Лематизація проти коріння

Лематизація подібна до коріння, яке також функціонує для зменшення флексій у словах. Єдина відмінність полягає в тому, що лематизація використовує слова зі словника як результат.

З іншого боку, коріння лише видаляє афікси зі змінюваного слова, що може призвести до слів, яких не існує.

Наприклад, якщо ми використовуємо похідні слова до слова studies , це дасть слово studi як результат, оскільки воно спрямоване на видалення суфікса es зі слова studies .

З іншого боку, якщо використовується лематизація , як результат буде надано дослідження слова, оскільки воно зосереджується на забезпеченні основної форми слова.

Речі, які слід враховувати при використанні лемматизації

  • Він використовує слова зі словника. З терміном лема , який означає корінь або основну форму слова, лематизація має на меті забезпечити основну форму слова, а не просто усунути флексії слова.
  • Пошук основного слова повністю залежить від частин мови. Без визначення частин мови) лемматизація може не працювати добре, і ви можете не отримати результат, який шукаєте.
  • Це повільніше, ніж стемінг, але потужніше. Оскільки лемматизація не дотримується алгоритму для виконання слів і потребує надання частин мови, вона вважається повільнішою, ніж коріння. Однак він потужніший у тому сенсі, що для отримання результатів використовує слова зі словника. 
  • Він має вищу точність у пошуку кореня слова. Оскільки лемматизація використовує слова зі словника для викладення результатів зі змінюваного слова, у вас буде більше шансів отримати точні результати.

Етап підготовки до лематизації в Python

Перш ніж перейти до впровадження лематизації, давайте почнемо з імпорту бібліотеки Word із textblob .

Лематизація в Python |  Посібник для початківців

Після цього ми створимо об’єкт Word. 

Лематизація в Python |  Посібник для початківців

Щоб створити об’єкт Word, ми створили змінну з іменем w . Потім ми зберегли бібліотеку Word, яка зберігає наш об’єкт word, який є octopi , форма множини слова octopus. Зверніть увагу, що під час передачі елемента за допомогою бібліотеки Word важливо взяти його в одинарні лапки.

Давайте ініціалізуємо змінну w , щоб побачити, чи містить вона щойно створений об’єкт слова.

Лематизація в Python |  Посібник для початківців

Після виконання змінної w в результаті ми отримуємо об’єкт word octopi .

Реалізація лемматизації в Python

Далі ми збираємося реалізувати лематизацію за допомогою функції .lemmatize

Лематизація в Python |  Посібник для початківців

На цьому кроці ми використали змінну w , яка містить слово об’єкт octopi , і використали функцію .lemmatize для застосування лематизації. В результаті ми отримали слово восьминіг , яке є коренем або основою слова восьминіг .

Після цього спробуємо застосувати лематизацію зі словом краще .

Лематизація в Python |  Посібник для початківців

У попередньому прикладі ми оновили наш об’єкт word з octopi на better . Потім ми лематизували це за допомогою функції .lemmatize . Таким чином, результат, який ми отримали, такий самий, як слово об’єкт, яке ми використали.

Використовуючи функцію .lemmatize, ви можете змінити спосіб її лемматизації, передавши частину мови. Як приклад, давайте спробуємо передати a до функції .lemmatize, яка означає прикметник у частинах мови. 

Лематизація в Python |  Посібник для початківців

Після додавання частини мови до функції .lemmatize ми можемо в результаті отримати базове слово good .

Давайте знову змінимо наш об’єкт word на runing . Давайте також змінимо частину мови, яку ми передамо функції .lemmatize, на v , що позначає дієслово.

Лематизація в Python |  Посібник для початківців

Після внесення змін та ініціалізації функції .lemmatize ми отримали корінь слова running , яке запускається в результаті. Більшість лемматизаторів не здатні виконувати методи, які ми щойно зробили, використовуючи функцію .lemmatize.

Однак функція .lemmatize є значним інструментом для використання під час виконання певних типів для отримання основної форми слова.




Висновок

Коротше кажучи, ми можемо зрозуміти використання лематизації в і як вона працює. Ми також обговорювали схожість і відмінності лемматизації від коріння . Ми також можемо створити об’єкт Word за допомогою бібліотеки Word і як використовувати функцію .lemmatize .

Крім того, ми навчилися застосовувати різні частини мови у функції .lemmatize. Впровадження лемматизації у ваших повсякденних завданнях аналізу тексту значно допоможе вам зменшити час і зусилля на пошук основного слова певного слова.

Все найкраще,

Гаеллім


Змініть формати дати за допомогою редактора Power Query

Змініть формати дати за допомогою редактора Power Query

У цьому посібнику ви дізнаєтеся, як перетворити текст у формат дати за допомогою редактора Power Query в LuckyTemplates.

Power Query: об’єднайте файли з кількох папок

Power Query: об’єднайте файли з кількох папок

Дізнайтеся, як об’єднати файли з кількох папок у мережі, робочому столі, OneDrive або SharePoint за допомогою Power Query.

Обчисліть місячне ковзне середнє з початку року (з початку року) у LuckyTemplates

Обчисліть місячне ковзне середнє з початку року (з початку року) у LuckyTemplates

Цей підручник пояснює, як обчислити місячне ковзне середнє на базі даних з початку року за допомогою функцій AVERAGEX, TOTALYTD та FILTER у LuckyTemplates.

Створення таблиці дат у LuckyTemplates

Створення таблиці дат у LuckyTemplates

Дізнайтеся, чому важлива спеціальна таблиця дат у LuckyTemplates, і вивчіть найшвидший і найефективніший спосіб це зробити.

Мобільні звіти LuckyTemplates. Поради та методи

Мобільні звіти LuckyTemplates. Поради та методи

У цьому короткому посібнику розповідається про функцію мобільних звітів LuckyTemplates. Я збираюся показати вам, як ви можете ефективно створювати звіти для мобільних пристроїв.

Звіти про професійну аналітику послуг у LuckyTemplates

Звіти про професійну аналітику послуг у LuckyTemplates

У цій презентації LuckyTemplates ми розглянемо звіти, що демонструють професійну аналітику послуг від фірми, яка має кілька контрактів і залучених клієнтів.

Оновлення Microsoft Power Platform | Microsoft Ignite 2021

Оновлення Microsoft Power Platform | Microsoft Ignite 2021

Ознайомтеся з основними оновленнями для Power Apps і Power Automate, а також їх перевагами та наслідками для Microsoft Power Platform.

Загальні функції SQL: огляд

Загальні функції SQL: огляд

Відкрийте для себе деякі поширені функції SQL, які ми можемо використовувати, наприклад String, Date і деякі розширені функції для обробки та маніпулювання даними.

Створення шаблону LuckyTemplates: керівництво та поради

Створення шаблону LuckyTemplates: керівництво та поради

У цьому підручнику ви дізнаєтеся, як створити свій ідеальний шаблон LuckyTemplates, налаштований відповідно до ваших потреб і вподобань.

Параметри полів і малі кратні в LuckyTemplates

Параметри полів і малі кратні в LuckyTemplates

У цьому блозі ми продемонструємо, як шарувати параметри поля з малими кратними, щоб створити неймовірно корисну інформацію та візуальні ефекти.