Набір даних Python: застосування повторюваних кодів

У цьому блозі ви дізнаєтесь, як застосувати повторювані коди або функції, щоб отримати вихід одного типу. Це допоможе вам бути більш ефективними та докладати менше зусиль для отримання певних даних із різних наборів даних. У цьому підручнику ми збираємося використати існуючий код, який я створив раніше, як приклад.

Ви також дізнаєтеся, як робити копії наборів даних, щоб уникнути пошкодження оригінальної версії набору даних, імпортувати бібліотеки та функції за допомогою повторюваних кодів і .

Для цього блогу я рекомендую вам постійно отримувати файл CSV і переносити його в LuckyTemplates. Я також продемонструю, як ми можемо перенести цей файл CSV і розмістити його прямо в LuckyTemplates, на випадок, якщо вам доведеться це зробити.

Зміст

Отримання файлу CSV у LuckyTemplates

Щоб перенести файл CSV у LuckyTemplates, перше, що вам потрібно зробити, це натиснути на меню « Отримати дані » на стрічці «Домашня сторінка».

Набір даних Python: застосування повторюваних кодів

Після натискання з’явиться спадне меню, у якому потрібно вибрати опцію « Текст/CSV ».

Набір даних Python: застосування повторюваних кодів

Після вибору опції « Текст/CSV » відкриється вікно, де ми можемо вибрати файл, який ми хочемо перенести в LuckyTemplates. Для цього прикладу скористаємося файлом набору даних IMDB

Набір даних Python: застосування повторюваних кодів

Відкривши файл IMDB Dataset.csv , ви побачите інше вікно, у якому відображаються дані в цьому файлі. Оскільки цей файл містить велику кількість даних, він переглядає лише деякі дані.

Перше, що ми збираємося зробити в цьому файлі, це перетворити його. Для цього просто натисніть опцію « Перетворити дані » у нижній правій частині вікна.

Набір даних Python: застосування повторюваних кодів

Створення копії набору даних Python

Перш ніж вносити будь-які зміни в цей набір даних, важливо зробити копію вихідного набору даних. Для цього просто клацніть правою кнопкою миші на наборі даних. 

Набір даних Python: застосування повторюваних кодів

Потім у меню виберіть « Копіювати ».

Набір даних Python: застосування повторюваних кодів

Нарешті, клацніть правою кнопкою миші на панелі запитів , а потім виберіть « Вставити » з параметрів.

Набір даних Python: застосування повторюваних кодів

Після виконання цих кроків у вас має бути копія оригінального набору даних IMDB на панелі запитів .

Набір даних Python: застосування повторюваних кодів

Перетворення набору даних за допомогою сценарію Python

Трансформуючи файл CSV, ви зможете розбити велику кількість наборів даних Python на менші. Ми можемо зробити це, застосувавши якийсь сценарій Python у цьому файлі.

Але спочатку ми повинні переконатися, що заголовки правильно вирівняні. Клацніть у головному меню, знайдіть опцію « Використовувати перший рядок як заголовки » та клацніть її.

Набір даних Python: застосування повторюваних кодів

Після натискання опції « Використовувати перший рядок як заголовки » заголовки тепер змінено на дані з попередніх перших рядків, а саме « огляд » і « настрій ».

Набір даних Python: застосування повторюваних кодів

Далі перейдіть до меню « Трансформація» та натисніть опцію « Запустити сценарій Python » у групі параметрів « Сценарії ».

Набір даних Python: застосування повторюваних кодів

Після цього з’явиться вікно « Запустити сценарій Python ». У цьому вікні ви можете запустити будь-який сценарій Python, який хочете, щоб перетворити поточний файл, який ви використовуєте. Для цього прикладу я збираюся зменшити набір даних, запустивши наступний код.

Набір даних Python: застосування повторюваних кодів

Я використовував функцію .iloc для набору даних, щоб вибрати певні рядки та стовпці з набору даних IMDB. Потім у параметрах я вибрав усі перші 500 рядків і всі стовпці в наборі даних IMDB. Я зберіг його у змінній під назвою « набір даних ».

Після виконання сценарію ми повинні побачити «набір даних», який є змінною, яку ми створили на попередньому кроці. Він містить дані, які ми змінили за допомогою сценарію Python.

Набір даних Python: застосування повторюваних кодів

Перевірка набору даних

Щоб відкрити таблицю набору даних , просто натисніть « Таблиця » під стовпцем «Значення » .

Набір даних Python: застосування повторюваних кодів

Ми бачимо, що цей набір даних тепер зменшився до 500 рядків .

Набір даних Python: застосування повторюваних кодів

Тепер, коли ми розбили наш набір даних на 500 рядків, наступне, що ми збираємося зробити, це імпортувати потрібні нам бібліотеки. Ми зробимо це за допомогою тієї самої процедури, яку робили під час зміни вмісту набору даних IMDB. Це робиться для того, щоб переконатися, що нашим кодом можна керувати в певних сценаріях з меншою кількістю змін.

Імпортування бібліотек і функцій за допомогою кодів, що повторюються

Щоб імпортувати бібліотеки, давайте повернемося до нашого блокнота та скопіюємо бібліотеки, які нам потрібні. Майте на увазі, що до цього підручника я вже створив ці бібліотеки, які ми збираємося скопіювати. Я просто повторно використовую їх, щоб ви чітко зрозуміли, як використовувати функції як повторювані коди.

Набір даних Python: застосування повторюваних кодів

Після того, як бібліотеки буде скопійовано, вставте їх у вікно « Виконати сценарій » і не забудьте включити рядок « Лічильник імпорту з колекцій » у кінці сценарію. 

Набір даних Python: застосування повторюваних кодів

Потім ми скопіюємо функцію очищення даних із нашого блокнота та додамо її до сценарію в LuckyTemplates.

Набір даних Python: застосування повторюваних кодів

Ми додамо його під бібліотеками. 

Набір даних Python: застосування повторюваних кодів

Ми також скопіюємо код для виклику функції, яку щойно додали.

Набір даних Python: застосування повторюваних кодів

Потім вставте його в сценарій Python у LuckyTemplates.

Набір даних Python: застосування повторюваних кодів

Створення таблиць даних

Тепер, коли ми додали код для виклику функції, нам потрібно змінити « df2 » на « dataset », а « title » на « review ». Ми зробили це завдяки змінам, які ми внесли в набір даних.

Ми змінили «df2» на « набір даних », оскільки ми зберігали дані з 500 рядками в «набір даних». Потім для «заголовка» ми оновили його до «огляду» в результаті зміни заголовків стовпців.

Додавши ці коди, ми зможемо отримати або згенерувати 3 таблиці, які містять дані1 для частоти слів, дані2 для частоти біграм і дані3 для частоти триграм.

Набір даних Python: застосування повторюваних кодів

Ви також можете зробити іншу копію цього зміненого набору даних IMDB (2), щоб пізніше відкрити іншу таблицю.

Набір даних Python: застосування повторюваних кодів

Тепер у наборі даних IMDB (2) давайте відкриємо таблицю data1

Набір даних Python: застосування повторюваних кодів

 Після відкриття таблиці data1 ми можемо побачити список слів, а також частоту.

Набір даних Python: застосування повторюваних кодів

Як бачите, ми можемо виконувати певні процедури з основного набору даних за допомогою повторюваних кодів, які ми взяли з Jupyter Notebook. За допомогою цих повторюваних кодів ми можемо трансформувати набір даних Python і створити таблицю для частоти слів, частоти біграм і частот триграм, не вводячи коди знову.

У наборі даних IMDB (3) давайте відкриємо таблицю data2 , щоб побачити частоту біграм.

Набір даних Python: застосування повторюваних кодів

У таблиці частоти біграм ви можете побачити « br », включений у список. Ймовірно, це пов’язано з кодом HTML. Ми можемо просто повернутися назад і додати щось інше, але ми не будемо робити це в цьому підручнику.

Тепер, коли дані завантажено за допомогою повторюваних кодів, ми можемо почати візуалізувати їх у LuckyTemplates. Наприклад, a для частоти кожного слова. 

Набір даних Python: застосування повторюваних кодів




Висновок

Підводячи підсумок, повторювані коди можуть допомогти вам виконувати певні процедури з набором даних з меншими зусиллями. Ви навчилися використовувати повторювані коди для перетворення набору даних Python у LuckyTemplates. Ви також можете використовувати функцію .iloc , щоб указати рядки та стовпці, які слід вибирати під час зміни набору даних.

Крім того, ви створили копії наборів даних і візуалізацію за допомогою гістограми. Ця візуалізація базується на наборах даних Python, які ми створили та змінили за допомогою повторюваних кодів.

Все найкраще,

Гаеллім

Leave a Comment

Змініть формати дати за допомогою редактора Power Query

Змініть формати дати за допомогою редактора Power Query

У цьому посібнику ви дізнаєтеся, як перетворити текст у формат дати за допомогою редактора Power Query в LuckyTemplates.

Power Query: об’єднайте файли з кількох папок

Power Query: об’єднайте файли з кількох папок

Дізнайтеся, як об’єднати файли з кількох папок у мережі, робочому столі, OneDrive або SharePoint за допомогою Power Query.

Обчисліть місячне ковзне середнє з початку року (з початку року) у LuckyTemplates

Обчисліть місячне ковзне середнє з початку року (з початку року) у LuckyTemplates

Цей підручник пояснює, як обчислити місячне ковзне середнє на базі даних з початку року за допомогою функцій AVERAGEX, TOTALYTD та FILTER у LuckyTemplates.

Створення таблиці дат у LuckyTemplates

Створення таблиці дат у LuckyTemplates

Дізнайтеся, чому важлива спеціальна таблиця дат у LuckyTemplates, і вивчіть найшвидший і найефективніший спосіб це зробити.

Мобільні звіти LuckyTemplates. Поради та методи

Мобільні звіти LuckyTemplates. Поради та методи

У цьому короткому посібнику розповідається про функцію мобільних звітів LuckyTemplates. Я збираюся показати вам, як ви можете ефективно створювати звіти для мобільних пристроїв.

Звіти про професійну аналітику послуг у LuckyTemplates

Звіти про професійну аналітику послуг у LuckyTemplates

У цій презентації LuckyTemplates ми розглянемо звіти, що демонструють професійну аналітику послуг від фірми, яка має кілька контрактів і залучених клієнтів.

Оновлення Microsoft Power Platform | Microsoft Ignite 2021

Оновлення Microsoft Power Platform | Microsoft Ignite 2021

Ознайомтеся з основними оновленнями для Power Apps і Power Automate, а також їх перевагами та наслідками для Microsoft Power Platform.

Загальні функції SQL: огляд

Загальні функції SQL: огляд

Відкрийте для себе деякі поширені функції SQL, які ми можемо використовувати, наприклад String, Date і деякі розширені функції для обробки та маніпулювання даними.

Створення шаблону LuckyTemplates: керівництво та поради

Створення шаблону LuckyTemplates: керівництво та поради

У цьому підручнику ви дізнаєтеся, як створити свій ідеальний шаблон LuckyTemplates, налаштований відповідно до ваших потреб і вподобань.

Параметри полів і малі кратні в LuckyTemplates

Параметри полів і малі кратні в LuckyTemplates

У цьому блозі ми продемонструємо, як шарувати параметри поля з малими кратними, щоб створити неймовірно корисну інформацію та візуальні ефекти.