Набір даних Python: застосування повторюваних кодів

У цьому блозі ви дізнаєтесь, як застосувати повторювані коди або функції, щоб отримати вихід одного типу. Це допоможе вам бути більш ефективними та докладати менше зусиль для отримання певних даних із різних наборів даних. У цьому підручнику ми збираємося використати існуючий код, який я створив раніше, як приклад.

Ви також дізнаєтеся, як робити копії наборів даних, щоб уникнути пошкодження оригінальної версії набору даних, імпортувати бібліотеки та функції за допомогою повторюваних кодів і .

Для цього блогу я рекомендую вам постійно отримувати файл CSV і переносити його в LuckyTemplates. Я також продемонструю, як ми можемо перенести цей файл CSV і розмістити його прямо в LuckyTemplates, на випадок, якщо вам доведеться це зробити.

Зміст

Отримання файлу CSV у LuckyTemplates

Щоб перенести файл CSV у LuckyTemplates, перше, що вам потрібно зробити, це натиснути на меню « Отримати дані » на стрічці «Домашня сторінка».

Набір даних Python: застосування повторюваних кодів

Після натискання з’явиться спадне меню, у якому потрібно вибрати опцію « Текст/CSV ».

Набір даних Python: застосування повторюваних кодів

Після вибору опції « Текст/CSV » відкриється вікно, де ми можемо вибрати файл, який ми хочемо перенести в LuckyTemplates. Для цього прикладу скористаємося файлом набору даних IMDB

Набір даних Python: застосування повторюваних кодів

Відкривши файл IMDB Dataset.csv , ви побачите інше вікно, у якому відображаються дані в цьому файлі. Оскільки цей файл містить велику кількість даних, він переглядає лише деякі дані.

Перше, що ми збираємося зробити в цьому файлі, це перетворити його. Для цього просто натисніть опцію « Перетворити дані » у нижній правій частині вікна.

Набір даних Python: застосування повторюваних кодів

Створення копії набору даних Python

Перш ніж вносити будь-які зміни в цей набір даних, важливо зробити копію вихідного набору даних. Для цього просто клацніть правою кнопкою миші на наборі даних. 

Набір даних Python: застосування повторюваних кодів

Потім у меню виберіть « Копіювати ».

Набір даних Python: застосування повторюваних кодів

Нарешті, клацніть правою кнопкою миші на панелі запитів , а потім виберіть « Вставити » з параметрів.

Набір даних Python: застосування повторюваних кодів

Після виконання цих кроків у вас має бути копія оригінального набору даних IMDB на панелі запитів .

Набір даних Python: застосування повторюваних кодів

Перетворення набору даних за допомогою сценарію Python

Трансформуючи файл CSV, ви зможете розбити велику кількість наборів даних Python на менші. Ми можемо зробити це, застосувавши якийсь сценарій Python у цьому файлі.

Але спочатку ми повинні переконатися, що заголовки правильно вирівняні. Клацніть у головному меню, знайдіть опцію « Використовувати перший рядок як заголовки » та клацніть її.

Набір даних Python: застосування повторюваних кодів

Після натискання опції « Використовувати перший рядок як заголовки » заголовки тепер змінено на дані з попередніх перших рядків, а саме « огляд » і « настрій ».

Набір даних Python: застосування повторюваних кодів

Далі перейдіть до меню « Трансформація» та натисніть опцію « Запустити сценарій Python » у групі параметрів « Сценарії ».

Набір даних Python: застосування повторюваних кодів

Після цього з’явиться вікно « Запустити сценарій Python ». У цьому вікні ви можете запустити будь-який сценарій Python, який хочете, щоб перетворити поточний файл, який ви використовуєте. Для цього прикладу я збираюся зменшити набір даних, запустивши наступний код.

Набір даних Python: застосування повторюваних кодів

Я використовував функцію .iloc для набору даних, щоб вибрати певні рядки та стовпці з набору даних IMDB. Потім у параметрах я вибрав усі перші 500 рядків і всі стовпці в наборі даних IMDB. Я зберіг його у змінній під назвою « набір даних ».

Після виконання сценарію ми повинні побачити «набір даних», який є змінною, яку ми створили на попередньому кроці. Він містить дані, які ми змінили за допомогою сценарію Python.

Набір даних Python: застосування повторюваних кодів

Перевірка набору даних

Щоб відкрити таблицю набору даних , просто натисніть « Таблиця » під стовпцем «Значення » .

Набір даних Python: застосування повторюваних кодів

Ми бачимо, що цей набір даних тепер зменшився до 500 рядків .

Набір даних Python: застосування повторюваних кодів

Тепер, коли ми розбили наш набір даних на 500 рядків, наступне, що ми збираємося зробити, це імпортувати потрібні нам бібліотеки. Ми зробимо це за допомогою тієї самої процедури, яку робили під час зміни вмісту набору даних IMDB. Це робиться для того, щоб переконатися, що нашим кодом можна керувати в певних сценаріях з меншою кількістю змін.

Імпортування бібліотек і функцій за допомогою кодів, що повторюються

Щоб імпортувати бібліотеки, давайте повернемося до нашого блокнота та скопіюємо бібліотеки, які нам потрібні. Майте на увазі, що до цього підручника я вже створив ці бібліотеки, які ми збираємося скопіювати. Я просто повторно використовую їх, щоб ви чітко зрозуміли, як використовувати функції як повторювані коди.

Набір даних Python: застосування повторюваних кодів

Після того, як бібліотеки буде скопійовано, вставте їх у вікно « Виконати сценарій » і не забудьте включити рядок « Лічильник імпорту з колекцій » у кінці сценарію. 

Набір даних Python: застосування повторюваних кодів

Потім ми скопіюємо функцію очищення даних із нашого блокнота та додамо її до сценарію в LuckyTemplates.

Набір даних Python: застосування повторюваних кодів

Ми додамо його під бібліотеками. 

Набір даних Python: застосування повторюваних кодів

Ми також скопіюємо код для виклику функції, яку щойно додали.

Набір даних Python: застосування повторюваних кодів

Потім вставте його в сценарій Python у LuckyTemplates.

Набір даних Python: застосування повторюваних кодів

Створення таблиць даних

Тепер, коли ми додали код для виклику функції, нам потрібно змінити « df2 » на « dataset », а « title » на « review ». Ми зробили це завдяки змінам, які ми внесли в набір даних.

Ми змінили «df2» на « набір даних », оскільки ми зберігали дані з 500 рядками в «набір даних». Потім для «заголовка» ми оновили його до «огляду» в результаті зміни заголовків стовпців.

Додавши ці коди, ми зможемо отримати або згенерувати 3 таблиці, які містять дані1 для частоти слів, дані2 для частоти біграм і дані3 для частоти триграм.

Набір даних Python: застосування повторюваних кодів

Ви також можете зробити іншу копію цього зміненого набору даних IMDB (2), щоб пізніше відкрити іншу таблицю.

Набір даних Python: застосування повторюваних кодів

Тепер у наборі даних IMDB (2) давайте відкриємо таблицю data1

Набір даних Python: застосування повторюваних кодів

 Після відкриття таблиці data1 ми можемо побачити список слів, а також частоту.

Набір даних Python: застосування повторюваних кодів

Як бачите, ми можемо виконувати певні процедури з основного набору даних за допомогою повторюваних кодів, які ми взяли з Jupyter Notebook. За допомогою цих повторюваних кодів ми можемо трансформувати набір даних Python і створити таблицю для частоти слів, частоти біграм і частот триграм, не вводячи коди знову.

У наборі даних IMDB (3) давайте відкриємо таблицю data2 , щоб побачити частоту біграм.

Набір даних Python: застосування повторюваних кодів

У таблиці частоти біграм ви можете побачити « br », включений у список. Ймовірно, це пов’язано з кодом HTML. Ми можемо просто повернутися назад і додати щось інше, але ми не будемо робити це в цьому підручнику.

Тепер, коли дані завантажено за допомогою повторюваних кодів, ми можемо почати візуалізувати їх у LuckyTemplates. Наприклад, a для частоти кожного слова. 

Набір даних Python: застосування повторюваних кодів




Висновок

Підводячи підсумок, повторювані коди можуть допомогти вам виконувати певні процедури з набором даних з меншими зусиллями. Ви навчилися використовувати повторювані коди для перетворення набору даних Python у LuckyTemplates. Ви також можете використовувати функцію .iloc , щоб указати рядки та стовпці, які слід вибирати під час зміни набору даних.

Крім того, ви створили копії наборів даних і візуалізацію за допомогою гістограми. Ця візуалізація базується на наборах даних Python, які ми створили та змінили за допомогою повторюваних кодів.

Все найкраще,

Гаеллім


Що таке Power Query та мова M: детальний огляд

Що таке Power Query та мова M: детальний огляд

Цей підручник містить огляд редактора Power Query і мови M на робочому столі LuckyTemplates.

Створення звіту з розбивкою на сторінки: додавання текстів і зображень

Створення звіту з розбивкою на сторінки: додавання текстів і зображень

Дізнайтеся, як створити звіт із розбивкою на сторінки, додати тексти та зображення, а потім експортувати звіт у різні формати документів.

Функція автоматизації SharePoint | Вступ

Функція автоматизації SharePoint | Вступ

Дізнайтеся, як використовувати функцію автоматизації SharePoint для створення робочих процесів і допомоги в мікрокеруванні користувачами, бібліотеками та списками SharePoint.

Вирішіть задачу аналізу даних за допомогою прискорювача LuckyTemplates

Вирішіть задачу аналізу даних за допомогою прискорювача LuckyTemplates

Відточіть свої навички розробки звітів, приєднавшись до змагання з аналізу даних. Прискорювач може допомогти вам стати суперкористувачем LuckyTemplates!

Підсумки в LuckyTemplates за допомогою DAX

Підсумки в LuckyTemplates за допомогою DAX

Дізнайтеся, як обчислювати поточні підсумки в LuckyTemplates за допомогою DAX. Поточні підсумки дозволяють вам не потрапити в окремий результат.

Змінні LuckyTemplates Dax постійні: що це означає?

Змінні LuckyTemplates Dax постійні: що це означає?

Зрозумійте концепцію змінних у DAX у LuckyTemplates і значення змінних для обчислення показників.

Діаграма нахилу LuckyTemplates: огляд

Діаграма нахилу LuckyTemplates: огляд

Дізнайтеся більше про настроюваний візуал під назвою LuckyTemplates Slope chart, який використовується для показу зростання/зменшення для одного чи кількох показників.

Колірні теми LuckyTemplates для однорідної візуалізації

Колірні теми LuckyTemplates для однорідної візуалізації

Відкрийте для себе кольорові теми в LuckyTemplates. Це необхідно для того, щоб ваші звіти та візуалізації виглядали та працювали без проблем.

Обчислення середнього значення в LuckyTemplates: виділення результатів у будні чи вихідні за допомогою DAX

Обчислення середнього значення в LuckyTemplates: виділення результатів у будні чи вихідні за допомогою DAX

Розрахувати середнє значення в LuckyTemplates можна кількома способами, щоб отримати точну інформацію для ваших бізнес-звітів.

Шаблони LuckyTemplates | Стандартне оформлення робочого столу LuckyTemplates

Шаблони LuckyTemplates | Стандартне оформлення робочого столу LuckyTemplates

Давайте заглибимося в стандартну тематику LuckyTemplates і розглянемо деякі функції, вбудовані в саму програму LuckyTemplates Desktop.