Як штучний інтелект може успішно використовувати дані

Наявність великої кількості даних недостатньо для створення успішного AI. В даний час алгоритм ШІ не може витягувати інформацію безпосередньо з необроблених даних. Більшість алгоритмів покладаються на зовнішній збір і маніпулювання перед аналізом. Коли алгоритм збирає корисну інформацію, він може представляти неправильну інформацію. Наступне обговорення допоможе вам зрозуміти, як збирати, маніпулювати та автоматизувати збір даних з оглядової точки зору.

З огляду на джерела даних

Дані, які ви використовуєте, надходять з кількох джерел. Найпоширенішим джерелом даних є інформація, введена людьми в певний момент. Навіть коли система автоматично збирає дані торгового сайту, люди спочатку вводять інформацію. Людина натискає різні предмети, додає їх у кошик, вказує характеристики (наприклад, розмір) і кількість, а потім здійснює реєстрацію. Пізніше, після продажу, людина дає оцінку досвіду покупок, продукту та способу доставки та коментує. Коротше кажучи, кожен досвід покупки також стає вправою зі збору даних.

Сьогодні багато джерел даних покладаються на вхідні дані, зібрані з людських джерел. Люди також забезпечують ручне введення. Ви телефонуєте або йдете кудись в офіс, щоб записатися на прийом до професіонала. Потім секретар збере від вас інформацію, необхідну для зустрічі. Ці дані, зібрані вручну, в кінцевому підсумку потрапляють у набір даних для цілей аналізу.

Дані також збираються з датчиків, і ці датчики можуть приймати практично будь-яку форму. Наприклад, багато організацій базують збір фізичних даних, таких як кількість людей, які переглядають об’єкт у вікні, на основі виявлення мобільного телефону. Програмне забезпечення для розпізнавання облич потенційно може виявити постійних клієнтів.

Однак датчики можуть створювати набори даних практично з усього. Служба погоди спирається на набори даних, створені датчиками, які контролюють умови навколишнього середовища, такі як дощ, температура, вологість, хмарність тощо. Роботизовані системи моніторингу допомагають виправляти невеликі недоліки роботи роботів, постійно аналізуючи дані, зібрані датчиками моніторингу. Датчик у поєднанні з невеликим додатком для штучного інтелекту може підказати вам, коли ваша вечеря сьогодні приготована досконало. Датчик збирає дані, але програма AI використовує правила, які допомагають визначити, коли їжа правильно приготована.

Отримання достовірних даних

Слово надійний здається таким легким для визначення, але таким важким у реалізації. Щось є надійним, коли результати, які воно дає, є очікуваними та послідовними. Надійне джерело даних створює звичайні дані, які не містять несподіванок; ніхто не шокований результатом. Залежно від вашої точки зору, може бути добре, що більшість людей не позіхають, а потім не засинають під час перегляду даних. Завдяки сюрпризам ці дані варто проаналізувати та переглянути. Отже, дані мають аспект подвійності. Нам потрібні надійні, повсякденні, повністю очікувані дані, які просто підтверджують те, що ми вже знаємо, але неочікуваність — це те, що робить збір даних корисним у першу чергу.

І все-таки вам не потрібні дані, які є настільки неординарними, що переглядати їх стає майже страшно. При отриманні даних необхідно підтримувати баланс. Дані повинні вписуватися в певні рамки. Він також повинен відповідати певним критеріям щодо істинної цінності. Дані також повинні надходити через очікувані інтервали, і всі поля вхідного запису даних мають бути заповненими.

Певною мірою безпека даних також впливає на надійність даних. Узгодженість даних має кілька форм. Коли дані надходять, ви можете переконатися, що вони потрапляють у очікувані діапазони та відображаються в певній формі. Однак після збереження даних надійність може знизитися, якщо ви не переконаєтеся, що дані залишаються в очікуваній формі. Суб’єкт, який возиться з даними, впливає на надійність, роблячи дані підозрілими та потенційно непридатними для подальшого аналізу. Забезпечення надійності даних означає, що після надходження даних ніхто не змінює їх, щоб укласти їх у очікуваний домен (в результаті це робить їх звичайними).

Зробити внесок людини більш надійним

Люди роблять помилки — це частина людського існування. Насправді очікувати, що люди не будуть робити помилок, нерозумно. Тим не менш, багато дизайнів додатків припускають, що люди якимось чином не будуть робити жодних помилок. Дизайн розраховує, що всі будуть просто дотримуватися правил. На жаль, переважна більшість користувачів гарантовано навіть не прочитає правила, тому що більшість людей також ліниві або занадто обмежені в часі, коли справа доходить до речей, які насправді не допомагають їм безпосередньо.

Розглянемо входження стану у форму. Якщо надати лише текстове поле, деякі користувачі можуть ввести повну назву штату, наприклад, Канзас. Звичайно, деякі користувачі зроблять друкарську помилку або помилку використання великих літер і придумають Kansus або kANSAS. Встановлюючи ці помилки, люди та організації мають різні підходи до виконання завдань. Хтось із видавничої індустрії може скористатися посібником зі стилю Associated Press (AP) і ввести Кан. Хтось старший і звик до інструкцій Державної друкарні (GPO) може ввести Kans. замість цього. Використовуються також інші скорочення. Пошта США (USPS) використовує KS, але берегова охорона США використовує KA. У той же час форма Міжнародної організації зі стандартизації (ISO) поєднується з US-KS. Майте на увазі, це лише запис про стан, який досить простий — або так ви думали, перш ніж читати цей розділ. зрозуміло,

Розкривні списки добре працюють для дивовижного масиву введених даних, і їх використання гарантує, що введення людей у ці поля стає надзвичайно надійним, оскільки у людини немає іншого вибору, крім як використовувати один із записів за замовчуванням. Звичайно, людина завжди може вибрати неправильне введення, і тут вступає в дію подвійна перевірка. Деякі новіші програми порівнюють поштовий індекс із записами міста та штату, щоб перевірити, чи збігаються вони. Якщо вони не збігаються, користувача знову просять ввести правильний вхід. Ця подвійна перевірка дуже дратує, але навряд чи користувач побачить її дуже часто, тому вона не повинна дратувати.

Навіть при перехресних перевірках і статичних записах у людей все ще є багато можливостей для помилок. Наприклад, введення цифр може бути проблематичним. Коли користувачеві потрібно ввести 2.00, ви можете побачити 2, або 2.0, або 2., або будь-які інші записи. На щастя, аналіз запису та його переформатування вирішить проблему, і ви можете виконати це завдання автоматично, без допомоги користувача.

На жаль, переформатування не виправить помилкового числового введення. Ви можете частково пом’якшити такі помилки, включивши перевірку діапазону. Клієнт не може купити –5 шматків мила. Законним способом показати клієнту, що повертає шматки мила, є процес повернення, а не продаж. Однак, можливо, користувач просто зробив помилку, і ви можете надати повідомлення із зазначенням належного діапазону введення для значення.

Використання автоматизованого збору даних

Деякі люди думають, що автоматизований збір даних вирішує всі проблеми, пов’язані з введенням людей, пов’язаними з наборами даних. Насправді, автоматизований збір даних дає ряд переваг:

Краща консистенція
Підвищена надійність
Нижча ймовірність відсутності даних
Підвищена точність
Зменшена дисперсія для таких речей, як тимчасові введення

На жаль, говорити, що автоматизований збір даних вирішує всі проблеми, просто неправильно. Автоматизований збір даних все ще покладається на датчики, програми та комп’ютерне обладнання, розроблене людьми, які надають доступ лише до даних, які люди вирішують дозволити. Через обмеження, які люди накладають на характеристики автоматизованого збору даних, результат часто дає менше корисної інформації, ніж сподівалися розробники. Отже, автоматизований збір даних постійно змінюється, оскільки дизайнери намагаються вирішити проблеми введення.

Автоматизований збір даних також страждає від програмних і апаратних помилок, які присутні в будь-якій комп’ютерній системі, але з більш високим потенціалом м’яких проблем (які виникають, коли система, очевидно, працює, але не дає бажаного результату), ніж інші типи комп’ютерних систем. налаштування. Коли система працює, надійність введення набагато перевищує людські можливості. Однак, коли виникають незначні проблеми, система часто не розпізнає, що проблема існує, як це може зробити людина, і тому набір даних може в кінцевому підсумку містити більш посередні або навіть погані дані.

Залишити коментар

Огляд Snagit 2018 Що нового з версії 13

TechSmith Snagit — наше улюблене програмне забезпечення для створення скріншотів і редагування зображень. Перегляньте нові функції в Snagit 2018!

8 онлайн-інструментів для малювання діаграм і блок-схем

Потрібно створити діаграми або блок-схеми і не хочете встановлювати додаткове програмне забезпечення? Ось список онлайн-інструментів для створення діаграм.

Spotify не може відтворити поточну пісню? Як виправити

Мати дім, повний бездротових пристроїв і потокових служб, таких як Spotify, — це чудово, доки все не запрацює, а ви знайдете цікаві рішення.

Що таке NVMe M.2 SSD і наскільки він швидкий?

NVMe M.2 SSD — це найновіша технологія комп’ютерних жорстких дисків. Що це таке та наскільки він швидкий порівняно зі старими жорсткими дисками та твердотільними накопичувачами (SSD)?

Sonos проти AirPlay: Чому я вибрав AirPlay для аудіосистеми всього будинку

Sonos — це ідеальне рішення для потокового аудіо від 400 доларів США за два динаміки. Але за правильного налаштування AirPlay може бути безкоштовним. Давайте розглянемо деталі.

Додаток Google Backup and Sync замінює Photos і Drive

Google Backup and Sync – це нова програма, яка синхронізується з Фото та Диском. Читайте далі, щоб побачити, як він протистоїть OneDrive, Dropbox, Backblaze і Crashplan.

Розрізання кабелю: огляд MyIPTV із SOPlayer

MyIPTV — це служба розрізання кабелю, яка використовує програму SOPlayer для кількох платформ і надає телебачення, фільми та інші форми медіа за плату.

Клавіатура Logitech K830 для вітальні з підсвічуванням

Logitech нещодавно випустила клавіатуру K830 з підсвічуванням для вітальні, призначену для домашнього розваги. Ось наш огляд агрегату.

Оновлено CloudHQ: швидша синхронізація, редагування файлів Dropbox із Google Docs

Ось подивіться на нещодавно випущене оновлення для CloudHQ і як воно працює. Читайте далі, щоб дізнатися більше.

Що таке Android-телефон OnePlus 6T?

OnePlus 6T — флагманський Android-телефон преміум-класу, який продається зі знижкою порівняно з Apple iPhone, Google Pixel 3 або Samsung Galaxy S9.