Как изкуственият интелект може да използва успешно данни

Наличието на изобилие от данни не е достатъчно, за да създадете успешен AI. Понастоящем алгоритъмът за изкуствен интелект не може да извлича информация директно от необработени данни. Повечето алгоритми разчитат на външно събиране и манипулиране преди анализ. Когато даден алгоритъм събира полезна информация, той може да не представлява правилната информация. Следващата дискусия ви помага да разберете как да събирате, манипулирате и автоматизирате събирането на данни от обща гледна точка.

Като се имат предвид източниците на данни

Данните, които използвате, идват от редица източници. Най-често срещаният източник на данни е от информация, въведена от хора в даден момент. Дори когато системата събира автоматично данни от сайта за пазаруване, хората първоначално въвеждат информацията. Човек щраква върху различни артикули, добавя ги в пазарска количка, посочва характеристики (като размер) и количество и след това плаща. По-късно, след продажбата, човекът дава оценка на пазаруването, продукта и метода на доставка и прави коментари. Накратко, всяко пазаруване се превръща и в упражнение за събиране на данни.

Много източници на данни днес разчитат на данни, събрани от човешки източници. Хората също предоставят ръчно въвеждане. Обаждате се или отивате в офис някъде, за да си уговорите среща с професионалист. След това рецепционистът събира информация от вас, която е необходима за срещата. Тези ръчно събрани данни в крайна сметка се озовават в набор от данни някъде за целите на анализа.

Данните също се събират от сензори и тези сензори могат да приемат почти всякаква форма. Например, много организации базират събирането на физически данни, като броя на хората, гледащи обект в прозорец, на откриването на мобилен телефон. Софтуерът за разпознаване на лица може потенциално да открие повтарящи се клиенти.

Въпреки това, сензорите могат да създават набори от данни от почти всичко. Услугата за времето разчита на набори от данни, създадени от сензори, които наблюдават условията на околната среда като дъжд, температура, влажност, облачност и т.н. Роботизираните системи за наблюдение помагат да се коригират малките недостатъци в работата на роботите, като постоянно анализират данните, събирани от сензорите за наблюдение. Сензор, комбиниран с малко приложение за изкуствен интелект, може да ви каже кога вечерята ви е приготвена до съвършенство тази вечер. Сензорът събира данни, но приложението AI използва правила, за да помогне да се определи кога храната е правилно приготвена.

Получаване на надеждни данни

Думата надежден изглежда толкова лесна за дефиниране, но толкова трудна за прилагане. Нещо е надеждно, когато резултатите, които произвежда, са както очаквани, така и последователни. Надежден източник на данни произвежда обикновени данни, които не съдържат изненади; никой не е шокиран ни най-малко от резултата. В зависимост от вашата гледна точка, всъщност може да е добре повечето хора да не се прозяват и след това да не заспят, когато преглеждат данни. Изненадите правят данните си струва да бъдат анализирани и прегледани. Следователно данните имат аспект на двойственост. Искаме надеждни, обикновени, напълно очаквани данни, които просто потвърждават това, което вече знаем, но неочакваното е това, което прави събирането на данните полезно на първо място.

Все пак не искате данни, които са толкова далеч от обичайните, че става почти страшно за преглед. При получаване на данни трябва да се поддържа баланс. Данните трябва да се вписват в определени граници. Той също така трябва да отговаря на специфични критерии относно стойността на истината. Данните също трябва да идват на очаквани интервали и всички полета на входящия запис на данни трябва да бъдат попълнени.

До известна степен сигурността на данните също влияе върху надеждността на данните. Последователността на данните се предлага в няколко форми. Когато данните пристигнат, можете да гарантирате, че попадат в очакваните диапазони и се появяват в определена форма. Въпреки това, след като съхранявате данните, надеждността може да намалее, освен ако не гарантирате, че данните остават в очакваната форма. Обект, който се занимава с данните, влияе върху надеждността, което прави данните подозрителни и потенциално неизползваеми за анализ по-късно. Осигуряването на надеждност на данните означава, че след като данните пристигнат, никой не ги подправя, за да ги напасне в рамките на очакван домейн (което ги прави обикновени в резултат на това).

Правене на човешкия принос по-надежден

Хората правят грешки - това е част от това да бъдеш човек. Всъщност очакването, че хората няма да правят грешки, е неразумно. И все пак, много дизайни на приложения предполагат, че хората по някакъв начин няма да правят грешки от какъвто и да е вид. Дизайнът очаква, че всеки просто ще спазва правилата. За съжаление, по-голямата част от потребителите гарантирано дори няма да прочетат правилата, защото повечето хора също са мързеливи или твърде притиснати от време, когато става въпрос да правят неща, които всъщност не им помагат директно.

Помислете за влизането на държава във форма. Ако предоставите само текстово поле, някои потребители може да въведат цялото име на щат, като например Канзас. Разбира се, някои потребители ще направят печатна грешка или грешка при изписване с главни букви и ще излязат с Kansus или kANSAS. Задавайки тези грешки, хората и организациите имат различни подходи за изпълнение на задачите. Някой в ​​издателската индустрия може да използва ръководството за стил на Асошиейтед прес (AP) и да въведе Кан. Някой, който е по-възрастен и свикнал с указанията на Държавната печатна служба (GPO), може да въведе Kans. вместо. Използват се и други съкращения. Пощенската служба на САЩ (USPS) използва KS, но бреговата охрана на САЩ използва KA. Междувременно формата на Международната организация по стандартизация (ISO) върви с US-KS. Имайте предвид, че това е просто запис на състояние, който е сравнително ясен - или поне така си помислихте, преди да прочетете този раздел. ясно,

Полетата с падащи списъци работят добре за невероятен набор от входни данни и използването им гарантира, че въвеждането от хора в тези полета става изключително надеждно, тъй като човекът няма друг избор, освен да използва един от записите по подразбиране. Разбира се, човекът винаги може да избере неправилното вписване, където влизат в действие двойните проверки. Някои по-нови приложения сравняват пощенския код с вписванията за град и щат, за да видят дали съвпадат. Когато не съвпадат, потребителят е помолен отново да предостави правилния вход. Тази двойна проверка е досадна, но е малко вероятно потребителят да я вижда много често, така че не трябва да става твърде досадна.

Дори с кръстосани проверки и статични вписвания, хората все още имат достатъчно място за допускане на грешки. Например въвеждането на числа може да бъде проблематично. Когато потребителят трябва да въведе 2.00, може да видите 2, или 2.0, или 2., или някой от различни други записи. За щастие, анализирането на записа и преформатирането му ще отстрани проблема и можете да изпълните тази задача автоматично, без помощта на потребителя.

За съжаление, преформатирането няма да коригира грешния цифров вход. Можете частично да смекчите такива грешки, като включите проверки на обхвата. Клиент не може да купи –5 сапуна. Законният начин да покажете на клиента, че връща сапунчетата, е да обработите връщане, а не продажба. Въпреки това, потребителят може просто да е направил грешка и можете да предоставите съобщение, посочващо правилния диапазон на въвеждане за стойността.

Използване на автоматизирано събиране на данни

Някои хора смятат, че автоматизираното събиране на данни решава всички проблеми, свързани с въвеждането на хора, свързани с наборите от данни. Всъщност автоматизираното събиране на данни осигурява редица предимства:

  • По-добра консистенция
  • Подобрена надеждност
  • По-ниска вероятност от липсващи данни
  • Повишена точност
  • Намалена дисперсия за неща като времеви входове

За съжаление, да се каже, че автоматизираното събиране на данни решава всеки проблем, е просто неправилно. Автоматизираното събиране на данни все още разчита на сензори, приложения и компютърен хардуер, проектирани от хора, които осигуряват достъп само до данните, които хората решат да разрешат. Поради ограниченията, които хората поставят върху характеристиките на автоматизираното събиране на данни, резултатът често предоставя по-малко полезна информация, отколкото се надява на дизайнерите. Следователно автоматизираното събиране на данни е в постоянно състояние, тъй като дизайнерите се опитват да решат проблемите с въвеждането.

Автоматизираното събиране на данни също страда както от софтуерни, така и от хардуерни грешки, присъстващи във всяка изчислителна система, но с по-висок потенциал за меки проблеми (които възникват, когато системата очевидно работи, но не осигурява желания резултат) в сравнение с други видове компютърно базирани настройки. Когато системата работи, надеждността на входа далеч надхвърля човешките способности. Въпреки това, когато възникнат незначителни проблеми, системата често не успява да разпознае, че проблемът съществува, както може човек, и следователно наборът от данни може да съдържа по-посредствени или дори лоши данни.


За възрастни: Как да вмъкнете изрезки в слайд на PowerPoint

За възрастни: Как да вмъкнете изрезки в слайд на PowerPoint

Клипартът е предварително нарисувано общо произведение на изкуството и Microsoft предоставя много файлове с клипарт безплатно със своите продукти на Office. Можете да вмъкнете изрезки в оформлението на слайда на PowerPoint. Най-лесният начин да вмъкнете клип арт е като използвате един от заместителите в оформлението на слайда: Покажете слайд, който съдържа клипарт […]

За възрастни: Как да запълните цвят в Microsoft Excel

За възрастни: Как да запълните цвят в Microsoft Excel

Цвят на запълване — наричан още засенчване — е цветът или моделът, който запълва фона на една или повече клетки на работния лист на Excel. Прилагането на засенчване може да помогне на очите на читателя да следват информацията в цялата страница и може да добави цвят и визуален интерес към работния лист. В някои видове електронни таблици, като например регистър на чековите книжки, […]

Добавяне на нови контакти в Act! 2005 г

Добавяне на нови контакти в Act! 2005 г

На най-простото ниво, основната цел на ACT! е да служи като място за съхранение на всички контакти, с които взаимодействате ежедневно. Можете да добавяте и редактирате всичките си контакти от прозореца Подробности за контакт, защото съдържа цялата информация, която се отнася до един конкретен запис и […]

Discord For LuckyTemplates Cheat Sheet

Discord For LuckyTemplates Cheat Sheet

Използвайте този Cheat Sheet, за да преминете директно към използването на Discord. Открийте полезни Discord ботове, приложения, които можете да интегрирате, и съвети за интервюиране на гости.

OpenOffice.org за LuckyTemplates Cheat Sheet

OpenOffice.org за LuckyTemplates Cheat Sheet

Офис пакетът OpenOffice.org има много инструменти за улесняване на работния живот. Когато работите в OpenOffice.org, запознайте се с функционалната лента с инструменти (която изглежда почти еднакво във всички приложения) и главните бутони на лентата с инструменти за помощ с основните команди за повечето задачи.

Машината за бомби на Алън Тюринг

Машината за бомби на Алън Тюринг

Машината Bombe на Алън Тюринг не беше никаква форма на изкуствен интелект (AI). Всъщност това дори не е истински компютър. Счупи криптографските съобщения на Enigma и това е всичко. Това обаче даде повод за размисъл за Тюринг, което в крайна сметка доведе до документ, озаглавен „Компютърни машини и интелигентност“?? която той публикува през 50-те години на миналия век, която описва […]

Стандартни хардуерни дефицити за изкуствен интелект

Стандартни хардуерни дефицити за изкуствен интелект

Възможността за създаване на модулна система има значителни предимства, особено в бизнеса. Възможността за премахване и замяна на отделни компоненти поддържа разходите ниски, като същевременно позволява постепенни подобрения както в скоростта, така и в ефективността. Въпреки това, както при повечето неща, няма безплатен обяд. Модулността, осигурена от архитектурата на фон Нойман, идва с някои […]

10 правила, които не трябва да правите при използване на QuarkXPress

10 правила, които не трябва да правите при използване на QuarkXPress

Ако трябва да изберете десет лесни за забравяне, но изключително полезни неща, които да запомните за QuarkXPress, тези в следващия списък, скъпи читателю, биха били те. Намасте. Говорете с вашия търговски принтер. Всички проекти за печат започват и завършват с принтера. Това е така, защото само принтерите знаят своите ограничения и хилядите начини, по които един проект може да бъде […]

Произходът на биткойн

Произходът на биткойн

Най-важният аспект на биткойн може да е концепцията зад него. Биткойн е създаден от разработчика Сатоши Накамото. Вместо да се опитва да създаде изцяло нов метод на плащане, за да премахне начина, по който всички плащаме за нещата онлайн, Сатоши видя някои проблеми със съществуващите платежни системи и искаше да ги разреши. Концепцията за […]

Как да защитите поверителността си, когато използвате биткойн

Как да защитите поверителността си, когато използвате биткойн

Известно ниво на анонимност е обвързано с използването на биткойн и цифровата валута като цяло. Дали можете да го обозначите като „достатъчно анонимен“ е лично мнение. Има начини да защитите поверителността си, когато използвате биткойн за преместване на средства, но те изискват известно усилие и планиране: Можете да генерирате нов адрес за […]