Теоремата на Байес може да ви помогне да заключите колко вероятно е нещо да се случи в определен контекст, въз основа на общите вероятности на самия факт и доказателствата, които изследвате, и в съчетание с вероятността на доказателствата предвид факта. Рядко едно доказателство ще намали съмненията и ще осигури достатъчно сигурност в прогнозата, за да се гарантира, че това ще се случи. Като истински детектив, за да постигнете сигурност, трябва да съберете повече доказателства и да накарате отделните части да работят заедно във вашето разследване. Забележката, че човек има дълга коса, не е достатъчно, за да се определи дали човекът е жена или мъж. Добавянето на данни за височината и теглото може да помогне за повишаване на увереността.
Алгоритъмът на Naive Bayes ви помага да подредите всички събрани доказателства и да постигнете по-солидна прогноза с по-голяма вероятност да бъдете верни. Събраните доказателства, разглеждани отделно, не биха могли да ви спасят от риска от неправилно прогнозиране, но всички доказателства, обобщени заедно, могат да постигнат по-категорично решение. Следващият пример показва как работят нещата в наивна класификация на Байес. Това е стар, известен проблем, но представлява способността, която можете да очаквате от AI. Наборът от данни е от статията „ Индукция на дърветата на решенията”, от Джон Рос Куинлан. Куинлан е компютърен учен, който допринесе за разработването на друг алгоритъм за машинно обучение, дървета на решения, по фундаментален начин, но неговият пример работи добре с всякакъв вид алгоритъм за обучение. Проблемът изисква AI да отгатне най-добрите условия за игра на тенис предвид метеорологичните условия. Наборът от функции, описани от Куинлан, е както следва:
- Перспективи: Слънчево, облачно или дъждовно
- Температура: хладно, меко или горещо
- Влажност: Висока или нормална
- Windy: Вярно или невярно
Следната таблица съдържа записите в базата данни, използвани за примера:
Outlook |
температура |
влажност |
Ветровит |
Играя тенис |
слънчево |
Горещо |
Високо |
Невярно |
Не |
слънчево |
Горещо |
Високо |
Вярно |
Не |
Облачно |
Горещо |
Високо |
Невярно |
да |
дъждовно |
Лека |
Високо |
Невярно |
да |
дъждовно |
Готино |
Нормално |
Невярно |
да |
дъждовно |
Готино |
Нормално |
Вярно |
Не |
Облачно |
Готино |
Нормално |
Вярно |
да |
слънчево |
Лека |
Високо |
Невярно |
Не |
слънчево |
Готино |
Нормално |
Невярно |
да |
дъждовно |
Лека |
Нормално |
Невярно |
да |
слънчево |
Лека |
Нормално |
Вярно |
да |
Облачно |
Лека |
Високо |
Вярно |
да |
Облачно |
Горещо |
Нормално |
Невярно |
да |
дъждовно |
Лека |
Високо |
Вярно |
Не |
Възможността за игра на тенис зависи от четирите аргумента, показани тук.
Един наивен модел на Байес може да проследи доказателствата до правилния резултат.
Резултатът от този пример за обучение на AI е решение дали да играете тенис, предвид метеорологичните условия (доказателството). Използването само на изглед (слънчево, облачно или дъждовно) няма да е достатъчно, защото температурата и влажността може да са твърде високи или вятърът може да е силен. Тези аргументи представляват реални условия, които имат множество причини, или причини, които са взаимосвързани. Алгоритъмът на Наивния Байес е умел да отгатва правилно, когато съществуват множество причини.
Алгоритъмът изчислява резултат въз основа на вероятността за вземане на конкретно решение и умножен по вероятностите на доказателствата, свързани с това решение. Например, за да определи дали да играете тенис, когато перспективите са слънчеви, но вятърът е силен, алгоритъмът изчислява резултата за положителен отговор, като умножава общата вероятност за игра (9 изиграни игри от 14 събития) по вероятността за денят е слънчев (2 от 9 изиграни игри) и с ветровито време при игра на тенис (3 от 9 изиграни игри). Същите правила важат за отрицателния случай (който има различни вероятности да не се играе при определени условия):
вероятност за игра: 9/14 * 2/9 * 3/9 = 0,05
вероятност да не играете: 5/14 * 3/5 * 3/5 = 0,13
Тъй като резултатът за вероятността е по-висок, алгоритъмът решава, че е по-безопасно да не се играе при такива условия. Той изчислява такава вероятност, като сумира двата резултата и раздели двата резултата на тяхната сума:
вероятност за игра : 0,05 / (0,05 + 0,13) = 0,278
вероятност да не играете : 0,13 / (0,05 + 0,13) = 0,722
Можете допълнително да разширите Naive Bayes, за да представите връзки, които са по-сложни от поредица от фактори, които намекват за вероятността от резултат с помощта на байесова мрежа, която се състои от графики, показващи как събитията влияят едно на друго. Байесовите графики имат възли, които представят събитията и дъги, показващи кои събития влияят на други, придружени от таблица с условни вероятности, които показват как работи връзката по отношение на вероятността. Фигурата показва известен пример за байесова мрежа, взета от академичен документ от 1988 г., „ Локални изчисления с вероятности върху графични структури и тяхното приложение към експертни системи “, от Lauritzen, Steffen L. и David J. Spiegelhalter, публикуван от Journal of Кралското статистическо дружество.
Байесова мрежа може да подкрепи медицинско решение.
Изобразената мрежа се нарича Азия. Показва възможни състояния на пациента и какво причинява какво. Например, ако пациентът има диспнея, това може да е резултат от туберкулоза, рак на белия дроб или бронхит. Знаейки дали пациентът пуши, е бил в Азия или има аномални рентгенови резултати (по този начин дава сигурност на определени доказателства, a priori на байесов език) помага да се направи извод за реалните (постериорни) вероятности за наличие на някоя от патологиите в графика.
Байесовите мрежи, макар и интуитивни, имат сложна математика зад себе си и са по-мощни от обикновен наивен байесов алгоритъм, защото имитират света като последователност от причини и последици, базирани на вероятността. Байесовите мрежи са толкова ефективни, че можете да ги използвате за представяне на всяка ситуация. Те имат различни приложения, като медицински диагнози, сливане на несигурни данни, пристигащи от множество сензори, икономическо моделиране и наблюдение на сложни системи като автомобил. Например, тъй като шофирането в магистрален трафик може да включва сложни ситуации с много превозни средства, консорциумът Analysis of MassIve Data STReams (AMIDST), в сътрудничество с автомобилния производител Daimler, разработи байесова мрежа, която може да разпознава маневрите от други превозни средства и да повиши безопасността на шофиране. Прочетете повече за този проекти вижте сложната байесова мрежа .