Bayesov teorém vám môže pomôcť odvodiť, aká je pravdepodobnosť, že sa niečo stane v určitom kontexte, na základe všeobecných pravdepodobností samotnej skutočnosti a dôkazov, ktoré skúmate, a v kombinácii s pravdepodobnosťou dôkazov danej skutočnosti. Len málokedy jediný dôkaz zníži pochybnosti a poskytne dostatok istoty v predpovedi, aby sa zabezpečilo, že sa tak stane. Ako správny detektív, aby ste dosiahli istotu, musíte zhromaždiť viac dôkazov a prinútiť jednotlivé kúsky, aby vo vašom vyšetrovaní spolupracovali. Všimnúť si, že človek má dlhé vlasy, nestačí na určenie, či ide o ženu alebo muža. Pridanie údajov o výške a hmotnosti môže pomôcť zvýšiť dôveru.
Algoritmus Naive Bayes vám pomôže usporiadať všetky zhromaždené dôkazy a dosiahnuť spoľahlivejšiu predpoveď s vyššou pravdepodobnosťou, že bude správna. Zhromaždené dôkazy, ktoré sa posudzujú jednotlivo, vás nemôžu zachrániť pred rizikom nesprávneho predpovedania, ale všetky súhrnné dôkazy môžu dosiahnuť definitívnejšie riešenie. Nasledujúci príklad ukazuje, ako veci fungujú v klasifikácii Naïve Bayes. Toto je starý známy problém, ale predstavuje druh schopnosti, ktorú môžete od AI očakávať. Súbor údajov je z článku „ Indukcia rozhodovacích stromov“ od Johna Rossa Quinlana. Quinlan je počítačový vedec, ktorý zásadným spôsobom prispel k vývoju ďalšieho algoritmu strojového učenia, rozhodovacích stromov, ale jeho príklad funguje dobre s akýmkoľvek druhom algoritmu učenia. Problém vyžaduje, aby AI odhadla najlepšie podmienky na hranie tenisu vzhľadom na poveternostné podmienky. Súbor funkcií opísaných Quinlanom je nasledovný:
- Výhľad: Slnečno, zamračené alebo daždivé
- Teplota: Studená, mierna alebo horúca
- Vlhkosť: Vysoká alebo normálna
- Veterno: Pravda alebo nepravda
Nasledujúca tabuľka obsahuje položky databázy použité v príklade:
Outlook |
Teplota |
Vlhkosť |
Veterno |
Hrať tenis |
Slnečno |
Horúce |
Vysoká |
Nepravdivé |
nie |
Slnečno |
Horúce |
Vysoká |
Pravda |
nie |
Zatiahnuté |
Horúce |
Vysoká |
Nepravdivé |
Áno |
Daždivé |
Mierne |
Vysoká |
Nepravdivé |
Áno |
Daždivé |
V pohode |
Normálne |
Nepravdivé |
Áno |
Daždivé |
V pohode |
Normálne |
Pravda |
nie |
Zatiahnuté |
V pohode |
Normálne |
Pravda |
Áno |
Slnečno |
Mierne |
Vysoká |
Nepravdivé |
nie |
Slnečno |
V pohode |
Normálne |
Nepravdivé |
Áno |
Daždivé |
Mierne |
Normálne |
Nepravdivé |
Áno |
Slnečno |
Mierne |
Normálne |
Pravda |
Áno |
Zatiahnuté |
Mierne |
Vysoká |
Pravda |
Áno |
Zatiahnuté |
Horúce |
Normálne |
Nepravdivé |
Áno |
Daždivé |
Mierne |
Vysoká |
Pravda |
nie |
Možnosť hrať tenis závisí od štyroch tu uvedených argumentov.
Naivný Bayesov model môže vysledovať dôkazy k správnemu výsledku.
Výsledkom tohto príkladu učenia AI je rozhodnutie, či hrať tenis vzhľadom na poveternostné podmienky (dôkazy). Použitie iba výhľadu (slnečno, zamračené alebo daždivé) nebude stačiť, pretože teplota a vlhkosť môžu byť príliš vysoké alebo môže byť silný vietor. Tieto argumenty predstavujú skutočné podmienky, ktoré majú viacero príčin, alebo príčiny, ktoré sú vzájomne prepojené. Algoritmus Naive Bayes je zručný v správnom uhádnutí, keď existuje viacero príčin.
Algoritmus vypočíta skóre na základe pravdepodobnosti prijatia konkrétneho rozhodnutia a vynásobí ho pravdepodobnosťou dôkazov spojených s týmto rozhodnutím. Napríklad, aby sa určilo, či hrať tenis, keď je slnečno, ale fúka silný vietor, algoritmus vypočíta skóre pre kladnú odpoveď vynásobením všeobecnej pravdepodobnosti hrania (9 odohratých hier zo 14 výskytov) pravdepodobnosťou slnečný deň (2 z 9 odohratých hier) a veterné podmienky pri hraní tenisu (3 z 9 odohraných hier). Rovnaké pravidlá platia pre negatívny prípad (ktorý má za určitých podmienok rôzne pravdepodobnosti nehrania):
pravdepodobnosť hrania: 9/14 * 2/9 * 3/9 = 0,05
pravdepodobnosť, že nebudete hrať: 5/14 * 3/5 * 3/5 = 0,13
Pretože je skóre pravdepodobnosti vyššie, algoritmus rozhodne, že za takýchto podmienok je bezpečnejšie nehrať. Takúto pravdepodobnosť vypočíta sčítaním dvoch skóre a vydelením oboch skóre ich súčtom:
pravdepodobnosť hrania: 0,05 / (0,05 + 0,13) = 0,278
pravdepodobnosť nehrania: 0,13 / (0,05 + 0,13) = 0,722
Naivné Bayes môžete ďalej rozšíriť tak, aby reprezentovali vzťahy, ktoré sú zložitejšie ako séria faktorov, ktoré naznačujú pravdepodobnosť výsledku pomocou Bayesovskej siete, ktorá pozostáva z grafov znázorňujúcich, ako sa udalosti navzájom ovplyvňujú. Bayesovské grafy majú uzly, ktoré predstavujú udalosti a oblúky ukazujúce, ktoré udalosti ovplyvňujú ostatných, spolu s tabuľkou podmienených pravdepodobností, ktorá ukazuje, ako vzťah funguje z hľadiska pravdepodobnosti. Obrázok ukazuje slávny príklad Bayesovskej siete prevzatý z akademickej práce z roku 1988, „ Miestne výpočty s pravdepodobnosťami na grafických štruktúrach a ich aplikácia na expertné systémy “, od Lauritzen, Steffen L. a David J. Spiegelhalter, publikovanej v Journal of Kráľovská štatistická spoločnosť.
Bayesovská sieť môže podporiť lekárske rozhodnutie.
Zobrazená sieť sa nazýva Ázia. Ukazuje možné stavy pacienta a čo spôsobuje čo. Napríklad, ak má pacient dýchavičnosť, môže to byť dôsledok tuberkulózy, rakoviny pľúc alebo bronchitídy. Vedieť, či pacient fajčí, bol v Ázii alebo či má anomálne výsledky röntgenových lúčov (čím poskytuje istotu istým dôkazom, a priori v Bayesovskom jazyku), pomáha odvodiť skutočnú (zadnú) pravdepodobnosť výskytu niektorej z patológií graf.
Bayesovské siete, hoci sú intuitívne, majú za sebou zložitú matematiku a sú výkonnejšie ako jednoduchý algoritmus naivného Bayesa, pretože napodobňujú svet ako postupnosť príčin a následkov založených na pravdepodobnosti. Bayesovské siete sú také efektívne, že ich môžete použiť na reprezentáciu akejkoľvek situácie. Majú rôzne aplikácie, ako sú lekárske diagnózy, spájanie neistých údajov prichádzajúcich z viacerých senzorov, ekonomické modelovanie a monitorovanie zložitých systémov, ako je napríklad automobil. Napríklad, pretože jazda na diaľnici môže zahŕňať zložité situácie s mnohými vozidlami, konzorcium Analysis of MassIve Data STreams (AMIDST) v spolupráci s automobilkou Daimler vytvorilo Bayesovskú sieť, ktorá dokáže rozpoznať manévre iných vozidiel a zvýšiť bezpečnosť jazdy. Prečítajte si viac o tomto projektea pozrite si komplexnú Bayesovskú sieť .