Bayesov izrek vam lahko pomaga sklepati, kako verjetno se bo nekaj zgodilo v določenem kontekstu, na podlagi splošnih verjetnosti samega dejstva in dokazov, ki jih preučujete, ter v kombinaciji z verjetnostjo dokaza glede na dejstvo. Le redkokdaj bo en sam dokaz zmanjšal dvome in zagotovil dovolj gotovosti v napovedi, da bi zagotovili, da se bo to zgodilo. Kot pravi detektiv morate, da bi dosegli gotovost, zbrati več dokazov in omogočiti, da posamezni deli sodelujejo v vaši preiskavi. Če opazite, da ima oseba dolge lase, ni dovolj, da bi ugotovili, ali je oseba ženska ali moški. Dodajanje podatkov o višini in teži bi lahko pomagalo povečati samozavest.
Algoritem Naive Bayes vam pomaga urediti vse zbrane dokaze in doseči bolj trdno napoved z večjo verjetnostjo pravilne. Zbrani dokazi, ki jih obravnavamo posamezno, vas ne bi mogli rešiti pred tveganjem napačnega napovedovanja, vendar lahko vsi dokazi, povzeti skupaj, dosežejo bolj dokončno rešitev. Naslednji primer prikazuje, kako stvari delujejo v naivni Bayesovi klasifikaciji. To je stara, znana težava, vendar predstavlja vrsto zmogljivosti, ki jo lahko pričakujete od AI. Nabor podatkov je iz prispevka » Indukcija dreves odločitev,« avtorja John Ross Quinlan. Quinlan je računalničar, ki je temeljno prispeval k razvoju drugega algoritma strojnega učenja, drevesa odločanja, vendar njegov primer dobro deluje s kakršnimi koli učnimi algoritmi. Težava zahteva, da AI ugiba najboljše pogoje za igranje tenisa glede na vremenske razmere. Nabor funkcij, ki jih opisuje Quinlan, je naslednji:
- Obeti: sončno, oblačno ali deževno
- Temperatura: hladno, blago ali vroče
- Vlažnost: visoka ali normalna
- Vetrovno: res ali ne
Naslednja tabela vsebuje vnose baze podatkov, uporabljene za primer:
Outlook |
Temperatura |
Vlažnost |
Vetrovno |
Igranje tenisa |
Sončno |
vroče |
Visoko |
Napačno |
št |
Sončno |
vroče |
Visoko |
Prav |
št |
Oblačno |
vroče |
Visoko |
Napačno |
da |
deževno |
blag |
Visoko |
Napačno |
da |
deževno |
kul |
Normalno |
Napačno |
da |
deževno |
kul |
Normalno |
Prav |
št |
Oblačno |
kul |
Normalno |
Prav |
da |
Sončno |
blag |
Visoko |
Napačno |
št |
Sončno |
kul |
Normalno |
Napačno |
da |
deževno |
blag |
Normalno |
Napačno |
da |
Sončno |
blag |
Normalno |
Prav |
da |
Oblačno |
blag |
Visoko |
Prav |
da |
Oblačno |
vroče |
Normalno |
Napačno |
da |
deževno |
blag |
Visoko |
Prav |
št |
Možnost igranja tenisa je odvisna od štirih argumentov, prikazanih tukaj.
Naivni Bayesov model lahko poišče dokaze do pravega izida.
Rezultat tega primera učenja umetne inteligence je odločitev, ali boste igrali tenis glede na vremenske razmere (dokazi). Uporaba samo napovedi (sončno, oblačno ali deževno) ne bo dovolj, ker sta lahko temperatura in vlažnost previsoki ali pa je lahko veter močan. Ti argumenti predstavljajo resnične pogoje, ki imajo več vzrokov, ali vzroke, ki so med seboj povezani. Naivni Bayesov algoritem je vešč pravilnega ugibanja, ko obstaja več vzrokov.
Algoritem izračuna rezultat, ki temelji na verjetnosti sprejetja določene odločitve in pomnoženo z verjetnostmi dokazov, povezanih s to odločitvijo. Na primer, da bi ugotovil, ali naj igra tenis, ko je obeti sončno, a veter močan, algoritem izračuna rezultat za pozitiven odgovor tako, da pomnoži splošno verjetnost igranja (9 odigranih iger od 14 dogodkov) z verjetnostjo dan je sončen (2 od 9 odigranih iger) in vetrovni pogoji pri igranju tenisa (3 od 9 odigranih iger). Ista pravila veljajo za negativni primer (ki ima različne verjetnosti neigranja pod določenimi pogoji):
verjetnost igranja: 9/14 * 2/9 * 3/9 = 0,05
verjetnost neigranja: 5/14 * 3/5 * 3/5 = 0,13
Ker je ocena verjetnosti višja, se algoritem odloči, da je v takšnih pogojih varneje ne igrati. Takšno verjetnost izračuna tako, da seštejeta dva rezultata in obe točki delimo z njuno vsoto:
verjetnost igranja : 0,05 / (0,05 + 0,13) = 0,278
verjetnost neigranja: 0,13 / (0,05 + 0,13) = 0,722
Naivnega Bayesa lahko dodatno razširite tako, da predstavlja odnose, ki so bolj zapleteni kot vrsta dejavnikov, ki namigujejo na verjetnost izida z uporabo Bayesove mreže, ki je sestavljena iz grafov, ki prikazujejo, kako dogodki vplivajo drug na drugega. Bayesovi grafi imajo vozlišča, ki predstavljajo dogodke in loke, ki kažejo, kateri dogodki vplivajo na druge, skupaj s tabelo pogojnih verjetnosti, ki prikazujejo, kako razmerje deluje v smislu verjetnosti. Slika prikazuje slavni primer Bayesove mreže, vzetega iz akademskega članka iz leta 1988, " Lokalni izračuni z verjetnostmi na grafičnih strukturah in njihova uporaba v ekspertnih sistemih ", avtorja Lauritzena, Steffena L. in Davida J. Spiegelhalterja, ki ga je objavil Journal of Kraljevo statistično društvo.
Bayesova mreža lahko podpira zdravniško odločitev.
Upodobljeno omrežje se imenuje Azija. Prikazuje možna stanja pacienta in kaj povzroča. Na primer, če ima bolnik dispnejo, je to lahko posledica tuberkuloze, pljučnega raka ali bronhitisa. Vedeti, ali bolnik kadi, je bil v Aziji ali ima nenormalne rezultate rentgenskih posnetkov (s čimer daje gotovost določenim dokazom, a priori v Bayesovem jeziku), pomaga sklepati o resnični (posteriorni) verjetnosti, da ima katero od patologij v graf.
Bayesova omrežja, čeprav so intuitivna, imajo za seboj zapleteno matematiko in so močnejša od preprostega naivnega Bayesovega algoritma, ker posnemajo svet kot zaporedje vzrokov in posledic, ki temeljijo na verjetnosti. Bayesova omrežja so tako učinkovita, da jih lahko uporabite za predstavljanje katere koli situacije. Imajo različne aplikacije, kot so medicinske diagnoze, spajanje negotovih podatkov, ki prihajajo iz več senzorjev, ekonomsko modeliranje in spremljanje kompleksnih sistemov, kot je avtomobil. Na primer, ker lahko vožnja v prometu po avtocesti vključuje zapletene situacije s številnimi vozili, je konzorcij za analizo masivnih podatkovnih stremov (AMIDST) v sodelovanju z avtomobilskim proizvajalcem Daimler zasnoval Bayesovsko omrežje, ki lahko prepozna manevre drugih vozil in poveča varnost vožnje. Preberite več o tem projektuin si oglejte kompleksno Bayesovo mrežo .