Bayesi teoreem võib aidata teil tuletada, kui tõenäoline on, et teatud kontekstis midagi juhtub, tuginedes fakti enda ja uuritavate tõendite üldistele tõenäosustele ning kombineerituna tõendite tõenäosusega, mis on antud fakti aluseks. Harva vähendab üksainus tõend kahtlusi ja annab ennustuses piisavalt kindlust, et see juhtuks. Tõelise detektiivina peate kindluse saavutamiseks koguma rohkem tõendeid ja panema üksikud tükid oma uurimises koos töötama. Kui märkate, et inimesel on pikad juuksed, ei piisa selleks, et teha kindlaks, kas inimene on naine või mees. Andmete lisamine pikkuse ja kaalu kohta võib aidata suurendada enesekindlust.
Naiivi Bayesi algoritm aitab teil kõik kogutud tõendid korrastada ja jõuda kindlama ennustuseni, mille tõenäolisus on suurem. Ainuüksi kogutud tõendid ei päästa teid valesti ennustamise riskist, kuid kõik tõendid kokkuvõttes võivad jõuda lõpliku lahenduseni. Järgmine näide näitab, kuidas asjad Naive Bayesi klassifikatsioonis töötavad. See on vana, tuntud probleem, kuid see esindab sellist võimekust, mida AI-lt oodata võib. Andmekogum pärineb paberist “ Otsustamispuude esilekutsumine”, autor John Ross Quinlan. Quinlan on arvutiteadlane, kes aitas põhimõtteliselt kaasa teise masinõppealgoritmi, otsustuspuude väljatöötamisse, kuid tema näide töötab hästi igasuguse õppealgoritmiga. Probleem nõuab, et tehisintellekt arvab ilmastikuolusid arvestades parimad tingimused tennise mängimiseks. Quinlani kirjeldatud funktsioonide komplekt on järgmine:
- Väljavaade: päikeseline, pilvine või vihmane
- Temperatuur: jahe, mahe või kuum
- Niiskus: kõrge või normaalne
- Tuuline: tõsi või vale
Järgmine tabel sisaldab näites kasutatud andmebaasikirjeid:
Väljavaade |
Temperatuur |
Niiskus |
Tuuline |
Mängi tennist |
Päikeseline |
Kuum |
Kõrge |
Vale |
Ei |
Päikeseline |
Kuum |
Kõrge |
Tõsi |
Ei |
Pilvine |
Kuum |
Kõrge |
Vale |
Jah |
Vihmane |
Kerge |
Kõrge |
Vale |
Jah |
Vihmane |
Lahe |
Tavaline |
Vale |
Jah |
Vihmane |
Lahe |
Tavaline |
Tõsi |
Ei |
Pilvine |
Lahe |
Tavaline |
Tõsi |
Jah |
Päikeseline |
Kerge |
Kõrge |
Vale |
Ei |
Päikeseline |
Lahe |
Tavaline |
Vale |
Jah |
Vihmane |
Kerge |
Tavaline |
Vale |
Jah |
Päikeseline |
Kerge |
Tavaline |
Tõsi |
Jah |
Pilvine |
Kerge |
Kõrge |
Tõsi |
Jah |
Pilvine |
Kuum |
Tavaline |
Vale |
Jah |
Vihmane |
Kerge |
Kõrge |
Tõsi |
Ei |
Tennise mängimise võimalus sõltub siin näidatud neljast argumendist.
Naiivne Bayesi mudel võib tõendeid õige tulemuseni leida.
Selle tehisintellekti õppimise näite tulemuseks on otsus, kas mängida tennist, võttes arvesse ilmastikutingimusi (tõendeid). Ainult väljavaate (päikesepaisteline, pilvine või vihmane) kasutamisest ei piisa, sest temperatuur ja niiskus võivad olla liiga kõrged või tuul võib olla tugev. Need argumendid esindavad tegelikke tingimusi, millel on mitu põhjust, või põhjused, mis on omavahel seotud. Naiivi Bayesi algoritm oskab õigesti arvata, kui põhjuseid on mitu.
Algoritm arvutab skoori, mis põhineb konkreetse otsuse tegemise tõenäosusel ja korrutatakse selle otsusega seotud tõendite tõenäosusega. Näiteks selleks, et teha kindlaks, kas mängida tennist, kui väljavaade on päikesepaisteline, kuid tuul on tugev, arvutab algoritm positiivse vastuse skoori, korrutades üldise mängimise tõenäosuse (9 mängu 14-st) mängu tõenäosusega. Päikesepaisteline päev (2 mängu 9-st) ja tuulised tingimused tennist mängides (3 mängu 9-st). Samad reeglid kehtivad negatiivse juhtumi puhul (millel on teatud tingimustel erinev tõenäosus, et ei mängita):
mängimise tõenäosus: 9/14 * 2/9 * 3/9 = 0,05
mittemängimise tõenäosus: 5/14 * 3/5 * 3/5 = 0,13
Kuna tõenäosuse skoor on suurem, otsustab algoritm, et sellistes tingimustes on turvalisem mitte mängida. See arvutab sellise tõenäosuse, liites kaks punktisummat ja jagades mõlemad hinded nende summaga:
mängimise tõenäosus : 0,05 / (0,05 + 0,13) = 0,278
mittemängimise tõenäosus : 0,13 / (0,05 + 0,13) = 0,722
Saate veelgi laiendada Naiivi Bayesi, et esindada seoseid, mis on keerukamad kui mitmed tegurid, mis vihjavad tulemuse tõenäosusele, kasutades Bayesi võrku, mis koosneb graafikutest, mis näitavad, kuidas sündmused üksteist mõjutavad. Bayesi graafikutel on sõlmed, mis tähistavad sündmusi ja kaare, mis näitavad, millised sündmused mõjutavad teisi, millele on lisatud tingimuslike tõenäosuste tabel, mis näitab, kuidas seos tõenäosuse osas töötab. Joonisel on kujutatud kuulus näide Bayesi võrgust, mis on võetud 1988. aasta akadeemilisest artiklist " Lokaalarvutused koos tõenäosustega graafilistes struktuurides ja nende rakendamine ekspertsüsteemidele ", mille autorid on Lauritzen, Steffen L. ja David J. Spiegelhalter, avaldatud Journal of kuninglik statistikaselts.
Bayesi võrgustik võib toetada meditsiinilist otsust.
Kujutatud võrku nimetatakse Aasiaks. See näitab patsiendi võimalikke seisundeid ja seda, mis mida põhjustab. Näiteks kui patsiendil on hingeldus, võib see olla tuberkuloosi, kopsuvähi või bronhiidi tagajärg. Teadmine, kas patsient suitsetab, on käinud Aasias või tal on anomaalsed röntgenitulemused (mis annab teatud tõenditele kindluse, Bayesi keeles a priori), aitab järeldada tõenäolist (tagumist) tõenäosust, et patsiendil on mõni patoloogia. graafik.
Kuigi Bayesi võrgud on intuitiivsed, on nende taga keerukas matemaatika ja nad on võimsamad kui lihtne naiivne Bayesi algoritm, kuna nad jäljendavad maailma kui tõenäosustel põhinevat põhjuste ja tagajärgede jada. Bayesi võrgud on nii tõhusad, et saate neid kasutada mis tahes olukorra kujutamiseks. Neil on mitmesuguseid rakendusi, nagu meditsiinilised diagnoosid, mitmelt andurilt saabuvate ebakindlate andmete liitmine, majanduslik modelleerimine ja keeruliste süsteemide (nt auto) jälgimine. Näiteks kuna maanteeliikluses sõitmine võib hõlmata keerulisi olukordi paljude sõidukitega, töötas Analysis of MassIve Data Streams (AMIDST) konsortsium koostöös autotootja Daimleriga välja Bayesi võrgu, mis suudab ära tunda teiste sõidukite manöövreid ja suurendada sõiduohutust. Loe selle projekti kohta lähemaltja vaadake keerulist Bayesi võrku .