El teorema de Bayes us pot ajudar a deduir la probabilitat que passi alguna cosa en un context determinat, basant-vos en les probabilitats generals del fet en si i de l'evidència que examineu, i combinada amb la probabilitat de l'evidència donada el fet. Poques vegades una sola evidència disminuirà els dubtes i proporcionarà prou certesa en una predicció per assegurar-se que passarà. Com a veritable detectiu, per arribar a la certesa, heu de recollir més proves i fer que les peces individuals funcionin conjuntament en la vostra investigació. Observar que una persona té els cabells llargs no és suficient per determinar si és una dona o un home. Afegir dades sobre l'alçada i el pes podria ajudar a augmentar la confiança.
L'algorisme de Naïve Bayes us ajuda a organitzar totes les proves que aplegueu i a arribar a una predicció més sòlida amb una probabilitat més alta de ser correcta. L'evidència recopilada considerada singularment no us podria estalviar del risc de predir incorrectament, però totes les proves sumades poden arribar a una resolució més definitiva. L'exemple següent mostra com funcionen les coses en una classificació de Naïve Bayes. Aquest és un problema antic i conegut, però representa el tipus de capacitat que podeu esperar d'una IA. El conjunt de dades és del document " Induction of Decision Trees”, de John Ross Quinlan. Quinlan és un informàtic que va contribuir al desenvolupament d'un altre algorisme d'aprenentatge automàtic, els arbres de decisió, d'una manera fonamental, però el seu exemple funciona bé amb qualsevol tipus d'algorisme d'aprenentatge. El problema requereix que la IA endevini les millors condicions per jugar a tennis donades les condicions meteorològiques. El conjunt de característiques descrites per Quinlan és el següent:
- Perspectiva: Assolellat, ennuvolat o plujós
- Temperatura: freda, suau o calenta
- Humitat: Alta o normal
- Vent: vertader o fals
La taula següent conté les entrades de la base de dades utilitzades per a l'exemple:
Perspectiva |
Temperatura |
Humitat |
Ventós |
Jugar a tennis |
Assolellat |
Calent |
Alt |
Fals |
No |
Assolellat |
Calent |
Alt |
És cert |
No |
Ennuvolat |
Calent |
Alt |
Fals |
Sí |
Plujós |
lleu |
Alt |
Fals |
Sí |
Plujós |
Guai |
Normal |
Fals |
Sí |
Plujós |
Guai |
Normal |
És cert |
No |
Ennuvolat |
Guai |
Normal |
És cert |
Sí |
Assolellat |
lleu |
Alt |
Fals |
No |
Assolellat |
Guai |
Normal |
Fals |
Sí |
Plujós |
lleu |
Normal |
Fals |
Sí |
Assolellat |
lleu |
Normal |
És cert |
Sí |
Ennuvolat |
lleu |
Alt |
És cert |
Sí |
Ennuvolat |
Calent |
Normal |
Fals |
Sí |
Plujós |
lleu |
Alt |
És cert |
No |
L'opció de jugar a tennis depèn dels quatre arguments que es mostren aquí.
Un model de Naïve Bayes pot recórrer l'evidència al resultat correcte.
El resultat d'aquest exemple d'aprenentatge d'IA és una decisió sobre si s'ha de jugar a tennis, donades les condicions meteorològiques (l'evidència). Utilitzar només la perspectiva (assolellat, ennuvolat o plujós) no serà suficient, perquè la temperatura i la humitat poden ser massa altes o el vent pot ser fort. Aquests arguments representen condicions reals que tenen múltiples causes, o causes que estan interconnectades. L'algoritme Naïve Bayes és hàbil per endevinar correctament quan existeixen múltiples causes.
L'algorisme calcula una puntuació, basada en la probabilitat de prendre una decisió determinada i multiplicada per les probabilitats de l'evidència relacionada amb aquesta decisió. Per exemple, per determinar si s'ha de jugar a tennis quan el panorama és assolellat però el vent és fort, l'algoritme calcula la puntuació d'una resposta positiva multiplicant la probabilitat general de jugar (9 partides jugades de 14 casos) per la probabilitat de la el dia assolellat (2 de cada 9 partits jugats) i de tenir condicions de vent a l'hora de jugar a tennis (3 de cada 9 partits jugats). S'apliquen les mateixes regles per al cas negatiu (que té diferents probabilitats de no jugar donades certes condicions):
probabilitat de jugar: 9/14 * 2/9 * 3/9 = 0,05
probabilitat de no jugar: 5/14 * 3/5 * 3/5 = 0,13
Com que la puntuació de la probabilitat és més alta, l'algoritme decideix que és més segur no jugar en aquestes condicions. Calcula aquesta probabilitat sumant les dues puntuacions i dividint ambdues puntuacions per la seva suma:
probabilitat de jugar: 0,05 / (0,05 + 0,13) = 0,278
probabilitat de no jugar: 0,13 / (0,05 + 0,13) = 0,722
Podeu ampliar encara més Naïve Bayes per representar relacions que són més complexes que una sèrie de factors que insinuen la probabilitat d'un resultat mitjançant una xarxa bayesiana, que consisteix en gràfics que mostren com els esdeveniments s'afecten mútuament. Els gràfics bayesians tenen nodes que representen els esdeveniments i arcs que mostren quins esdeveniments afecten els altres, acompanyats d'una taula de probabilitats condicionals que mostren com funciona la relació en termes de probabilitat. La figura mostra un exemple famós d'una xarxa bayesiana extreta d'un article acadèmic de 1988, " Local computations with probabilities on graphical structures and their application to experts systems ", de Lauritzen, Steffen L. i David J. Spiegelhalter, publicat pel Journal of la Royal Statistical Society.
Una xarxa bayesiana pot donar suport a una decisió mèdica.
La xarxa representada s'anomena Àsia. Mostra les possibles condicions del pacient i què causa què. Per exemple, si un pacient té dispnea, podria ser un efecte de tuberculosi, càncer de pulmó o bronquitis. Saber si el pacient fuma, ha estat a Àsia o té resultats radiogràfics anòmals (donant així certesa a determinades evidències, a priori en llengua bayesiana) ajuda a inferir les probabilitats reals (posterior) de tenir alguna de les patologies en el gràfic.
Les xarxes bayesianes, tot i que intuïtives, tenen matemàtiques complexes darrere d'elles, i són més potents que un simple algorisme Naïve Bayes perquè imiten el món com una seqüència de causes i efectes basats en la probabilitat. Les xarxes bayesianes són tan efectives que les podeu utilitzar per representar qualsevol situació. Tenen aplicacions variades, com ara diagnòstics mèdics, la fusió de dades incertes que arriben de múltiples sensors, modelització econòmica i el seguiment de sistemes complexos com un cotxe. Per exemple, com que la conducció en trànsit d'autopistes pot implicar situacions complexes amb molts vehicles, el consorci d'anàlisi de fluxos de dades massius (AMIDST), en col·laboració amb el fabricant d'automòbils Daimler, va idear una xarxa bayesiana que pot reconèixer les maniobres d'altres vehicles i augmentar la seguretat de la conducció. Llegeix més sobre aquest projectei veure la complexa xarxa bayesiana .