È possibile prevedere esattamente il futuro? Beh, non proprio ma possiamo provarci. Come? Con il teorema di Bayes. La sua formulazione matematica è relativamente semplice e per questo molto elegante, ma nasconde una profondità difficilmente intuibile ad un occhio superficiale. In questo articolo cercheremo di capire la formula matematica, le applicazioni e perché questa regola ha già conquistato le più diverse discipline. Le sue conquiste spaziano dalla finanza alla medicina, passando per la giustizia e la sicurezza informatica, per finire con l’immancabile Intelligenza Artificiale e il Machine Learning. Pronti? Partiamo insieme per questo viaggio!
Table of Contents
- Prima Un Po’ Di Storia
- La Formula Del Teorema di Bayes
- Alcune Storiche Applicazioni
- Conclusioni
- E Ora Qualche Esercizio Sul Teorema Di Bayes
Prima Un Po’ Di Storia
Ma chi era Thomas Bayes? Nato in una famiglia agiata nel sud-est dell’Inghilterra nel 1701 da un ministro presbiteriano, si laureò presso l’Università di Edimburgo e seguì le orme del padre come pastore. La sua opera più nota e importante è “Essay Towars Solving a Problem in the Doctrine of Chances” pubblicata postuma dall’amico Richard Price nel 1763.
Il saggio si occupa di come formulare affermazioni probabilistiche sul mondo quando aggiungiamo nuove informazioni alle nostre credenze iniziali. Attenzione però: stiamo sempre parlando di probabilità e non di risposte esatte! L’originalità dell’autore è chiaramente verificabile dal tema del suo saggio. Bayes chiedeva infatti ai suoi lettori di immaginare un uomo che appena catapultato sul nostro pianeta inizi a formulare ipotesi sul suo funzionamento, dopo aver collezionato un certo numero di osservazioni. Quest’uomo come dovrebbe ragionare dopo aver visto la prima, la seconda e la terza alba? La conclusione è decisamente sconvolgente: l’uomo non dovrebbe inferire che il Sole sorge ogni giorno neanche dopo molti anni!
L’attuale linguaggio matematico formale che utilizziamo non fu proposto dal reverendo Bayes, ma dal grande astronomo, matematico e fisico francese Pierre-Simon de Laplace che scoprì il teorema in modo indipendente e lo chiamò “probabilità delle cause”. Eppure, dalla morte di Laplace in poi, il teorema di Bayes cominciò a soffrire un rifiuto generalizzato da parte degli statistici.
Il Rifiuto
Ad opporsi furono soprattutto i cosiddetti “frequentisti”, ossia quel gruppo di matematici che si adoperava a verificare un’ipotesi nella maniera quanto più oggettiva possibile. Come? Sfruttando la grande mole di dati scientifici che a partire dal XVIII secolo in avanti sono stati prodotti, archiviati e resi disponibili per la ricerca.
Tra i frequentisti spicca il nome del grande statistico e biologo britannico Ronald Fisher. Egli era ed è tuttora considerato il fondatore della statistica moderna, essendo il padre sia della progettazione sperimentale che dei metodi statistici, nonché il più grande biologo dai tempi di Charles Darwin. L’avversione di Fisher per il teorema di Bayes non era in realtà fondata sulla formulazione matematica, ma bensì sulle sue applicazioni. Il concetto che più alimentava la polemica era quello di “probabilità a priori” (che spiegheremo a breve) perché considerato troppo soggettivo. È bene sottolineare però che Fisher, verso la fine della propria carriera, riconobbe la validità e l’importanza del teorema di Bayes.
Il Recupero
Il recupero del Teorema incomincia con la sua applicazione da parte del geniale matematico e pioniere dell’informatica Alan Turing (1912-1954) durante la Seconda Guerra Mondiale. Turing utilizzò il Teorema per decriptare “l’inviolabile” codice Enigma dei tedeschi, e per la costruzione dei computer Colussus, sempre a scopo di decriptazione. Successi però nascosti sia al grande pubblico sia al mondo della scienza dal Governo Britannico che li classificò come segreti di guerra. E questo proprio perché si rilevarono estremamente efficaci!
Durante la Guerra Fredda il teorema di Bayes risorse con forza grazie a due fondamentali figure: l’inglese Harold Jeffreys e l’italiano Bruno de Finetti. Infine, negli anni Novanta del XX secolo si aggiunsero altri decisivi alleati quali i personal computer e linguaggi di programmazione applicati a nuove tecniche di calcolo.
Oggigiorno il teorema di Bayes è impiegato nelle più varie ed eterogenee discipline. Ecco un elenco non esaustivo di alcuni suoi utilizzi concreti:
- nella cyber security è fondamentale per rilevare intrusioni ai sistemi informatici.
- In medicina e diagnostica medica per stimare la probabilità d’una malattia basandosi sui sintomi, risultati dei testi e altre informazioni cliniche.
- In finanza, dove le capacità predittive sono pagate letteralmente in oro, permette l’aggiornamento delle nostre stime in risposta ad eventi economici.
- Infine, il teorema di Bayes è utilizzato nel mondo del marketing, nella meteorologia, modellazione del clima, in ambito legale e in guerra.
La Formula Del Teorema di Bayes
Con un piccolo ma efficace esempio tratto dal magnifico libro “The Ten Equations That Rule The World” di David Sumpter, proviamo ad intuire la grandezza del teorema. Il formalismo matematico sarà tenuto al minimo possibile ma quanto basta per una comprensione efficace.
Siamo su un aereo di linea e si iniziano a sentire delle forti turbolenze: il nostro velivolo comincia ad oscillare pesantemente mettendo in agitazione passeggeri e personale. Stiamo per andare a schiantarci? Ragioniamo con calma: la probabilità che un aereo si schianti fatalmente è di una su 10 milioni, quindi molto bassa. Eppure, intuiamo che a noi serve poco questa statistica perché è proprio il nostro aereo che sta oscillando!
Introduciamo allora un altro elemento alla nostra equazione, ossia la probabilità condizionata, che risponde alla domanda “qual è la probabilità di un evento dato il verificarsi di un altro?”. In questo caso siamo interessati alla probabilità che il nostro aereo oscilli dato il fatto che si stia schiantando al suolo. Qui il calcolo è semplice: la probabilità è infatti pari a 1, perché uno schianto è sempre preceduto da forti oscillazioni.
Per i nostri scopi ci serve ora anche la probabilità opposta, ossia di oscillazioni dato però, passatemi il termine, il “non-schianto”, cioè di un atterraggio sicuro. Qui scegliamo una probabilità “stimata” sulla nostra esperienza e assegniamo un valore di uno su cento. Significa quindi che, dato un volo con atterraggio sicuro, un centesimo delle volte ci sono state oscillazioni preoccupanti dell’aereo.
Ora abbiamo tutti gli elementi per calcolare quello che vogliamo veramente: la probabilità di uno schianto date le oscillazioni, ossia in simboli:

Sostituendo i numeri nell’equazione otteniamo il valore desiderato:

Ecco dunque che la matematica corre in nostro aiuto a tranquillizzarci. Anche se le oscillazioni e turbolenze che stiamo vivendo sono molto forti e terrificanti, le probabilità di salvezza sono del 99.99999 per cento. Fiuu!
Alcune note sulla formula
Al numeratore della nostra equazione abbiamo la già menzionata “probabilità a priori” , ossia P(Schianto) = 1 su 10 milioni. In questo esempio è stata semplice da calcolare essendoci una statistica registrata sui disastri aerei, ma spesso la sua stima può creare alcuni grattacapi in situazioni più complesse. Era proprio la componente “a priori” ad essere sgradita a Fisher perché spesso scelta senza basi statistiche adeguate e quindi esposta ad un eccesso di soggettività.
L’altro elemento P(Oscilla/Schianto), sempre a numeratore, è chiamato verosimiglianza (“likehood” in inglese). Esso indica la probabilità che i dati siano prodotti sotto l’ipotesi di validità del nostro modello. In questo caso dunque calcoliamo le probabilità che ci siano oscillazioni dato uno schianto. La verosimiglianza si moltiplica per la probabilità a priori in quanto sono eventi che devono accadere insieme.
A denominatore abbiamo invece la cosiddetta “probabilità totale”. Nel nostro esempio è scritta in forma esplicita e corrisponde alla probabilità di avere oscillazioni, sia in conseguenza di uno schianto sia di un buon atterraggio. Nell’espressione incontriamo infatti il simbolo P(Oscillazioni | Non-Schianto) che possiamo generalizzare in P( A| non-B): esso permette di inserire l’ipotesi o le ipotesi alternativa/e nel computo della nostra probabilità.
E’ proprio per questo motivo che il teorema di Bayes è molto onesto: ci permette infatti di calcolare delle probabilità senza cadere nell’errore di dover confermare le nostre ipotesi ma lasciando spazio anche a spiegazioni alternative. Attenzione: questo punto è molto importante. Anche in paper scientifici di alto livello è capitato che la componente P(A | non-B) non sia stata trattata adeguatamente e lasciata fuori dalla formula, generando quindi il cosiddetto bias di conferma.
Questo semplice ma brillante esempio ci ha permesso di catturare l’essenza del teorema di Bayes: ossia il potere di chiarire il nostro processo decisionale e abbandonare i nostri pregiudizi.
Alcune Storiche Applicazioni
Il Caso Dreyfus
Vediamo ora alcune applicazioni pratiche del teorema di Bayes. Il primo esempio è il cosiddetto “Caso Dreyfus” ossia uno scandalo politico e militare che sconvolse la Francia alla fine del XIX secolo. Nel 1894, il capitano Alfred Dreyfus, un ufficiale ebreo dell’esercito francese, fu accusato ingiustamente di tradimento per aver trafugato e consegnato segreti militari ai tedeschi. Ricordiamo infatti che la guerra franco-prussiana combattuta tra il 1870-71 fu vinta dalla Confederazione Tedesca e il clima tra i due Paesi era ancora molto teso.
L’accusa si basava su un documento segreto ritrovato in un cestino dell’ambasciata tedesca a Parigi. Nonostante la mancanza di reali prove concrete, Dreyfus fu condannato principalmente a causa del clima antisemita dell’epoca.
Anni dopo, nel 1896, un altro ufficiale, il maggiore Ferdinand Walsin Esterhazy, fu sospettato di essere il vero traditore. Tuttavia, le autorità militari ignorarono le prove a suo carico e continuarono a proteggere la loro reputazione. Si aprì allora un dibattito nazionale che divideva la Francia in difensori e detrattori di Dreyfus. Lo scrittore naturalista di origini italiane Emile Zola scrisse nel 1898 un articolo diventato celebre, “J’accuse”, diretto al presidente francese per difendere l’innocenza dell’artigliere Dreyfus. Zola per la sua iniziativa ottenne solamente una condanna per diffamazione e un conseguente esilio in Gran Bretagna.
Nell 1899 il caso fu rivisto da un consiglio di guerra e l’avvocato difensore chiamò a testimoniare il grande scienziato Henri Poincaré. Per il matematico francese l’innocenza di Dreyfus si poteva dimostrare solo con il teorema di Bayes, perché unico metodo adatto ad attualizzare un’ipotesi a cui si apportavano nuovi dati. Dopo una lunga battaglia legale Dreyfus fu assolto dall’accusa di tradimento da un tribunale civile nel 1906.
Napoleone e Bayes a Waterloo
Napoleone, che si dice abbia più di 70 mila biografie a suo nome, è stato tra le altre cose un abile matematico, tanto da aver un teorema di geometria euclidea che porta il suo nome. In numerosi siti, dopo aver eseguito una semplice ricerca con i termini “Napoleone e Bayes” otteniamo un divertente aneddoto sull’uso di questo teorema prima della battaglia di Waterloo. È probabile che questa storia sia apocrifa ma noi la riportiamo in ogni caso, allo scopo di allenarci al ragionamento bayesiano.
Siamo alla vigilia della battaglia che sarà decisiva per la sorte dell’imperatore dei francesi: sul campo dovrà affrontare gli inglesi, guidati dal Duca di Wellington, e i prussiani comandati dal generale Bücher. Le due armate alleate non si sono ancora congiunte e Napoleone conta proprio su questo fatto per la vittoria.
Egli ha assegnato infatti all’esercito francese una probabilità di vittoria sugli inglesi pari al 90% se la sua armata riuscirà a trattenerli separati dall’esercito prussiano. In simboli possiamo scrivere P(Vittoria Napoleone) =0.90.
Venuto a conoscenza del congiungimento dei due alleati, le probabilità di vittoria sono naturalmente scese, pari secondo il generale corso, al 60%. In simboli P(Vittoria Napoleone|Unione Prussiani ed Inglesi)=0,60. Quello che vogliamo calcolare è il rapporto tra i due elementi dell’equazione ossia P(Unione Prussiani e Inglesi|Napoleone Vince) e P(Unione Prussiani e Inglesi|Napoleone Perde). In particolare, qual è questo rapporto? Ecco la soluzione:

Perché è importante questo rapporto? E’ interessante per i nostri scopi perché riflette la modifica di opinione da parte di Napoleone sulla base delle nuove informazioni. Questo rapporto è il fattore di aggiornamento che indica quanto le nuove evidenze abbiano influenzato le sue stime iniziali. Napoleone ha dunque ridotto le sue aspettative di vittoria di un terzo dopo aver saputo del congiungimento dei due eserciti!
Conclusioni
Eccoci dunque giunti alla conclusione. In questo articolo abbiamo visto come attraverso una regola matematica “semplice” ma molto profonda è possibile trarre conclusioni sul mondo con un approccio probabilistico. Aggiungendo osservazioni alle nostre ipotesi iniziali possiamo, con la giusta dose di umiltà, aggiornare i nostri pregiudizi e approssimarci alla verità. Bonne Chance!
Se ti è piaciuto questo articolo potrebbe anche interessarti metti “Anche i Geni sbagliano. Newton e l’equazione di De Moivre”
E Ora Qualche Esercizio Sul Teorema Di Bayes
Ecco alcuni esempi come esercitazione. Provate ad eseguirli da soli prima di sbirciare la soluzione!
1) Una certa produzione viene affidata, in parti uguali, a due macchine A e B che hanno rispettivamente probabilità dello 0,2% e dello 0,5% di produrre pezzi difettosi. Se si sceglie a caso un pezzo fra quelli di un certo lotto, e lo si scopre difettoso, qual è la probabilità che la macchina B lo abbia prodotto?
Soluzione: 0,71
2) Una fabbrica di maglieria acquista filati da tre ditte diverse nella percentuale rispettivamente del 30%, 35% e 35%. La percentuale di matasse che non hanno il colore concordato è del 4% per la prima ditta, del 5% per la seconda e del 3,5% per la terza. Se scelta a caso una matassa di filato, si vede che è difettosa, qual è la probabilità che provenga dalla seconda ditta fornitrice?
Soluzione: 70/167
3) Un gruppo di signore che si tingono i capelli viene tenuto sotto osservazione da un’azienda del settore che vuole verificare l’efficacia di un olio protettivo. Di esse il 60% ha i capelli scuri e il rimanente capelli chiari. Se non viene applicato correttamente, l’olio risulta inefficace per l’8% delle donne con i capelli scuri e per il 30% di quelle con i capelli chiari. L’azienda esamina una delle persone su cui l’olio non ha avuto effetto protettivo. Qual è la probabilità che essa abbia una capigliatura chiara?
Soluzione: 0,714
Bibliografia:
“Il Teorema di Bayes: Approssimarsi Alla Verità”, Pedro Castro, Mondo Matematico.
“The Ten Equations That Rule The World”, David Sumpter, Flariton Books, 2021
Gli esercizi sono tratti da: “Lineamenti di Matematica 5”, Marzia Re Fraschini e Gabriella Grazzi, Atlas.