Cinque volte su sei

È arrivato quel momento dell’anno: fare l’esercizio divertente e inutile di prevedere i risultati del Mondiale, tanto più dal momento in cui non giocano gli azzurri.

giu 08, 2026

Mettiamo subito in chiaro l’imbarazzo. Per settimane ho dato in pasto a un computer quattromila partite di calcio. Ho scritto righe di codice (ora grazie a Claude Code conosco il kung fu!) con la fronte aggrottata. Ho fatto simulare al povero processore cinquantamila volte l’intero Mondiale 2026: dodici gironi, il nuovo turno a trentadue, ottavi, quarti, rigori, supplementari, lacrime.

E tutto questo apparato degno di un’agenzia spaziale ha prodotto un verdetto che si riassume così: la squadra più forte del torneo vincerà la coppa una volta su sei. Le altre cinque volte, semplicemente, no.

Non è il risultato che speravo. È molto meglio.

Come quasi sempre, la cosa interessante di questo esercizio empirico non è il nome della favorita (lo saprete tra tre righe e non vi cambierà la vita); la cosa interessante è quanto poco quel nome significhi. Costruire un vate che vede nel futuro e scoprire che il vate, onestamente, alza le spalle: ecco un risultato che vale il prezzo del biglietto.

Prevedere il calcio: una nobile forma di presunzione

Alla vigilia di ogni Mondiale, l’umanità si divide in due. Da una parte chi prevede chi vincerà: bookmaker, opinionisti, zii al pranzo della domenica, bambini con l’album delle figurine.

Dall’altra, nessuno, perché il fascino dell’indovino è irresistibile.

È un rito antico quanto il pallone, e fallisce con puntualità svizzera (di cui per altro abbiamo calcolato odds, visto che la confederazione elvetica ha una buona nazionale). Il Brasile dato per spacciato che trionfa; la corazzata che esce ai gironi; il pronostico unanime che dura fino al novantesimo ma non nel recupero.

L’approccio standard, quando lo si fa con un minimo di serietà, è sempre lo stesso: si assegna a ogni squadra un punteggio di forza, fondato sui risultati storici delle nazionali coinvolte nel torneo; si simula il torneo un sacco di volte, si conta chi vince più spesso. Funziona, in un senso molto preciso e molto limitato. Io volevo provare a fare una cosa leggermente diversa e, soprattutto, più onesta.

Cosa fa la macchina (e cosa fa di diverso)

Il cuore della questione è semplice. Per ogni nazionale ho stimato due numeri: quanto segna e quanto subisce. Non li ho decisi io, perché li ho ricavati da circa quattromila partite internazionali giocate tra il 2017 e oggi, pesando di più quelle recenti e di meno le amichevoli, dove le squadre provano formazioni improbabili e i risultati contano quanto un sondaggio fatto al bar. Da questi due numeri possiamo stimare, per qualsiasi partita immaginabile, quanti gol è lecito attendersi da ciascuna squadra.

Vale tuttavia la pena ribadire cosa la macchina non sa.

Non sa chi è Mbappé. Non sa che il Brasile è il Brasile. Non ha mai visto giocare nessuno. È un marziano col dito sul tabellino: conosce solo chi ha vinto, contro chi, e con quanti gol. Tenetelo a mente, perché è una scelta, non una dimenticanza, e tra poco mi servirà non per dire una poesia, ma per provare a sviluppare un ragionamento critico.

Poi si tirano i dadi. Il torneo viene simulato per intero non una volta, ma cinquantamila volte: cinquantamila universi paralleli in cui, di sentiero in sentiero, di scarpata in crepaccio, la Spagna alza la coppa, oppure esce agli ottavi per un rigore sbagliato, oppure guarda in tv la finale tra due sorprese.

Alla fine si contano le occorrenze e otteniamo le probabilità.

Fin qui, niente di rivoluzionario. La parte che mi piace (la mia personalissima e narcisa presunzione di originalità, concedetemela) sta in cinque scelte.

Primo: ho rovesciato la domanda. Non «chi vince», ma «quanto conta vincere»: l’obiettivo dichiarato è misurare l’imprevedibilità, non spazzarla sotto il tappeto.

Secondo: incertezza onesta. Invece di un’unica stima di forza per squadra, ne ho calcolato duecento versioni leggermente diverse e facendole girare tutte nelle simulazioni. Il risultato non è una previsione, ma una nuvola di previsioni (oh, la serenità che sa di resa di nascondersi in un inconcludente cirrocumulo di punti) che è l’unico modo intellettualmente serio di dare un numero a qualcosa che non è ancora successo.

Terzo: separare talento e fortuna in laboratorio. Più avanti vi mostro il trucco. È la cosa di cui vado più fiero, ed è anche quella che fa più male. So che non ci state probabilmente capendo niente, ma continuate a leggere… poi vi spiego.

Quarto: giudicare dai risultati, non dalla reputazione. È il marziano col tabellino. E quando il marziano è in disaccordo con i bookmaker, che invece la reputazione la conoscono benissimo, quel disaccordo diventa la parte più gustosa dell’articolo.

Quinto: pubblicare la nostra pagella. Ho testato il modello mettendolo a prevedere un Mondiale di cui… conosciamo già la fine, per vedere quanto è bravo. Il voto è imbarazzante. Lo vedrete, brutta figura inclusa.

Titolo: Importanza delle variabili nel prevedere i gol - Descrizione: Importanza delle variabili nel prevedere i gol

Cosa pesa, quando la macchina decide. La differenza di forza tra le squadre domina; reddito e popolazione del paese fanno capolino — la macchina ha scoperto da sola che le nazioni ricche e popolose segnano di più. Grazie, ci mancava.

La classifica, e il primo schiaffo

Eccola, la graduatoria che fingete di non aspettare. In cima ci sono Spagna e Argentina, appaiate intorno al 17%. Poi un gradino più giù e arrivano Inghilterra (circa il 10%), Francia (8%), Brasile (7%), Portogallo (6%). Verso il basso, una sorpresa che terremo per dopo: il Marocco al 4%. È una classifica ragionevole, di quelle che fanno annuire qualunque tifoso.

Titolo: Probabilità di vittoria, prime 15 squadre - Descrizione: Probabilità di vittoria, prime 15 squadre

Probabilità di alzare la coppa, prime quindici. In blu il modello, in rosso le probabilità implicite nelle quote dei bookmaker al 3 giugno 2026.

Ma guardiamoli di nuovo, questi numeri. La favorita assoluta è data al 17%. Significa che nell’83% dei casi vince qualcun altro. Le prime cinque squadre messe insieme non arrivano al 60%: c’è più probabilità che vinca «una delle altre quarantatré» che la grande favorita. Spesso dimentichiamo la banalità di questi numeri, per cui penso sia un punto utile da sottolineare.

Siamo abituati a pensare ai tornei come a una verifica al termine della quale, doverosamente, vince il migliore. I numeri raccontano un’altra storia e la raccontano con la falsa precisione di chi non sa nulla, ma lo sa in modo molto dettagliato.

Pure l’utilizzo del verbo sapere è il risultato di un prestito concettuale che è sintomo del problema: una tecnologia che corre più velocemente dell’evoluzione linguistica porta le parole stesse a cercare conforto in campi non di stretta competenza. È il motivo per cui la data science si serve spesso del lessico delle scienze comportamentali.

Se volete il quadro completo (chi ha più chance di superare i gironi, chi di arrivare in semifinale, chi di sognare la finale) eccolo, dalla cima al fondo del barile.

Titolo: Mappa di sopravvivenza per fase del torneo - Descrizione: Mappa di sopravvivenza per fase del torneo

La traversata, fase per fase: probabilità di raggiungere ogni turno, dalle teste di serie in alto fino alle outsider in basso. Più scuro, più probabile. Lo so, è un grafico abbastanza illeggibile, ma fa figo mettere le heat maps, per cui ve le accollo.

Il talento e la fortuna, separati in laboratorio

Ed eccoci alla parte che mi ha fatto venire voglia di scrivere tutto questo.

Immaginiamoci un Mondiale parallelo in cui, in ogni partita, vince sempre e comunque la squadra più forte sulla carta. Niente episodi, niente pali, niente notti storte del portiere, niente arbitro distratto. In quel mondo ordinato e leggermente fascista, la Spagna alzerebbe la coppa nel 97% dei casi. Il torneo sarebbe una formalità con rinfresco finale.

Ora riaccendiamo la luce (o il buio, dipende dal philosophical bending) del caso. Reintroduciamo il fatto, ovvio a chiunque abbia visto mezza partita, che la squadra più forte vince spesso ma non sempre: magari sei volte su dieci contro una pari, otto contro una più debole. Basta questo. Quella probabilità realistica, moltiplicata partita dopo partita lungo sette turni a eliminazione diretta, fa franare il 97% della Spagna fino al suo 17% reale.

La differenza tra quel 97% e questo 17% ha un nome preciso: si chiama fortuna. Non è un modo di dire poetico. È, letteralmente, la fetta di risultato che il talento non spiega. L’ho misurata mettendo i due mondi uno accanto all’altro.

Titolo: Scomposizione talento contro fortuna - Descrizione: Scomposizione talento contro fortuna

A sinistra l’«apertura» del torneo. A destra, per ogni squadra, la probabilità di vincere in un mondo dove conta solo il talento (rosso) contro il mondo reale, dove conta anche il caso (blu). Quel crollo è la fortuna, fotografata.

C’è un modo di mettere un singolo numero su tutto questo: si chiama entropia ed è una misura di imprevedibilità. Su una scala da zero a uno (dove zero significa «so già chi vince» e uno significa «è una lotteria fra quarantotto biglietti identici») il Mondiale 2026 si piazza a 0,71. Molto più vicino all’estrazione del lotto che all’esame con i primi della classe. Tradotto per il bar: state per guardare una lotteria con i favoriti, non una verifica con i secchioni.

Dove la macchina litiga con il mercato

I bookmaker sono, a modo loro, un modello rivale: aggregano i soldi e le opinioni di milioni di persone, nonché dati a profusione, e di solito hanno ragione. Confrontare le mie probabilità con le loro è il modo più rapido per capire dove diciamo qualcosa di originale e dove sto semplicemente prendendo un granchio. Sulla maggior parte delle squadre i due mondi si parlano. Su tre, litigano. E i litigi, per dare sapidità all’articolo, sono tutto.

Titolo: Probabilità del modello contro probabilità di mercato - Descrizione: Probabilità del modello contro probabilità di mercato

Modello (in verticale) contro mercato (in orizzontale). Sulla diagonale, accordo perfetto. Sopra la linea, il modello è più ottimista del mercato; sotto, più pessimista.

La macchina ama l’Argentina molto più del mercato: la mette quasi alla pari della Spagna, mentre i bookmaker la danno a metà. Perché? Perché l’Argentina, nei risultati degli ultimi anni, ha vinto e continua a vincere ed è esattamente ciò che la macchina misura. Il mercato, forse, sconta l’età della squadra e una certa stanchezza da campioni in carica: cose che i gol passati non raccontano.

Specularmente, la macchina è fredda sulla Francia, che i bookmaker piazzano invece tra le primissime. Qui torna il marziano col tabellino: il modello non vede il valore stratosferico della rosa francese, vede i risultati. E i risultati recenti, evidentemente, impressionano meno dell’organico. È un disaccordo onesto tra due filosofie: contano i nomi sulla maglia o i punti sul tabellone? E la verità, probabilmente, sta in un punto scomodo nel mezzo.

Infine il Marocco, che il modello valuta quattro volte più del mercato. O è una scommessa coraggiosa, l’eredità di un percorso di risultati solidi che il mondo continua a sottovalutare; o è un eccesso di entusiasmo di una macchina che non ha visto la differenza tra una bella vittoria e una vittoria fortunata. Lo sapremo a luglio. È il bello e il maledetto di esporsi.

L’arte di sbagliare con metodo

Ma ecco la confessione, che è anche il cuore della faccenda con un bel bagno scozzese (occhio pure a loro eh) di umiltà.

Ho messo il modello alla prova facendogli «prevedere» il Mondiale 2022, di cui, piccolo dettaglio, conosciamo già il finale, allenandolo solo su dati precedenti. Verdetto: la mia macchina batte il puro tirare a indovinare di circa il cinque per cento.

Cinque.

Per cento.

Cioè, leggermente meglio di una monetina ma con una fatica immensamente maggiore nel lanciare i dati in aria.

Il dilemma morale è evidente: vale la pena dare in pasto a un computer quattromila partite, scomodare la statistica bayesiana e bruciare cinquantamila simulazioni per un Nostradamus che, alla fine, supera di un’incollatura una moneta di 1 euro cui avete dato un bacino alla testa?

Titolo: Calibrazione sul Mondiale 2022 - Descrizione: Calibrazione sul Mondiale 2022

La pagella, Mondiale 2022. Più i punti stanno sulla diagonale, meglio il modello azzecca le probabilità. Diciamo che c’è spazio per crescere.

Si potrebbe leggere come una débâcle, per me è la prova del nove del senso di questo pezzo.

Sono riuscito a costruire una macchina diligente e il meglio che sa fare è guadagnare un soffio sulla monetina. E il tutto ci porta a una conclusione talmente banale nella sua ovvietà da sorprenderci in un’epifania che sa di rivelazione: quello che la macchina cerca di prevedere è, alla radice, poco più del lancio di una monetina.

Una sfera di cristallo data driven che indovina appena meglio del caso non è una cattiva sfera di cristallo: è una sfera di cristallo onesta che fa previsioni attorno a un fenomeno che è, in buona parte, caso. Per cui varrebbe appunto la pena usare una sfera di cristallo non data driven.

Scusate la cacofonia dei miei pensieri disordinati, ma il calcio, fra tutti gli sport, è il più refrattario alla profezia.

Primo, perché i gol sono (ancora, pur se si avvertono nelle retrovie dei laterali a tutto campo e dei centrocampisti box to box i segnali di un cambiamento) rari: una partita può girare su un episodio, un rimpallo, un fuorigioco di un alluce (vedremo i risultati della nuova regola).Là dove nel basket le decine di canestri fanno media e premiano il più forte, nel calcio un singolo lampo decide novanta minuti.

Secondo, le partite sono pochissime: anche il campione ne gioca sette in tutto, troppo poche perché il talento abbia il tempo di imporsi sul rumore.

Terzo, questo è il primo Mondiale a quarantotto squadre della storia: non esiste un precedente identico da cui imparare, e noi stiamo estrapolando da tornei che avevano un’altra forma.

Infine, e scusate se è poco, c’è tutto ciò che la macchina, beata lei, ignora: l’infortunio del fuoriclasse a tre giorni dal via, l’espulsione al ventesimo, l’acquazzone, l’altitudine di Città del Messico (duemiladuecento metri che tolgono il fiato a chi non è abituato e non si chiama Mennea per i baby boomers che se lo ricordano), il caldo del Texas che spezza le gambe, i viaggi siderali tra tre nazioni.

Tutte cose che, il giorno della partita, contano enormemente e che nessun tabellino del 2019 può raccontare.

Una piccola confessione finale, nello spirito di ridere di noi stessi: la primissima versione di questo modello, qualche settimana fa, dava il Messico campione, gli Stati Uniti in semifinale e Panama davanti alla Francia. L’ho cestinata con la dignità di chi finge non sia mai successo. È servita a ricordarmi una regola d’oro: un modello che ti dice ciò che vuoi sentire è un cattivo modello; un modello che ti dice numeri assurdi, almeno, ha il pregio di urlare il proprio errore. Il vero pericolo sono i modelli che sbagliano con eleganza e finiscono col convincerti.

Il canovaccio

C’è una ragione se questa newsletter si chiama come si chiama. Nel teatro dell’arte il canovaccio è la traccia scarna della trama: stabilisce chi entra in scena e quando, ma lascia agli attori il compito di improvvisare il resto, lì, nel momento, davanti al pubblico.

Un Mondiale funziona allo stesso modo. Il tabellone è il canovaccio. Il talento scrive la traccia: chi è forte, chi parte avanti, chi dovrebbe arrivare in fondo. Ma la rappresentazione vera, quella che ci terrà svegli fino alle due di notte per cinque settimane, la improvvisa il caso: un rimpallo, un rigore calciato sulla luna, una parata che non doveva esistere.

Per questo, quando il 19 luglio qualcuno solleverà la coppa a New York e tutti diranno «ha vinto la più forte», varrà la pena tenere a mente questi numeri. Forse era davvero la più forte. Ma è anche, più semplicemente, quella a cui è andata bene.

Una volta su sei.

Discussione su questo Post

Assolutamente, procediamo.