La finale di Champions League non era solo una partita entusiasmante, ma era anche un potenziale punto di svolta: il Liverpool Striker Mo Salah, giocatore dell'anno, vincitore dello Scarpone d'oro e giocatore più famoso d'Egitto aveva improvvisamente preso il suo biglietto per il titolo di Coppa del Mondo nel dubbio dopo una sfida aggressiva di Sergio Ramos lo ha lasciato ferito.

Le implicazioni di questo conflitto avrebbero potuto essere enormi: se Salah non fosse in grado di giocare per il suo paese (si scopre che ha fatto il quasi impossibile ed è in forma), questo avrebbe potuto influenzare le possibilità dell'Egitto nella Coppa del Mondo, e mentre l'Egitto è improbabile che possa turbare i turni successivi della competizione, come una farfalla che sbatte le ali dall'altra parte del mondo, le prestazioni dell'Egitto potrebbero a loro volta influenzare come fanno le altre squadre del suo gruppo - e in definitiva influenzare il paese che deve sollevare il trofeo.

Ciò detto, la potenziale caduta di Salah è solo uno dei milioni di punti dati. Uno dei milioni di fattori che potrebbero influenzare in definitiva l'esito della competizione.

Come possiamo capire cosa aspettarci, allora? C'è un modo per prevedere come si esibiranno i team? Big Data, che ha già trasformato innumerevoli altri settori, potrebbe sbloccare anche una più profonda comprensione del bellissimo gioco? Potrebbe prevedere chi vincerà la Coppa del Mondo?

Punti dati

Opta Sports e STATS sono due aziende che cercano di rispondere a domande come questa. Come società di dati sportivi, le loro missioni sono di raccogliere dati e dare un senso ai loro clienti, che comprende squadre sportive e federazioni, così come i media che sono affamati di dati approfonditi (ahem).

“È molto facile pensare che più dati siano buoni, ma finché non sai come utilizzarli e cosa puoi imparare da esso, a volte possono essere dati per motivi di sicurezza”

Paul Power, STATS.com

Che cosa effettivamente raccolgono, quindi? Il direttore marketing di Opta, Peter Deeley, ha spiegato che per ogni partita di calcio, la sua compagnia raccoglie circa 2000 punti dati individuali, per lo più focalizzati su “on-ball” Azioni. Un team di tre analisti - uno per ogni lato e qualcuno per ricontrollare momenti difficili, siederà nell'hub di dati della società a Leeds e registrerà essenzialmente tutto ciò che accade sul campo: ogni passaggio, cross e tiro, così come le posizioni sul campo in cui ogni interazione ha avuto luogo.

I dati vengono consegnati ai clienti dal vivo, motivo per cui, ad esempio, l'esperto britannico (ed ex giocatore inglese) Gary Lineker è in grado di comunicare agli spettatori statistiche come possesso e tiri in porta a metà tempo.

Stats.com fa lo stesso genere di cose - e Paul Power, uno scienziato di dati della compagnia, era desideroso di dirmi che non sono solo gli umani ad essere usati per la raccolta dei dati, ma anche le nuove tecnologie di visione artificiale.

Quando si tratta di registrare con precisione la posizione di ogni giocatore sul campo, la sua compagnia utilizza telecamere posizionate sul bordo per capirlo, evitando che i giocatori indossino i beacon di tracciamento sotto le loro magliette, come è successo negli sport come il Rugby Union.

Ma perché attenersi agli umani? Non è possibile utilizzare la visione del computer per accedere tutti di questo tipo di dati? “Le persone sono ancora le migliori a causa delle sfumature che i computer non saranno in grado di capire,” sostiene Paul.

Dà l'esempio e se un giocatore viene messo all'angolo e calcia via la palla per disperazione, ma fortunatamente la palla viene poi ricevuta da un giocatore della stessa squadra. Per una macchina, questo può sembrare semplicemente un passaggio lungo, poiché le macchine non riescono a capire il contesto di ciò che sta accadendo, o l'espressione di panico sulla faccia del giocatore - registrerebbe un passaggio lungo, mentre tecnicamente l'evento è tecnicamente qualcosa altro: un gioco. Il che significa che senza un essere umano effettuare queste chiamate, i dati registrati potrebbero essere meno accurati.

L'approccio Opta

Sappiamo che entrambe le società hanno molti dati, ma chi pensano che vincerà effettivamente la Coppa del Mondo? Sebbene entrambe le società generino molti dati dettagliati per i loro clienti, curiosamente STATS e Opta si sono differenziati quando si tratta di modellare il torneo di questa estate.

Nel caso di Opta, Peter mi ha spiegato che il loro modello di Coppa del Mondo non tiene conto della miriade di dati dei singoli giocatori. Invece, Opta ha scelto solo di guardare le prestazioni delle squadre nazionali specifiche a livello di squadra. Ad esempio, valutando le probabilità dell'Egitto sulla base di come la squadra egiziana si è comportata in passato, e senza prendere in considerazione la situazione di infortunio di Mo Salah.

“I dati degli scienziati per la Coppa del Mondo hanno esaminato le prestazioni storiche di diversi paesi, che differenza fa se stai giocando come nazione ospitante, che differenza fa che stai giocando nel tuo continente. "

Peter Deeley, Opta

“I dati degli scienziati per la Coppa del Mondo hanno esaminato le prestazioni storiche di diversi paesi, che differenza fa se stai giocando come nazione ospitante, che differenza fa che stai giocando nel tuo continente [e] che differenza fa? fa se hai vinto le ultime coppe del mondo,” Spiega Peter.

Gli scienziati dei dati sono stati quindi in grado di modificare il modello eseguendolo centinaia di migliaia di volte per apportare miglioramenti iterativi, regolando il peso relativo di ciascun fattore nell'algoritmo.

Questa è una sorpresa, poiché si presuppone che più dati siano i migliori, ma Peter ritiene che questo modello possa ancora fornire buone previsioni.

“Una Coppa del Mondo viene fatta solo ogni quattro anni, quindi troverai spesso che un giocatore di qualità decente, che gioca per un paese che spesso gioca in Coppa del Mondo, giocherà solo in due tornei di Coppa del Mondo - non avrai molti dati su che i giocatori hanno un impatto sulla squadra più ampia, all'interno del set-up internazionale.” lui dice.

E crede che i dati a livello di squadra siano sufficienti: “L'Italia vinse nel 2006 - non erano favoriti e la qualità della loro squadra era buona, non erano una squadra che aveva una superstar di livello Cristiano Ronaldo.”

Continua a spiegare: “È davvero interessante, con i Mondiali è vero che quelle squadre che storicamente stanno bene continuano a fare bene. La Germania, negli ultimi tre mondiali, è arrivata almeno alle semifinali.

"Anche se puoi discutere della loro squadra questa volta non è buono come la scorsa volta, hanno ancora il record di essere campioni del mondo in carica, di essere una squadra che generalmente si comporta bene - ed è nel loro continente natale. significa che hanno una buona possibilità in generale, non indipendentemente dalla loro squadra, ma hanno una storia di risultati positivi ai tornei.”

“È molto facile pensare che più dati siano buoni, ma finché non sai come utilizzarli e cosa puoi imparare da esso, a volte possono essere dati per motivi di sicurezza”, lui dice.

Il modello STATS

STATS ha modellato la Coppa del Mondo in modo diverso. A differenza del suo rivale, sta prendendo in considerazione i dati dei singoli giocatori per quello che chiama “Cosa succede se?” analitica.

Secondo Paul, ciò significa che STATS può utilizzare efficacemente i dati dei singoli giocatori per capire non solo come una squadra si esibirà, ma anche quantificare l'impatto dei giocatori che si scambiano dentro e fuori la squadra. Nel caso di Mo Salah, STATS afferma che il suo sistema sarebbe in grado di determinare l'impatto sull'Egitto della sua idoneità a giocare o meno.

“Puoi collegare queste diverse situazioni e questo sarebbe in grado di generare un risultato e quella misura sarebbe il numero di goal segnati o concessi, o semplicemente la probabilità di vittoria: in che modo quel giocatore aumenta o diminuisce le probabilità? "Spiega Paul.

“Possiamo guardare a questo, eseguire le simulazioni e questo in realtà ci dirà: Mo Salah potrebbe valere 0.3 di un goal, o se non sta giocando e un altro giocatore entra, che riduce la probabilità di vincita del 3% o del 10% o potrebbe effettivamente aumentarlo a seconda della squadra contro cui stanno effettivamente giocando.”

(Immagine: © Getty Images)

Perché STAT ritiene che l'approccio individuale funzioni meglio rispetto ai team?

“Tutti sanno se ti mancano i tuoi star player che avranno un impatto sulle prestazioni - non hai bisogno di una complessa rete neurale per dirti che,” dice Paul. “Se ti manca nel tuo set di dati, questo davvero distorcerà le tue probabilità e le tue previsioni”.

“Sappiamo che aggiungendo in queste funzionalità aggiuntive ai giocatori che otteniamo un impatto migliore perché ciò che siamo in grado di fare meglio è modellare le relazioni dirette tra gli individui, e mentre è uno sport di squadra, sappiamo che alcune persone hanno un'influenza maggiore sul risultato di certi altri.

"Se per esempio ti manca un terzino, potrebbe essere meno un problema che mancare a un centrocampista centrale, quindi devi tenerne conto e, di conseguenza, siamo molto fiduciosi nel modello che abbiamo generato.”

Dimmi chi vincerà, dannazione

Ora arriviamo alla domanda più importante: quale paese predicono i due modelli vincerà? In entrambi i casi, come veri nerd delle statistiche, hanno fornito previsioni probabilistiche che contengono un po 'più di sfumatura di quelle di Dave, che giura cieco che la Germania vincerà di nuovo perché ha una bella sensazione su di loro.

Ho chiesto a STATS le sue previsioni, e purtroppo, nonostante la compagnia sia disposta a parlarmi di tutti i dati a cui ha accesso, e come voluto Effettivamente fare una previsione, mi è stato detto che non pubblicheranno le loro previsioni quest'anno. Perché? Per paura di sbagliare? No, la risposta è molto più semplice: si tratta di informazioni preziose e vogliono solo versare i fagioli ai clienti paganti.

Tuttavia, abbiamo una previsione da parte di Opta. Valuta ancora una volta i vincitori della Coppa del Mondo brasiliana (solo per non parlare del 2014) come i campioni più probabili, dando loro il 14,2% di possibilità di vincere. Ciò significa che se hai corso la Coppa del Mondo con le stesse squadre esattamente 20 volte, ti aspetteresti che il Brasile vinca tre volte. Come il tuo compagno Dave, anche Opta immagina la Germania, dando loro l'11,4% di possibilità di portare a casa il trofeo.

Un'altra società a cui piace prevedere e ha una quantità spaventosa di precisione nei suoi risultati è EA Sports. Per gli ultimi tre Mondiali, ha giustamente predetto l'eventuale vincitore della Coppa del Mondo.

Usando i dati dettagliati che ha sui giocatori e le classifiche delle squadre in FIFA 2018 e il suo add-on per la Coppa del Mondo, è stata eseguita una simulazione del torneo e la Francia è stata l'eventuale vincitrice, sconfiggendo la Germania nella finale. Dato che prevedeva la Germania e la Spagna rispettivamente per i Mondiali del 2014 e del 2010, questo potrebbe essere un buon grido.

Poi c'è Blue Yonder, un'azienda famosa per l'utilizzo di IA per prevedere il flusso e riflusso della gestione delle scorte in alcuni dei più grandi supermercati del mondo. Di recente ha girato la mano per prevedere la Coppa del Mondo. Campo sinistro sì, ma la sua tecnologia ha analizzato ogni partita di calcio internazionale giocata dal 1872, correndo oltre 1 milione di simulazioni della Coppa del Mondo e ritiene che il Brasile sia il favorito per vincere la Russia, con una probabilità del 22,5% di vincere.

E l'Inghilterra? La cattiva notizia per Gareth Southgate è che Opta regala alla sua squadra una modesta possibilità dell'1,9%, mentre Blue Yonder fa un po 'di differenza al 5,7%.

Se Opta e Blue Yonder hanno ragione, è molto probabile che non vediamo l'ora di perdere ancora un altro rigore. Sospiro.

La copertura della Coppa del Mondo di TechRadar ti viene offerta in associazione con Honor.