Tutti la vogliono (la digitalizzazione), ma nessuno se la prende: il caso dell’algoritmo del merito sportivo della FIGC

La proposta di algoritmo del merito sportivo della FIGC, che rappresenta senz’altro un lodevole tentativo di introdurre meccanismi predittivi al fine di riequilibrare le discriminazioni conseguenti alla conclusione anticipata dei campionati professionistici, rischia di naufragare a causa della contrarietà delle componenti federali e dei media. Tale vicenda conferma la ritrosia dei soggetti direttamente interessati a essere destinatari di decisioni automatizzate che, senza l’intermediazione umana, incidono sulla propria libertà e sfera giuridico patrimoniale.

 

Media, istituzioni, cittadini e imprese richiedono alle istituzioni una maggiore digitalizzazione delle funzioni amministrative e la diffusione di sistemi automatizzati di decisione. Tuttavia, all’atto pratico nessuno accetta che la propria libertà o sfera giuridico patrimoniale possa essere incisa da un algoritmo (sulla nozione di algoritmo si v. S.Abiteboul e G. Dowek, The age of Alghoritms) o da un modello matematico predittivo, senza l’intermediazione dell’attività cognitiva umana.

Emblematica, di tale paradosso, è la vicenda dell’algoritmo del merito sportivo con il quale la FIGC intende elaborare, tramite un modello matematico, le classifiche dei campionati professionistici qualora non sarà possibile concludere regolarmente i campionati professionistici.

Il Consiglio federale con il Comunicato n. 196/A del 20.5.2020, nel deliberare la ripresa dei campionati professionistici di calcio, ha previsto che “nella denegata ipotesi in cui, in ragione dell’emergenza epidemiologica da Covid-19, non fosse possibile riavviare le competizioni o, una volta riprese con il calendario ordinario o con un formato diverso, le stesse dovessero essere nuovamente sospese in via definitiva, i criteri di definizione degli esiti delle competizioni, ivi comprese promozioni e retrocessioni, verranno individuati dal Consiglio Federale in base alla classifica cristallizzatasi al momento della definitiva interruzione anche applicando oggettivi coefficienti correttivi che tengano conto della organizzazione in gironi della competizione e/o del diverso numero di gare disputate dalle società”.

Secondo l’organo di vertice della FIGC la sopravvenuta impossibilità di concludere regolarmente il campionato e, quindi, di garantire il doppio confronto tra tutte le squadre partecipanti (in casa e in trasferta) comporta una palese disparità tra i diversi club, pregiudicando i valori sportivi delle competizioni e, conseguentemente, l’assegnazione dei titoli fondata su tali valori.

In altre parole, secondo l’organo di vertice della Federazione nel caso di interruzione dei campionati professionistici al fine di determinare il posizionamento delle diverse squadre, con le correlate conseguenze di ordine economico (premi per le posizioni) e sportivo (qualificazione alle coppe europee, promozioni e retrocessioni), non si dovrebbe tener conto soltanto della classifica risultante dalle partite disputate sino al momento dell’anticipata conclusione, in quanto alla luce del diverso numero di partite giocate, della mancanza del doppio confronto (in casa/in trasferta) tra tutte le partecipanti e della diversa qualità delle compagini affrontate da ciascuna squadra la mera sommatoria dei punti ottenuti sul campo rappresenta un dato disomogeneo che non corrisponde necessariamente ai valori emersi durante il campionato.

Per riequilibrare tale squilibrio anticompetitivo, il Presidente federale ha proposto l’utilizzo di un algoritmo predittivo che attraverso “una valutazione sul piano numerico dei valori sportivi di ciascun club, utilizzando alcuni fattori oggettivi già esistenti, ma proiettandoli, con opportuna ponderazione in un contesto il più possibile omogeneo”. Il modello matematico elabora, dunque, una proiezione della classifica finale, utilizzando predeterminati dati oggettivi estratti dalle partite già disputate da ciascuna squadra prima dell’interruzione del campionato.

L’algoritmo proposto, al fine di determinare la classifica definitiva in caso di interruzione anticipata dei campionati, tiene conto non soltanto dei punti ottenuti da ciascuna squadra, ma anche dei risultati conseguiti in casa e in trasferta, del numero di partite in casa e in trasferta non ancora disputate, della differenza reti e della redditività delle reti per punti ottenuti.

Tale algoritmo è stato elaborato attraverso un procedimento articolato in tre fasi, delle quali è data ampia evidenza nella relazione trasmessa dal Presidente a tutte le componenti federali.

Una prima fase definita di schematizzazione, nell’ambito della quale è stato definito il quadro di riferimento in relazione al funzionamento dei campionati, ai soggetti coinvolti e al quadro normativo vigente al fine di individuare i dati e i criteri rilevanti ai fini della formazione della classifica.

Una seconda fase c.d. di osservazione, con la quale è stato ricostruito il contesto di riferimento, attraverso la ricerca, la raccolta e la catalogazione del materiale inerente agli elementi maggiormente utili.

Una terza fase denominata di descrizione con la quale sono stati individuati gli indici del modello matematico.

L’algoritmo proposto a conclusione del procedimento è il seguente: “Pt(x) + 0,90[(MPC t(x) x Ct(z-x)) +(MPF t(x) x F t(z-x))]+ 0,10[(IAG x ΔRt(x))]”, dove

Pt(x) corrisponde ai punti della classifica al momento dell’interruzione del campionato;

MPC t(x) corrisponde alla media punti casalinghi al momento dell’interruzione del campionato;

Ct(z-x) indica il numero di partite casalinghe che devono essere ancora disputate;

MPF t(x) corrisponde alla media punti in trasferta al momento dell’interruzione del campionato;

F t(z-x) indica il numero di gare in trasferta che devono essere ancora disputate;

IAG corrisponde all’indice medio di redditività aggregato dei goal segnati nel girone.

ΔRt(x) indica la differenza tra i goal fatti e i goal fatti e i goal subiti da ciascun club nelle gare valide disputate.

Tre sono, dunque, gli elementi che costituiscono il modello matematico, ai quali, tra l’altro, è attribuita una rilevanza differente al fine di concorrere alla formazione della graduatoria.

Il primo, che è considerato in valore assoluto, è il punteggio ottenuto da ciascuna squadra fino al momento dell’interruzione del campionato.

Il secondo, al quale è attribuito un valore ponderato del 90%, è costituito dall’indice di propensione dei punti: la media dei punti ottenuti (in casa e trasferta) moltiplicata per le gare non disputate (in casa e in trasferta).

Il terzo, al quale è attribuito un valore ponderato esiguo (10%), è l’indice di redditività delle reti: il rapporto tra le reti realizzate e i punti ottenuti.

In particolare, secondo la Federazione, gli ultimi due criteri dovrebbero consentire una proiezione dell’andamento delle diverse squadre nell’ambito delle partite che non sarebbero giocate.

Tale algoritmo consente una proiezione dell’andamento delle partite non disputate e l’elaborazione, in caso di interruzione anticipata dei campionati, della classifica definitiva tenendo conto, dunque, non soltanto della media punti ricavata dividendo il numero dei punti raccolti per le partite effettivamente giocate, ma dei risultati ottenuti in casa e in trasferta rispetto alle partite che devono essere ancora disputate, alla differenza reti, ai goal fatti.

Non appare questa la sede per effettuare valutazioni in merito ai dati prescelti, ai criteri individuati e alla formula elaborata. Tuttavia, dalla vicenda in esame si possono trarre alcune considerazioni.

Innanzitutto, l’algoritmo elaborato dalla FIGC è elementare, in quanto si fonda su un complesso di dati e criteri limitati. La scarsità di dati presi in considerazione incide inevitabilmente sulla semplicità della predizione effettuata dall’algoritmo. Si sarebbe potuto elaborare anche un sistema maggiormente complesso e articolato che elaborava, al fine di prevedere i possibili esiti delle partite non disputate, anche altri dati, quali, ad esempio i precedenti specifici tra gli stessi club (per lo meno nel girone d’andata), la diversa posizione in classifica delle squadre che si sarebbero dovute incontrare o la profondità delle rose in relazione alla propensione di ciascuna squadra a subire provvedimenti disciplinari e infortuni, etc, etc.

Tuttavia, non si può omettere di evidenziare che la proposta del Presidente federale è senz’altro positiva e innovativa, laddove la FIGC non si accontenta di un dato statico e discriminatorio per determinare la classifica finale, ma tenta di introdurre un sistema predittivo con il quale sono apportati correttivi nel tentativo di eliminare alcuni degli effetti distorsivi determinati dalla conclusione anticipata del campionato e dall’omesso svolgimento della doppia sfida (in casa e in trasferta) tra tutte le compagini.

È evidente che un algoritmo non può essere in grado di valutare l’imponderabile (errori arbitrali, pali, traverse, colpi di classe dei campioni o papere dei portieri), ma tramite l’utilizzo di statistiche sempre più raffinate e dettagliate è possibile fornire una proiezione più verosimile e meno discriminatoria rispetto alla semplice media punti delle partite giocate.

In secondo luogo, il procedimento adottato dalla FIGC corrisponde ai principi giurisprudenziali finora elaborati dal Consiglio di Stato e dalle istituzioni europee in materia di sistemi di decisione automatizzata.

La Federazione prima d’introdurre la decisione automatizzata ha precostituito una base legale, autorizzando espressamente, con il Comunicato n. 196/A del Consiglio federale, l’utilizzo di oggettivi coefficienti correttivi alla classifica risultante al momento dell’interruzione del campionato.

I dati utilizzati, i criteri con i quali i dati sono elaborati e il funzionamento dell’algoritmo sono stati esplicitati in una relazione che, in ossequio al principio di trasparenza, è stata messa a disposizione delle diverse componenti federali che rappresentano i soggetti destinatari diretti delle eventuali decisioni automatizzate.

L’algoritmo consente di ricostruire l’iter logico utilizzato per addivenire a ciascuna specifica decisione, consentendo il pieno sindacato sul corretto funzionamento [su tali vincoli si v. G. Avanzini, Decisioni amministrative e algoritmi informatici. Predeterminazione analisi predittiva e nuove forme di intelligibilità e F. De Leonardis, Big data, decisioni amministrative e “povertà” di risorse della pubblica amministrazione). Sindacato attribuito, ai sensi dell’art. 218 del Decreto Rilancio (n.34/2020), in prima battuta al Collegio di Garanzia dello Sport e successivamente alla giustizia amministrativa, nell’ambito di procedimenti superaccelerati (7 giorni per ricorrere innanzi all’Organo del Coni, 15per proporre il gravame innanzi al Tar e al Consiglio di Stato).

Il regime processuale individuato dal richiamato art. 218 solleva alcuni dubbi interpretativi.

In primis, chi è legittimato a contestare la scelta di introdurre l’algoritmo, il modello matematico adottato e le sue concrete applicazioni? Senz’altro sono legittimate le componenti federali direttamente interessate (la Lega Nazionale Professionisti Serie A, la Lega Nazionale Professionisti B, la Lega Italiana Calcio Professionistico) e le squadre direttamente interessate. È esclusa la legittimazione di tifosi o altri soggetti non tesserati (titolari dei diritti televisivi), mentre dubbi sussistono in merito alla possibilità di configurare una legittimazione in capo anche alle altre componenti federali e ai singoli tesserati.

Anche il dies a quo dal quale decorre il termine breve di impugnazione non è certo. Inizia a decorrere dalla data di pubblicazione della decisione di utilizzare l’algoritmo, dalla delibera del Consiglio Federale conla quale sono approvate le regole di funzionamento dell’algoritmo o dall’elaborazione della nuova graduatoria tramite il predetto modello matematico?

Un ulteriore dubbio concerne l’estensione del sindacato (para)giurisdizionale. L’elaborazione dell’algoritmo è configurabile alla stregua dell’esercizio di un potere discrezionale, ovvero di discrezionalità tecnica? Conseguentemente il sindacato deve limitarsi all’ambito estrinseco della logicità-ragionevolezza dell’algoritmo, ovvero ai giudici è riconosciuto il potere di valutare l’attendibilità della regola tecnica utilizzata?

Nonostante l’iter di approvazione sia conforme ai principi di trasparenza, non opacità e conoscibilità dell’algoritmo, appare significativa la ritrosia degli interessati ad accettare l’utilizzo di un sistema di decisione automatizzata. Tutte le componenti federali e i media hanno manifestato una contrarietà assoluta all’applicazione dell’algoritmo (la Lega di Serie A nel corso dell’assemblea del 5 giugno 2020 si è opposta all’introduzione del sistema di decisione automatizzate con 16 voti favorevoli e 4 astenuti). Le critiche non riguardano eventuali discriminazioni o malfunzionamenti del modello matematico proposto, ma la decisione di affidarsi a un algoritmo per elaborare la classifica e prevedere l’imprevedibile: il risultato di una partita di calcio. Tale argomentazione non sembra, tuttavia, cogliere nel segno. Da un lato, neppure il sistema alternativo proposto tiene conto dell’imprevedibilità dei risultati dal momento che si tratta della mera proiezione della media punti realizzata per le partite non disputate. Da un altro lato, il sistema predittivo almeno elimina alcune delle distorsioni.

In tale prospettiva, la diffidenza all’introduzione di qualsivoglia sistema di decisione automatizzata appare di difficile comprensione soprattutto nei casi, come questo, in cui non vi è la necessità di ponderare molteplici interessi pubblici e privati in gioco, ovvero di eserciate un potere discrezionale, ma si tratta esclusivamente di applicare un modello matematico predittivo al fine di riequilibrare una palese discriminazione determinata dall’impossibilità di garantire il regolare svolgimento del campionato.

Un’ultima considerazione riguarda la neutralità dell’algoritmo. Il caso della FIGC dimostra che l’algoritmo non è neutrale, in quanto il suo funzionamento e i risultati prodotti dipendono dai dati utilizzati e i criteri predeterminati. Secondo l’algoritmo proposto, ad esempio, il Milan attualmente in posizione utile per qualificarsi alle coppe europee, sarebbe sorpassato da Hellas Verona e Parma. Se si eliminasse dall’algoritmo il criterio relativo all’indice di redditività delle reti i punteggi di ciascuna squadra sarebbero diversi, anche se la classifica sarebbe identica a quella elaborata dall’algoritmo risultati sarebbero diversi.

Se, invece, si attribuisse rilievo anche alla posizione in classifica delle squadre che ogni club avrebbe dovuto affrontare, al fine di tenere in considerazione la difficoltà del match, la proiezione porterebbe a una classifica significativamente diversa.

Analogamente la graduatoria sarebbe completamente diversa se si dovesse tenere in considerazione ai fini della valutazione predittiva del risultato ottenuto nel medesimo match a campi invertiti nel girone di andata.

Alla luce di tale evidenza appare evidente come sia necessaria la massima partecipazione ai procedimenti di elaborazione degli algoritmi e, soprattutto, un’attenta istruttoria in ordine ai dati, ai criteri e alla ponderazione di tali elementi, anche al fine di valutare l’impatto delle diverse soluzioni prospettate.

Licenza Creative Commons
Quest’opera è distribuita con Licenza Creative Commons Attribuzione – Non commerciale – Non opere derivate 4.0 Internazionale.