Cosa ci dicono davvero i dati sull’epidemia di coronavirus

Una crescita meno rapida su scala nazionale è una buona notizia, ma meglio essere molto cauti con l’ottimismo: molte province e regioni italiane continuano a seguire un trend esponenziale, seppur con numeri più piccoli della Lombardia, e ancora non ci sono previsioni affidabili sul picco

(foto: Massimo Bertolini/NurPhoto/Getty Images)

I 368 decessi e i 2.853 nuovi casi positivi fatti registrare nella giornata di domenica 15 marzo rappresentano il nuovo triste record dell’epidemia di Covid-19 in Italia, ma come ormai è chiaro questa non è di per sé una notizia. Ed è difficile sostenere che con queste cifre, a cui si aggiungono le 1.672 persone attualmente ricoverate negli ormai saturi reparti di terapia intensiva, si possa trovare qualcosa come un segnale incoraggiante. Perché di buono, in effetti, potrebbe esserci semmai solo un’inversione di tendenza.

Eppure i numeri degli ultimi giorni – che sono sì su scala nazionale, ma di fatto determinati dallo strapotere statistico dell’andamento lombardo – qualcosa di positivo lo raccontano. Come abbiamo già avuto modo di spiegare qui su Wired, infatti, i modelli matematici che descrivono l’epidemia prevedono dapprima una fase di crescita esponenziale e poi un periodo di incremento via via più moderato, fino a raggiungere l’agognato picco. Bene, da ormai 4 o 5 giorni di fila pare che l’originale trend esponenziale che ha caratterizzato l’ultima settimana di febbraio e la prima di marzo sia stato abbandonato, in favore di una fase di crescita meno ripida, dalla forma ancora incerta.

Lo anticipiamo subito: andiamoci piano con i facili entusiasmi e gli ottimismi, perché ci sono diversi se e però che ridimensionano la portata di questa apparente buona notizia. Ma andiamo con ordine.

Lo scostamento dal trend esponenziale

Tra i tanti approcci possibili per svolgere le analisi statistiche sui dati a disposizione, qui su Wired abbiamo scelto di considerare come parametro rilevante la somma dei decessi e dei ricoveri in terapia intensiva. In breve, il dato osservato da metà della settimana scorsa si sta discostando, per difetto, rispetto a quanto i modelli di crescita esponenziale avrebbero previsto. Ci sono diversi modi di raccontare questo effetto: si può dire che la crescita percentuale da un giorno al successivo sta lentamente diminuendo (e sembra essersi assestata al di sotto del 20%, contro una media del 20%-25% di inizio mese), si può osservare in modo più tecnico che l’andamento in scala logaritmica ha abbandonato la perfetta linearità, oppure si può notare che (se si fosse seguita la crescita tendenziale di inizio mese) oggi avremmo dovuto registrare grossomodo un migliaio di decessi in più, che invece per fortuna secondo i dati ufficiali non ci sono stati.

(grafico: Riccardo Saporiti)

Un primo punto di attenzione però va messo proprio sulla robustezza statistica di queste considerazioni. Basarsi su un trend di pochi giorni, infatti, potrebbe darci false speranze, tanto che le semplici fluttuazioni statistiche giornaliere – per difetto o per eccesso – fanno passare gli analisti più superficiali da un effimero entusiasmo a un altrettanto immotivato panico. La fiducia in questo nuovo andamento meno ripido, quindi, può affermarsi solo se il trend verrà confermato anche dai prossimi aggiornamenti quotidiani, i quali peraltro a volte sono in qualche modo falsati da ritardi nelle registrazioni e da altri effetti del sovraccarico sul sistema sanitario. Va detto comunque che anche il dato di domenica, certamente più negativo dei precedenti, ha continuato a confermare lo scostamento dal trend esponenziale.

Non c’è solo la Lombardia

Come si è già accennato, il dato nazionale è fortemente condizionato da ciò che accade in Lombardia, a sua volta dominata nelle statistiche dalle province di Bergamo, Brescia, Cremona e Milano. Questo significa che ad abbandonare la fase di crescita esponenziale sono state (nel complesso) queste aree, mentre la statistica nazionale di per sé poco ci dice di ciò che accade nelle regioni e nelle province meno interessante dal contagio.

(grafico: Riccardo Saporiti)

In questi territori meno chiacchierati a livello mediatico, ma di cui abbiamo a disposizione i dati, non di rado si osserva una crescita ancora del tutto esponenziale, con numeri in assoluto molto più piccoli rispetto alle tre regioni più colpite, ma percentuali che indicano crescite vertiginose. È importante, dunque, non cadere nella trappola statistica del pensare che un cambio di trend del dato nazionale indichi che lo stesso valga per estensione in ogni realtà locale. A maggior ragione, sarà importante tenere a mente questa varietà geografica quando si arriverà a parlare del raggiungimento del picco epidemico e della fase di decrescita.

Previsioni strambe e altre grane statistiche

Se da un lato è molto complesso ricavare considerazioni sensate dai dati già registrati, dall’altro è facile capire quanto possa essere scarsa l’attendibilità delle proiezioni dei dati sul futuro. A meno che ci si limiti a guardare avanti di un solo giorno (e allora non si tratta nemmeno di una previsione, ma della banale estrapolazione di un dato ipotizzando che ci sia continuità con quanto già accaduto), i possibili modelli matematici sono semplicemente troppo incerti per poter dare risposte precise o affidabili. Pensare di sfruttare quel piccolo scostamento dal trend esponenziale per disegnare tutta la curva epidemica, definendo per esempio la data del picco e il numero complessivo di decessi, è un bellissimo esercizio di stile matematico che certamente restituirà dei numeri, i quali però sono di fatto sterili poiché hanno una rilevanza di poco superiore a una previsione astrologica.

Un modello che a ogni bollettino deve essere aggiornato con variazioni in proiezione del 20%-30% (quando va bene) non è un’analisi ponderata, ma sostanzialmente una sparata. Per convincersene basta rendersi conto di quanto i diversi modelli in circolazione facciano previsioni completamente diverse (c’è chi parla del picco il 18 marzo, chi a metà aprile, chi a maggio), e anche notare come le istituzioni si siano categoricamente rifiutate di lanciarsi in previsioni sul futuro. Tra l’altro – vale la pena di ribadirlo – ciò che accadrà nelle prossime settimane dipende fortemente dal nostro comportamento individuale, quindi fare previsioni avanti nel tempo potrebbe dare adito a un senso di deresponsabilizzazione, perché ci si potrebbe convincere che tutto ormai sia predeterminato.

Infine, tutti i modelli hanno un intrinseco limite geografico. Dato che siamo d’accordo che il picco italiano non coincida con quello cinese, né con quello tedesco o spagnolo, non è chiaro perché il picco lombardo dovrebbe coincidere con quello toscano o pugliese, dato che il coronavirus di certo non rispetta i confini nazionali né si preoccupa di avere una distribuzione uniforme all’interno di ciascuno Stato. Quando ci parla di picco, infatti, spesso non è ben chiaro nemmeno a che cosa ci si stia riferendo: non è possibile escludere a priori, infatti, che nelle prossime settimane altre regioni italiane possano diventare determinanti in modo confrontabile alla Lombardia nel contribuire al dato nazionale.

Proprio come l’Italia sembra essere in anticipo rispetto ad altri Paesi europei, la Lombardia, il Veneto e l’Emilia-Romagna (a cui dovrebbero essere ormai aggiunte la Toscana e il Piemonte) potrebbero essere semplicemente in anticipo rispetto ad altre regioni. È proprio questo il motivo per cui le misure di contenimento sono importanti non solo nelle aree con il focolaio più intenso, ma anche laddove a oggi i casi sono sporadici.

Fonte : Wired